[关闭]
@tony-yin 2018-10-29T15:04:17.000000Z 字数 6520 阅读 1299

为什么 crontab 不执行

Linux


作为linux中的定时任务工具,crontab被广大开发者所热爱和使用。该技术由来已久,相当成熟,但是在真正使用的时候会时不时地发现为什么crontab脚本没有按照预期那样执行?本文以本周笔者遇到一个crontab不能运行的问题为引子,详细地介绍为什么crontab不运行的各种原因。

引子

本周遇到一个crontab不能执行的问题,发现原因后觉得甚是有趣。

笔者通过一个python脚本向/etc/cron.d目录下的一个文件写入定时任务命令,每分钟调用一个脚本,调用的这个脚本是个python文件,然后发现cron并没有按照预期每分钟执行一次。然后笔者就将原定时任务脚本aaa拷贝了一份,并重新命名为bbb,然后将定时任务中调用脚本改成了执行一个简单的echo命令,然后保存退出,发现bbb是可以正常定时运行的,这时候,笔者就通过file命令想比较一下这两个文件有何不同:

  1. [root@tony cron.d]# file *
  2. aaa: ASCII text, with no line terminators
  3. bbb: ASCII text

这个时候我们可以发现aaa文件出现了比较奇怪的标识:

  1. with no line terminators

显而易见,这是在说cron脚本中定时命令没有行终止符,导致这个问题是因为该cron脚本由python代码生成时没有添加换行符:

  1. with open('/etc/cron.d/aaa', 'w') as f:
  2. f.write('xxx')

然后笔者尝试性地在aaa文件中在定时命令下新增一行后,发现定时任务可以正常运行了。不得不说,这是一个很有意思的问题,crontab居然会因为一个换行符导致定时任务的不运行,后来google了一下发现,crontab的确存在这个机制,具体解释下面会提到。

google的同时,在ask unbuntu上发现了这篇文章:《Why crontab scripts are not working?》,里面很多开发者罗列了他们遇到cron不能正常运行的各种因素,笔者大致浏览了下,发现有遇到过,也有很多并不知道的,所以想把这些因素和解决方案一一罗列下来。

因素

因素1:环境变量

场景及原因

cron中的环境变量和系统的环境变量是不一样的,我们可以通过设置定时脚本将cron中的环境变量打印出来:

  1. * * * * * env > /tmp/env.output

可以看到cron中的环境变量:

  1. XDG_SESSION_ID=12952
  2. SHELL=/bin/sh
  3. USER=root
  4. PATH=/usr/bin:/bin
  5. PWD=/root
  6. LANG=en_US.UTF-8
  7. SHLVL=1
  8. HOME=/root
  9. LOGNAME=root
  10. XDG_RUNTIME_DIR=/run/user/0
  11. _=/usr/bin/env

查看系统的环境变量:

  1. [root@tony cron.d]# env
  2. XDG_SESSION_ID=1140
  3. HOSTNAME=tony
  4. TERM=xterm-256color
  5. SHELL=/bin/bash
  6. HISTSIZE=1000
  7. USER=root
  8. PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin:/root/bin
  9. MAIL=/var/spool/mail/root
  10. PWD=/etc/cron.d
  11. LANG=en_US.UTF-8
  12. TMUX_PANE=%18
  13. HISTCONTROL=ignoredups
  14. SHLVL=2
  15. HOME=/root
  16. LOGNAME=root
  17. _=/usr/bin/env
  18. OLDPWD=/root

我们可以看到cron中的环境变量很多都和系统环境变量不一样(cron会忽略/etc/environment文件),尤其是PATH,只有/usr/bin:/bin,也就是说在cron中运行shell命令,如果不是全路径,只能运行/usr/bin/bin这两个目录中的标准命令,而像/usr/sbin/usr/local/bin等目录中的非标准命令是不能运行的。

这个问题笔者也遇到很多次,所以很多非标准命令都选择了全路径,但是这个方法也有问题,因为不同环境的命令所存在的目录是不一样的。

解决方案

方案1:

cron脚本文件头部声明PATH

  1. #!/bin/bash
  2. PATH=/opt/someApp/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin
  3. # rest of script follows

方案2:

在定时脚本调用的脚本头部声明PATH

  1. PATH=/opt/someApp/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin
  2. 15 1 * * * backupscript --incremental /home /root

因素2:换行符

场景及原因

这个因素就是笔者引子中提到的,官方解释(man crontab)如下:

  1. Although cron requires that each entry in a crontab end in a newline character, neither the crontab command nor the cron daemon will detect this error. Instead, the crontab will appear to load normally. However, the command will never run. The best choice is to ensure that your crontab has a blank line at the end.
  2. 4th Berkeley Distribution 29 December 1993 CRONTAB(1)

简单翻译一下就是:

尽管crontab要求cron中的每个条目都要以换行符结尾,但crontab命令和cron守护进程都不会检测到这个错误。相反,crontab将正常加载。然而,命令永远不会运行。最好的选择是确保您的crontab在末尾有一个空白行。

解决方案

cron中每个条目下面添加一个空行

注意:

除了没了换行符会导致cron中的命令不会运行,即引子中所标识:

  1. with no line terminators

但是因为非linux操作系统导致的非\n换行符同样会导致该问题,比如windows^Mmac\r

  1. with CR line terminators

解决方案:

windows的话就通过dos2unix命令转换;而mac则可以通过mac2unix来转换,mac2unix也是dos2unix软件中的一部分

Refer

因素3:crond 服务

场景及原因

很多时候crond服务未开启,也会导致定时任务不会正常执行。

解决方案

查看服务是否运行,如果未运行,启动crond服务即可。

查看方式有两种:

1.通过进程查看

pgrep相当于ps -ef | grep

  1. pgrep cron

2.通过service查看

  1. service crond status

启动服务:

  1. service crond start

因素4:shell 解释器

场景及原因

从因素1就知道cron环境变量中的SHELLsh而不是bash,我们知道很多shell命令是可以在bash中正常运行,但是不能在sh中运行的,所以这个因素也会影响定时任务的正常运行。

解决方案:

方案1:

cron中需要执行的命令在sh中执行确认

方案2:

cron中需要执行的命令外面加一个bash shell的封装:

  1. bash -c "mybashcommand"

方案3:

修改cron中的SHELL环境变量的值,让所有命令都用bash解释器:

  1. SHELL=/bin/bash

方案4:

如果定时任务执行的命令是shell脚本,只要在脚本内添加bash解释器:

  1. #!/bin/bash

因素5:时区

场景及原因

当修改系统时区后,无论是之前已经存在的cron还是之后新创建的cron,脚本中设置的定时时间都以旧时区为准,比如原来时区是Asia/Shanghai,时间为10:00,然后修改时区为Europe/Paris,时间变为3:00,此时你设置11:00的定时时间,cron会在Asia/Shanghai时区的11:00执行。

解决方案:

方案1:

重启crond服务

  1. service crond restart

方案2:

kill crond进程,因为crond进程是可重生的

因素6:百分号%

场景及原因

cron定时执行命令中,有百分号并且没有转义的时候,cron执行会出错,比如执行以下cron

  1. 0 * * * * echo hello >> ~/cron-logs/hourly/test`date "+%d"`.log

会有如下报错:

  1. /bin/sh: -c: line 0: unexpected EOF while looking for matching ``'
  2. /bin/sh: -c: line 1: syntax error: unexpected end of file

有的日志也会有如下报错:

  1. (echo) ERROR (getpwnam() failed)

crontab manpage中解释:

  1. The "sixth" field (the rest of the line) specifies the command to be run. The entire command portion of the line, up to a newline or % character, will be executed by /bin/sh or by the shell specified in the SHELL variable of the cronfile. Percent-signs (%) in the command, unless escaped with backslash (\), will be changed into newline characters, and all data after the first % will be sent to the command as standard input.

cron中换行符或%前的命令会被shell解释器执行,但是%会被认为新一行的字符,并且%后所有的数据都会以标准输出的形式发送给命令。

解决方案

为百分号做转义,即在%前添加反斜杠\

Refer

因素7:密码过期

场景及原因

Linux下新建用户密码过期时间是从/etc/login.defs文件中PASS_MAX_DAYS提取的,普通系统默认就是99999,而有些安全操作系统是90。更改此处,只是让新建的用户默认密码过期时间变化,已有用户密码过期时间仍然不变。

当用户密码过期也会导致cron脚本执行失败。

解决方案

将用户密码有效期设置成永久有效期或者延长有效期

方案1:

  1. chage -M <expire> <username>

方案2:

  1. passwd -x -1 <username>

方案3:

手动修改/etc/login.defs文件中PASS_MAX_DAYS的值

因素8:权限

场景及原因

很多时候解决方案都是采用root用户执行cron,但是有时候这并不是一个很好的方式。如果采用非root用户执行cron,需要注意很多权限问题,比如cron用户对操作的文件或目录是否存在权限等。

如果权限不够,cron会拒绝执行:

  1. sudo service cron restart
  2. grep -i cron /var/log/syslog|tail -2
  3. 2013-02-05T03:47:49.283841+01:00 ubuntu cron[49906]: (user) INSECURE MODE (mode 0600 expected) (crontabs/user)

解决方案

  1. # correct permission
  2. sudo chmod 600 /var/spool/cron/crontabs/user
  3. # signal crond to reload the file
  4. sudo touch /var/spool/cron/crontabs

因素9:不同平台

场景及原因

一些特殊选项各个平台支持不一样,有的支持,有的不支持,例如2/31-51,3,5

解决方案

需要针对不同平台做兼容性测试

因素10:不同 cron

场景及原因

将之前运行的Crontab Spec在从一个Crontab文件移动到另一个Crontab文件时可能会崩溃。有时候,原因是你已经将Spec从系统crontab文件转移到用户crontab文件,反之亦然。

cron分为系统cron和用户cron,用户cron/var/spool/cron/username/var/spool/crontabs/crontabs/username,系统cron
/etc/crontab以及/etc/crontab,这两者是存在部分差异的。

系统crontab在命令行运行之前有一个额外的字段user。这会导致一些错误,比如你将/etc/crontab中的命令或者/etc/cron.d中的文件移动至用户crontab会报错如下:

  1. george; command not found

相反,当发生相反的情况时,cron将显示/usr/bin/restartxyz is not a valid username之类的错误。

解决方案

当共享系统cron或用户cron时,注意用户的添加和删除。

因素11:crontable 变量

场景及原因

虽然你可以在crontable里面声明环境变量,但是在下面这种情况定时任务是不会执行的:

  1. SOME_DIR=/var/log
  2. MY_LOG_FILE=${SOME_LOG}/some_file.log
  3. BIN_DIR=/usr/local/bin
  4. MY_EXE=${BIN_DIR}/some_executable_file
  5. 0 10 * * * ${MY_EXE} some_param >> ${MY_LOG_FILE}

这是因为在crontable里面只能声明变量,不能对变量进行操作或者执行其他任何shell命令的,所以上述的shell字符串拼接是不会成功的,所以只能声明变量,然后在命令中引用变量。

解决方案:

方案1:

直接声明变量

  1. SOME_DIR=/var/log
  2. MY_LOG_FILE=/var/log/some_file.log
  3. BIN_DIR=/usr/local/bin
  4. MY_EXE=/usr/local/bin/some_executable_file
  5. 0 10 * * * ${MY_EXE} some_param >> ${MY_LOG_FILE}

方案2:

声明多个变量,在命令中引用拼接

  1. SOME_DIR=/var/log
  2. MY_LOG_FILE=some_file.log
  3. BIN_DIR=/usr/local/bin
  4. MY_EXE=some_executable_file
  5. 0 10 * * * ${BIN_DIR}/${MY_EXE} some_param >> ${SOME_DIR}/${MY_LOG_FILE}

因素12:GUI

场景及原因

如果你的cronjob调用了相关GUI应用时,你需要告诉它们应该使用什么DISPLAY环境变量,从因素1我们可以知道cron中的环境变量是和系统环境变量不一样的,DISPLAY同样如此,比如

  1. Firefox launch with cron.

解决方案

声明DISPLAY=:0

  1. * * * * * export DISPLAY=:0 && <command>

总结

目前主要总结了影响cron运行的12种因素,当然肯定还存在其他影响因素,本文将持续更新,希望这些坑能够被广大开发者所熟知。

大家如果有上述以外导致cron不能正常运行的因素可以在博客下方留言,或者在Github上面提pr,笔者已经将本文在Github上面创建了一个仓库,让我们一起不断完善吧 -。-

Github仓库地址:https://github.com/tony-yin/Why-Cronjob-Not-Work

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注