zoukankan      html  css  js  c++  java
  • Linux计划任务crontab运行脚本不正确的问题

    问题的由来

    写好的程序希望在崩溃之后能够自启动,于是利用linux的crontab功能,添加一个计划任务,每分钟执行一个脚本查看需要监控的进程是否还在,如果不在则启动之,否则不做任何事情。这么一个简单的脚本在crontab中运行和在shell终端手工运行的结果却不一样。

    问题描述

    以下是监控脚本/home/watch.sh的内容:

    #!/bin/sh
    shell_log_file=/home/start.log
    pid_count=`pidof video_checkup | wc -w`
    path=$(cd "$(dirname "$0")"; pwd)
    run_command="${path}/video_checkup"
    config_path="${path}/config.json"
    if [ $pid_count -eq 0  ]; then
         echo `date +%Y-%m-%d_%H:%M:%S`" run $run_command $config_path" >> $shell_log_file
         $run_command $config_path
    else
         echo `date +%Y-%m-%d_%H:%M:%S`" video_checkup already running" >> $shell_log_file
    fi
    

    在shell终端中执行crontab -e 命令添加如下语句:

    */1 * * * *  /home/watch.sh >/dev/null 2>&1
    

    表示该脚本每分钟运行一次,脚本的逻辑很简单就是检查进程video_checkup如不存在则运行之,可是在实际测试中却发现,video_checkup进程不断增多,每分钟都被运行了一次。

    问题分析

    通过调试发现脚本中 if [ $pid_count -eq 0  ]; then 每次都会进入并执行video_checkup程序,也就是说 $pid_count -eq 0 这个判断每次都是true。将 $pid_count 的值导入到log文件中发现确实是0 。


    但是video_checkup明明在运行的啊,不可能是0的,将watch.sh在shell命令行上手工执行却是正常的结果($pid_count就是实际的正在运行的video_checkup进程个数的值)。经过google发现,在crontab计划任务中执行脚本watch.sh的环境变量,和自己ssh登录到shell中手工执行watch.sh的环境变量是不同的,于是乎在watch.sh中加入下面的语句:

    echo `export` >> $shell_log_file  并分别在crontab中执行watch.sh,以及在ssh登录的shell中手工执行watch.sh发现果然export的结果不一样。

    在crontab中执行watch.sh的时候log文件中显示的export结果中PATH的值是: export PATH="/usr/bin:/bin"
    而ssh登录到shell之后手工执行watch.sh之后log文件中显示的export结果中的PATH的值是: PATH="/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin" 这个影响大吗,难道这个PATH变量对 pid_count=`pidof video_checkup | wc -w` 执行的结果会有影响?  


    此时我想到有一种可能就是,pidof命令是在哪个目录下?  在ssh的shell环境中执行:

    [root@172-28-246-152 video_checkup]# which pidof
    /sbin/pidof
    

    发现pidof命令是在 /sbin/目录下,也就是说crontab运行的环境中 PATH="/usr/bin:/bin" 目录中根本没有pidof这个命令,那么在crontab中执行 watch.sh中的 pid_count=`pidof video_checkup | wc -w` 就会失败,但是居然连一个错误都没有报告,而且pid_count变量中还被赋值了,难道pidof命令找不到的时候这个语句也能返回值?

    我在ssh的shell中构造一个不存在的pidof路径,试一下:

    [root@172-28-246-152 video_checkup]# pid_count=`/xx/pidof video_checkup | wc -w`
    -bash: /xx/pidof: No such file or directory
    

    果然报错说No such file or directory找不到命令,但是此时pid_count中是否有值呢? 再试一下:

    [root@172-28-246-152 video_checkup]# pid_count=`/xx/pidof video_checkup | wc -w` && echo $pid_count
    -bash: /xx/pidof: No such file or directory
    0
    

    结果彻底清楚了: 由于crontab在后台运行,所以pidof命令不存在,我们根本看不到报错信息,因为报命令不存在的信息是不会被通过管道传递给 wc -w  的,所以可以说出错的时候wc -w没有收到任何输入,但是其执行的结果却是 0 那么变量pid_count的值就是 0 了。  

    问题解决

    将ssh登录之后的shell环境中的PATH赋值到watch.sh脚本中即可,这样脚本在运行的时候就可以正确找到 pidof 命令得出正确的结果了 (也即在脚本watch.sh的开始处加入代码 PATH="/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin" 即可)

    一个小问题居然花了几个小时查清楚原因,可见平时觉得简单的问题在实际应用过程中还是有很多坑的

  • 相关阅读:
    第六周
    第五周(实验报告)
    第四周(实验报告)
    第三周(实验报告)
    Java第二周学习总结
    第一周
    2019课程总结
    第十四周课程总结
    第十三周总结
    第十二周总结
  • 原文地址:https://www.cnblogs.com/wangqiguo/p/5399227.html
Copyright © 2011-2022 走看看