zoukankan      html  css  js  c++  java
  • Crontab

    Crond

    关于编写完成的爬虫脚本,我们后续的操作无非是定时执行,以及挂掉的监听。定时执行的话可以用到crontab.

    有两个坑吧,第一个在编辑定时任务的时候需要绝对路径,第二个就是scrapy.cfg需要放在当前目录下。

    $ yum install crontab 
    
    
    # 启动
    $ systemctl start crond.service
    

      

    # 新增定时任务
    crontab -e
    0 */6 * * * cd /root/NewsSpider/ && /usr/local/python3/bin/scrapy crawlall
    

      

    crontab文件的含义:

    用户所建立的crontab文件中,每一行都代表一项任务,每行的每个字段代表一项设置,它的格式共分为六个字段,前五段是时间设定段,第六段是要执行的命令段,格式如下:

    minute   hour   day   month   week   command

    其中:

    minute: 表示分钟,可以是从0到59之间的任何整数。

    hour:表示小时,可以是从0到23之间的任何整数。

    day:表示日期,可以是从1到31之间的任何整数。

    month:表示月份,可以是从1到12之间的任何整数。

    week:表示星期几,可以是从0到7之间的任何整数,这里的0或7代表星期日。

    command:要执行的命令,可以是系统命令,也可以是自己编写的脚本文件。

    在以上各个字段中,还可以使用以下特殊字符:

    星号(*):代表所有可能的值,例如month字段如果是星号,则表示在满足其它字段的制约条件后每月都执行该命令操作。

    逗号(,):可以用逗号隔开的值指定一个列表范围,例如,“1,2,5,7,8,9”

    中杠(-):可以用整数之间的中杠表示一个整数范围,例如“2-6”表示“2,3,4,5,6”

    正斜线(/):可以用正斜线指定时间的间隔频率,例如“0-23/2”表示每两小时执行一次。同时正斜线可以和星号一起使用,例如*/10,如果用在minute字段,表示每十分钟执行一次。

    监听

    用到的是os模块,主要是os.popen("command")的用法,将命令的输出作为值返回。

    import os
    import re
    
    message = os.popen("ps aux | grep python3").readlines()
    message = os.popen("ps aux |grep python3").read()
    
    condition = re.search(r"notebook/Xj.py",message)
    if condition:
        pass
    else:
        print("掉线啦")
        post
    

      

  • 相关阅读:
    Java 链表
    知识点归列
    HTML和CSS必须知道的重点难点问题
    函数表达式
    javascript原型链
    canvas成长树
    checkbox选中问题
    使用vue-cli脚手架自定义iview主题
    AI学习吧-Redis操作-事务、订阅
    AI学习吧-REDIS-常识
  • 原文地址:https://www.cnblogs.com/zenan/p/9676804.html
Copyright © 2011-2022 走看看