zoukankan      html  css  js  c++  java
  • scrapy 6023 telnet查看爬虫引擎相关状态

    Telnet终端(Telnet Console)

    Scrapy提供了内置的telnet终端,以供检查,控制Scrapy运行的进程。 telnet仅仅是一个运行在Scrapy进程中的普通python终端。因此您可以在其中做任何事。

    telnet终端是一个 自带的Scrapy扩展 。 该扩展默认为启用,不过您也可以关闭。 关于扩展的更多内容请参考 Telnet console 扩展

    如何访问telnet终端

    telnet终端监听设置中定义的 TELNETCONSOLE_PORT ,默认为 6023 。 访问telnet请输入:

    telnet localhost 6023
    >>>
    

    Windows及大多数Linux发行版都自带了所需的telnet程序。

    telnet终端中可用的变量

    telnet仅仅是一个运行在Scrapy进程中的普通python终端。因此您可以做任何事情,甚至是导入新终端。

    telnet为了方便提供了一些默认定义的变量:

    快捷名称描述
    crawler Scrapy Crawler (scrapy.crawler.Crawler 对象)
    engine Crawler.engine属性
    spider 当前激活的爬虫(spider)
    slot the engine slot
    extensions 扩展管理器(manager) (Crawler.extensions属性)
    stats 状态收集器 (Crawler.stats属性)
    settings Scrapy设置(setting)对象 (Crawler.settings属性)
    est 打印引擎状态的报告
    prefs 针对内存调试 (参考 调试内存溢出)
    p pprint.pprint 函数的简写
    hpy 针对内存调试 (参考 调试内存溢出)

    Telnet console usage examples

    下面是使用telnet终端的一些例子:

    查看引擎状态

    在终端中您可以使用Scrapy引擎的 est() 方法来快速查看状态:

    telnet localhost 6023
    >>> est()
    Execution engine status
    
    time()-engine.start_time                        : 8.62972998619
    engine.has_capacity()                           : False
    len(engine.downloader.active)                   : 16
    engine.scraper.is_idle()                        : False
    engine.spider.name                              : followall
    engine.spider_is_idle(engine.spider)            : False
    engine.slot.closing                             : False
    len(engine.slot.inprogress)                     : 16
    len(engine.slot.scheduler.dqs or [])            : 0
    len(engine.slot.scheduler.mqs)                  : 92
    len(engine.scraper.slot.queue)                  : 0
    len(engine.scraper.slot.active)                 : 0
    engine.scraper.slot.active_size                 : 0
    engine.scraper.slot.itemproc_size               : 0
    engine.scraper.slot.needs_backout()             : False
    

    暂停,恢复和停止Scrapy引擎

    暂停:

    telnet localhost 6023
    >>> engine.pause()
    >>>
    

    恢复:

    telnet localhost 6023
    >>> engine.unpause()
    >>>
    

    停止:

    telnet localhost 6023
    >>> engine.stop()
    Connection closed by foreign host.
    

    Telnet终端信号

    scrapy.telnet.update_telnet_vars(telnet_vars)

    在telnet终端开启前发送该信号。您可以挂载(hook up)该信号来添加,移除或更新 telnet本地命名空间可用的变量。 您可以通过在您的处理函数(handler)中更新 telnet_vars 字典来实现该修改。

    参数: telnet_vars (dict) – telnet变量的字典

    Telnet设定

    以下是终端的一些设定:

    TELNETCONSOLE_PORT

    Default: [6023, 6073]

    telnet终端使用的端口范围。如果设为 None0 , 则动态分配端口。

    TELNETCONSOLE_HOST

    默认: '127.0.0.1'

    telnet终端监听的接口(interface)。

  • 相关阅读:
    TI DM3730 EBOOT分析(一)
    收费系统三层+抽象工厂+反射实例
    sql语句中的时间查询
    五线谱学习软件
    hdu1061Rightmost Digit(附20循环的规律解法和附快速幂简单原理)
    云计算安全指南
    linux 下orcale基本操作指令
    HDU/HDOJ 2102 A计划 广度优先搜索BFS
    网站优化策略之SEO必知的七大技巧
    SEO之四大要不得
  • 原文地址:https://www.cnblogs.com/bonelee/p/9258453.html
Copyright © 2011-2022 走看看