zoukankan      html  css  js  c++  java
  • supervisor模块学习使用

    supervisor组件

    1. supervisord

      supervisord是supervisor的服务端程序。

      启动supervisor程序自身,启动supervisor管理的子进程,响应来自clients的请求,重启闪退或异常退出的子进程,把子进程的stderr或stdout记录到日志文件中,生成和处理Event

    2. supervisorctl

      客户端的命令行工具,提供一个类似shell的操作接口,通过它你可以连接到不同的supervisord进程上来管理它们各自的子程序,最牛逼的一点是,supervisorctl不仅可以连接到本机上的supervisord,还可以连接到远程的supervisord,当然在本机上面是通过UNIX socket连接的,远程是通过TCP socket连接的。supervisorctl和supervisord之间的通信,是通过xml_rpc完成的。服务端也可以要求客户端提供身份验证之后才能进行操作   相应的配置在[supervisorctl]

    3. Web Server

      Web Server主要可以在界面上管理进程,Web Server其实是通过XML_RPC来实现的,可以向supervisor请求数据,也可以控制supervisor及子进程。配置在[inet_http_server]

    4. XML_RPC接口

                供远程调用,supervisorctl和Web Server需要使用

    • 安装

      supervisor安装完成后会生成三个执行程序:supervisortd、supervisorctl、echo_supervisord_conf,分别是supervisor的守护进程服务(用于接收进程管理命令)、客户端(用于和守护进程通信,发送管理进程的指令)、生成初始配置文件程序。

    pip install supervisor
    • 生成配置文件

    安装好supervisor之后,默认是没有生成配置文件的。可以通过以下命令生成配置文件(我们通常是把配置文件放到/etc/下面,当然也可以放到任意路径下面)

    echo_supervisord_conf > /etc/supervisord.conf

    配置文件里每一行开头都是分号;这个符号用来表示注释,去掉需要配置项的分号并作修改即可

    [unix_http_server] 

    file=/home/supervisor.sock ;socket文件的路径,supervisorctl用XML_RPC和supervisord通信就是通过它进行
    的。如果不设置的话,supervisorctl也就不能用了,非必须设置
    ;chmod=0700 ; socket file mode (default 0700)
    ;chown=nobody:nogroup ; socket file uid:gid owner
    ;username=user ; default is no username (open server)
    ;password=123 ; default is no password (open server)

    [inet_http_server]          ;侦听在TCP上的socket,Web Server和远程的supervisorctl都要用到他(提供web管理界面),非必须

    port=xx.xx.xx.xxx:9001 ;Web管理后台运行的IP和端口,如果开放到公网,需要注意安全性,非必须设置
    ;username=user ; default is no username (open server)
    ;password=123 ; default is no password (open server)
    
    [supervisord]                ; 主要是定义supervisord这个服务端进程的一些参数的,必须设置

    logfile=/home/supervisord.log ; supervisor服务的日志文件 main log file; default $CWD/supervisord.log,$CWD为当前目录非必须设置
    logfile_maxbytes=50MB ; 日志文件大小当超过50M的时候,会生成一个新的日志文件。当设置为0时,表示不限制文件大小,默认值为50M,非必须设置
    logfile_backups=10 ;日志文件保持的数量,上面的日志文件大于50M时,就会生成一个新文件。文件数量大于10时,最初的老文件被新文件覆盖,
    文件数量将保持为10当设置为0时,表示不限制文件的数量默认情况下为10。。。非必须设置
    loglevel=warn ; 日志级别,默认是info log level; default info; others: debug,warn,trace。程序稳定的情况下,维护用warn就够了
    pidfile=/tmp/supervisord.pid ; supervisord pidfile; default supervisord.pid
    nodaemon=false ; 如果是true,supervisord进程将在前台运行默认为false,也就是后台以守护进程运行。。。非必须设置
    minfds=1024 ;这个是最少系统空闲的文件描述符,低于这个值supervisor将不会启动。系统的文件描述符在这里设置
    cat /proc/sys/fs/file-max默认情况下为1024。。。非必须设置
    minprocs=200 ;最小可用的进程描述符,低于这个值supervisor也将不会正常启动。ulimit  -u这个命令,可以查看
    linux下面用户的最大进程数默认为200。。。非必须设置
    ;umask=022 ; process file creation umask; default 022
    ;user=chrism ; default is current user, required if root
    ;identifier=supervisor ; supervisord identifier, default is 'supervisor'
    ;directory=/tmp ; default is not to cd during start
    ;nocleanup=true ; don't clean up tempfiles at start; default false
    ;childlogdir=/tmp ; 'AUTO' child log dir, default $TEMP
    ;environment=KEY="value" ; key value pairs to add to environment
    ;strip_ansi=false ; strip ansi escape codes in logs; def. false
    ; The rpcinterface:supervisor section must remain in the config file for
    ; RPC (supervisorctl/web interface) to work. Additional interfaces may be
    ; added by defining them in separate [rpcinterface:x] sections.
    [rpcinterface:supervisor]    ;给XML_RPC用的,如果想使用supervisord或者web server 都必须设置

    supervisor.rpcinterface_factory = supervisor.rpcinterface:make_main_rpcinterface
    ; The supervisorctl section configures how supervisorctl will connect to
    ; supervisord. configure it match the settings in either the unix_http_server
    ; or inet_http_server section.
    
    [supervisorctl];supervisorctl的一些配置
    serverurl=unix:///home/supervisor.sock   ;use a unix:// URL  for a unix socket这个是supervisorctl本地连接supervisord的时候,本地UNIX socket
    路径,注意这个是和前面的[unix_http_server]对应的默认值就是unix:///tmp/supervisor.sock。。非必须设置
    serverurl=http://xx.21.21.xxx:9001 ;use an http:// url to specify an inet socket这个是supervisorctl远程连接supervisord的时候,
    用到的TCP socket路径注意这个和前面的[inet_http_server]对应默认就是http://127.0.0.1:9001。非必须项
    ;username=chris ; should be same as in [*_http_server] if set
    ;password=123 ; should be same as in [*_http_server] if set
    ;prompt=mysupervisor ; cmd line prompt (default "supervisor")
    ;history_file=~/.sc_history ; use readline history if available
    ; The sample program section below shows all possible program subsection values.
    ; Create one or more 'real' program: sections to be able to control them under
    ; supervisor.
    
    [program:f5_manage]
    command=nohup java -jar /home/soft/jarpackage/sr_f5_manage-0.0.1-SNAPSHOT.jar &      ; the program (relative uses PATH, can take args)
    
    ;process_name=%(program_name)s ; 这个是进程名,如果我们下面的numprocs参数为1的话,就不用管这个参数
                                     了,它默认值%(program_name)s也就是上面的那个program冒号后面的名字,
                                     但是如果numprocs为多个的话,那就不能这么干了。想想也知道,不可能每个
                                     进程都用同一个进程名吧。                                
    ;numprocs=1                    ; 启动进程的数目。当不为1时,就是进程池的概念,注意process_name的设置
                                     默认为1    。。非必须设置
    ;directory=/tmp                ; 进程运行前,会前切换到这个目录
                                     默认不设置。。。非必须设置
    ;umask=022                     ; 进程掩码,默认none,非必须
    ;priority=999                  ; 子进程启动关闭优先级,优先级低的,最先启动,关闭的时候最后关闭
                                     默认值为999 。。非必须设置
    ;autostart=true                ; 如果是true的话,子进程将在supervisord启动后被自动启动
                                     默认就是true   。。非必须设置
    ;autorestart=unexpected        ; 这个是设置子进程挂掉后自动重启的情况,有三个选项,false,unexpected
                                     和true。如果为false的时候,无论什么情况下,都不会被重新启动,
                                     如果为unexpected,只有当进程的退出码不在下面的exitcodes里面定义的退 
                                     出码的时候,才会被自动重启。当为true的时候,只要子进程挂掉,将会被无
                                     条件的重启
    ;startsecs=1                   ; 这个选项是子进程启动多少秒之后,此时状态如果是running,则我们认为启
                                     动成功了
                                     默认值为1 。。非必须设置
    ;startretries=3                ; 当进程启动失败后,最大尝试启动的次数。。当超过3次后,supervisor将把
                                     此进程的状态置为FAIL
                                     默认值为3 。。非必须设置
    ;exitcodes=0,2                 ; 注意和上面的的autorestart=unexpected对应。。exitcodes里面的定义的
                                     退出码是expected的。
    ;stopsignal=QUIT               ; 进程停止信号,可以为TERM, HUP, INT, QUIT, KILL, USR1, or USR2等信号
                                      默认为TERM 。。当用设定的信号去干掉进程,退出码会被认为是expected
                                      非必须设置
    ;stopwaitsecs=10               ; 这个是当我们向子进程发送stopsignal信号后,到系统返回信息
                                     给supervisord,所等待的最大时间。 超过这个时间,supervisord会向该
                                     子进程发送一个强制kill的信号。
                                     默认为10秒。。非必须设置
    ;stopasgroup=false             ; 这个东西主要用于,supervisord管理的子进程,这个子进程本身还有
                                     子进程。那么我们如果仅仅干掉supervisord的子进程的话,子进程的子进程
                                     有可能会变成孤儿进程。所以咱们可以设置可个选项,把整个该子进程的
                                     整个进程组都干掉。 设置为true的话,一般killasgroup也会被设置为true。
                                     需要注意的是,该选项发送的是stop信号
                                     默认为false。。非必须设置。。
    ;killasgroup=false             ; 这个和上面的stopasgroup类似,不过发送的是kill信号
    ;user=chrism                   ; 如果supervisord是root启动,我们在这里设置这个非root用户,可以用来
                                     管理该program
                                     默认不设置。。。非必须设置项
    ;redirect_stderr=true          ; 如果为true,则stderr的日志会被写入stdout日志文件中
                                     默认为false,非必须设置
    ;stdout_logfile=/a/path        ; 子进程的stdout的日志路径,可以指定路径,AUTO,none等三个选项。
                                     设置为none的话,将没有日志产生。设置为AUTO的话,将随机找一个地方
                                     生成日志文件,而且当supervisord重新启动的时候,以前的日志文件会被
                                     清空。当 redirect_stderr=true的时候,sterr也会写进这个日志文件
    ;stdout_logfile_maxbytes=1MB   ; 日志文件最大大小,和[supervisord]中定义的一样。默认为50
    ;stdout_logfile_backups=10     ; 和[supervisord]定义的一样。默认10
    ;stdout_capture_maxbytes=1MB   ; 这个东西是设定capture管道的大小,当值不为0的时候,子进程可以从stdout
                                     发送信息,而supervisor可以根据信息,发送相应的event。
                                     默认为0,为0的时候表达关闭管道。。。非必须项
    ;stdout_events_enabled=false   ; 当设置为ture的时候,当子进程由stdout向文件描述符中写日志的时候,将
                                     触发supervisord发送PROCESS_LOG_STDOUT类型的event
                                     默认为false。。。非必须设置
    ;stderr_logfile=/a/path        ; 这个东西是设置stderr写的日志路径,当redirect_stderr=true。这个就不用
                                     设置了,设置了也是白搭。因为它会被写入stdout_logfile的同一个文件中
                                     默认为AUTO,也就是随便找个地存,supervisord重启被清空。。非必须设置
    ;stderr_logfile_maxbytes=1MB   ; 这个出现好几次了,就不重复了
    ;stderr_logfile_backups=10     ; 这个也是
    ;stderr_capture_maxbytes=1MB   ; 这个一样,和stdout_capture一样。 默认为0,关闭状态
    ;stderr_events_enabled=false   ; 这个也是一样,默认为false
    ;environment=A="1",B="2"       ; 这个是该子进程的环境变量,和别的子进程是不共享的
    ;serverurl=AUTO                ; override serverurl computation (childutils)
    ; The sample eventlistener section below shows all possible eventlistener ; subsection values. Create one or more 'real' eventlistener: sections to be ; able to handle event notifications sent by supervisord. ;[eventlistener:theeventlistenername] ;command=/bin/eventlistener ; the program (relative uses PATH, can take args) ;process_name=%(program_name)s ; process_name expr (default %(program_name)s) ;numprocs=1 ; number of processes copies to start (def 1) ;events=EVENT ; event notif. types to subscribe to (req'd) ;buffer_size=10 ; event buffer queue size (default 10) ;directory=/tmp ; directory to cwd to before exec (def no cwd) ;umask=022 ; umask for process (default None) ;priority=-1 ; the relative start priority (default -1) ;autostart=true ; start at supervisord start (default: true) ;startsecs=1 ; # of secs prog must stay up to be running (def. 1) ;startretries=3 ; max # of serial start failures when starting (default 3) ;autorestart=unexpected ; autorestart if exited after running (def: unexpected) ;exitcodes=0,2 ; 'expected' exit codes used with autorestart (default 0,2) ;stopsignal=QUIT ; signal used to kill process (default TERM) ;stopwaitsecs=10 ; max num secs to wait b4 SIGKILL (default 10) ;stopasgroup=false ; send stop signal to the UNIX process group (default false) ;killasgroup=false ; SIGKILL the UNIX process group (def false) ;user=chrism ; setuid to this UNIX account to run the program ;redirect_stderr=false ; redirect_stderr=true is not allowed for eventlisteners ;stdout_logfile=/a/path ; stdout log path, NONE for none; default AUTO ;stdout_logfile_maxbytes=1MB ; max # logfile bytes b4 rotation (default 50MB) ;stdout_logfile_backups=10 ; # of stdout logfile backups (0 means none, default 10) ;stdout_events_enabled=false ; emit events on stdout writes (default false) ;stderr_logfile=/a/path ; stderr log path, NONE for none; default AUTO ;stderr_logfile_maxbytes=1MB ; max # logfile bytes b4 rotation (default 50MB) ;stderr_logfile_backups=10 ; # of stderr logfile backups (0 means none, default 10) ;stderr_events_enabled=false ; emit events on stderr writes (default false)
    ;environment
    =A="1",B="2" ; process environment additions ;serverurl=AUTO ; override serverurl computation (childutils) ; The sample group section below shows all possible group values. Create one ; or more 'real' group: sections to create "heterogeneous" process groups. ;[group:thegroupname] ;programs=progname1,progname2 ; each refers to 'x' in [program:x] definitions ;priority=999 ; the relative start priority (default 999) ; The [include] section can just contain the "files" setting. This ; setting can list multiple files (separated by whitespace or ; newlines). It can also contain wildcards. The filenames are ; interpreted as relative to this file. Included files *cannot* ; include files themselves. ;[include] ;files = relative/directory/*.ini
    • 启动:
    1.supervisord  #直接启动
    2.supervisord -c /etc/supervisord.conf #指定配置文件启动服务
    [root@localhost tmp]# supervisord
    /usr/lib/python2.7/site-packages/supervisor/options.py:461: UserWarning: Supervisord is running as root and it is searching for its configuration file in default locations (including its current working directory); you probably want to specify a "-c" argument specifying an absolute path to a configuration file for improved security.
      'Supervisord is running as root and it is searching '
    Error: Another program is already listening on a port that one of our HTTP servers is configured to use.  Shut this program down first before starting supervisord.
    For help, use /usr/bin/supervisord -h

    ①【启动错误】如果报这个错是因为supervisord已经在运行了,

    ps -ef | grep supervisord 
    [root@localhost tmp]# ps -ef | grep supervisord 
    root      2886     1  0 16:07 ?        00:00:02 /usr/bin/python /usr/bin/supervisord
    #下面这行的意思是用户root在执行grep --color=auto
    supervisord的命令,不用管
    root 3076 2588 0 19:53 pts/0 00:00:00 grep --color=auto supervisord
    #杀掉supervisord服务
    kill -9 2886
    #再次启动服务
    root@localhost tmp]# supervisord
    #下面的提示是希望启动服务的时候指定具体的配置文件而非默认的,
    #当服务有几个不同的配置文件的时候,每次启动服务的时候可以根据业务需求选择使用的配置文件
    /usr/lib/python2.7/site-packages/supervisor/options.py:461: UserWarning: Supervisord is running as root and it is searching for its configuration file in default locations (including its current working directory); you probably want to specify a "-c" argument specifying an absolute path to a configuration file for improved security.
    'Supervisord is running as root and it is searching '
    #这个提示,每次重启都会提示这个,没有搞明白为什么,有什么影响
    Unlinking stale socket /tmp/supervisor.sock
    #可以执行下面的命令解决,
    sudo unlink /tmp/supervisor.sock

    ②【使用supervisorctl命令行报错】一开始supervisorctl没有配置好就启动服务了,更改配置后要重新启动supervisord服务才可以使用命令行

    error: <class 'socket.error'>, [Errno 111] Connection refused: file: /usr/lib64/python2.7/socket.py line: 571

    ③【直接kill掉supervisord之后又重启,子进程会出现异常】在关闭supervisord服务之前需要先手工关闭被supervisor启动的子进程。如果直接关掉supervisord服务,那么被管理的子进程变为孤儿进程,还存在,之后再重启supervisord,它会一直尝试启动子进程。supervisorctl status查到的pid一直在动态变化,其实就是在尝试启动被管理的服务。手工杀掉之前的孤儿进程才会正常

    [root@localhost ~]# netstat -nlp | grep 8007
    tcp6       0      0 :::8007                 :::*                    LISTEN      711/java            
    [root@localhost ~]# supervisorctl status
    f5_manage                        RUNNING   pid 791, uptime 0:00:04
    [root@localhost ~]# supervisorctl status
    f5_manage                        RUNNING   pid 861, uptime 0:00:05
    [root@localhost ~]# supervisorctl status
    f5_manage                        RUNNING   pid 885, uptime 0:00:02
    [root@localhost ~]# supervisorctl status
    f5_manage                        RUNNING   pid 885, uptime 0:00:05
    [root@localhost ~]# supervisorctl status
    f5_manage                        RUNNING   pid 885, uptime 0:00:08
    [root@localhost ~]# supervisorctl status
    f5_manage                        STARTING  
    [root@localhost ~]# supervisorctl status
    f5_manage RUNNING pid
    935, uptime 0:00:03 [root@localhost ~]# supervisorctl status f5_manage RUNNING pid 1006, uptime 0:00:03 [root@localhost ~]# netstat -nlp | grep 8007 tcp6 0 0 :::8007 :::* LISTEN 711/java

     [root@localhost ~]# kill -9 711
     [root@localhost ~]# netstat -nlp | grep 8007
     tcp6 0 0 :::8007 :::* LISTEN 2551/java
     [root@localhost ~]# netstat -nlp | grep 8007
     tcp6 0 0 :::8007 :::* LISTEN 2551/java
     [root@localhost ~]# netstat -nlp | grep 8007
     tcp6 0 0 :::8007 :::* LISTEN 2551/java
     [root@localhost ~]# supervisorctl status f5_manage
     f5_manage RUNNING pid 2551, uptime 0:00:30

    ps:正确的操作

    ①通过supervisorctl加载配置,重启

    # 载入最新的配置文件,停止原有进程并按新的配置启动、管理所有进程
    supervisorctl reload
    # 根据最新的配置文件,启动新配置或有改动的进程,配置没有改动的进程不会受影响而重启
    supervisorctl update

    ②通过supervisorctl先停掉所有的子进程再kill  supervisord以及重启 

    # 停止全部进程,注:start、restart、stop 都不会载入最新的配置文件
    supervisorctl stop all

    supervisord启动成功后,可以通过supervisorctl客户端控制进程,启动、停止、重启。运行supervisorctl命令,不加参数,会进入supervisor客户端的交互终端,并会列出当前所管理的所有进程

    • supervisorctl常用命令
    # 停止某一个进程,program_name 为 [program:x] 里的 x
    supervisorctl stop program_name
    # 启动某个进程
    supervisorctl start program_name
    # 重启某个进程
    supervisorctl restart program_name
    # 结束所有属于名为 groupworker 这个分组的进程 (start,restart 同理)
    supervisorctl stop groupworker:
    # 结束 groupworker:name1 这个进程 (start,restart 同理)
    supervisorctl stop groupworker:name1
    # 停止全部进程,注:start、restart、stop 都不会载入最新的配置文件
    supervisorctl stop all
    # 载入最新的配置文件,停止原有进程并按新的配置启动、管理所有进程
    supervisorctl reload
    # 根据最新的配置文件,启动新配置或有改动的进程,配置没有改动的进程不会受影响而重启
    supervisorctl update

    参考文章:

                      https://www.cnblogs.com/zhaoding/p/6257363.html

                      https://www.cnblogs.com/wswang/p/5795766.html

                      http://blog.51cto.com/lixcto/1539136

                      https://blog.csdn.net/xyang81/article/details/51555473

                      https://www.cnblogs.com/zhoujinyi/p/6073705.html

    官方文档:

                      http://supervisord.org/

  • 相关阅读:
    C#制作windows屏保实战
    创建一个可以修改不可以删除的文件夹或文件,windows目录和文件权限实测总结
    分享一下我用C#写的贪吃蛇和迷宫
    用C#做的汉诺塔游戏以及对汉诺塔递归的简单理解
    纪念一下即将逝去的flash,曾今的flash入门学习示例《别盯着我》C#版
    C#中关于变量的作用域不易理解的特例
    列出文件夹和遍历文件夹的区别
    怎样创建无法直接删除的文件夹--关于windows权限的迷思
    用C#写的后台整点报时工具
    用C#写差异文件备份工具
  • 原文地址:https://www.cnblogs.com/yy-cola/p/9513936.html
Copyright © 2011-2022 走看看