Intro
当我们编写服务器代码时,为了让自己的服务器在意外崩溃时能够及时的重启,软件看门狗就显示出它的作用了,该看门狗进程是通过fork一个子进程(业务进程),父进程一旦捕获到了子进程的结束信号就重新再fork一个子进程来实现的,下面将完整代码贴上。
/************************************************
* 该例程讲解Linux软件看门狗的优雅编写方法
*
* 编写WatchDog有很多种方式:
* a.一个WatchDog.sh脚本程序
* b.一个WatchDog.exe可执行程序
* c.一个可执行程序里面包含WatchDog
*
* 本例程就是使用的c方式,通过父进程监控子进程的运行状态来实现的
* 其中父进程就是子进程(具体的任务进程)的WatchDog
************************************************/
#include <unistd.h>
#include <signal.h>
#include <sys/wait.h>
#include <errno.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <assert.h>
void childProcessFunc()
{
int i = 0;
while (true)
{
++i;
printf("i: %d, pid: %d, ppid: %d
", i, getpid(), getppid());
if (i == 10)
{
// 子进程主动结束
//exit(0);
char* p = NULL;
*p = 1;
}
sleep(1);
}
}
void forkChildProcess(int)
{
int status = 0;
// 等待子进程中断或终止,释放子进程资源
// 否则死掉的子进程会变成僵尸进程
int pid = wait(&status);
if (pid < 0)
{
printf("error: %s
", strerror(errno));
return;
}
// 如果子进程是由于某种信号退出的,捕获该信号
if (WIFSIGNALED(status))
{
int signalNum = WTERMSIG(status);
printf("Child process was killed by signal num: %d
", signalNum);
}
// 检测是否生成了core文件
if (WCOREDUMP(status))
{
printf("Child process core dump file generated
");
}
// 等待3秒钟重新启动子进程
sleep(3);
pid = fork();
if (pid == 0)
{
printf("Fork new child process
");
childProcessFunc();
}
}
bool initWatchDog()
{
int pid = fork();
if (pid)
{
// 父进程一直监视子进程的运行状态
while (true)
{
// 捕获子进程结束信号
assert(signal(SIGCHLD, forkChildProcess) != SIG_ERR);
// 父进程挂起,当有信号来时被唤醒
pause();
}
}
else if (pid < 0)
{
return false;
}
return true;
}
int main()
{
printf("Main pid: %d
", getpid());
// 初始化看门狗进程
bool ret = initWatchDog();
if (!ret)
{
printf("Init watch dog failed
");
return 1;
}
printf("Init watch dog success...
");
// 运行子进程代码
childProcessFunc();
return 0;
}
该例子的github地址:https://github.com/chxuan/samples/blob/master/WatchDog/WatchDog.cpp