Dameon进程又被称做守护进程,一般来说他有以下2个特点:
1.生命周期非常长,一旦启动,一般不会终止,直到系统推出,不过dameon进程可以通过stop或者发送信号将其杀死
2.在后台执行,不跟任何控制终端关联,终端信号比如:SIGINT,SIGQUIT,SIGTSTP,以及关闭终端都不会影响deamon
如何编写Daemon进程,需要遵循以下规则:
(1)执行fork()函数,父进程退出,子进程继续
执行这一步,原因有二:
·父进程有可能是进程组的组长(在命令行启动的情况下),从而不能够执行后面要执行的setsid函数,子进程继承了父进程的进程组ID,并且拥有自己的进程ID,一定不会是进程组的组长,所以子进程一定可以执行后面要执行的setsid函数。
·如果daemon是从终端命令行启动的,那么父进程退出会被shell检测到,shell会显示shell提示符,让子进程在后台执行。
(2)子进程执行如下三个步骤,以摆脱与环境的关系
1)修改进程的当前目录为根目录(/)。
这样做是有原因的,因为daemon一直在运行,如果当前工作路径上包含有根文件系统以外的其他文件系统,那么这些文件系统将无法卸载。因此,常规是将当前工作目录切换成根目录,当然也可以是其他目录,只要确保该目录所在的文件系统不会被卸载即可。
chdir("/")
2)调用setsid函数。这个函数的目的是切断与控制终端的所有关系,并且创建一个新的会话。
这一步比较关键,因为这一步确保了子进程不再归属于控制终端所关联的会话。因此无论终端是否发送SIGINT、SIGQUIT或SIGTSTP信号,也无论终端是否断开,都与要创建的daemon进程无关,不会影响到daemon进程的继续执行。
3)设置文件模式创建掩码为0。
umask(0)
这是为了让daemon进程创建的文件权限属性跟shell脱离关系,因为默认情况下,进程的umask来源于父进程shell的umask.如果不执行umask(0),那么父进程shell的umask就会影响daemon进程的umask.如果用户改变了shell的umask,那么也就改变了dameon的umask,就会使得daemon进程每次执行的umask信息可能不一致
(3)再次执行fork,父进程退出,子进程继续
执行完前面两步之后,可以说已经比较圆满了:新建会话,进程是会话的首进程,也是进程组的首进程。进程ID、进程组ID和会话ID,三者的值相同,进程和终端无关联。那么这里为何还要再执行一次fork函数呢?
原因是,daemon进程有可能会打开一个终端设备,即daemon进程可能会根据需要,执行类似如下的代码:
int fd = open("/dev/console", O_RDWR);
这个打开的终端设备是否会成为daemon进程的控制终端,取决于两点:
·daemon进程是不是会话的首进程。
·系统实现。(BSD风格的实现不会成为daemon进程的控制终端,但是POSIX标准说这由具体实现来决定)。
既然如此,为了确保万无一失,只有确保daemon进程不是会话的首进程,才能保证打开的终端设备不会自动成为控制终端。因此,不得不执行第二次fork,fork之后,父进程退出,子进程继续。这时,子进程不再是会话的首进程,也不是进程组的首进程了。
(4)关闭标准输入(stdin)、标准输出(stdout)和标准错误(stderr)
因为文件描述符0、1和2指向的就是控制终端。daemon进程已经不再与任意控制终端相关联,因此这三者都没有意义。一般来讲,关闭了之后,会打开/dev/null,并执行dup2函数,将0、1和2重定向到/dev/null。这个重定向是有意义的,防止了后面的程序在文件描述符0、1和2上执行I/O库函数而导致报错。
至此,即完成了daemon进程的创建,进程可以开始自己真正的工作了。
上述步骤比较繁琐,对于C语言而言,glibc提供了daemon函数,从而帮我们将程序转化成daemon进程。
#include <unistd.h>
int daemon(int nochdir, int noclose);
该函数有两个入参,分别控制一种行为,具体如下。
其中的nochdir,用来控制是否将当前工作目录切换到根目录。
·0:将当前工作目录切换到/。
·1:保持当前工作目录不变。
而noclose,用来控制是否将标准输入、标准输出和标准错误重定向到/dev/null。
·0:将标准输入、标准输出和标准错误重定向到/dev/null。
·1:保持标准输入、标准输出和标准错误不变。
一般情况下,这两个入参都要为0。
ret = daemon(0,0)
成功时,daemon函数返回0;失败时,返回-1,并置errno。因为daemon函数内部会调用fork函数和setsid函数,所以出错时errno可以查看fork函数和setsid函数的出错情形。
glibc的daemon函数做的事情,和前面讨论的大体一致,但是做得并不彻底,没有执行第二次的fork。
进程的终止
在不考虑线程的情况下,进程的退出有以下5种方式。
正常退出有3种:
·从main函数return返回
·调用exit
·调用_exit
异常退出有两种:
·调用abort
·接收到信号,由信号终止
_exit函数的接口定义如下:
#include <unistd.h>
void _exit(int status);
用户调用_exit函数,本质上是调用exit_group系统调用。这点在前面已经详细介绍过,在此就不再赘述了。
exit函数
exit函数更常见一些,其接口定义如下:
#include <stdlib.h>
void exit(int status);
exit()函数的最后也会调用_exit()函数,但是exit在调用_exit之前,还做了其他工作:
1)执行用户通过调用atexit函数或on_exit定义的清理函数。
2)关闭所有打开的流(stream),所有缓冲的数据均被写入(flush),通过tmpfile创建的临时文件都会被删除。
3)调用_exit。
图4-11给出了exit函数和_exit函数的差异。
下面介绍exit函数和_exit函数的不同之处。
首先是exit函数会执行用户注册的清理函数。用户可以通过调用atexit()函数或on_exit()函数来定义清理函数。这些清理函数在调用return或调用exit时会被执行。执行顺序与函数注册的顺序相反。当进程收到致命信号而退出时,注册的清理函数不会被执行;当进程调用_exit退出时,注册的清理函数不会被执行;当执行到某个清理函数时,若收到致命信号或清理函数调用了_exit()函数,那么该清理函数不会返回,从而导致排在后面的需要执行的清理函数都会被丢弃。
其次是exit函数会冲刷(flush)标准I/O库的缓冲并关闭流。glibc提供的很多与I/O相关的函数都提供了缓冲区,用于缓存大块数据。
缓冲有三种方式:无缓冲(_IONBF)、行缓冲(_IOLBF)和全缓冲(_IOFBF)。
·无缓冲:就是没有缓冲区,每次调用stdio库函数都会立刻调用read/write系统调用。
·行缓冲:对于输出流,收到换行符之前,一律缓冲数据,除非缓冲区满了。对于输入流,每次读取一行数据。
·全缓冲:就是缓冲区满之前,不会调用read/write系统调用来进行读写操作。
对于后两种缓冲,可能会出现这种情况:进程退出时,缓冲区里面可能还有未冲刷的数据。如果不冲刷缓冲区,缓冲区的数据就会丢失。比如行缓冲迟迟没有等到换行符,又或者全缓冲没有等到缓冲区满。尤其是后者,很容易出现,因为glibc的缓冲区默认是8192字节。exit函数在关闭流之前,会冲刷缓冲区的数据,确保缓冲区里的数据不会丢失。
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
void foo()
{
fprintf(stderr,"foo says bye. ");
}
void bar()
{
fprintf(stderr,"bar says bye. ");
}
int main(int argc, char **argv)
{
atexit(foo);
atexit(bar);
fprintf(stdout,"Oops ... forgot a newline!");
sleep(2);
if (argc > 1 && strcmp(argv[1],"exit") == 0)
exit(0);
if (argc > 1 && strcmp(argv[1],"_exit") == 0)
_exit(0);
return 0;
- }
注意上面的示例代码,fprintf打印的字符串是没有换行符的,对于标准输出流stdout,采用的是行缓冲,收到换行符之前是不会有输出的。输出情况如下:
manu@manu-hacks:exit$ ./test exit //调用exit结束,输出了缓冲区的字符
bar says bye.
foo says bye.
Oops ... forgot a newline!manu@manu-hacks:exit$ //调用return 输出了缓冲区字符
manu@manu-hacks:exit$
manu@manu-hacks:exit$ ./test
bar says bye.
foo says bye.
Oops ... forgot a newline!manu@manu-hacks:exit$ //直接调用_exit没有输出缓冲区的字符
manu@manu-hacks:exit$
manu@manu-hacks:exit$ ./test _exit
manu@manu-hacks:~/code/self/c/exit$
尽管缓冲区里的数据没有等到换行符,但是无论是调用return返回还是调用exit返回,缓冲区里的数据都会被冲刷,“Oops...forgot a newline!”都会被输出。因为exit()函数会负责此事。从测试代码的输出也可以看出,exit()函数首先执行的是用户注册的清理函数,然后才执行了缓冲区的冲刷。
第三,存在临时文件,exit函数会负责将临时文件删除.
exit函数的最后调用了_exit()函数,最终殊途同归,走向内核清理。
return退出
return是一种更常见的终止进程的方法。执行return(n)等同于执行exit(n),因为调用main()的运行时函数会将main的返回值当作exit的参数。