【Linux 应用编程】进程管理

zoukankan html css js c++ java

【Linux 应用编程】进程管理
基本概念

程序和进程的区别

程序是平台相关的二进制文件，只占用磁盘空间。编写完程序代码后，编译为可执行的二进制文件即可。

进程是运行中的程序，占用 CPU、内存等系统资源。

通过 Shell 命令，可以在终端启动进程，例如执行 ls 命令：
- 找到命令对应的二进制文件
- 使用 fork() 函数创建新的进程
- 在新创建的进程中调用 exec 函数组，加载命令对应的二进制文件，并从 main 函数开始执行
并发和并行

并发 concurrent：在一个时间段内，处理的请求总数。个数越多，并发越大。
并行 parallel：任意时刻能够同时处理的请求数。通常跟 CPU 内核数量相关。

Linux 进程的状态

Linux 的进程有以下 6 种状态：
- D：深度睡眠状态，不可中断，处于这种状态的进程不能响应异步信号
- R：进程处于运行态或就绪状态，只有在该状态的进程才可能在 CPU 上运行
- S：可中断的睡眠状态，处于这个状态的进程因为等待某种事件的发生而被挂起
- T：暂停状态或跟踪状态
- X：退出状态，进程即将被销毁
- Z：退出状态，进程成为僵尸进程
命令行控制进程

ps 命令

通过 ps aux 可以查看当前机器上的进程，其中 STAT 列的第一个字符就是进程的状态：
```
# ps aux
USER       PID %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root         1  0.0  0.2 190764  2140 ?        Ss    2018  12:35 /usr/lib/systemd/systemd --system --deserialize 20
root         2  0.0  0.0      0     0 ?        S     2018   0:00 [kthreadd]
root         3  0.0  0.0      0     0 ?        S     2018   1:24 [ksoftirqd/0]
```
kill 命令

kill 命令用于结束进程，语法如下：
```
kill [-s signal|-p] [-q sigval] [-a] [--] pid...
kill -l [signal]
```
执行 kill 命令，系统会发送一个 SIGTERM 信号给对应的进程，请求进程正常关闭。SIGTERM 是有可能会被阻塞的。kill -9 命令用于强制杀死进程，系统给对应程序发送的信号是 SIGKILL，即 exit。exit 信号不会被系统阻塞。
示例：
```
kill -9 11235
```
PID

每个进程在创建的时候，内核都会为之分配一个全局唯一的进程号。

getpid 和 getppid 函数

通过 getpid 函数可以获取当前进程的 PID。getppid 函数可以获取父进程的 PID。

通过 ps aux 可以查看进程的 PID，资源消耗情况，通过 ps -ef 可以查看当前进程及其父进程的 PID。通过 pstree 命令可以以树状关系查看所有进程。

函数原型：
```
#include <sys/types.h>
#include <unistd.h>

pid_t getpid(void);
pid_t getppid(void);
```
环境变量

除了通过 main 函数的第三个参数获取环境变量，还可以通过 environ 全局变量或 getenv() 函数来获取。

getenv 函数原型：
```
#include <stdlib.h>

char *getenv(const char *name);
char *secure_getenv(const char *name);
```
环境变量示例
```
#include <stdio.h>
#include <stdlib.h>

extern char** environ;

int main(int argc, char* argv[], char* env[])
{
    int i = 0;
    char* myenv = NULL;
    while(env[i])
    {
        printf("env[%d] is: %s
", i, env[i++]);
    }
    i = 0;
    while(environ[i])
        puts(environ[i++]);

    myenv = getenv("PATH");
    puts(myenv);
    return 0;
}
```
孤儿进程和僵尸进程

PCB（Process Control Block，进程控制块）是每个进程都有的数据结构，用于保存进程运行所需的信息，例如文件描述符表。

wait() 函数用来帮助父进程获取其子进程的退出状态。当进程退出时，内核为每一个进
程保存了退出状态信息。如果父进程未调用 wait() 函数，则子进程的退出信息将一直保存在内存中。

孤儿进程

Linux 中，每个进程在退出的时候，可以释放用户区空间，但是无法释放进程本身的 PCB 所占用的内存资源。PCB 必须由父进程释放。

父进程在创建子进程后退出，子进程变成孤儿进程。为防止内存泄漏，孤儿进程被 init 进程领养，init 进程变成孤儿进程的父进程。

下面示例中，父进程先退出：
```
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>

int main()
{
	pid_t pid = fork();
	
	if (pid == 0) 
	{
		printf("child pid is: %d, ppid is: %d
", getpid(), getppid());
		sleep(1);
		printf("child pid is: %d, ppid is: %d
", getpid(), getppid());
	}
	else if (pid > 0)
	{	
		sleep(0.5);
		printf("parent pid is: %d, ppid is: %d
", getpid(), getppid());
		printf("parent exit
");
	}
	return 0;
}
```
输出：
```
parent pid is: 3348, ppid is: 713
parent exit
child pid is: 3349, ppid is: 1
child pid is: 3349, ppid is: 1
```
僵尸进程

子进程退出了，父进程一直未调用 wait 或 waitpid 函数，子进程就变成了僵尸进程。

代码控制进程

进程入口函数 main

可执行的二进制文件，都是从 main 函数开始执行的。main 函数有 3 种原型定义：
```
int main();
int main(int argc, char *argv[]);
int main(int argc, char *argv[], char *env[]);
```
参数：
- argc：参数个数
- argv：参数数组，每个参数都是字符串
- env：环境变量数组，每个环境变量都是字符串
进程基本操作

注意，Shell 终端无法检测进程是否创建了子进程。在进程执行完毕后，Shell 会立即回到交互状态，此时如果子进程还在输出数据，会打印在 Shell 的命令提示符之后。可以在父进程中 sleep 一下。

创建进程

Linux 中用 fork() 函数创建新进程，函数原型如下：
```
#include<unistd.h>

pid_t fork(void);
```
返回值：
成功创建进程时，会对父子进程各返回一次，对父进程返回子进程的 PID，对子进程返回 0。通过条件分支语句可以分别进行不同处理。失败则返回小于 1 的错误码。

fork 函数执行的时候，会将当前正在运行的进程完整的复制一份，提供给子进程。子进程从 fork 函数之后开始执行。

创建多个子进程

通过 for 循环，可以创建多个子进程，只需要在每次 fork 之后判断如果是子进程则结束循环即可。通过循环下标可以判断当前子进程是第几次创建的：
```
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>

int main()
{
	int i = 0;
	int number = 5;
	pid_t pid;
	
	for (i = 0; i < number; i++)
	{
		pid = fork();
		if (pid == 0) break;
	}
	
	// 子进程
	if (i == 0) printf("first process, pid = %d
", getpid());
	if (i == 1) printf("second process, pid = %d
", getpid());
	//...
	
	// 父进程
	if (i == number) printf("parent process, pid = %d
", getpid());
	return 0;
}
```
终止进程

进程的终止分为两种：
- 正常终止：
  
  从 main() 函数中 return 返回，实际上也是调用的 exit() 函数
  
  调用 exit() 类函数
- 异常终止：
  
  调用 abort() 函数
  
  接收到终止信号
exit 函数原型如下：
```
#include <stdlib.h>

void exit(int status);
```
exit(0) 等价于 return 0。

exec 函数组

fork 函数可以复制一份父进程，得到的子进程跟父进程有完全一样的代码跟数据。之后两个进程各自执行，互不影响。

实际上我们通常需要子进程执行不同的代码，这时就需要通过 exec 函数加载代码段，并跳转到新代码段的 main 入口执行。

函数原型：
```
#include <unistd.h>

extern char **environ;

int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ..., char * const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execvpe(const char *file, char *const argv[], char *const envp[]);
```
exec 函数组是在 exec 上加 l、v、p、e 四个后缀形成的，这些函数作用相同，只是在参数列表上存在差别。
- 后缀 p：用文件名做参数，如果文件名中不含路径则会去 PATH 环境变量所指定的各个目录中搜索可执行文件。无后缀 p 则使用绝对路径名来指定可执行文件的位置。
- 后缀 e：表示可以传递一个指向环境字符串指针数组的指针，环境数组需要以 NULL 结束。而无此后缀的函数则使用调用进程中 environ 变量为新程序复制现有的环境。
- 后缀 l：用 list 形式来传递新程序的参数，传给新程序的所有参数以可变参数的形式传递，最后一个参数必须是 NULL。
- 后缀 v：用 vector 形式来传递新程序的参数，传给新程序的所有参数放入一个字
  符串数组中，数组以 NULL 结束。
返回值：exec 族函数报错时才有返回值 -1，否则无返回值。如果执行到后面的代码，就是出错了。

示例：
```
char* myenv[] = {"TEST=666", "HOME=/home/kika", NULL};
execle("home/kika/test", "hello", "world", myenv);
```
完整示例：
```
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>

int main()
{
	int pid = fork();
	if (pid > 0) {
		exit(0);
	} else if (pid == 0) {
		execle("home/kika/test", "hello", "world", myenv);
		perror("execle error");
		exit(-1);
	} else {
		perror("fork error");
	}
	return -1;
}
```
wait 和 waitpid 函数

通常，在父进程中调用 wait 函数，可以查看子进程的退出信息，让子进程撤单结束。wait 函数是阻塞式的，waitpid 可以设置为非阻塞的。父进程根据创建的子进程个数，在循环中通过 wait 函数逐个回收子进程。而 waitpid 函数则可以通过 PID 等待指定的子进程退出。

wait 函数调用一次只会回收一个子进程。多个子进程需要调用多次 wait。

函数原型：
```
#include <sys/types.h>
#include <sys/wait.h>

pid_t wait(int *status);
pid_t waitpid(pid_t pid, int *status, int options);
```
wait 参数：
- status：进程退出的原因。可以通过预定义的宏来检查：
  
  WIFEXITED(status)：若为正常终止子进程返回状态，则为真
  
  WEXITSTATUS(status)：获取子进程传给 exit 或 return 的参数
  
  WIFSIGNALED(status)：若为异常终止子进程返回状态，则为真
  
  WTERMSIG(status)：获取使子进程退出的信号
waitpid 参数：
- pid：用于设置 waitpid 工作方式。
  
  -1：等价于 wait，等待任意子进程退出
  
  0：等待组 ID 等于调用进程的组 ID 的任一子进程退出
  
  > 0：等待 PID 等于该数值的进程退出
  
  < -1：等待其组 ID 等于该数值的任一子进程退出
- options：用于设置 waitpid 是否阻塞执行。0 则阻塞，设为 WNOHANG 则非阻塞。
返回值：成功时返回退出子进程的 PID，没有子进程时返回 -1.

综合示例

创建三个子进程，分别运行自定义程序，shell 程序，未定义程序（段错误）。然后在父进程中通过 wait 回收所有子进程，并分别判断退出原因：
```
#include <unistd.h>
#include <stdio.h>
#include <fcntl.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <sys/stat.h>
#include <errno.h>

int main(int argc, char* argv[])
{
    int num = 3;
    int i;
    pid_t pid;
    for (i = 0; i < 3; i++) {
        pid = fork();
        if (pid == 0) break;
    }
    
    if (i == 0) {
        execlp("ps", "ps", "aux", NULL);
        perror("execlp ps error");
        exit(1);
    } else if (i == 1) {
        execl("/root/test/api/process/myls", "", NULL);
        perror("execl myls error");
        exit(1);
    } else if (i == 2) {
        execl("./error", "", NULL);
        perror("execl ./error");
        exit(1);
    } else {
        int status;
        pid_t pid;
        while (pid = wait(&status) != -1) {
            printf("children PID is: %d
", pid);
            if (WIFEXITED(status)) {
                printf("return value is: %d
", WEXITSTATUS(status));
            } else if (WIFSIGNALED(status)) {
                printf("died by signal: %d
", WTERMSIG(status));
            }
        }
    }
    return 0;
}
```
查看全文

相关阅读:
Entity Framework Extended 批量删除
 EntityFramework.Extended扩展用法
 Entity Framework Extended Library （EF扩展类库，支持批量更新、删除、合并多个查询等）
C#多线程实现方法——线程池(Thread Pool)
Entity Framework(code first)数据库初始化
 单表60亿记录等大数据场景的MySQL优化和运维之道
 pt-online-schema-change使用说明、限制与比较
 MySQL online ddl
mysqldump的流程
 innodb_max_dirty_pages_pct与检查点的关系

原文地址：https://www.cnblogs.com/kika/p/10851501.html

【Linux 应用编程】进程管理

基本概念

程序和进程的区别

并发和并行

Linux 进程的状态

命令行控制进程

ps 命令

kill 命令

PID

getpid 和 getppid 函数

环境变量

环境变量示例

孤儿进程和僵尸进程

孤儿进程

僵尸进程

代码控制进程

进程入口函数 main

进程基本操作

创建进程

创建多个子进程

终止进程

exec 函数组

wait 和 waitpid 函数

综合示例