Linux进阶教程丨第6章：监控与管理Linux进程

第6章：监控与管理Linux进程

一、Linux进程

定义：进程是已经启动的可执行程序在运行中的实例。

在Linux中，进程是由4部分组成分别是：

1. 已分配内存的地址空间

2. 安全属性

3. 程序代码的一个或者多个执行线程

4. 进程状态

而进程的环境包含三个方面，分别是：

1. 本地和全局变量

2. 当前调度上下文

3. 分配的系统资源

进程的生命周期：

当现有的（父）进程复制自己的地址空间（fork）来创建一个新的（子）进程。每个进程分配有一个唯一进程ID（PID），满足跟踪和安全性到底需要。PID和父进程ID（PPID）是新进程环境的元素。任何进程都可以创建子进程。所有进程都是第一个系统进程的后代。

通过fork例程，子进程继承安全性身份、过去和当前的文件描述符、端口和资源特权、环境变量，以及程序代码。然后，子进程可能exec其自己的程序代码。通常，父进程在子进程运行期间处于睡眠状态，设置一个在子进程完成时发出的请求。在退出的时候，子进程已经关闭或丢弃了气资源和环境，唯一剩下的资源被称为僵停，是进程表中的一个条目。父进程在子进程退出时收到信号而被唤醒，清理子条目的进程表，由此释放子进程的最后一个资源，然后，父进程继续执行自己的程序代码。

在多任务处理操作系统中，每个CPU在一个时间点上处理一个进程。在进程运行时，它对CPU时间和资源分配的直接要求会有变化。进程分配有一个状态，它会随着环境要求而改变。

下表提供了Linux的进程状态的说明。

当我们对系统进行故障排除时，了解内核如何与进程通信以及进程如何相互通信就变得尤为重要。在创建进程时，系统会为进程分配一个状态。top命令的s列或ps命令的stat列可以显示每个进程的状态。在单个CPU系统上，一个只能运行一个进程。可以看到多个状态为R的进程。然而，并非所有这些进程都在持续运行，其中一些处于等到状态。

使用top查看进程：

也可以使用信号暂停、停止、终止和中断进程。

ps命令可以列出当前的进程，这个命令可以提供详细的进程包括以下6个方面：

1. 用户标识符（UID）

2. 唯一进程识别符（PID）

3. CPU和已经花费的实时时间

4. 进程在各种位置上分配的内存数量

5. 进程stdout的位置（也称为控制终端）

6. 当前的进程状态

而aux则是ps命令中最常见的选项集，它可以显示无控制终端进内的所有进程。长列表（选项lax）则提供更多技术的详细信息，它可以通过避免查询用户来加快显示。

使用ps命令的aux选项查看进程：

使用ps命令的lax选项查看进程

默认情况下，如果我们不使用选项而运行ps，将选择具有与当前用户相同的有效用户ID（EUID）并于调用ps所处同一终端的所有关联。而方括号中的进程为调度的内核线程，僵停列为exiting或者defunct，在查看进程时，ps的输出只会显示一次，而top可以获得动态更新的进程显示。

二、中断进程

使用信号中断进程：

信号是传递至进程的软件中断，信号向执行中的程序报告事件。生成信号的事件可以是错误或外部事件（I/O请求或定时器过期），或者来自显式使用信号发送命令或键盘序列。

下表是基本进程管理信号：

每一个信号都有一个默认操作，以下是常见的信号：

终止：导致程序立即终止（退出）。

核心转储：导致程序保持内存镜像（核心转储），然后终止。

停止：导致程序停止操作（暂停），在等待继续（恢复）。

程序可以通过实施处理程序来响应预期的事件信号做准备，以忽略、替换或拓展信号的默认操作。

Kill命令可以根据PID编号向进程发送信号，虽然这个名称为kill，但该命令可用于发送任何信号，而不仅仅是终止程序的信号，我们可以使用kill -l命令列出所有信号的名称和编号。

使用kill -l查看编号：

使用pkill可以向一个或多个符合选项条件的进程发送信号。选择条件可以是命令名称、特定用户拥有的进程，或所有系统范围进程。Pkill命令包含以下高级选择条件：

命令：具有模式匹配的命令名称的进程。

UID：由某一Linux用户账户拥有的进程，无论是有效的还是真实的。

GID：由某一Linux组账户拥有的进程，无论是有效的还是真实的。

父级：特定父进程的子进程。

终端：运行于特定控制终端的进程。

查看pkill进程：

三、监控进程活动和实时进程监控

负载平均值：

负载平均值是Linux内核提供的一种度量方式，它可以简单地表示一段时间内感知的系统负载，我们可以用它来粗略衡量待处理的系统资源请求数量，并确定系统负载是随时间增加还是减少。

Linux负载平均值计算：

负载平均值代表一段时间内感知的系统负载，通过报告CPU上准备运行的进程数以及等待磁盘或网络I/O完成的进程数，Linux可以确定负载平均值。

负载数基本上是根据准备运行的进程数（进程状态为R）和等待I/O完成的进程数（进程状态为D）而得到的。

一些unix系统仅考虑CPU使用率或运行队列长度来指示系统负载。Linux还包含磁盘或网络利用率，因为它们与CPU负载一样会对系统性能产生重大影响。遇到负载平均值很高但CPU活动很低时，需要我们检查磁盘和网络活动。

Uptime命令是显示当前负载平均值的一种方法，它可以显示当前时间，计算机启动时长，运行的用户会话数以及当前的负载平均值。

使用uptime命令查看：

op程序是系统进程的动态视图，显示一个摘要标题，以及与ps信息类似的进程或线程列表。与静态的ps输出不同，top可配置的间隔持续刷新，而且也提供重新排列，排序和突出显示的功能。用户配置可以保存，变为永久。

默认输出列可以从其他资源工具识别：

1.进程ID（PID）

2.用户名称（USER）是进程所有者

3.虚拟内存（VIRT）是进程正在使用的所有内存，包括常驻集合，共享库，以及任何映射或交换的内存页

4.常驻内存（RES）是进程的物理内存，包括任何驻留的共享对象

5.进程状态（S）显示为：

D=不可中断睡眠

R=运行中或可运行

S=睡眠中

T=已停止或已跟踪

Z=僵停

6.CPU时间（TIME）是进程启动以来总的处理时间，可以切换为包含所有过去子进程的累计时间。

7.进程命令名称（COMMAND）

在top中的基本击键操作：

以上就是这次所分享的命令。