本文是 i 春秋作家「xiehudie」表哥分享的技术文章,旨在为大家提供更多的学习方法与技能技巧,文章仅供学习参考。本套Linux进阶教程共分为14章,欢迎大家前来系统学习。
前期回顾>>
第6章:监控与管理Linux进程
一、Linux进程
定义:进程是已经启动的可执行程序在运行中的实例。
在Linux中,进程是由4部分组成分别是:
1. 已分配内存的地址空间
2. 安全属性
3. 程序代码的一个或者多个执行线程
4. 进程状态
而进程的环境包含三个方面,分别是:
1. 本地和全局变量
2. 当前调度上下文
3. 分配的系统资源
进程的生命周期:
当现有的(父)进程复制自己的地址空间(fork)来创建一个新的(子)进程。每个进程分配有一个唯一进程ID(PID),满足跟踪和安全性到底需要。PID和父进程ID(PPID)是新进程环境的元素。任何进程都可以创建子进程。所有进程都是第一个系统进程的后代。
通过fork例程,子进程继承安全性身份、过去和当前的文件描述符、端口和资源特权、环境变量,以及程序代码。然后,子进程可能exec其自己的程序代码。通常,父进程在子进程运行期间处于睡眠状态,设置一个在子进程完成时发出的请求。在退出的时候,子进程已经关闭或丢弃了气资源和环境,唯一剩下的资源被称为僵停,是进程表中的一个条目。父进程在子进程退出时收到信号而被唤醒,清理子条目的进程表,由此释放子进程的最后一个资源,然后,父进程继续执行自己的程序代码。
在多任务处理操作系统中,每个CPU在一个时间点上处理一个进程。在进程运行时,它对CPU时间和资源分配的直接要求会有变化。进程分配有一个状态,它会随着环境要求而改变。
下表提供了Linux的进程状态的说明。
当我们对系统进行故障排除时,了解内核如何与进程通信以及进程如何相互通信就变得尤为重要。在创建进程时,系统会为进程分配一个状态。top命令的s列或ps命令的stat列可以显示每个进程的状态。在单个CPU系统上,一个只能运行一个进程。可以看到多个状态为R的进程。然而,并非所有这些进程都在持续运行,其中一些处于等到状态。
使用top查看进程:
也可以使用信号暂停、停止、终止和中断进程。
ps命令可以列出当前的进程,这个命令可以提供详细的进程包括以下6个方面:
1. 用户标识符(UID)
2. 唯一进程识别符(PID)
3. CPU和已经花费的实时时间
4. 进程在各种位置上分配的内存数量
5. 进程stdout的位置(也称为控制终端)
6. 当前的进程状态
而aux则是ps命令中最常见的选项集,它可以显示无控制终端进内的所有进程。长列表(选项lax)则提供更多技术的详细信息,它可以通过避免查询用户来加快显示。
使用ps命令的aux选项查看进程:
使用ps命令的lax选项查看进程
默认情况下,如果我们不使用选项而运行ps,将选择具有与当前用户相同的有效用户ID(EUID)并于调用ps所处同一终端的所有关联。而方括号中的进程为调度的内核线程,僵停列为exiting或者defunct,在查看进程时,ps的输出只会显示一次,而top可以获得动态更新的进程显示。
二、中断进程
使用信号中断进程:
信号是传递至进程的软件中断,信号向执行中的程序报告事件。生成信号的事件可以是错误或外部事件(I/O请求或定时器过期),或者来自显式使用信号发送命令或键盘序列。
下表是基本进程管理信号:
每一个信号都有一个默认操作,以下是常见的信号:
终止:导致程序立即终止(退出)。
核心转储:导致程序保持内存镜像(核心转储),然后终止。
停止:导致程序停止操作(暂停),在等待继续(恢复)。
程序可以通过实施处理程序来响应预期的事件信号做准备,以忽略、替换或拓展信号的默认操作。
Kill命令可以根据PID编号向进程发送信号,虽然这个名称为kill,但该命令可用于发送任何信号,而不仅仅是终止程序的信号,我们可以使用kill -l命令列出所有信号的名称和编号。
使用kill -l查看编号:
使用pkill可以向一个或多个符合选项条件的进程发送信号。选择条件可以是命令名称、特定用户拥有的进程,或所有系统范围进程。Pkill命令包含以下高级选择条件:
命令:具有模式匹配的命令名称的进程。
UID:由某一Linux用户账户拥有的进程,无论是有效的还是真实的。
GID:由某一Linux组账户拥有的进程,无论是有效的还是真实的。
父级:特定父进程的子进程。
终端:运行于特定控制终端的进程。
查看pkill进程:
三、监控进程活动和实时进程监控
负载平均值:
负载平均值是Linux内核提供的一种度量方式,它可以简单地表示一段时间内感知的系统负载,我们可以用它来粗略衡量待处理的系统资源请求数量,并确定系统负载是随时间增加还是减少。
Linux负载平均值计算:
负载平均值代表一段时间内感知的系统负载,通过报告CPU上准备运行的进程数以及等待磁盘或网络I/O完成的进程数,Linux可以确定负载平均值。
负载数基本上是根据准备运行的进程数(进程状态为R)和等待I/O完成的进程数(进程状态为D)而得到的。
一些unix系统仅考虑CPU使用率或运行队列长度来指示系统负载。Linux还包含磁盘或网络利用率,因为它们与CPU负载一样会对系统性能产生重大影响。遇到负载平均值很高但CPU活动很低时,需要我们检查磁盘和网络活动。
Uptime命令是显示当前负载平均值的一种方法,它可以显示当前时间,计算机启动时长,运行的用户会话数以及当前的负载平均值。
使用uptime命令查看:
op程序是系统进程的动态视图,显示一个摘要标题,以及与ps信息类似的进程或线程列表。与静态的ps输出不同,top可配置的间隔持续刷新,而且也提供重新排列,排序和突出显示的功能。用户配置可以保存,变为永久。
默认输出列可以从其他资源工具识别:
1.进程ID(PID)
2.用户名称(USER)是进程所有者
3.虚拟内存(VIRT)是进程正在使用的所有内存,包括常驻集合,共享库,以及任何映射或交换的内存页
4.常驻内存(RES)是进程的物理内存,包括任何驻留的共享对象
5.进程状态(S)显示为:
D=不可中断睡眠
R=运行中或可运行
S=睡眠中
T=已停止或已跟踪
Z=僵停
6.CPU时间(TIME)是进程启动以来总的处理时间,可以切换为包含所有过去子进程的累计时间。
7.进程命令名称(COMMAND)
在top中的基本击键操作:
以上就是这次所分享的命令。