内核的公用
1 进程管理、文件系统、网络功能、内存管理、驱动程序、安全功能等
进程简介
1 运行中的程序的一个副本,是被载入内存的一个指令集合 2 进程ID(Process ID,PID)号码被用来标记各个进程 3 UID、GID、和SELinux语境决定对文件系统的存取和访问权限 4 通常从执行进程的用户来继承 5 存在生命周期
进程状态
1 运行态:running 2 就绪态:ready 3 睡眠态: 4 可中断:interruptable 5 不可中断:uninterruptable 6 停止态:stopped,暂停于内存,但不会被调度,除非手动启动 7 僵死态:zombie,结束进程,父进程结束前,子进程不关闭(异常进程)
进程分类
1 CPU-Bound:CPU密集型,非交互 (大量的CPU运算) 2 IO-Bound:IO密集型,交互 (大量的磁盘读写)
Linux系统状态的查看及管理工具
1 pstree, ps, pidof,top,pmap, vmstat, dstat, kill, pkill, job, bg, fg, nohup
pstree命令
1 pstree display a tree of processes 显示进程树 2 pstree -p:显示更详细的线程信息
ps命令
1 Linux系统各进程的相关信息均保存在/proc/PID目录下的各文件中 2 ps默认显示当前终端的进程,和当前终端开启的进程列表 3 ps [OPTION]... 4 支持三种选项: 5 UNIX选项 如-A -e 6 BSD选项 如a 7 GNU选项 如--help 8 选项:默认显示当前终端中的进程 9 a 选项包括所有终端中的进程 10 x 选项包括不链接终端的进程(和终端无关的) 11 u 选项显示进程所有者的信息 12 f 选项显示进程树,相当于 --forest 13 k|--sort 属性 对属性排序,属性前加- 表示倒序 14 o 属性… 选项显示定制的信息 pid、cmd、%cpu、%mem 15 L 显示支持的属性列表 16 ps常见选项 17 -C cmdlist 指定命令,多个命令用,分隔 18 -L 显示线程 19 -e: 显示所有进程,相当于-A 20 -f: 显示完整格式程序信息 21 -F: 显示更完整格式的进程信息 22 -H: 以进程层级格式显示进程相关信息 23 -u userlist 指定有效的用户ID或名称 24 -U userlist 指定真正的用户ID或名称 25 -g gid或groupname 指定有效的gid或组名称 26 -G gid或groupname 指定真正的gid或组名称 27 -p pid 显示指pid的进程 28 --ppid pid 显示属于pid的子进程 29 ps输出属性 30 VSZ: Virtual memory SiZe,虚拟内存集,线性内存 31 RSS: ReSident Size, 常驻内存集 32 STAT:进程状态 33 R:running 运行 34 S: interruptable sleeping 可中断 35 D: uninterruptable sleeping 不可中断 36 T: stopped 停止 37 Z: zombie 僵尸 38 僵尸状态的处理方法因为杀掉子进程是杀不掉的本身已经死了,可以通过杀掉父进程 39 来解决僵尸状态下的进程 40 +: 前台进程 41 l: 多线程进程 42 L:内存分页并带锁 43 N:低优先级进程 44 <: 高优先级进程 45 s: session leader,会话(子进程)发起者 46 ps示例 47 查询你拥有的所有进程 48 ps -x 49 显示指定用户名(RUID)或用户ID的进程 50 ps -fU apache 51 ps -fU 48 52 显示指定用户名(EUID)或用户ID的进程 53 ps -fu wang 54 ps -fu 1000 55 查看以root用户权限(实际和有效ID)运行的每个进程 56 ps -U root -u root 57 列出某个组拥有的所有进程(实际组ID:RGID或名称) 58 ps -fG nginx 59 列出有效组名称(或会话)所拥有的所有进程 60 ps -fg mysql 61 ps -fg 27 62 显示指定的进程ID对应的进程 63 ps -fp 1234 64 以父进程ID来显示其下所有的进程,如显示父进程为1234的所有进程 65 ps -f --ppid 1234 66 显示指定PID的多个进程 67 ps -fp 1204,1239,1263 68 要按tty显示所属进程 69 ps -ft pts/0 70 以进程树显示系统中的进程如何相互链接 71 ps -e --forest 72 以进程树显示指定的进程 73 ps -f --forest -C sshd 74 ps -ef --forest | grep -v grep | grep sshd 75 要显示一个进程的所有线程,将显示LWP(轻量级进程)以及NLWP(轻量级进程数)列 76 ps -fL -C nginx 77 要列出所有格式说明符 78 ps L 79 查看进程的PID,PPID,用户名和命令 80 ps -eo pid,ppid,user,cmd 81 自定义格式显示文件系统组,ni值开始时间和进程的时间 82 ps -p 1234 -o pid,ppid,fgroup,ni,lstart,etime 83 使用其PID查找进程名称: 84 ps -p 1244 -o comm= 85 要以其名称选择特定进程,显示其所有子进程 86 ps -C sshd,bash 87 查找指定进程名所有的所属PID,在编写需要从std输出或文件读取PID的脚本时这个参数很有用 88 ps -C httpd,sshd -o pid= 89 检查一个进程的执行时间 90 ps -eo comm,etime,user | grep nginx 91 查找占用最多内存和CPU的进程 92 ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%mem | head 93 ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%cpu | head 94 显示安全信息 95 ps -eM 96 ps --context 97 使用以下命令以用户定义的格式显示安全信息 98 ps -eo euser,ruser,suser,fuser,f,comm,label 99 使用watch实用程序执行重复的输出以实现对就程进行实时的监视,如下面的命令显示每秒钟的监视 100 watch -n 1 'ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%mem | head'
uptime命令
1 显示当前时间,系统已启动的时间、当前上线人数,系统平均负载(1、5、10分钟的平均负载,一般不会超过1) 2 系统平均负载: 3 指在特定时间间隔内运行队列中的平均进程数 4 通常每个CPU内核的当前活动进程数不大于3,那么系统的性能良好。如果每 5 个CPU内核的任务数大于5,那么此主机的性能有严重问题 6 如果linux主机是1个双核CPU,当Load Average 为6的时候说明机器已经被充分使用
top命令
1 top:有许多内置命令 2 top:显示当前进程各个资源的使用情况动态显示 3 排序: 4 P:以占据的CPU百分比,%CPU 5 M:占据内存百分比,%MEM 6 T:累积占据CPU时长,TIME+ 7 首部信息显示: 8 uptime信息:l命令 9 tasks及cpu信息:t命令 10 cpu分别显示:1 (数字) 11 memory信息:m命令 12 退出命令:q 13 修改刷新时间间隔:s 14 终止指定进程:k 15 保存文件:W 16 添加颜色:Z 17 标注:b 18 栏位信息简介 19 us:用户空间 20 sy:内核空间 21 ni:调整nice时间 22 id:空闲 23 wa:等待IO时间 24 hi:硬中断 25 si:软中断(模式切换) 26 st:虚拟机偷走的时间 27 选项: 28 -d # 指定刷新时间间隔,默认为3秒 29 -b 全部显示所有进程 30 -n # 刷新多少次后退出 31 -H 线程模式,示例:top -H -p `pidof mysqld`
内存工具
1 vmstat命令:虚拟内存信息 2 vmstat [options] [delay [count]] 3 vmstat 2 5 4 iostat:统计CPU和设备IO信息 5 示例:iostat 1 10 6 pmap命令:进程对应的内存映射 (可以了解进程占用内存的细节) 7 pmap [options] pid [...] 8 -x: 显示详细格式的信息 9 示例:pmap 1
10 pmap `pidof dd`:显示进程占用内存的情况 11 另外一种实现 12 cat /proc/PID/maps
iotop工具
1 otop :专门看磁盘IO的,查看进程占用IO的情况 2 iotop命令是一个用来监视磁盘I/O使用状况的top类工具iotop具有与top相似的UI,其中包括 3 PID、用户、I/O、进程等相关信息,可查看每个进程是如何使用IO 4 iotop输出 5 第一行:Read和Write速率总计 6 第二行:实际的Read和Write速率 7 第三行:参数如下: 8 线程ID(按p切换为进程ID) 9 优先级 10 用户 11 磁盘读速率 12 磁盘写速率 13 swap交换百分比 14 IO等待所占的百分比 15 线程/进程命令 16 iotop常用参数 17 -o, --only只显示正在产生I/O的进程或线程,除了传参,可以在运行过程中按o生效 18 -b, --batch非交互模式,一般用来记录日志 19 -n NUM, --iter=NUM设置监测的次数,默认无限。在非交互模式下很有用 20 -d SEC, --delay=SEC设置每次监测的间隔,默认1秒,接受非整形数据例如1.1 21 -p PID, --pid=PID指定监测的进程/线程 22 -u USER, --user=USER指定监测某个用户产生的I/O 23 -P, --processes仅显示进程,默认iotop显示所有线程 24 -a, --accumulated显示累积的I/O,而不是带宽 25 -k, --kilobytes使用kB单位,而不是对人友好的单位。在非交互模式下,脚本编程有用 26 iotop常用参数和快捷键 27 -t, --time 加上时间戳,非交互非模式 28 -q, --quiet 禁止头几行,非交互模式,有三种指定方式 29 -q 只在第一次监测时显示列名 30 -qq 永远不显示列名 31 -qqq 永远不显示I/O汇总 32 交互按键 33 left和right方向键:改变排序 34 r:反向排序 35 o:切换至选项--only 36 p:切换至--processes选项 37 a:切换至--accumulated选项 38 q:退出 39 i:改变线程的优先级
dstat工具
1 dstat命令:系统资源统计,代替vmstat,iostat 2 dstat [-afv] [options..] [delay [count]] 3 -c 显示cpu相关信息 4 -C #,#,...,total 5 -d 显示disk相关信息 6 -D total,sda,sdb,... 7 -g 显示page相关统计数据 8 -m 显示memory相关统计数据 9 -n 显示network相关统计数据 10 -p 显示process相关统计数据 11 -r 显示io请求相关的统计数据 12 -s 显示swapped相关的统计数据 13 --tcp 14 --udp 15 --unix 16 --raw 17 --socket 18 --ipc 19 --top-cpu:显示最占用CPU的进程 20 --top-io: 显示最占用io的进程 21 --top-mem: 显示最占用内存的进程 22 --top-latency: 显示延迟最大的进程 23 ifstat:监控网卡的
lsof工具
1 lsof (查看进程使用的一些情况,比如说打开文件,重要的是当利用一些进程正在访问 2 文件,比如说不小心给删除了,用这个工具可以把删除的文件找回来)俗称瑞士军刀 3 lsof:list open files查看当前系统文件的工具。在linux环境下,一切皆文件, 4 用户通过文件不仅可以访问常规数据,还可以访问网络连接和硬件如传输控制 5 协议 (TCP) 和用户数据报协议 (UDP)套接字等,系统在后台都为该应用程序分 6 配了一个文件描述符 7 命令参数 8 -a:列出打开文件存在的进程 9 -c<进程名>:列出指定进程所打开的文件 10 -g:列出GID号进程详情 11 -d<文件号>:列出占用该文件号的进程 12 +d<目录>:列出目录下被打开的文件 13 +D<目录>:递归列出目录下被打开的文件 14 -n<目录>:列出使用NFS的文件 15 -i<条件>:列出符合条件的进程(4、6、协议、:端口、 @ip ) 16 -p<进程号>:列出指定进程号所打开的文件 17 -u:列出UID号进程详情 18 -h:显示帮助信息 19 -v:显示版本信息。 20 -n: 不反向解析网络名字 21 lsof示例 22 进程管理 23 查看由登陆用户启动而非系统启动的进程 24 lsof /dev/pts1 25 指定进程号,可以查看该进程打开的文件 26 lsof -p 9527 27 文件管理 28 查看指定程序打开的文件 29 lsof -c httpd 30 查看指定用户打开的文件 31 lsof -u root | more 32 查看指定目录下被打开的文件 33 lsof +D /var/log/ 34 lsof +d /var/log/ 35 参数+D为递归列出目录下被打开的文件,参数+d为列出目录下被打开的文件 36 网络管理 37 查看所有网络连接 38 lsof -i –n lsof -i@127.0.0.1 39 通过参数-i查看网络连接的情况,包括连接的ip、端口等以及一些服务的连接情况,例如: 40 shd等。也可以通过指定ip查看该ip的网络连接情况 41 查看端口连接情况 42 lsof -i :80 -n (面试题) 43 通过参数-i:端口可以查看端口的占用情况,-i参数还有查看协议,ip的连接情况等 44 查看指定进程打开的网络连接 45 lsof -i –n -a -p 9527 46 参数-i、-a、-p等,-i查看网络连接情况,-a查看存在的进程,-p指定进程 47 查看指定状态的网络连接 48 lsof -n -P -i TCP -s TCP:ESTABLISHED 49 -n:no host names, -P:no port names,-i TCP指定协议,-s指定协议状态通过多个参数可以 50 清晰的查看网络连接情况、协议连接情况等 51 恢复删除文件 :正在被使用的文件删除恢复 52 lsof:默认就是显示所有正在使用的文件列表 53 lsof |grep /var/log/messages :查看文件是否正在使用 54 rm -f /var/log/messages :删除文件 55 lsof |grep /var/log/messages :查看文件是否正在使用 56 cat /proc/653/fd/6:这个可以查看 57 cat /proc/653/fd/6 > /var/log/messages
kill工具
1 kill命令:向进程发送控制信号,以实现对进程管理,每个信号对应一个数字,信号名称以SIG开 2 头(可省略),不区分大小写 3 显示当前系统可用信号: kill –l 或者 trap -l 4 trap:设置进程陷阱 5 常用信号:man 7 signal 6 1) SIGHUP 无须关闭进程而让其重读配置文件 (重新读取配置文件) 7 2) SIGINT 中止正在运行的进程;相当于Ctrl+c 8 3) SIGQUIT 相当于ctrl+ :退出进程 9 9) SIGKILL 强制杀死正在运行的进程 10 15) SIGTERM 终止正在运行的进程 (正常终止进程) 11 18) SIGCONT 继续运行 12 19) SIGSTOP 后台休眠 13 指定信号的方法 : (1) 信号的数字标识:1, 2, 9 14 (2) 信号完整名称:SIGHUP 15 (3) 信号的简写名称:HUP 16 kill -n 0 1:给进程发信号,检查进程是不是有错误 17 echo $?:如果是0表示没有问题,如果是1表示有问题,如果检查的进程不存在也会 18 报错 19 按PID:kill [-SIGNAL] pid … 20 kill –n SIGNAL pid 21 kill –s SIGNAL pid 22 按名称:killall [-SIGNAL] comm… :根据名称杀死进程 23 按模式:pkill [options] pattern 24 -SIGNAL 25 -u uid: effective user,生效者 26 pkill -u wang:将wang用户开启的所有进程全部杀掉 27 pkill -9 -u wang:强制将wang用户开启的所有进程全部杀掉 28 -U uid: real user,真正发起运行命令者 29 -t terminal: 与指定终端相关的进程 30 -l: 显示进程名(pgrep可用) 31 -a: 显示完整格式的进程名(pgrep可用) 32 -P pid: 显示指定进程的子进程
Linux作业管理
1 Linux的作业控制 2 前台作业:通过终端启动,且启动后一直占据终端 3 后台作业:可通过终端启动,但启动后即转入后台运行(释放终端) 4 让作业运行于后台 5 (1) 运行中的作业: Ctrl+z 6 (2) 尚未启动的作业: COMMAND & 7 后台作业虽然被送往后台运行,但其依然与终端相关;退出终端,将关闭后台作业。如果希望 8 送往后台后,剥离与终端的关系 9 nohup COMMAND &>/dev/null & :可以解决当终端突然断掉或者是网络终端 10 导致进程中断的问题 11 screen;COMMAND 12 查看当前终端所有作业:jobs 13 作业控制: 14 fg [[%]JOB_NUM]:把指定的后台作业调回前台 15 bg [[%]JOB_NUM]:让送往后台的作业在后台继续运行 16 kill [%JOB_NUM]: 终止指定的作业