《linux内核原理与分析》第七周作业
这个作业属于哪个课程 | 2020-2021-1 Linux内核原理与分析 |
这个作业要求在哪里 | 2020-2021-1Linux内核原理与分析第七周作业 |
这个作业的目标 | 了解linux中进程是如何被创建的以及进程在内核中是如何被描述的 |
作业正文 | 本博客链接 |
一、实验相关
1、跟踪分析进程创建的完整过程
首先给MenuOS添加一个fork命令,该命令调用了linux内核中的fork系统调用,添加后结果如下:
然后使用gdb跟踪fork系统调用的执行过程,如下图:
执行如下代码添加断点:
b sys_clone
b do_fork
b dup_task_struct
b copy_process
b copy_thread
b ret_from_fork
如图可以看到fork函数的执行过程,首先执行sys_clone函数,这个函数是宏命令,无法查看具体内容
接下来依次执行执行do_fork函数、dup_task_struct函数、copy_process函数、copy_thread函数、ret_from_fork函数,其函数体实现如下图:
2、分析fork执行过程
通过linux-3.18.6/kernel/fork.c中的fork函数代码,可以看出,fork、vfork和clone都可以创建一个新进程,而且都是通过do_fork函数来创建进程的。
查看源码中的do_fork函数,函数有5个参数:
- clone_flags:子进程创建相关标志,通过此标志可以对父进程的资源进行有选择的复制
- stack_start:子进程用户态堆栈的地址
- regs:指向pt_regs结构体的指针
- stack_size:用户态站的大小,通常是不必要的,被设置为0
- parent_tidptr和child_tidptr:父进程子进程用户台下的pid地址
do_fork主要完成了调用copy_process复制父进程信息、获得pid、调用wake_ip_new_task将子进程加入调度器队列等待获得分配CPU资源运行、通过clone_flags标志做一些辅助工作,其中copy_process是创建一个进程内容的主要代码。接下来分析copy_process函数是如何复制父进程的。
copy_process函数主要完成了调用dup_task_struct复制当前进程(父进程)描述符task_struct、信息检查、初始化、把进程状态设置为TASK_RUNNING(此时子进程置为就绪态)、采用写时复制技术之一复制所有其他进程资源、调用copy_thread初始化子进程内核栈、设置子进程pid等。其中最关键的就是dup_task_struct复制当前进程描述符task_struct和copy_thread初始化子进程内核栈。
duo_task_struct函数中位子进程分配好了内核栈,copy_thread真正完成内核栈关键信息的初始化。
这些工作都完成后,如果创建的是内核线程则从ret_from_kernel_thread执行返回,如果是用户态进程,则从ret_from_frok返回。
二、学习收获
1、操作系统原理中进程状态与实际内核中运行状态的不同
在操作系统原理中,会将进程分为创建、就绪、执行、阻塞、终结五个状态,但通过本章的学习,发现在实际的linux内核中,进程创建之后就处于就绪态,内核讲就绪态与运行态的进程状态都表示为TASK_RUNNING,就绪态和运行态的区别就是是否占用CPU,占用CPU的就绪态进程就是运行态。在内核中,阻塞态也细分为不同的阻塞状态,TASK_INTERRUPIBLE和TASK_UNINTERRUPTIBLE是其中的两个状态,两者的区别是前一个可以被信号和wake_up唤醒,而后者只能被wake_up唤醒。
2、linux进程状态学习
经过查阅资料,了解到linux中进程有以下状态
- R (TASK_RUNNING),可执行状态。只有在该状态的进程才可能在CPU上运行。而同一时刻可能有多个进程处于可执行状态,这些进程的task_struct结构(进程控制块)被放入对应CPU的可执行队列中(一个进程最多只能出现在一个CPU的可执行队列中)。进程调度器的任务就是从各个CPU的可执行队列中分别选择一个进程在该CPU上运行。很多操作系统教科书将正在CPU上执行的进程定义为RUNNING状态、而将可执行但是尚未被调度执行的进程定义为READY状态,这两种状态在linux下统一为 TASK_RUNNING状态。
- S (TASK_INTERRUPTIBLE),可中断的睡眠状态。处于这个状态的进程因为等待某某事件的发生(比如等待socket连接、等待信号量),而被挂起。这些进程的task_struct结构被放入对应事件的等待队列中。当这些事件发生时(由外部中断触发、或由其他进程触发),对应的等待队列中的一个或多个进程将被唤醒。
- D (TASK_UNINTERRUPTIBLE),不可中断的睡眠状态。与TASK_INTERRUPTIBLE状态类似,进程处于睡眠状态,但是此刻进程是不可中断的。不可中断,指的并不是CPU不响应外部硬件的中断,而是指进程不响应异步信号。
- T (TASK_STOPPED or TASK_TRACED),暂停状态或跟踪状态。向进程发送一个SIGSTOP信号,它就会因响应该信号而进入TASK_STOPPED状态(除非该进程本身处于TASK_UNINTERRUPTIBLE状态而不响应信号)。(SIGSTOP与SIGKILL信号一样,是非常强制的。不允许用户进程通过signal系列的系统调用重新设置对应的信号处理函数。)向进程发送一个SIGCONT信号,可以让其从TASK_STOPPED状态恢复到TASK_RUNNING状态。
- Z (TASK_DEAD - EXIT_ZOMBIE),退出状态,进程成为僵尸进程。进程在退出的过程中,处于TASK_DEAD状态。在这个退出过程中,进程占有的所有资源将被回收,除了task_struct结构(以及少数资源)以外。于是进程就只剩下task_struct这么个空壳,故称为僵尸。
- X (TASK_DEAD - EXIT_DEAD),退出状态,进程即将被销毁。而进程在退出过程中也可能不会保留它的task_struct。比如这个进程是多线程程序中被detach过的进程(进程?线程?参见《linux线程浅析》)。或者父进程通过设置SIGCHLD信号的handler为SIG_IGN,显式的忽略了SIGCHLD信号。(这是posix的规定,尽管子进程的退出信号可以被设置为SIGCHLD以外的其他信号。)此时,进程将被置于EXIT_DEAD退出状态,这意味着接下来的代码立即就会将该进程彻底释放。所以EXIT_DEAD状态是非常短暂的,几乎不可能通过ps命令捕捉到。
3、进程状态切换
一个进程在运行期间,不断地从一种状态转换到另一种状态,它可以多次处于就绪状态和执行状态,也可以多次处于阻塞状态。
(1) 就绪→执行
处于就绪状态的进程,当进程调度程序为之分配了处理机后,该进程便由就绪状态转变成执行状态。
(2) 执行→就绪
处于执行状态的进程在其执行过程中,因分配给它的一个时间片已用完而不得不让出处理机,于是进程从执行状态转变成就绪状态。
(3) 执行→阻塞
正在执行的进程因等待某种事件发生而无法继续执行时,便从执行状态变成阻塞状态。
(4) 阻塞→就绪
处于阻塞状态的进程,若其等待的事件已经发生,于是进程由阻塞状态转变为就绪状态。
具体的状态转换如下图:
4、进程的pid和tgid
每个进程都有自己的pid,每个线程都有自己的线程id(pthread_t类型),但这是在用户空间的层面。而在内核层面中,线程其实也是进程。为了更好地区分这些概念,我们用任务task来指代内核中的进程概念,而依旧用进程来指定用户空间层面的进程。所以当说起task的时候,指的是内核层面,而当说起进程的时候,指的就是用户空间层面的。
回到刚才说的地方,每个线程都是一个task,所以每个线程都有自己的一份struct task_sruct,而且每个线程都有自己独特的pid。那内核通过什么来知道这个线程属于哪个进程呢?答案是task_sruct.tgid。是的,一个进程就是一个线程组,所以每个进程的所有线程都有着相同的tgid。
当程序开始运行时,只有一个主线程,这个主线程的tgid就等于pid。而当其他线程被创建的时候,就继承了主线程的tgid。这样,内核就可以通过tgid知道某个task属于哪个线程组,也就知道属于哪个进程了。当我们用ps命令或者getpid()等接口查询进程id时,内核返回给我们的也正是这个tgid。