1.进程:
(1)处于执行期的程序,但不止是代码,还包括各种程序运行时所需的资源,实际上进程是正在执行的
程序的实时结果。
(2)程序的本身并不是进程,进程是处于执行期的程序及其相关资源的总称。
(3)两个或两个以上并存的进程可以共享诸如打开的文件,地址空间等共享资源。
(4)在Linux中通常是调用fork()系统函数的结果,通过复制一个现有的进程来创建一个新的子进程。
fork()系统函数
(5)fork在这个系统调用结束时,在同一位置上返回两次(从内核返回两次),父进程恢复运行,子进程开始运行。
exec()系统函数
(6) exce这组函数可以创建新的地址空间,并将新的程序载入其中。
exit()系统函数
(7)程序通过exit()系统调用退出执行,这个进程会终结进程,并将其占用的资源释放掉
wait4()系统函数
(8)父进程通过wait4()系统调用来查询子进程是否终结。
执行线程:简称线程,在进程中活动的对象,每个线程都拥有独立的程序计数器,进程栈,和一组进程寄存器。
2.进程描述符及其任务结构
(1)任务队列:进程的列表存放的一个双向循环链表
(2)进程描述符:这个链表的每个元素的类型,为task_stuct的结构体,包含的数据能完整的描述一个正在执行的程序的所 有信息,包括:打开的文件,进程的地址空间,挂起的信号,进程的状态,等。。
(3)分配进程描述符:linux通过slab分配器,分配task_struct结构,每个任务的thread_info结构在它的内核栈的尾端分配 结构中的task域的存放的是指向该任务的实际的task_struct指针。
(4)进程描述符的存放:内核通过唯一的进程标示值或者说PID值来标识每一个进程,PID是一个数,表示为pid_t隐含类型
实际上就是一个int型。
(5)进程的状态:
1>运行态:
2>可中断:(被阻塞)
3>不可中断:就算是接受到信号也不会被唤醒或者准备运行(其它和2相同)
4>:被其他进程跟踪的进程
5>停止:进程停止执行
(6)进程上下文:
一般程序在用户空间执行,当一个程序执行了系统调用或者触发了某种异常时,它就陷入了内核空间,即内核代表
进程执行,并处于进程的上下文中。
当内核执行完毕后,可以退出内核空间,并恢复到程序的用户空间继续运行。
(7)进程家族树:
在unix中进程有着明显的继承关系,进程pid为1的init进程为其它所有进程的父进程,一个父进程可以有许多的子进程
在每个进程的描述符中的task_struct结构体中有指向父进程的指针,有着指向子进程的指针链表
3.进程创建
fork():拷贝当前的进程形成一个新的子进程
exec():负责读取可执行文件,并载入到地址空间开始运行。
(1)写时拷贝技术:
这是一种可以推迟甚至免除拷贝的技术,只有当写入时,数据才会开始复制。
(2)fork():
fork的实际开销是复制父进程的页表已经给子进程创建唯一的进程描述符。
(3)vfork():
除了不拷贝父进程的页表外,其它的和fork没啥区别。
4.线程在linux中的实现
(1)该机制提供了在同一程序内共享内存地址空间运行的一组线程,这些线程还可以共享打开的文件等其它资源
(2)在linux中线程仅仅被看做与其它进程共享一些资源的进程。
(3)对于linux来说,他只是一种进程间共享资源的一种手段(linux进程本来已经够轻量级了)
(4)创建线程和创建进程时都用clone()。只是传入的参数不同,线程还需共享一些资源,还有内存空间
(5)内核线程:独立运行于内核空间中的标准进程,她没有独立的地址空间,她只在内核空间中运行,不会切换到用户空间
5.进程终结
(1)进程的析构是由自身引起的,他发生在显式的或隐式的调用系统函数exit()的过程,并且大部分的工作由do_exit完成
(2)当exit()后,与进程相关的资源被释放掉了,该进程不可运行。
(3)但在do_exit后尽管线程已经僵死不能运行了,但系统还保留了它的进程描述符。
(4)孤儿进程造成的进退维谷:如果父进程在子进程之前退出,必须有机制来保证子进程能找到一个新父亲,否则这些子进 程就会在退出时永远处于僵死状态,白白的耗费内存。
所以在do_exit()函数中会调用exit_notify()。而这个函数又会调用forget_original_parent(),这个函数又会 调用find_new_parent()来执行寻父过程。