zoukankan      html  css  js  c++  java
  • 高级操作系统——进程管理

    一、进程描述符

    进程控制块PCB:是OS控制进程运行用的数据结构,是一个task_struct结构体。

    PCB包括:进程标识信息(进程标识符PID等)、执行现场信息(CPU现场,进程切换时需要保存现场信息)、进程映像信息(进程地址空间,即进程在运行时代码、数据、栈放在什么位置,方便OS对地址空间进行管理)(现场与地址空间比较重要)、进程资源信息、信号信息。

    对PCB,说其中几个重要的字段:

    mm_struct:有一个成员mm,标明了进程的地址空间;

    thread:记录了进程的现场,最后一个字段;

    thread_info在4.4.6版本中改成了stack,包括内核栈(即进程进入内核工作时需要的栈和用户栈是分开的)和一些需要快速访问的数据。

    在4.4.6版本中,stack占用了两个页面,即8k,大部分是放内核栈的,低端约10k存放快速访问的信息。CPU若想访问当前进程的快速访问数据的话,只需要拿到当前的栈指针,即ESP寄存器的值,可以推算出数据所在的位置来,因此在查找他的地址的时候,访问速度可以很快。这部分数据可以看作是进程描述符的一部分,在空间上不是连续的,但相互之间有指针,可以相互找得到。

    进程状态转换图,可自行搜索。

    在4.4.6中,增加了被跟踪和僵死撤销状态。

    进程描述符是管理进程的重要数据结构,故他的组织方式非常重要。0号进程的描述符是由init_task这个变量所存储的。从他出发,所有进程描述符构成了双向链表。task_struct中包含一个成员,叫tasts,tasks类型是list_head类型,tasts本身是嵌入在进程描述符里面的,知道tasks的地址,只要送减去620就能得到进程描述符的首地址。在Linux中有很多这样的技巧,即通过嵌入的地址,反推结构体的地址,进而找到结构体的其他成员。

    进程与线程关系

    多个线程构成线程组,共享内存,不共享栈。

    一个会话对应一个终端,在终端中敲一个命令相当于创建了一个进程组来执行。

    下面进行演示,建立一个文件命名为0.gdb,文件内容如下,直接运行

    1 target remote localhost:1234
    2 dir ~/aos/lab/busybox
    3 add-symbol-file ~/aos/lab/busybox/busybox_unstripped 0x8048400
    4 display $lx_current().pid
    5 display $lx_current().comm
    6 b start_kernel
    7 b ls_main
    8 c

    执行含有下列代码的文件

     1 #include <stdio.h>
     2 #include <stdlib.h>
     3 #include <pthread.h>
     4 
     5 void loop(){
     6   while(1);
     7 }
     8 
     9 void *p1(){
    10   printf("thread-1 starting
    ");
    11   loop();
    12 }
    13 
    14 void *p2(){
    15   printf("thread-2 starting
    ");
    16   loop();
    17 }
    18 
    19 void main(){
    20   int pid1, pid2;
    21   pthread_t t1,t2;
    22   void *thread_result;
    23 
    24   printf("main starting
    ");
    25 
    26   if (!(pid1 = fork())){
    27     printf("child-1 starting
    ");
    28     loop();
    29     exit(0);
    30   }
    31 
    32   if (!(pid2 = fork())){
    33     printf("child-2 starting
    ");
    34     loop();
    35     exit(0);
    36   }
    37 
    38   pthread_create(&t1, NULL, p1, NULL);
    39   pthread_create(&t2, NULL, p2, NULL);
    40   
    41   pthread_join(t1, &thread_result);
    42   pthread_join(t2, &thread_result);
    43 
    44   int status;
    45   waitpid(pid1, &status, 0);
    46   waitpid(pid2, &status, 0);
    47   printf("main exiting
    ");
    48   exit(0);
    49 }

     可以看到do-fork可执行文件创建了三个进程,976、977、978

     

    979、980是新创建的两个线程

     再执行一次,可以看到后台运行了两个

     新创建的三个进程是刚创建的

     fg %+序号将指定的进程放到前台,ctrl+z放到后台

    用以下三条命令依次查看线程组、进程组和会话的leader

    命令的意思是根据进程的描述符,找到线程组leader的描述符,里面对应的字段就是要显示的ID

    p $lx_task_by_pid(977).group_leader->pids[0].pid->numbers.nr
    p $lx_task_by_pid(977).group_leader->pids[1].pid->numbers.nr
    p $lx_task_by_pid(977).group_leader->pids[2].pid->numbers.nr

    987和988是984创建的,他们处于同一个线程组,leader是976

    二、进程调度算法

    每个进程属于某一个调度器类,每个调度器类都有一个进程队列,不同的队列有不同的调度算法。

    先调度硬实时的,软实时次之,普通进程最后。

    普通进程使用CFS(完全公平)调度算法:

    虚拟时钟,调度器总是选时钟最小的那个进程来执行。

    优先级高的进程时钟增长得慢。

    所有可运行的进程被放在一个红黑树中。

    下面进行演示:

    再次运行0.gdb,在终端输入ls,使其被捕获

    建立文件demo-2-2.gdb,内容如下

     1 break __schedule//进程调度的时候执行这个函数
     2 
     3 break __switch_to//调度时如果切换进程就会调用这个函数
     4   commands
     5     printf "next_p->pid: %d
    ", next_p->pid
     6     printf "next_p->se.vruntime: "
     7     print  next_p->se.vruntime
     8   end
     9 
    10 break enqueue_task_fair//如果有新进程要进入到CFS队列时,执行这个函数
    11   commands
    12     printf "p->pid: %d
    ", p->pid
    13     printf "p->se.vruntime: "
    14     print  p->se.vruntime
    15   end
    16 
    17 display   $lx_current().state//显示当前进程的状态
    18 display   $lx_current().se.vruntime
    19 display   $lx_per_cpu("runqueues").nr_running//CPU里面有多少个进程在运行
    20 
    21 display ((struct sched_entity *)((void *)$lx_per_cpu("runqueues").cfs.rb_leftmost - 0x8))->vruntime//CFS队列里最左边的节点,即虚拟时钟最小的信息
    22 display ((struct task_struct *)((void *)$lx_per_cpu("runqueues").cfs.rb_leftmost - 0x4c))->pid

     

      由上图可以看到,当前正在运行的是975号进程,当前的虚拟时钟可以从runtime那里看到,state=0表示其当前的状态是就绪的或正在运行,树最左边目前还没有进程。由于enqueue_task_fair函数的作用是往进程队列里面加入新进程,现在已经有一个,可以看到,要加的是7号进程,下面一行的虚拟时钟是个负值,现在还暂时看不到,继续执行。

     可以看到7号进程的虚拟时钟小于975号的,下次如果要调度,应该选7号。即将创建的是3号进程。

     由上图,975号进程的虚拟时钟增加了,在这两个断点时间,存在中断,这才导致了时钟的增加。运行有一定的随机性,虚拟机在虚拟的时候有一定的随机性。继续

     运行了切换函数,下一步要切换7号进程。继续

     7号时钟的进程的时钟比之前也增加了,需要注意当前正在运行的进程不放在树里面,但放在了队列里面,队列里面进程就是树里面的进程加当前进程。继续若干次

     下一步要创建的是4号进程。

    除了普通进程有队列之外,其他的硬实时和软实时都有各自的队列。

    红黑树的某个节点可以是另外一个树,共用一个时钟。

    三、进程调度的时机

    内核程序的入口,系统调用总控函数,异常处理函数,中断处理函数、内核线程主函数,用bt查看栈顶层,根据函数的种类来确定是哪种内核调用。

  • 相关阅读:
    k8s资源需求和限制, 以及pod驱逐策略
    python转义引起的错误
    nginx location 匹配目录
    kubelet 证书自动续期
    docker常见退出码
    (转)firefox火狐浏览器语言设置
    去掉表的identity属性
    SQL Server内存方面知识收集
    SQL Server 中not in和not exists
    Data Compression(1)
  • 原文地址:https://www.cnblogs.com/ppbb/p/12494794.html
Copyright © 2011-2022 走看看