zoukankan      html  css  js  c++  java
  • Linux内核源代码的学习过程转换完成细节

    linux中的进程是个最主要的概念,进程从执行队列到開始执行有两个開始的地方,
    一个就是switch_to宏中的标号1:"1:/t",//仅仅要不是新创建的进程,差点儿都是从上面的那个标号1開始的,而switch_to宏则是除了内核本身,全部的进程要 想执行都要经过的地方
    另 一个就是ret_form_fork
    这样看来。尽管linux的进程体系以及进程调度很复杂,可是整体看来就是一个沙漏状。
    对于系统中的每一个新进程它首次被运行的过程必定是:
    sys_fork---->do_fork---->copy_process ---->copy_thread 当中copy_process 设置的新进程的eip ret_from_fork --->放入就绪队列---->被调度---->运行switch_to
    然后就到了jmp __switch_to了,这是个函数。这个函数的返回地址就区分了被调度的进程是新创建的进程还是已经运行过的进程了。
    新创建(没有被运行过)的进程的返回地址是ret_from_fork
    已经运行过的进程的返回地址是:switch_to中的标号1:

    switch_to宏就是沙漏中间那个 最细的地方,想从一端到还有一端。必定要经过那个地方,在非新创建的进程的情况下,全部进程都是从标号1開始,
    看一下switch_to宏:
    #define switch_to(prev,next,last) do {                            / 
             unsigned long esi,edi;                                          / 
             asm volatile("pushfl/n/t"                                      / 
                          "pushl %%ebp/n/t"                                 / 
                          "movl %%esp,%0/n/t"        /* save ESP */          / 
                          "movl %5,%%esp/n/t"        /* restore ESP */       /   //注意这里已经切换到了新的内核栈,故原来的栈中的局部变量所有失效。因而想得到其值就必须想办法保存它们,为了效率。这里将prev保存在寄存器中, 以便善后使用 
                          "movl $1f,%1/n/t"          /* save EIP */          /   //这里。仅仅要是以前在这里被切换出去的进程都会将标号1作为再回来时的eip 
                          "pushl %6/n/t"             /* restore EIP */       /   //将新进程的eip压入栈中,由于以下是个jmp,并且jmp到的函数最后有一个return。那么依照return的语义,就能够从栈取出eip加载 eip寄存器了,实际上这个对__switch_to的jmp调用就是一个手动的call调用(须要注意的是,这里return的是下一个进程的eip保存的是本进程的eip留给下次被切换进来的时候像如今这样使用)。非常巧妙 
                          "jmp __switch_to/n"                                /   //__switch_to是个FASTCALL的函数。eax/ebx寄存器传參数 
                          "1:/t"                                             /   //标号1的指令,非常easy。可是就是这个简单成全了总体架构的简单 这里为什么不用call
                          "popl %%ebp/n/t"                                   / 
                          "popfl"                                            / 
                          :"=m" (prev->thread.esp),"=m" (prev->thread.eip),  / 
                           "=a" (last),"=S" (esi),"=D" (edi)                 / 
                          :"m" (next->thread.esp),"m" (next->thread.eip),    / 
                           "2" (prev), "d" (next));                          / 
    } while (0) 
    switch_to宏里面的第三个參数是什么?
    实际上这里的三个參数各自是原先A的 prev和next 而最后一个參数是 A被切换进来的前一个进程为什么要这第三个(被调度前的一个进程)參数呢?留待兴许 
    linux 之所以实现上述的单点切换就是为了减少复杂度,事实上非常多操作系统内核都是这么做的。这里的单点并非指switch_to这个单点,而是保存/恢复eip 这个寄存器从而保证全部切换回来的进程都从一个地方開始,可是有点美中不足的就是linux并没有将全部的进程从就绪到開始运行都从标号1開始。这也就引出了以下一个问题:
    为什么不用call 取代 push+jmp?
    假设用call 的话。call运行的时候首先将标号1处的地址压栈,然后jmp到__switch_to開始运行, __switch_to的函数都要返回到标号1:開始处来运行
    而其实并非这种,由于新创建的进程并非从标号1開始运行的。而是从ret_from_fork開始运行的。
    所以新进程在运行宏  switch_to到 "jmp __switch_to/n"的时候,它的返回地址将不会是标号1:而应该是eip,即在copy_thread中设置的eip中的值:ret_from_fork
    所以关键点是这里的__switch_to函数
    全部进程被调度的时候应该运行的是:

    新创建进程返回的地址是:ret_from_fork
    已经被调度过的进程的返回地址是:1:
    看看新创建进程的返回地址处干了什么
    到这里说明。新的线程已产生了. 
    ENTRY(ret_from_fork) 
        pushl %eax 
        call schedule_tail 
        GET_THREAD_INFO(%ebp) 
        popl %eax 
        jmp syscall_exit 
    syscall_exit: 
    ... 
    work_resched: 
        call schedule 
    ... 
    当他从ret_from_fork退出时。会从堆栈中弹出原来保存的eip,而ip指向kernel_thread_helper, 
    至此kernel_thread_helper被调用。他就行执行我们的指定的函数了do_exit(). 
    从内核空间返回到用户空间。
    这样费事做的原因是什么?
    看看 do_fork的实现就知道,事实上新创建的进程是不这么做的,新创建的进程的eip是ret_from_fork而不是标号1,这个原因是什么?新创建进 程的时候要手工指定一个開始的地址,毕竟它要開始就要有个起点,那么起点在哪里好呢
    最好是模拟该进程和别的已有进程一样是又一次開始执行的,这样比較统一又便于管理, 然后将这个開始地址也指为标号1。可是这时标号1在哪里,是标号1在嵌入式汇编宏中导致标号1的地址不好取到吗,假设真的由于这的话,全然能够将标号1分 离出来放到一个地方,然后无论是已经有的进程还是新创建的进程都从这个固定的分离出来标号1的地址处取指令不就能够了吗?内核的设计者不可能还没有我聪明,那样的话会浪费取指令的时间和空间的,
    来个间接引用肯定没有嵌入式汇编标号直接。减少时间开销,并且另一个原因。用ret_from_fork全然能够做到和既有 进程的标号1一样的好

    我们看看进程切换函数的设计。既有进程的切换都是在schedule里面进入switch_to从而找到标号1的,而在 switch_to之后就剩下一个finish_task_switch和推断又一次调度标志了。
    我们看看ret_from_fork: 
    ENTRY(ret_from_fork) 
             pushl %eax      //注意刚从switch_to调用的__switch_to中ret回来。正好ret到了ret_from_fork(注意switch_to中jmp 指令前的push),而那个函数返回的就是prev,将其放到了eax中,故这里schedule_tail的參数就是prev,也就是切换出去的进程。

     
             call schedule_tail 
             GET_THREAD_INFO(%ebp) 
             popl %eax 
             jmp syscall_exit 
    上 面看到ret_from_fork调用的schedule_tail參数是切换出去的进程,而后者立即调用finish_task_switch,这样就 和schedule中的switch_to之后的逻辑对上了,并且參数也没有什么问题,


    那么finish_task_switch之后的逻辑呢,比方推断 又一次调度标志怎么办?
    那就看看ret_from_fork中的syscall_exit吧,那里面做了推断,假设须要调度,那就会进入正常的 schedule流程,十分正确。
    事实上就是这个finish_task_switch善后惹的祸。只是它的设计也是一个非常巧妙的看点,它主要推断原先的进 程是否还有存在的必要,假设已经dead了,那么就是在这里彻底释放其task_struct的,因此必须保存prev的值(回答了为甚么要三个參数这个问题引出的“要了这第三个參数有什么问题”),由于prev是 schedule的局部变量在prev的内核栈中,在切换到新的内核栈后(schedule函数用到了两个内核栈),prev失效。因此才要保存(这里能够理解为从prev传递到兴许可见的地方)的。
    http://blog.csdn.net/dog250/article/details/5303541

  • 相关阅读:
    解决VS控制台窗口自动关闭问题
    ZOJ1003:Crashing Balloon(dfs)
    POJ2607:Fire Station(SPFA+枚举)
    C语言在屏幕上输出玫瑰花图片
    HRBUST
    UVA10182: Bee Maja (模拟)
    洛谷P1144: 最短路计数(bfs)
    (转载)MySQL LIKE 用法:搜索匹配字段中的指定内容
    (转载)[MySQL技巧]INSERT INTO… ON DUPLICATE KEY UPDATE
    (转载)INSERT INTO .. ON DUPLICATE KEY 语法与实例教程
  • 原文地址:https://www.cnblogs.com/zfyouxi/p/5028361.html
Copyright © 2011-2022 走看看