zoukankan      html  css  js  c++  java
  • 一道值得思考的fork()面试题

    程序如下,判断输出多少个'_' 【运行环境:Linux】

    ./a.out

    int main(){
        for(int i = 0; i < 2; ++i){
            fork();
            printf("_");
        }        
    }

    熟悉fork的话,这里很容易就能知道,一共产生了3个子进程,还有一个父进程,所以一共是四个进程;每次fork之后都会输出一个'_',那么在这里应当的输出是6个'_'

     但是实际输出却是 8个'_'; 但是如果在printf("_")之后使用fflush(stdout),或者使用printf(" ")清空输出缓冲区来输出则结果就是6个了,这就不得不再返回来谈一谈printf的输出机制。

    • 标准I/O对待缓存的数据采用3种不同的策略,全缓冲、行缓冲、无缓冲。
    • 对于没有交互的终端,例如块设备文件,系统采用全缓冲;(比如输出到文件)
    • 对于标准输入,标准输出这样交互设备采用行缓冲;(输出到屏幕或控制台)
    • 对于需要立即响应的设备,例如标准错误采用无缓冲;

    printf函数只有当缓冲区被刷新的时候才会输出数据,在此之前只是将数据存放到缓冲区。

    理解了这点后,再去分析上述代码;首先只有一个进程a.out,缓冲区为空;第一次fork()后,父进程a.out产生了一个子进程“子1”,子进程复制父进程的缓冲区(此时为空),然后printf将"_"先放入缓冲区内,a.out与"子1"的缓冲区内各有一个"_";

    第二次fork()后,a.out产生了一个子进程"子2",“子1”产生了一个子进程“子3”,“子2”和“子3”均从各自的父进程复制了缓冲区的“_”,此时,a.out,"子1",“子2”,“子3”各自的缓冲区内均有一个“_”,接下来的printf语句又将”_“分别放入了四个进程的缓冲区内(图中用黑色标识的_),此时,循环结束,四个进程的各自缓冲区内都分别有两个"_",总共8个,特殊之处在于,”子2“与”子3“的缓冲区内的第一个”_“是复制各自的父进程缓冲区得到的,a.out与"子1"的缓冲区内的第一个"_"是printf累积”_“的结果。如此一来,循环结束后,程序就要结束了,此时缓冲区刷新输出了8个"_".

     到这里,这道题已经讲的很明白了,为了深入理解,再通过几个代码详细理解一下缓冲区的刷新机制:

    int main(){
        printf("hello");
    //fflush(stdout); sleep(
    5); int m = 5; m = 7; while(m-->0){ printf("*"); } //printf(" "); sleep(3); printf("world"); }

    这个程序将如何输出呢?如果去掉注释输出结果又是什么?先思考一下吧。

    理想中的输出应该是先输出 "hello",等待5秒,输出7个'*',再等待3秒,输出"world";但是实际情况却是等待 8秒,一瞬间输出”hello*******world“.

    如果去掉注释呢?就是我们所期盼的第一种情况了;造成这种现象的原因上面已经提到了,就是printf并非直接输出,而是先攒到缓冲区里,等待缓冲区刷新再输出;这段程序中的两条注释语句均可以刷新行缓冲策略的缓冲区(行缓冲与全缓冲在文章末尾)。

    那么来看一下缓冲区刷新的时机吧

    • 1.遇到“ ”,立即刷新缓冲区。(行缓冲)
    • 2.程序调用fflush函数刷新缓冲区
    • 3.程序以exit结束,缓冲区会刷新。如果以_exit结束,缓冲区数据会被直接清空。
    • 4.缓冲区满,也会将缓冲区数据刷新出来。

    这样子便不难理解了吧。可惜刚开始学习printf的时候总是习惯性在后面加一个' ',所以这么久了这么重要的一个缓冲区机制居然才知道。

    最后再用一个例子补充一下行缓冲与全缓冲的区别

    int main(){
        printf("hello world
    ");
        if(0 == fork()){
            printf("son
    ");
        }else{
            printf("father
    ");
        }                                                                           
    }

    先普通执行一下输出结果为一条"hello world",一条"son",以及一条"father";

    再将输出位置重定向到文件,输出结果多了一条"hello world"

     

     同样的程序,只因为输出位置的不同,结果也就不同,这是因为第一种使用了标准输出也就是控制台和屏幕,采用行缓冲策略;第二种将标准输出重定向到文件,采用的是全缓冲策略;行缓冲策略中的' '对全缓冲无效;所以又回到了文章开始的那道面试题的缓冲区复制。由于是全缓冲,并不会刷新缓冲区,因此fork时子进程复制了父进程的缓冲区,里面有一条”hello world“,此时父子进程再各自往缓冲区中攒了"father"和'son';因此就呈现出最终的输出结果啦。

    (这种缓冲区机制在C++中的cout也是一样的)

    完。

  • 相关阅读:
    mysql脚本导入导出
    centos6.9关闭防火墙
    hdfs 架构
    MySQL JOIN的使用
    六种方式,教你在SpringBoot初始化时搞点事情!
    mybatis快速入门
    有了Swagger2,再也不用为写Api文档头疼了
    kafka查看Topic列表及消费状态等常用命令
    @RequestMapping注解
    寻找写代码感觉(三)之使用 Spring Boot 编写接口
  • 原文地址:https://www.cnblogs.com/GuoYuying/p/12559828.html
Copyright © 2011-2022 走看看