zoukankan      html  css  js  c++  java
  • 从一个新手容易混淆的例子简单分析C语言中函数调用过程

            某天,王尼玛写了段C程序:

     1 #include <stdio.h>
     2 
     3 void input()
     4 {
     5     int i;
     6     int array[20];
     7     for(i = 0; i < 20; i++)
     8     {
     9         array[i] = i;
    10     }
    11 }
    12 
    13 void output()
    14 {
    15     int i;
    16     int array[20];
    17     for(i = 0; i < 20; i++)
    18     {
    19         printf("%d
    ", array[i]);
    20     }
    21 }
    22 
    23 int main()
    24 {
    25     input();
    26     output();
    27     while(1){}
    28     return 0;
    29 }

      这段代码的目的很简单,在input函数中定义了array[20]并赋值,在output函数中输出,运行结果如下:

      Nice Work!

      But……在input()后来一发printf()呢?????

    1  int main()
    2  {
    3      input();
    4      printf("any string");
    5      output();
    6      while(1){}
    7      return 0;
    8  }

      其实,只要学过一段时间的C语言的童鞋就会发现,刚刚开始那俩函数里定义的array[20]就出问题了,这俩array压根儿没关系,如果遇到这样的代码,第一反应就是通过参数或者全局变量的方法,让这俩array有关系。

      But,问题来了……王尼玛是个新手,他将两个array定义成一样的名字认为他们就是同一个数组,并且,他振振有词的说,我之前的代码是没问题的,只加了个printf就出问题了,应该就是这里有问题了,怎么可能是定义array的问题?

      尼玛,这只是巧合而已,你的第一段程序就是错的!

      可我的输出是正确的啊……

      这……

    ==============================================分割线================================================

      其实大家都知道,问题的根源是output和input函数中的数组array虽然同名,但却不是同一个数组,只是碰巧将原先赋值的内存给输出了而已,要解释这个问题,就需要了解C语言在函数调用过程中,堆栈是如何变化的。首先必须明确一点也是非常重要的一点,栈是向下生长的,所谓向下生长是指从内存高地址->低地址的路径延伸,那么就很明显了,栈有栈底和栈顶,那么栈顶的地址要比栈底低。对x86体系的CPU而言,其中

      ---> 寄存器ebp(base pointer )可称为“帧指针”或“基址指针”,其实语意是相同的。
      ---> 寄存器esp(stack pointer)可称为“ 栈指针”。

    要知道的是:

      ---> ebp 在未受改变之前始终指向栈帧的开始,也就是栈底,所以ebp的用途是在堆栈中寻址用的。
      ---> esp是会随着数据的入栈和出栈移动的,也就是说,esp始终指向栈顶。

    见下图,假设函数A调用函数B,我们称A函数为"调用者",B函数为“被调用者”则函数调用过程可以这么描述:

    (1)先将调用者(A)的堆栈的基址(ebp)入栈,以保存之前任务的信息。

    (2)然后将调用者(A)的栈顶指针(esp)的值赋给ebp,作为新的基址(即被调用者B的栈底)。

    (3)然后在这个基址(被调用者B的栈底)上开辟(一般用sub指令)相应的空间用作被调用者B的栈空间。

    (4)函数B返回后,从当前栈帧的ebp即恢复为调用者A的栈顶(esp),使栈顶恢复函数B被调用前的位置;然后调用者A再从恢复后的栈顶可弹出之前的ebp值(可以这么做是因为这个值在函数调用前一步被压入堆栈)。这样,ebp和esp就都恢复了调用函数B前的位置,也就是栈恢复函数B调用前的状态。

      回到之前的问题,由于input函数和output函数为各自的array数组分配的空间在内存中的地址恰好相同,所以可以顺利输出其内容;但是在调用printf函数以后,由于堆栈中一部分内容被修改了,所以输出结果前半部分是正确的,后半部分是错误的。看到这里,相信有童鞋会试着运行这段代码,如果使用Turbo C,恭喜你可以获得相同的结果(上述结果在Turbo C测试截图);如果使用Visual Studio XXXX,将得到如下结果:

      这是怎么回事呢?查看了反汇编,发现在Debug版本中,为了方便调试,VS会将数组初始化为0xCCCCCCCC,而output函数中的array数组是刚刚定义的,所以被VS初始化位0xCCCCCCCC,转换成unsigned int就是-858993460。

      当然,在Release版本中,为了提高效率,是不会对数组进行这种默认初始化的操作,那么结果是什么样的呢?

      纳尼?!如果VS不给数组初始化,得到的结果为毛和Turbo C不一样啊……

      既然这样,只能再次借助反汇编了,见下图。可以发现input函数没有对应的汇编语句,也就是说,由于这货啥都不干,被编译器优化掉了。既然没有对数组array赋值,那么输出的自然是内存里原先乱七八糟的数据了。

      至于GCC会得出什么结果,作为Windows党,就不测试了,感兴趣的童鞋可以调整编译选项自己试试看

      

  • 相关阅读:
    附加数据库报错:无法打开物理文件 XXX.mdf",操作系统错误 5:"5(拒绝访问。)"
    Java(TM) SE Development Kit 6 卸载不掉怎么办
    (转)WCF入门教程(一)简介
    (转)SQL Server 2008怎样编辑200行以上的数据
    远程桌面下如何打开任务管理器
    在 sys.servers 中找不到服务器的解决办法,自己解决的
    MySQL 8小时问题
    Spring 事件机制
    MapReduce架构
    HDFS架构
  • 原文地址:https://www.cnblogs.com/wangchengfeng/p/3590475.html
Copyright © 2011-2022 走看看