某天,王尼玛写了段C程序:
1 #include <stdio.h> 2 3 void input() 4 { 5 int i; 6 int array[20]; 7 for(i = 0; i < 20; i++) 8 { 9 array[i] = i; 10 } 11 } 12 13 void output() 14 { 15 int i; 16 int array[20]; 17 for(i = 0; i < 20; i++) 18 { 19 printf("%d ", array[i]); 20 } 21 } 22 23 int main() 24 { 25 input(); 26 output(); 27 while(1){} 28 return 0; 29 }
这段代码的目的很简单,在input函数中定义了array[20]并赋值,在output函数中输出,运行结果如下:
Nice Work!
But……在input()后来一发printf()呢?????
1 int main() 2 { 3 input(); 4 printf("any string"); 5 output(); 6 while(1){} 7 return 0; 8 }
其实,只要学过一段时间的C语言的童鞋就会发现,刚刚开始那俩函数里定义的array[20]就出问题了,这俩array压根儿没关系,如果遇到这样的代码,第一反应就是通过参数或者全局变量的方法,让这俩array有关系。
But,问题来了……王尼玛是个新手,他将两个array定义成一样的名字认为他们就是同一个数组,并且,他振振有词的说,我之前的代码是没问题的,只加了个printf就出问题了,应该就是这里有问题了,怎么可能是定义array的问题?
尼玛,这只是巧合而已,你的第一段程序就是错的!
可我的输出是正确的啊……
这……
==============================================分割线================================================
其实大家都知道,问题的根源是output和input函数中的数组array虽然同名,但却不是同一个数组,只是碰巧将原先赋值的内存给输出了而已,要解释这个问题,就需要了解C语言在函数调用过程中,堆栈是如何变化的。首先必须明确一点也是非常重要的一点,栈是向下生长的,所谓向下生长是指从内存高地址->低地址的路径延伸,那么就很明显了,栈有栈底和栈顶,那么栈顶的地址要比栈底低。对x86体系的CPU而言,其中
---> 寄存器ebp(base pointer )可称为“帧指针”或“基址指针”,其实语意是相同的。
---> 寄存器esp(stack pointer)可称为“ 栈指针”。
要知道的是:
---> ebp 在未受改变之前始终指向栈帧的开始,也就是栈底,所以ebp的用途是在堆栈中寻址用的。
---> esp是会随着数据的入栈和出栈移动的,也就是说,esp始终指向栈顶。
见下图,假设函数A调用函数B,我们称A函数为"调用者",B函数为“被调用者”则函数调用过程可以这么描述:
(1)先将调用者(A)的堆栈的基址(ebp)入栈,以保存之前任务的信息。
(2)然后将调用者(A)的栈顶指针(esp)的值赋给ebp,作为新的基址(即被调用者B的栈底)。
(3)然后在这个基址(被调用者B的栈底)上开辟(一般用sub指令)相应的空间用作被调用者B的栈空间。
(4)函数B返回后,从当前栈帧的ebp即恢复为调用者A的栈顶(esp),使栈顶恢复函数B被调用前的位置;然后调用者A再从恢复后的栈顶可弹出之前的ebp值(可以这么做是因为这个值在函数调用前一步被压入堆栈)。这样,ebp和esp就都恢复了调用函数B前的位置,也就是栈恢复函数B调用前的状态。
回到之前的问题,由于input函数和output函数为各自的array数组分配的空间在内存中的地址恰好相同,所以可以顺利输出其内容;但是在调用printf函数以后,由于堆栈中一部分内容被修改了,所以输出结果前半部分是正确的,后半部分是错误的。看到这里,相信有童鞋会试着运行这段代码,如果使用Turbo C,恭喜你可以获得相同的结果(上述结果在Turbo C测试截图);如果使用Visual Studio XXXX,将得到如下结果:
这是怎么回事呢?查看了反汇编,发现在Debug版本中,为了方便调试,VS会将数组初始化为0xCCCCCCCC,而output函数中的array数组是刚刚定义的,所以被VS初始化位0xCCCCCCCC,转换成unsigned int就是-858993460。
当然,在Release版本中,为了提高效率,是不会对数组进行这种默认初始化的操作,那么结果是什么样的呢?
纳尼?!如果VS不给数组初始化,得到的结果为毛和Turbo C不一样啊……
既然这样,只能再次借助反汇编了,见下图。可以发现input函数没有对应的汇编语句,也就是说,由于这货啥都不干,被编译器优化掉了。既然没有对数组array赋值,那么输出的自然是内存里原先乱七八糟的数据了。
至于GCC会得出什么结果,作为Windows党,就不测试了,感兴趣的童鞋可以调整编译选项自己试试看