首先来看看主要有几种程序内存分配:
一个由C/C++编译程序占用内存分为以下几个部分
1、栈区(stack)— 由编译器自动分配释放 ,存放函数参数值,局部变量值等。其操作方式类似于数据结构中栈。
2、堆区(heap) — 一般由程序员分配释放, 若程序员不释放,程序结束时可能由OS回收 。注意它与数据结构中堆是两回事,分配方式倒是类似于链表,呵呵。
3、全局区(静态区)(static)—,全局变量和静态变量存储是放在一块,初始化全局变量和静态变量在一块区域, 未初始化全局变量和未初始化静态变量在相邻另一块区域。 - 程序结束后由系统释放。-->分别是data区,bbs区
4、文字常量区 —常量字符串就是放在这里。 程序结束后由系统释放-->coment区
5、程序代码区—存放函数体二进制代码。-->code(text)区
经典实例:
#include <string> int a=0; //全局初始化区 char *p1; //全局未初始化区 void main() { int b;//栈 char s[]="abc"; //栈 char *p2; //栈 char *p3="123456"; //123456 在常量区,p3在栈上。 static int c=0; //全局(静态)初始化区 p1 = (char*)malloc(10); p2 = (char*)malloc(20); //分配得来的10和20字节的区域就在堆区。 strcpy(p1,"123456"); //123456 放在常量区,编译器可能会将它与p3所向"123456 "优化成一个地方。 }
一、堆和栈究竟有什么区别(堆和栈理论知识)?
2.1申请方式
stack:
由系统自动分配。 例如,声明在函数中一个局部变量 int b; 系统自动在栈中为b开辟空间
heap:
需要程序员自己申请,并指明大小,在c中malloc函数
如p1 = (char *)malloc(10);
如p2 = (char *)malloc(10);
在C++中用new运算符:
int *p = new int(10); // new一个整型数
但是注意p、p1、p2本身是在栈中。
2.2申请后系统响应
栈:只要栈剩余空间大于所申请空间,系统将为程序提供内存,否则将报异常提示栈溢出。
堆:首先应该知道操作系统有一个记录空闲内存地址链表,当系统收到程序申请时,会遍历该链表,寻找第一个空间大于所申请空间堆结点,然后将该结点从空闲结点链表中删除,并将该结点空间分配给程序,另外,对于大多数系统,会在这块内存空间中首地址处记录本次分配大小,这样,代码中delete语句才能正确释放本内存空间。另外,由于找到堆结点大小不一定正好等于申请大小,系统会自动将多余那部分重新放入空闲链表中。
2.3申请大小限制
栈:在Windows下,栈是向低地址扩展数据结构(栈向下生长),是一块连续内存区域。这句话意思是栈顶地址和栈最大容量是系统预先规定好,在WINDOWS下,栈大小是2M(也有说是1M,总之是一个编译时就确定常数),如果申请空间超过栈剩余空间时,将提示overflow。因此,能从栈获得空间较小。
堆:堆是向高地址扩展数据结构(堆向上生长),是不连续内存区域。这是由于系统是用链表来存储空闲内存地址,自然是不连续,而链表遍历方向是由低地址向高地址。堆大小受限于计算机系统中有效虚拟内存。由此可见,堆获得空间比较灵活,也比较大。
2.4申请效率比较:
栈效率高:栈由系统自动分配,速度较快。但程序员是无法控制。
堆效率相对比较低:堆是由new分配内存,一般速度比较慢,而且容易产生内存碎片,不过用起来最方便.
另外,在WINDOWS下,最好方式是用VirtualAlloc分配内存,他不是在堆,也不是在栈是直接在进程地址空间中保留一快内存,虽然用起来最不方便。但是速度快,也最灵活。
2.5堆和栈中存储内容
栈: 在函数调用时,第一个进栈是主函数中后下一条指令(函数调用语句下一条可执行语句)地址,然后是函数各个参数,在大多数C编译器中,参数是由右往左入栈,然后是函数中局部变量。注意静态变量是不入栈。
当本次函数调用结束后,局部变量先出栈,然后是参数,最后栈顶指针指向最开始存地址,也就是主函数中下一条指令,程序由该点继续运行。
堆:一般是在堆头部用一个字节存放堆大小。堆中具体内容有程序员安排。
2.6存取效率比较
char s1[] = "aaaaaaaaaaaaaaa"; char *s2 = "bbbbbbbbbbbbbbbbb";
aaaaaaaaaaa是在运行时刻赋值;
而bbbbbbbbbbb是在编译时就确定;
但是,在以后存取中,在栈上数组比指针所指向字符串(例如堆)快。
比如:
#include void main() { char a = 1; char c[] = "1234567890"; char *p ="1234567890"; a = c[1]; a = p[1]; return; }
对应汇编代码
10: a = c[1]; 00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh] 0040106A 88 4D FC mov byte ptr [ebp-4],cl 11: a = p[1]; 0040106D 8B 55 EC mov edx,dword ptr [ebp-14h] 00401070 8A 42 01 mov al,byte ptr [edx+1] 00401073 88 45 FC mov byte ptr [ebp-4],al
第一种在读取时直接就把字符串中元素读到寄存器cl中,而第二种则要先把指针值读到edx中,在根据edx读取字符,显然慢了。
2.7小结:
堆和栈区别可以用如下比喻来看出:
使用栈就象我们去饭馆里吃饭,只管点菜(发出申请)、付钱、和吃(使用),吃饱了就走,不必理会切菜、洗菜等准备工作和洗碗、刷锅等扫尾工作,他好处是快捷,但自由度小。
使用堆就象是自己动手做喜欢吃菜肴,比较麻烦,但是比较符合自己口味,而且自由度大。
全局变量或者静态变量,它们都放在堆里
局部变量放在栈里
堆区,也叫自由存储区.
为什么说在堆上分配内存比在栈上分配内存慢?
1.堆空间开辟需要用系统函数,栈上直接修改指针.
2. 堆空间管理需要系统记帐,栈上空间可以由编译器管理或是保存在某个处理器寄存器中。
3. 堆空间释放需要系统管理,栈上释放可以直接丢弃。堆空间需要通过栈上指针间接引用,所以访问会慢;
记得在apue2上面看到关于线程中有这样一段话,大致意思是,一个线程有自己堆栈,可以在堆栈上分配内存,比如说一个结构体,如果这个线程调用了pthread_exit()返回这个结构体指针时候之后要特别小心,因为很有可能这个结构体里面成员值发生改变,这个可以理解,因为同一个进程所有线程资源是共享,当这个线程退出之后那部分以前用过堆栈很可能被其它线程占用,但同时又说如果malloc就不会出现这样问题,
比如,在栈上分一个int,只要esp-4就可以了,
在堆上系统要记录被分配内存信息,以便释放
BTW:
栈有序
堆无序
----------------------------------
内存分配方式有三种:
1.从静态存储区域分配。内存在程序编译时候就已经分配好,这块内存在程序整个运行期间都存在。例如全局变量,static变量。
2.在栈上创建。在执行函数时,函数内局部变量存储单元都可以在栈上创建,函数执行结束时这些存储单元自动被释放。栈内存分配运算内置于处理器指令集中,效率很高,但是分配内存容量有限。
3.从堆上分配,亦称动态内存分配。程序在运行时候用malloc或new申请任意多少内存,程序员自己负责在何时用free或delete释放内存。动态内存生存期由我们决定,使用非常灵活,但问题也最多。
----------------------------------------
一般所说堆栈(stack)往往是指栈,先进后出,它是一块内存区。用以存放程序局部变量,临时变量,函数参数,返回地址等。在这块区域中变量分配和释放由系统自动进行。不需要用户参与。
而在堆(heap,先进先出)上空间则是由用户进行分配,并由用户负责释放。
二、 函数调用与堆栈
1)编译器一般使用栈来存放函数的参数,局部变量等来实现函数调用。有时候函数有嵌套调用,这个时候栈中会有多个函数的信息,每个函数占用一个连续的区域。一个函数占用的区域被称作帧()。同时栈是线程独立的,每个线程都有自己的栈。例如下面简单的函数调用:
另外函数堆栈的清理方式决定了当函数调用结束时由调用函数或被调用函数来清理函数帧,在VC中对函数栈的清理方式由两种:
参数传递顺序 | 谁负责清理参数占用的堆栈 | |
__stdcall | 从右到左 | 被调函数 |
__cdecl | 从右到左 | 调用者 |
2) 有了上面的知识为铺垫,我们下面细看一个函数的调用时堆栈的变化:
代码如下:
int Add(int x, int y) { return x + y; } void main() { int *pi = new int(10); int *pj = new int(20); int result = 0; result = Add(*pi,*pj); delete pi; delete pj; }
对上面的代码,我们分为四步,当然我们只画出了我们的代码对堆栈的影响,其他的我们假设它们不存在,哈哈!
第一,int *pi = new int(10); int *pj = new int(20); int result = 0; 堆栈变化如下:
第二,Add(*pi,*pj);堆栈如下(函数参数入栈:从右向左):
第三,将Add的结果给result,堆栈如下:
第四,delete pi; delete pj; 堆栈如下:
第五,当main()退出后,堆栈如下,等同于main执行前,哈哈!
例子1 ----------------------------------------------------------------------------
【参见】http://blog.csdn.net/wudaijun/article/details/8135205
#include<iostream> using namespace std; int main() { char p[] ="123456"; // char s[10]; // 正常复制: 123456 -- 123456 char s[4]; // 栈溢出(目标栈空间不够大), output: 56 -- 123456 char *ptr = p + 3; strcpy(s, p); cout<< p << " -- " << s << " --- " << ptr << endl; return 0; } // 栈 内存分配方式 (地址:高(左)->低(右); 数据写入方向:低(右)->高(左)) // '/0' '6' '5' '4'(ptr) '3' '2' '1'(p) '' '' '' ''(s) // char p[] ="123456";//char s[4]; // '/0' '6' '5' '4'(ptr) '/0' '6' '5'(p) '4' '3' '2' '1'(s) //strcpy(s, p); // output : 56 -- 123456 --- 456 // 解析:在这里我们可以知道p=s+4; 然后我们对s进行写入"123456" s所在的四个字节不够用 所以"56"(包括后面的/0)均被写入了p地址 因此输出p将输出56
结果讨论:
例子2 ----------------------------------------------------------------------------
#include<iostream> using namespace std; int main() { char p[] ="123456"; int c=0; char s[4]; strcpy(s, p); cout<<p<<endl; cout<<c<<endl; return 0; }
// output :
123456
13877
请按任意键继续. . .
例子3 ----------------------------------------------------------------------------
int main() { int a; int* pb = new int; cout<<"a is from stack, b is from heap"<<endl; cout<<"(int)a= "<<a<<endl; cout<<"(int)b= "<<*pb<<endl; cout<<"(hex)a= "<<hex<<a<<endl; cout<<"(hex)b= "<<hex<<*pb<<endl; char* pa = (char*)&a; cout<<"(char)a= "<<pa<<endl; cout<<"(char)b= "<<(char*)pb<<endl; delete pb; return 0; }
int main() { int*a = new int; int*b = new int; int*c = new int; delete a; delete b; delete c; return 0; }
a = 00382a48 b = 00382a90 c = 00382ad8
00382a48 - 00382a28 = 32Byte
48(H) = 0100 1000(B) = 72(D)
28(H) = 0010 1000(B) = 40(D)
72 - 40 = 32