C语言编程主要操作的对象就是指针。
指针从哪里来
指针就是表示内存存储区域的一组数值,使用%p
格式化字符串。
Linux系统会为程序维护两个临时变量存储位置:栈、堆。栈的空间少,栈通常在用户更高的地址空间处分配,通常有数M字节的大小,堆一般比栈要更大一点,一般会达到几十甚至是数百M字节。
栈
对于较小的变量,使用int、char、double等定义符号,可以直接在栈中建立空间。
#include <stdio.h>
int main(){
int a = -1;
int b[4] = {0, 1, 2, 3};
int c = 4;
printf("id(a):%p
", &a);
printf("id(b[0]):%p
id(b[3]):%p
", &b[0], &b[3]);
printf("id(c):%p
", &c);
int* d = &b[4];
printf("id(d[0]):%p
id(d[3]):%p",&d[0], &d[3]);
return 0;
}
函数退出时C编译器会从栈中“弹出”所有变量,清空整个栈,因此防止了栈上变量的内存泄漏。
值得注意的是,如果获取了指向栈上变量的指针,并且将它用于传参或从函数返回,接收它的函数会产生“段错误”。因为实际的数据被弹出而消失,指针依旧指向被释放的栈区域。
堆
栈容量有限,很容易溢出,因此对于较大的数据结构,比如结构体,尽可能在堆上开辟空间。
malloc、calloc等初始化函数就是Linux为程序进程开辟堆内存空间的函数。这些初始化动作返回的指针,都是指向目标内存区域的起始位置。
一块内存空间一旦使用完毕,应该立即调用free函数释放空间。否则,函数退出后,指针变量在栈上随即被注销。但是指针所指向的内存空间仍然在系统注册为“正在使用”。这就造成了,系统无法再度分配该空间,而进程也没有指针操纵该空间,就成了内存泄漏。
使用free释放内存空间之后,该指针仍然会指向原来的地址,成了“野指针”,容易造成危险。为了避免,这种情况的发生,应该在调用free之后,立即将指针置为NULL。
指针有什么用
指针可以用于四个最基本的操作:
- 向OS申请一块内存,并且用指针处理它。这包括字符串、结构体等等。
- 通过指针向函数传递大块的内存(比如很大的结构体),这样不必把全部数据都传递进去。
- 获取函数的地址用于动态调用,可以向其他函数传递函数指针,从而实现callback回调机制。
- 对一块内存做复杂的搜索,比如,转换网络套接字中的字节,或者解析文件。
指针的使用
type *ptr
,type类型的指针,名为ptr。*ptr
,指针ptr所指向位置的值。*(ptr + i)
,(ptr所指向位置加上i)的值。以字节为单位的话,应该是ptr所指向的位置再加上sizeof(type) * i。&thing
,变量thing的地址。type *ptr = &thing
,type类型的名为ptr的指针,其值设置为thing的地址,也就是“新建一个指向thing的指针,thing的类型是type”。ptr++
,自增ptr指向的位置,相当于*(ptr + 1)
。
指针和数组
指针并不是数组,即使C允许以一些相同的方法来使用它们。例如,对于一个数组age[]
的指针cur_age,调用sizeof(cur_age)
会得到指针的大小,而不是它指向数组的大小。如果想得到整个数组的大小,应该使用数组的名称age。
除了sizeof、&操作和声明之外,数组名称都会被编译器推导为指向其首个元素的指针。对于这些情况,不要用“是”这个词,而是要用“推导”。