因为使用C++写小题目时经常需要清除数组,这里记录下Memset函数的sizeof运算符的使用注意。
memset的特点是:将给定地址后连续的内存(包括给定地址),逐个byte初始化为参数中指明的值。
因为是逐byte初始化,所以memset一般只用来清空(赋值为0)
如果不赋值为0,结果是什么呢?假设对于int A[],如果使用memset(A, 1, sizeof(A)),那么数组A的每一个值会被初始化为0x01010101
正因为如此,一般只会出现 memset(A, 0, sizeof(A))
对于堆区分配的数组,int *A = new int[N], memset(A, 0, sizeof(A[0])*N) 也可以达到效果,但要注意,这里第三个参数不能使用sizeof(A),而要指明byte数。
要想知道原因,需要知道sizeof 运算符的作用。它返回的是“占用的栈空间字节数”。如果数组用int A[N]的形式申明,那么sizeof(A)返回的是整个A数组的占用byte数。如果用int *A = new int[N],sizeof(A)返回的依旧是一个int *所占用的byte数,也就是说,32位编译器会返回 4,64位编译器会返回8。需要注意的是,对于两种编译器,sizeof作用在int *才会有区别,而sizeof(int) 或者 sizeof(a) (a是一个申明为int的参数) 在两种编译器上都返回4。
下面是一个测试程序。编译环境为gcc 4.8.2 64-bit
int *B; int b; cout << "sizeof B: " << sizeof(B) << endl; //8,因为我的编译器是64-bit cout << "sizeof b: " << sizeof(b) << endl; //4,无论32-bit还是64-bit编译器,int所占字节数都是4 B = new int[5]; B[4] = 7; B[3] = 6; B[2] = 5; B[1] = 3; B[0] = 1; cout << "-------B--------- "; for(i = 0; i < 5; ++i) cout << B[i] << ' '; //1 3 5 6 7 cout << endl; memset(B, 0, sizeof(B)); for(i = 0; i < 5; ++i) cout << B[i] << ' '; // 0 0 5 6 7 因为B 占了8字节,所以前8 byte置0 cout << endl; int C[3]; C[2] = 6; C[1] = 4; C[0] = 2; cout << " --------C-------- "; cout << "size of C: " << sizeof(C) << endl; //12,返回数组所占用的字节数 for(i = 0; i < 3; ++i) cout << C[i] << ' '; //2 4 6 cout << endl; memset(C, 0, sizeof(C)); for(i = 0; i < 3; ++i) cout << C[i] << ' '; //0 0 0 cout << endl;
知道了上面的原理,我们来看看二维数组的初始化。
int A[2][3] 对于这样的定义方式,我们依然可以通过memset(A, 0, sizeof(A))来完成对整个二维数组的初始化,因为这种方式申明的二维数组本质上还是一维排列。
如果是int **A,然后动态申明一个2*3的二维数组呢?我们可以像上面一样,通过 memset(A, 0, sizeof(A[0][0])*2*3) 来完成二维数组的初始化吗?
答案自然是不行。
动态分配的一维数组之所以依然能用Memset(虽然第三参数要指明byte数)来完成赋值,因为在堆区,一维数组的成员依然是连续排列。
而动态分配的二维数组中的int成员在堆区还是连续排列的吗?当然不是,既然不是,memset就不能得到想要的结果了。那实际结果是啥?memset会清空存放二级指针的连续内存,附带清除些别的内存区域。之后只要访问诸如A[0][1]之类的都会引发内存错误,因为二维数组的结构已经被破坏。
高维数组在初始化时的注意类似于二维数组,这里就不再赘述了。