zoukankan      html  css  js  c++  java
  • 数组名和数组名取地址的区别

    数组名和数组名取地址的区别

    以下代码会打印出什么样的日志呢?

    [cpp] view plaincopy
     
    1. #include <stdio.h>  
    2.   
    3. int a[2] = {1,2};  
    4. int main(){  
    5.         printf("a = %p ", a); // I  
    6.         printf("&a = %p ", &a); // II  
    7.         printf("a + 1 = %p ", a + 1);// III  
    8.         printf("&a + 1 = %p ", &a + 1);// IV  
    9.   
    10.         return 0;  
    11. }  

    本机(linux)结果输出:
    a = 0x804a014
    &a = 0x804a014
    a + 1 = 0x804a018
    &a + 1 = 0x804a01c

    没错,上面I 和 II打印出来的地址是一样的,IV 要比 III 大4个字节的地址空间。下面是我对这一现象的解释,如有不妥的地方请各位大虾一定给于指出:

    首先引用《C和指针》p141中的理论
    在C中, 在几乎所有使用数组的表达式中,数组名的值是个指针常量,也就是数组第一个元素的地址。 它的类型取决于数组元素的类型: 如果它们是int类型,那么数组名的类型就是“指向int的常量指针“。
    看到这里我想应该就知道为什么 会有I 和 III式的结果了。

    对于II 和 IV 则是特殊情况,在《C和指针》p142中说到,在以下两中场合下,数组名并不是用指针常量来表示,就是当数组名作为sizeof操作符和单目操作符&的操作数时。 sizeof返回整个数组的长度,而不是指向数组的指针的长度。 取一个数组名的地址所产生的是一个指向数组的指针,而不是一个指向某个指针常量的指针。
    所以&a后返回的指针便是指向数组的指针,跟a(一个指向a[0]的指针)在指针的类型上是有区别的。

    然后我们用符号表和汇编代码来看看编译器到底是怎样区分&a 和 a, 并将其转换为汇编代码的

    通过 nm a.out 得到符号表如下:

    [plain] view plaincopy
     
    1. 。。。。。。。// 省略了一些与本主题无关的变量  
    2. 0804a01c A _edata  
    3. 0804a024 A _end  
    4. 080484ec T _fini  
    5. 08048508 R _fp_hw  
    6. 080482bc T _init  
    7. 08048330 T _start  
    8. 0804a014 D a // a 变量保存在虚拟地址0x0804a014 中  
    9. 0804a01c b completed.7021  
    10. 0804a00c W data_start  
    11. 0804a020 b dtor_idx.7023  
    12. 080483c0 t frame_dummy  
    13. 080483e4 T main // main函数的地址  
    14.          U printf@@GLIBC_2.0  

    调用gcc -S xx.c得到汇编代码:

    [cpp] view plaincopy
     
    1.     .file   "name_of_array.c"  
    2. .globl a  
    3.     .data  
    4.     .align 4  
    5.     .type   a, @object  
    6.     .size   a, 8 // 从这里我们便知道sizeof(a) 等于8  
    7. a:  
    8.     .long   1 // 从这里可以看出,编译器直接把 .c文件中的int 转化为long型  
    9.     .long   2  
    10.     .section    .rodata  
    11. .LC0:  
    12.     .string "a = %p "  
    13. .LC1:  
    14.     .string "&a = %p "  
    15. .LC2:  
    16.     .string "a + 1 = %p "  
    17. .LC3:  
    18.     .string "&a + 1 = %p "  
    19.     .text  
    20. .globl main  
    21.     .type   main, @function  
    22. main:  
    23.     pushl   %ebp  
    24.     movl    %esp, %ebp  
    25.     andl    $-16, %esp  
    26.     subl    $16, %esp  
    27.     movl    $.LC0, %eax // I 所对应的汇编代码  
    28.     movl    $a, 4(%esp)  
    29.     movl    %eax, (%esp)  
    30.     call    printf  
    31.     movl    $.LC1, %eax // II 所对应的汇编代码  
    32.     movl    $a, 4(%esp)  
    33.     movl    %eax, (%esp)  
    34.     call    printf  
    35.     movl    $.LC2, %eax // III 所对应的汇编代码  
    36.     movl    $a+4, 4(%esp)  
    37.     movl    %eax, (%esp)  
    38.     call    printf  
    39.     movl    $a+8, %edx // IV 所对应的汇编代码  
    40.     movl    $.LC3, %eax  
    41.     movl    %edx, 4(%esp)  
    42.     movl    %eax, (%esp)  
    43.     call    printf  
    44.     movl    $0, %eax  
    45.     leave  
    46.     ret  
    47.     .size   main, .-main  
    48.     .ident  "GCC: (Ubuntu 4.4.3-4ubuntu5) 4.4.3"  
    49.     .section    .note.GNU-stack,"",@progbits  

    I所对应的汇编代码 movl $a, 4(%esp)
    $表示取地址,通过符号表我们知道a对应地址为0x0804a014, 所以这段代码将会打印0x0804a014。但是我们明明在代码里写的是printf("a = %p ", a), (如果a不为数组名而是一般意义的int变量,相应的汇编码应为movl a, 4(%esp) 怎么编译后的汇编代码会是对a取地址呢? 本人猜测为编译器自动给a 加了一个取值符,从而翻译为$a。
    结论: 对于用户没有明确给出&的编码,编译器翻译自动给变量a加上取值符$, 其中取a的地址得到的指针类型由数组元素决定。

    II 略过

    III movl $a+4, 4(%esp)
    对a加上取值符得到$a,因为数组元素类型为int,所以指针每次需要移动四个字节的地址空间。 所以c代码 a + 1 翻译为汇编 $a + 4 

    IV  movl $a+8, %edx 
    所对应用户代码为printf("a = %p ", &a + 1), 根据《C和指针》中的理论,当a前面有&操作符时,编译器将会把a对应符号表中的地址看作指向数组的指针,sizeof(a) 为8,
    从而&a + 1 将会翻译为$a + 8
    结论: 对于用户明确给出&的编码,编译器将会把取a的地址得到的指针类型看作指向数组的指针。

    总结:编译器通过用户是否给出&,来决定指针变量的类型,进而翻译为相应的汇编码。 或者换句话说,&符只是用来表明变量a取地址后得到的值,被看作什么类型的指针,而不是用来表示对a进行取地址操作。

    ///////////////////////////////////《c专家编程》 P201页提到表达式中的数组名(与声明不同)被编译器当作一个指向该数组第一个元素的指针////////////////////////

     1 #include "stdafx.h"
     2 #include "iostream"
     3 using namespace std;
     4 
     5 int _tmain(int argc, _TCHAR* argv[])
     6 {
     7     int *p = NULL;
     8     char a[10];
     9     cout<<((int(p+1) - int(p)))<<endl;
    10 
    11     cout<<((int(&a+1) - int(&a)))<<endl;//等同于下列
    12     char (*b)[10];//b代表指向数组的指针,即行指针。
    13     b = &a;
    14     cout<<((int(b+1) - int(b)))<<endl;
    15 
    16     cout<<((int(a+1) - int(a)))<<endl;//等同于下列
    17     cout<<((int(&a[0]+1) - int(&a[0])))<<endl;
    18 
    19     return 0;
    20 }

    打印输出:

    4

    10

    10

    1

    1

  • 相关阅读:
    gulp学习笔记1
    2017年秋季校招前端面经(百度,腾讯,网易,华为,乐视等)
    前端面试笔试知识汇总3(含答案)
    前端面试笔试知识汇总2(含答案)
    前端面试笔试知识汇总1(含答案)
    一些新的web性能优化技术
    一个简单的无限滚动的加载数据实现
    正则和字符串之间的关系梳理
    数据结构——二叉树的知识点总结
    秋招笔试碰到的疑难题目2
  • 原文地址:https://www.cnblogs.com/kira2will/p/4342507.html
Copyright © 2011-2022 走看看