zoukankan      html  css  js  c++  java
  • 浅析C++中的this指针

    转自:http://blog.csdn.net/starlee/article/details/2062586

    有下面的一个简单的类:

     1 class CNullPointCall
     2 {
     3 public:
     4     static void Test1();
     5     void Test2();
     6     void Test3(int iTest);
     7     void Test4();
     8 
     9 private:
    10     static int m_iStatic;
    11     int m_iTest;
    12 };
    13 
    14 int CNullPointCall::m_iStatic = 0;
    15 
    16 void CNullPointCall::Test1()
    17 {
    18     cout << m_iStatic << endl;
    19 }
    20 
    21 void CNullPointCall::Test2()
    22 {
    23     cout << "Very Cool!" << endl; 
    24 }
    25 
    26 void CNullPointCall::Test3(int iTest)
    27 {
    28     cout << iTest << endl; 
    29 }
    30 
    31 void CNullPointCall::Test4()
    32 {
    33     cout << m_iTest << endl; 
    34 }

     那么下面的代码都正确吗?都会输出什么?

    1 CNullPointCall *pNull = NULL; // 没错,就是给指针赋值为空
    2 pNull->Test1(); // call 1
    3 pNull->Test2(); // call 2
    4 pNull->Test3(13); // call 3
    5 pNull->Test4(); // call 4

    你肯定会很奇怪我为什么这么问。一个值为NULL的指针怎么可以用来调用类的成员函数呢?!可是实事却很让人吃惊:除了call 4那行代码以外,其余3个类成员函数的调用都是成功的,都能正确的输出结果,而且包含这3行代码的程序能非常好的运行。
        经过细心的比较就可以发现,call 4那行代码跟其他3行代码的本质区别:类CNullPointCall的成员函数中用到了this指针。
        对于类成员函数而言,并不是一个对象对应一个单独的成员函数体,而是此类的所有对象共用这个成员函数体。 当程序被编译之后,此成员函数地址即已确定。而成员函数之所以能把属于此类的各个对象的数据区别开, 就是靠这个this指针。函数体内所有对类数据成员的访问, 都会被转化为this->数据成员的方式。
        而一个对象的this指针并不是对象本身的一部分,不会影响sizeof(“对象”)的结果。this作用域是在类内部,当在类的非静态成员函数中访问类的非静态成员的时候,编译器会自动将对象本身的地址作为一个隐含参数传递给函数。也就是说,即使你没有写上this指针,编译器在编译的时候也是加上this的,它作为非静态成员函数的隐含形参,对各成员的访问均通过this进行。
        对于上面的例子来说,this的值也就是pNull的值。也就是说this的值为NULL。而Test1()是静态函数,编译器不会给它传递this指针,所以call 1那行代码可以正确调用(这里相当于CNullPointCall::Test1());对于Test2()和Test3()两个成员函数,虽然编译器会给这两个函数传递this指针,但是它们并没有通过this指针来访问类的成员变量,因此call 2和call 3两行代码可以正确调用;而对于成员函数Test4()要访问类的成员变量,因此要使用this指针,这个时候发现this指针的值为NULL,就会造成程序的崩溃。    
        其实,我们可以想象编译器把Test4()转换成如下的形式:

    1 void CNullPointCall::Test4(CNullPointCall *this)
    2 {
    3     cout << this->m_iTest << endl; 
    4 }

    而把call 4那行代码转换成了下面的形式:

    1 CNullPointCall::Test4(pNull);

     所以会在通过this指针访问m_iTest的时候造成程序的崩溃。
        下面通过查看上面代码用VC 2005编译后的汇编代码来详细解释一下神奇的this指针。
        上面的C++代码编译生成的汇编代码是下面的形式:

     1    CNullPointCall *pNull = NULL;
     2 0041171E  mov         dword ptr [pNull],0 
     3     pNull->Test1();
     4 00411725  call        CNullPointCall::Test1 (411069h) 
     5     pNull->Test2();
     6 0041172A  mov         ecx,dword ptr [pNull] 
     7 0041172D  call        CNullPointCall::Test2 (4111E0h) 
     8     pNull->Test3(13);
     9 00411732  push        0Dh  
    10 00411734  mov         ecx,dword ptr [pNull] 
    11 00411737  call        CNullPointCall::Test3 (41105Ah) 
    12     pNull->Test4();
    13 0041173C  mov         ecx,dword ptr [pNull] 
    14 0041173F  call        CNullPointCall::Test4 (411032h) 

      通过比较静态函数Test1()和其他3个非静态函数调用所生成的的汇编代码可以看出:非静态函数调用之前都会把指向对象的指针pNull(也就是this指针)放到ecx寄存器中(mov ecx,dword ptr [pNull])。这就是this指针的特殊之处。看call 3那行C++代码的汇编代码就可以看到this指针跟一般的函数参数的区别:一般的函数参数是直接压入栈中(push 0Dh),而this指针却被放到了ecx寄存器中。在类的非成员函数中如果要用到类的成员变量,就可以通过访问ecx寄存器来得到指向对象的this指针,然后再通过this指针加上成员变量的偏移量来找到相应的成员变量。
        下面再通过另外一个例子来说明this指针是怎样被传递到成员函数中和如何使用this来访问成员变量的。
        依然是一个很简单的类:

     1 class CTest
     2 {
     3 public:
     4     void SetValue();
     5 
     6 private:
     7     int m_iValue1;
     8     int m_iValue2;
     9 };
    10 
    11 void CTest::SetValue()
    12 {
    13     m_iValue1 = 13;
    14     m_iValue2 = 13;
    15 }

      用如下的代码调用成员函数:

    1 CTest test;
    2 test.SetValue();

      上面的C++代码的汇编代码为:  CTest test;
        test.SetValue();
    004117DC  lea         ecx,[test] 
    004117DF  call        CTest::SetValue (4111CCh)    

    同样的,首先把指向对象的指针放到ecx寄存器中;然后调用类CTest的成员函数SetValue()。地址4111CCh那里存放的其实就是一个转跳指令,转跳到成员函数SetValue()内部。

    004111CC  jmp         CTest::SetValue (411750h)

    而411750h才是类CTest的成员函数SetValue()的地址。

     1 void CTest::SetValue()
     2 {
     3 00411750  push        ebp  
     4 00411751  mov         ebp,esp 
     5 00411753  sub         esp,0CCh 
     6 00411759  push        ebx  
     7 0041175A  push        esi  
     8 0041175B  push        edi  
     9 0041175C  push        ecx // 1   
    10 0041175D  lea         edi,[ebp-0CCh] 
    11 00411763  mov         ecx,33h 
    12 00411768  mov         eax,0CCCCCCCCh 
    13 0041176D  rep stos    dword ptr es:[edi] 
    14 0041176F  pop         ecx // 2 
    15 00411770  mov         dword ptr [ebp-8],ecx // 3
    16     m_iValue1 = 13;
    17 00411773  mov         eax,dword ptr [this] // 4
    18 00411776  mov         dword ptr [eax],0Dh // 5
    19     m_iValue2 = 13;
    20 0041177C  mov         eax,dword ptr [this] // 6
    21 0041177F  mov         dword ptr [eax+4],0Dh // 7
    22 }
    23 00411786  pop         edi  
    24 00411787  pop         esi  
    25 00411788  pop         ebx  
    26 00411789  mov         esp,ebp 
    27 0041178B  pop         ebp  
    28 0041178C  ret 

    下面对上面的汇编代码中的重点行进行分析:
        1、将ecx寄存器中的值压栈,也就是把this指针压栈。
        2、ecx寄存器出栈,也就是this指针出栈。
        3、将ecx的值放到指定的地方,也就是this指针放到[ebp-8]内。
        4、取this指针的值放入eax寄存器内。此时,this指针指向test对象,test对象只有两个int型的成员变量,在test对象内存中连续存放,也就是说this指针目前指向m_iValue1。
        5、给寄存器eax指向的地址赋值0Dh(十六进制的13)。其实就是给成员变量m_iValue1赋值13。
        6、同4。
        7、给寄存器eax指向的地址加4的地址赋值。在4中已经说明,eax寄存器内存放的是this指针,而this指针指向连续存放的int型的成员变量m_iValue1。this指针加4(sizeof(int))也就是成员变量m_iValue2的地址。因此这一行就是给成员变量m_iValue2赋值。
        通过上面的分析,我们可以从底层了解了C++中this指针的实现方法。虽然不同的编译器会使用不同的处理方法,但是C++编译器必须遵守C++标准,因此对于this指针的实现应该都是差不多的。

  • 相关阅读:
    MSComm控件进行串口编程的基本步骤(转载)
    Linux C Socket编程原理及简单实例(转载)
    ubuntu14.04英文环境下安装中文输入法(转载)
    2015高工机器人年会第一批100名参会嘉宾名单公布
    中国式人机协作
    优傲机器人:协作机器人助力电子制造业智能转型
    netty学习笔记
    画图模板
    文本建模
    自定义IP协议
  • 原文地址:https://www.cnblogs.com/zl1991/p/4762065.html
Copyright © 2011-2022 走看看