zoukankan      html  css  js  c++  java
  • 【原创】Performanced C++ 经验规则 第二条:你不知道的构造函数(中)

    第二条:你不知道的构造函数(中)

    上一篇你不知道的构造函数(上)主要讲述了,C++构造函数在进入构造函数体之前,你可能不知道的一些细节。这一篇将讲述,进入构造函数体后,又发生了什么。

    4、虚表初始化

    上一篇曾提到,如果一个类有虚函数,那么虚表的初始化工作,无论构造函数是你定义的还是由编译器产生的,这部分工作都将由编译器隐式“合成”到构造函数中,以表示其良苦用心。上一篇还提到,这部分工作,在“刚”进入构造函数的时候,就开始了,之后,编译器才会理会,你构造函数体的第一行代码。这一点,通过反汇编,我们已经看的非常清楚。

    虚表初始化的主要内容是:将虚表指针置于对象的首4字节;用该类的虚函数实际地址替换虚表中该同特征标(同名、同参数)函数的地址,以便在调用的时候实现多态,如果有新的虚函数(派生类中新声明的),则依次添加至虚表的后面位置。

    5、构造函数中有虚特性(即多态、即动态绑定、晚绑定)产生吗?

    这个问题,看似简单,答案却比较复杂,正确答案是:对于构造函数,构造函数中没有虚特性产生(在C++中答案是NO,但在Java中,答案是YES,非常的奇葩)。

    先从基类构造函数说起,为什么要提基类构造函数呢,因为,派生类总是要调用一个基类的构造函数(无论是显式调用还是由编译器隐式地调用默认构造函数,因为这里讨论的是有虚函数的情况,所以一定会有基类构造函数产生并调用),而此时,在基类构造函数中,派生类对象根本没有创建,也就是说,基类根本不知道派生类中产生了override,即多态,故没有虚特性产生。

    这一段非常让人疑惑。让我们再看一小段代码,事实胜于雄辩。

     1 #include <iostream>
     2 using namespace std;
     3 
     4 class Base
     5 {
     6 public:
     7         Base() { foo(); }
     8         virtual void foo(void) { cout << "Base::foo(void)" << endl; }
     9         virtual void callFoo(void) { foo(); }
    10 };
    11 
    12 class Derived : public Base
    13 {
    14 public:
    15         Derived() { foo(); }
    16         void foo(void) { cout << "Derived::foo(void)" << endl; }
    17 };
    18 
    19 int main(int argc, char** argv)
    20 {
    21         Base* pB = new Derived;
    22         pB->callFoo();
    23         if(pB)
    24                 delete pB;
    25         return 0;
    26 }

    在Ubuntu 12.04 + gcc 4.6.3输出结果如下:

    1 Base::foo(void)
    2 Derived::foo(void)
    3 Derived::foo(void)

    这个结果可以很好的解释上述问题,第一行,由于在Base构造函数中,看不到Derived的存在,所以根本不会产生虚特性;而第二行,虽然输出了Derived::foo(void),但因为在派生类直接调用方法名,调用的就是本类的方法,(当然,也可认为在Derived构造函数中,执行foo()前,虚表已经OK,故产生多态,输出的是派生类的行为)。再看第三行,也产生多态,因为,此时,派生类对象已经构建完成,虚表同样也已经OK,所以产生多态是必然。

    这个问题其实是C++比较诟病的陷阱问题之一,但我们只要记住结论:不要在构造函数内调用其它的虚成员函数,否则,当这个类被继承后,在构造函数内调用的这些虚成员函数就没有了虚特性(丧失多态性)。(非虚成员函数本来就没有多态性,不在此讨论范围)

    解决此类问题的方法,是使用“工厂模式”,在后续篇幅中笔者会继续提到,这也是《Effective C++》中阐述的精神:尽可能以工厂方法替换公有构造函数。

    另外,有兴趣的同学,可以将上述代码稍加修改成Java跑一跑,你会惊喜的发现,三个输出都是Derived::foo(void),也就是说,JVM为你提供了一种未卜先知的超自然能力。

    6、构造函数中调用构造函数、析构函数

    上面已经提到,不要在构造函数内调用其它成员函数,那么调用一些“特殊”的函数,情况又如何呢?我知道,有同学想到了,在构造函数中调用本类的析构函数,情况如何?如下面的代码

     1 #include <iostream>
     2 using namespace std;
     3 
     4 class A
     5 {
     6 public:
     7         ~A() { cout << hex << (int)this <<"destructed!" << endl; }
     8         A() { cout << hex << (int)this << "constructed!" << endl;
     9                 ~A();  }
    10 
    11 };
    12 
    13 int main(int argc, char** argv)
    14 {
    15         A a;
    16         return 0;
    17 }

    虽然我对有这种想法的同学有强拖之去精神病院的冲动,但还是本着研究精神,把上述“疯子”代码跑一遍,还特地把析构函数的定义提到构造函数之前以防构造函数不认识它。结论是:构造函数中调用析构函数,编译器拒绝接受~A()是析构函数,从而拒绝这一不讲理行为。此时编译器认为,你是在重载~操作符,并给出没有找到operator ~()声明的错误提示。其实,无论是在构造函数A()里面调用~A()不行,在成员函数里,也是不行的(编译器仍认为你要调用operator ~(),而你并没有声明这个函数)。但是,有个小诡计,却可以编译通过,就是通过this->~A()来调用析构函数,这将导致对象a被析构多次,隐藏着巨大的安全隐患。

    总之,在构造函数中调用析构函数,是十分不道德的行为,应严格禁止。

    好了,接下来是,构造函数中,调用构造函数,情况又如何呢?

    (1)首先,如果构造函数中递归调用本构造函数,产生无限递归调用,很快就栈溢出(栈上分配)或其它crash,应严格禁止;

    (2)如果构造函数中,调用另一个构造函数,情况如何?

     1 #include <iostream>
     2 using namespace std;
     3 
     4 class ConAndCon
     5 {
     6 public:
     7     int _i;
     8     ConAndCon( int i ) : _i(i){}
     9     ConAndCon()
    10     {
    11         ConAndCon(0);
    12     }
    13 };
    14 
    15 int main(int argc, char** argv)
    16 {
    17     ConAndCon cac;
    18     cout << cac._i << endl;
    19     return 0;
    20 }

    上面代码,输出为0吗?

    答案是:不一定。输出结果是不确定的。根据C++类非静态成员是没有默认值的规则,可以推定,上述代码里,在无参构造函数中调用另一个构造函数,并没有成功完成对成员的初始化工作,也就是说,这个调用,是不正确的。

    那么,由ConAndCon产生的对象哪里去了?如果用gdb跟踪调试或在上述类的构造、析构函数中打印出对象信息就会发现,在构造函数中调用另一个构造函数,会产生一个匿名的临时对象,然后这个对象又被销毁,而调用它的cac对象,仍未得到本意的初始化(设置_i为0)。这也是应严格禁止的。

    通常解决此问题的三个方案是:

    方案一,我们称为一根筋方案,即,我仍要继续在构造函数中调用另一个构造函数,还要让它正确工作,即“一根筋”,解决思路:不要产生新分配的对象,即在第一个构造函数产生了对象的内存分配之后,仍在此内存上调用另一个构造函数,通过布局new操作符(replacement new)可以做到:

    //标准库中replacement new操作符的定义:
    //需要#include <new>
    
    inline void *__cdecl operator new(size_t, void *_P)
    {
        return (_P); 
    }
    
    //那么修改ConAndCon()为:
    
        ConAndCon()
        {
            new (this)ConAndCon(0);
        }

    即在第一次分配好的内存上再次分配。

    某次在Ubuntu 12.04 + gcc 4.6.3运行结果如下(修改后的代码):

     1 #include <iostream>
     2 #include <new>
     3 using namespace std;
     4 
     5 class ConAndCon
     6 {
     7 public:
     8     int _i;
     9     ConAndCon( int i ) : _i(i){cout << hex << (int)this <<"constructed!" << endl;}
    10     ConAndCon()
    11     {
    12         cout << hex << (int)this <<"constructed!" << endl;
    13         new (this)ConAndCon(0);
    14     }
    15         ~ConAndCon() { cout << hex << (int)this <<"destructed!" << endl; }
    16 };
    17 
    18 int main(int argc, char** argv)
    19 {
    20     ConAndCon cac;
    21     cout << cac._i << endl;
    22     return 0;
    23 }
    24 
    25 //运行结果:
    26 bfd1ae9cconstructed!
    27 bfd1ae9cconstructed!
    28 0
    29 bfd1ae9cdestructed!

    可以看到,成功在第一次分配的内存上调用了另一个构造函数,且无需手动为replacement new调用析构函数(此处不同于在申请的buffer上应用replacement new,需要手动调用对象析构函数后,再释放申请的buffer)

    方案二,我们称为“AllocAndCall"方案,即构造函数只完成对象的内存分配和调用初始化方法的功能,即把在多个构造函数中都要初始化的部分“提取”出来,通常做为一个private和非虚方法(为什么不能是虚的参见上面第5点),然后在每个构造函数中调用此方法完成初始化。通常,这样的方法取名为init,initialize之类。

    1 class AllocAndCall
    2 {
    3 private:
    4     void initial(...) {...} //初始化集中这里
    5 public:
    6     AllocAndCall() { initial(); ...}
    7     AllocAndCall(int x) { initail(); ...}
    8 };

    这个方案和后面要详述的“工厂模式”,在一些思想上类似。

    这个方案最大的不足,是在于,initial()初始化方法不是构造函数而不能使用初始化列表,对于非静态const成员的初始化将无能为力。也就是说,如果该类包含非静态的const成员(静态的成员初始化参看上一篇中的第2点),则对这些非静态const成员的初始化,必须要在每个构造函数的初始化列表完成,无法“抽取“到初始化方法中。

    方案三,我们称为“C++ 0x“方案,这是C++ 0x中的新特性,叫做“委托构造函数”,通过在构造函数的初始化列表(注意不是构造函数体内)中调用其它构造函数,来得到相应目的。感谢C++ 0x! 

     1 class CPerson
     2 {
     3 public:
     4  CPerson() : CPerson(0, "") { NULL; }
     5  CPerson(int nAge) : CPerson(nAge, "") { NULL; }
     6  CPerson(int nAge, const string &strName)
     7  {
     8   stringstream ss;
     9   ss << strName << "is " << nAge << "years old.";
    10   m_strInfo = ss.str();
    11  }
    12 
    13 private:
    14  string m_strInfo;
    15 };

    其实,对于这样的问题,笔者认为,最好的解决方式,没有在这几种方案中讨论,仍是——使用“工厂模式”,替换公有构造函数。

    中篇到此结束,下一篇将会有更多精彩内容——in C++ Constructor!。谢谢大家!

    iCC Develop Center
  • 相关阅读:
    20165105 学习基础和C语言基础调查
    2017-2018网络攻防第四周作业
    2017-2018-2 20165233 实验三 敏捷开发与XP实践
    20165233 2017-2018-2 《Java程序设计》第九周学习总结
    Linux学习笔记(一)
    第三周学习总结
    数据结构C++,线性表学习
    uname()系统调用学习
    cd
    go连接数据库并执行文件中的sql语句
  • 原文地址:https://www.cnblogs.com/ccdev/p/2830085.html
Copyright © 2011-2022 走看看