zoukankan      html  css  js  c++  java
  • [Effective C++ --009]确定对象被使用前已先被初始化

    在确保对象在使用前已先被初始化这一条款的编码实践中,作者为我们总结了三条经验,它们分别是:
    -------------------------------------------------------------------------------------------------------
    ⅰ. 手工初始化内置类型对象
    ⅱ. 构造函数最好使用成员初值列,而不要在构造函数内使用赋值操作,其排列次序应和他们在类中声明的次序相同
    ⅲ. 用local static对象替换non-local static对象,以避免“跨编译单元的初始化次序”问题
    -------------------------------------------------------------------------------------------------------
    下面我们就一条一条的来解读作者的这三条经验。

    □第一节. 手工初始化内置类型对象

    在解读这条经验之前,我们先来看一段简单的程序让大家对“对象初始化先行”的重要性有一个认识。
    -------------------------------------
    1| #include <iostream>
    2| using namespace std;
    3|
    4| int main(){
    5|
    6| int x;
    7| cout<<x<<endl;
    8|
    9| system("pause");
    10| return 0;
    11| }
    -------------------------------------
    问题:上面的代码输出什么?
    -------------------------------------
    1| Windows: 不定值
    2| Linux: 不定值
    3| Unix: 0
    -------------------------------------
    看,多么危险的一件事。什么?看不出危险,好吧!试想,假如变量x里面是你的银行存款。1. 银行采用Windows做服务器,假如x的值是198812282,你会因掠夺银行财富而进某某监狱;2. 银行用了Unix系统,你会忍气吞声吗?当然,这只是一个玩笑,不过透过这个玩笑,让我们对变量的初始化先行的重要性有了更深的认识。
    为什么变量要初始化呢?初始化和不初始化有什么区别呢?一切高级语言的本质都是汇编码,我们究其本质,来看下面的代码片段:
    -------------------------------------------------------------------------------------------------------------------------
    1| int x; | int x = 0;
    2| cout<<x<<endl; | cout<<x<<endl;
    -|-----------------------------------------------------------------------------------------------------------------------
    1| mov eax,dword ptr [__imp_std::endl (10D2040h)] | mov eax,dword ptr [__imp_std::endl (0CC2040
    2| mov ecx,dword ptr [esp] | mov ecx,dword ptr [__imp_std::cout (0CC2044
    ⇒3| push eax | push eax
    ⇒4| push ecx | push 0
    5| mov ecx,dword ptr [__imp_std::cout (10D2044h)] |
    6| call dword ptr [__imp_std::basic_ostream<char,std... | call dword ptr [__imp_std::basic_ostream<cha
    7| mov ecx,eax | mov ecx,eax
    8| call dword ptr [__imp_std::basic_ostream<char,std... | call dword ptr [__imp_std::basic_ostream<cha
    -------------------------------------------------------------------------------------------------------------------------
    从汇编码中,我们可以看出:
    ----------------------------------------------------------------------------------------------------------------------------------
    ▲.未初始化变量的程序会将栈顶指针esp指向的未知值放到寄存器ecx里,然后压栈供后面的cout使用;初始化变量的程序则将数值0压栈,供后面的cout使用。
    ----------------------------------------------------------------------------------------------------------------------------------
    由于main也是一个函数,它内部的所有变量都是存储在栈里的,倘若栈里的值没有被初始化,那么就会得到一块"脏数据",运行结果就成了不可期待的了,这非常危险。因此,上面的内置类型对象x在声明之后,就应该被手动的初始化"x = 0"。

    □第二节. 构造函数最好使用成员初值列,而不要在构造函数内使用赋值操作,其排列次序应和他们在类中声明的次序相同

    内置类型的对象我们是可以手动初始化的,而其外的任何其他对象就需要构造函数出场了。那成员初值列是什么?我们仍然以一个示例程序作为开始,然后展开讨论。
    -------------------------------------
    1| #include <iostream>
    2| #include <string>
    3| using namespace std;
    4|
    5| class MyType{
    6| };
    7|
    ⇒ 8| class A{
    ⇒ 9| public:
    ⇒10| A(){
    ⇒11| this->m_IntValue = 0;
    ⇒12| this->m_StrValue = "";
    ⇒13| this->m_MyType = 0;
    ⇒14| }
    15| private:
    16| int m_IntValue;
    17| string m_StrValue;
    18| MyType *m_MyType;
    19| };
    20|
    21| int main(){
    22| A a;
    23| return 0;
    24| }
    -------------------------------------
    你是不是这样写构造函数的呢?我也是这样写构造函数的,至少在阅读这个条款之前。但是今天的条款04认为这样的写法欠妥,为什么呢?来看看作者的理由:
    -----------------------------------------------------------------------
    ⅰ. C++规定,对象的成员变量初始化动作发生在进入构造函数本体之前
    ⅱ. 上面写法是赋值,而不是初始化,对于对象,赋值操作的效率要比初始化低
    -----------------------------------------------------------------------

    1.1. C++规定,对象的成员变量初始化动作发生在进入构造函数本体之前
    这一点比较坑爹,它说了“C++规定”,我找了好多资料都没提到这一点。先不管这些,我们按照他说的来改造我们的构造函数,于是我们的类A变成了下面的样子:
    -------------------------------------
    1| class A{
    2| public:
    3| A():m_IntValue(0), m_StrValue(""),m_MyType(0){
    4| }
    5| private:
    6| int m_IntValue;
    7| string m_StrValue;
    8| MyType *m_MyType;
    9| };
    -------------------------------------
    关于上面的修改,以下内容援自《Effective C++》侯捷译第三版来进行说明:
    -------------------------------------------------------------------------------------------------------------------------------
    这个构造函数和上一个的最终结果相同,但通常效率较高。基于赋值的那个版本首先调用default构造函数为成员对象设初值,然后立刻再对它们赋予新值。default构造函数的一切作为因此浪费了。成员初值列(member initialization list)的做法避免了这一问题,因为初值列中针对各个成员变量而设的实参,被拿去作为各成员变量之构造函数的实参。
    --------------------------------------------------------------------------------------------------------------------------------
    1.2. 上面写法是赋值,而不是初始化,对于对象,赋值操作的效率要比初始化低

    我并不相信,所以写了一个测试程序,看看到底效率有没有差异,测试代码如下:
    -------------------------------------------
    1| int i = 0;
    2| DWORD start_time = GetTickCount();
    3| {
    4| for(i = 10; i < 10000; i++){
    5| A a;
    6| }
    7| }
    8| DWORD end_time = GetTickCount();
    9| cout<<end_time - start_time<<endl;
    -------------------------------------------
    ==测试结果(Debug)==
    -----------------------------------------------------
    成员初值列初始化 手动赋值初始化
    i=1000 : 0 0
    i=10000 : 16 62
    i=100000 : 201 256
    -----------------------------------------------------
    上面的结果或许能支撑作者的观点吧!好吧,数据面前说话,我们姑且认为作者是对的。

    □第三节. 用local static对象替换non-local static对象,以避免“跨编译单元的初始化次序”问题

    这个问题要稍微复杂一点了,至少作者用了很大的篇幅来描述他的问题和观点。而我觉得理解这一点的核心就三点:
    -------------------------------------
    ⅰ. 理解什么是local static和non-local static
    ⅱ. 理解什么是跨编译单元和初始化次序
    ⅲ. 为什么将non-local static变成local static就能避免初始化次序问题
    -------------------------------------
    3.1. 理解什么是local static和non-local static
    理解二者最好的方法就是看一段代码:
    -------------------------------------------
    1| #include <iostream>
    2| using namespace std;
    3|
    4| // 该静态变量不再函数中,因此是non-local static的
    5| static int non_local_static_value = 10;
    6|
    7| void test(){
    8| // 该静态变量在函数中,因此是local static的
    9| static int local_static_value = 10;
    10| }
    11|
    12| int main(){
    13| return 0;
    14| }
    -------------------------------------------
    这就不用细说了,不过需要提醒一下,local static的变量可以存在的位置有:class内、函数内、file作用域。non-local static的变量可以存在的位置:global、namespace内。

    3.2. 理解什么是跨编译单元和初始化次序
    所谓编译单元,是指单独生成目标文件的那些源码,比如我们在配置编译文件时,经常看到Makefile里有OBJ=XXX的字样,这就是目标文件。而跨编译单元的意思是我在A目标文件里使用B目标文件中的变量。要跨编译单元访问,我们有一个关键字extern。示例代码如下:
    -------------------------------------------
    1| class MyType{
    2| };
    3| extern MyType mt; // 这句代码告诉其他编译单元,mt这个全局变量你们是可以使用的
    -------------------------------------------
    所谓初始化序列,是指构造函数在为其成员变量初始化时的顺序。当然,这里并不仅仅指成员变量的初始化次序,还有全局的变量,静态变量等。这里关于次序有一个问题,试想,如果成员变量m_A的值需要由m_B计算而来,那么谁先初始化呢?当然是m_B了。类的构造函数是按照其成员变量声明次序来初始化的。但是跨编译单元的non-local static变量初始化是没有这样一个顺序的。那么我们就有了一个大问题了。
    ---------------------------------------------------------------------------------------------------------------------
    ★问题:因为没有严格的初始化次序规定,有极大的可能,A编译单元使用了还没有初始化的B编译单元里的non-local static变量。
    ---------------------------------------------------------------------------------------------------------------------
    3.3. 为什么将non-local static变成local static就能避免初始化次序问题
    在解释这一点之前,我们将作者给的解决方案的代码贴出来:
    -------------------------------------------
    1| class MyType{
    2| };
    3| // 这里定义了全局函数来将non-local static的变量变为local static
    4| MyType& GetMT(){
    5| static MyType mt;
    6| return mt;
    7| }
    -------------------------------------------
    这样做的根据是什么呢?那是因为C++有下面这样一条规定:
    ------------------------------------------------------------------------------------------------------
    ★C++保证,函数内的local static对象会在“该函数被调用期间”“首次遇上该对象之定义式”时被初始化。
    ------------------------------------------------------------------------------------------------------

    ■总结■

    1. 对内置类型,如int、double、float、char等,声明变量后,要手工初始化对象
    2. 对内置类型对象以外的对象,要用构造函数初始化,最好使用成员初值列,而不要在构造函数内使用赋值操作,其排列次序应和他们在类中声明的次序相同
    3. 对跨编译单元的对象,要用全局函数将non-local static变为local static对象

  • 相关阅读:
    构建之法读书笔记 第4章 两人合作
    ASE19 团队项目 alpha 阶段 Frontend 组 scrum9 记录
    ASE —— 第二次结对作业
    ASE —— 第一次结对作业
    高级软件工程 —— 第一周博客作业
    软工个人总结
    六月上团队项目心得
    团队项目心得
    结对编程收获
    结对作业——随机生成四则运算(Core 第7组)
  • 原文地址:https://www.cnblogs.com/hustcser/p/4092076.html
Copyright © 2011-2022 走看看