zoukankan      html  css  js  c++  java
  • 《inside the c++ object model》读书笔记 之六 执行期语意学


    6.1 对象的构造和解构:
      如果一个区段(以{}括起来的区域)或是函数中有一个以上的离开点,情况会混乱一些,因为destructor必须放在每一个离开点(当object还活着时)之前,同样,goto语句也可能需要许多个destructor调用操作,一般而言,我们会把object尽可能放置在使用它的那个程序区段附近,这样做可以节省不必要的对象产生和摧毁操作.

    ...全局对象:
    例如有如下程序片段:

    Matrix identity;

    main()
    {
        Matrix mi=identity;
        //...
        //...
        return 0;
    }

      C++保证,一定会在main()函数中第一次用到identity之前,把indentity构造出来,而在main()函数结束之前把indentity摧毁掉,像indentity这样的global object,如果有constructor和destructor的话,我们说它需要静态的初始化操作和内存释放操作.
      C++程序中所有的global objects都被放置在程序的data segment中,如果明确指定给它一个值,object将以该值为初值,否则object所配置到的内存内容为0.
      虽然class object 在编译时期可以被放置于data segment中并且内容为0,但constructor一直要到程序激活时才会实施,必须对一个"放置区program data segment中的object初始化表达式"做评估,这正是为什么一个object需要静态初始化得原因.

      在cfront还是C++唯一的编译器时,静态初始化采用一个所谓的munch方案:
      1)为,诶一个需要静态初始化的档案产生一个_sti()函数,内带必要的constructor调用操作或inline expansions.
      2)在每一个需要静态初始化的内存释放操作的文件中,产生一个_std()函数,内带必要的destructor操作,或是其inline expansions
      3)提供一组runtime library "munch"函数:一个_main()函数(用以调用可执行文件中的所有_sti()函数),以及一个_exit()函数(以类似的方法调用所有的_std()函数).

      支持"nonclass objects"的静态初始化,在某种程度上是支持virtual base classes的一个副产品,因为,以一个derived class的pointer或是reference来存取virtual base class subobject,是一种nonconstant expression,必须在执行期才能评估求值.

    ...局部静态对象:

    假设有如下程序片段:

    const Matrix& inentity()
    {
        static Matrix mat_identity;
        //...
        return mat_indentity;
    }

    Local static class object必须保证:
      1)mat_identity的constructor必须只能施行一次,虽然上述函数可能会被调用多次.
      2)mat_identity的destructor必须只能施行一次,虽然上述函数可能会被调用多次.

      为了支持上述特点,以前编译器的策略之一是,在程序起始(startup)时构造出对象来,这将导致所有的local static class object都必须在起始时被初始化,即使它们所在的函数不曾被调用,因此只有在indentity()函数被调用时才构造 mat_identity是比较好的做法(现在已经被强制要求做到这一点).
      为了实现这一点,在cfront之中的做法是:首先,导入一个临时性对象以保护mat_identity的初始化操作,第一次处理identity()函数时,该值为false,于是constructor被调用,然后临时对象的值被改为true,同样这destructor这一端,只有在临时对象的值为true时(对象被构造出来),才能调用destructor,但是由于cfront产生C码,mat_identity对函数而言还是local,没办法在静态的内存释放函数中存取它,所以一个比较诡异的解决方法就是:去处local object的地址,最后,destructor必须在"与text program file有关联的静态内存释放函数"中被有条件地调用.

    ...对象数组:
      例如有如下定义:
      Point knots[10];
      如果Point既没有定义一个constructor也没有定义一个destructor,那么我们的工作不会建立一个"内建类型所组成的数组"更多,也就是说我们只需配置10个连续的Point元素即可.
      然而如果一个class定义了一个default constructor,所以这个destructor必须轮流施行与每一个元素之上.一般而言,这是经由一个或多个runtime library函数达成,在cfront中,我们使用一个被命名为vec_new()的函数,产生出一class objects构造而成的数组,比较晚的编译器如:Borland,Microsoft...则是提供两个函数,一个用来"没有virtual base class"的class,另一个用来处理"内带virtual base class"的class,后哟个函数通常被称为vec_vnew().
      如果class也定义了一个destructor,当object数组的生命结束时,该destructor也必须施行于那10个objects上.类似地,这是经由一个类似的vec_delete()或是vec_vdelete()(带virtual base class的object)runtime library函数完成.
      如果程序员提供一个或多个明显的初值给一个有class objects组成的数组,那么,对于那些明显获得初值的元素,vec_new()不在有必要,对于那些尚未被初始化的元素,vec_new()的施行方式就像面对"由class elements组成的数组,而该数组没有explicit initialization list"一样.

    ...default constructor和数组:
      如果在一个程序中存取出一个constructor的地址,这是不可以的,这是编译器在支持vec_new()时该做的事情,然而经由一个指针来激活constructor,将无法存取default argument values.
      声明一个由class objects所组成的数组,而不赋初值,意味着这个class必须没有声明带参数的constructor或只有一个default constructor(不带参数或者是所有的参数都有默认值),当声明一个带有参数的constructor的class objects数组时,则必须为数组的每一个元素赋初值,调用构造函数.
      在cfront中的解决方法是,内部产生一个stub constructor,没有参数,在其函数内调用由程序员提供的constructor,并将default constructor参数数值明确地指定过去.
      编译器有一次违反了一个明显的语言规则:class如今支持了连个没有带参数的constructors,当然,只有当class objects数组真正被产生出来时,stub实体此才会被产生以及被使用.

    6.2 new和delete运算符:
      当用new配置一个内建类型,比如:
      int *pi=new int(5);
      事实上它是有两个步骤完成:
      1)通过适当的new运算符函数实体,配置所需的内存.
      int *pi=_new(sizeof(int));
      2)给配置的得来的对象设立初值.
      *pi=5;
      更进一步,初始化操作应该在内存配置成功以后才执行:
      int *pi;
      if(pi=_new(sizeof(int)))
        *pi=5;
      delete的情况类似,对于:
      delete pi;
      如果pi的值是0,C++语言会要求delete运算符不要有操作:
      if(pi!=0)
        _delete(pi);
    注:pi并不会因此被自动清除为0.
      pi所指向的对象之生命会因delete而结束.所以后继任何对pi的参考操作就不再保证有良好的行为,并因此被视为是一种不好的程序风格,然而,把pi继续当做一个指针来使用,仍然是可以的,在这里使用指针pi和使用pi所指的对象,其差别在于哪一个的声明已经结束了,虽然该地址上的对象不再合法,但地址本身确仍然代表一个合法的程序空间.因此pi能够继续被使用,但只能在受限制的情况下使用,很像一个void*指针的情况.

      以constructor来配置一个class object,情况类似:
      class T;
      T *pt=new T;
      转化如下:
      T *pt;
      if(pt=_new(sizeof(T)))
        pt=T:T(pt);
      destructor的应用极为类似:
      delete pt;
      转化如下:
      if(pt!=0)
      {
        T::~T(pt);
        _delete(pt);
      }
    注:在exception情况下,转化的代码会复杂一些...

      一般的library对new运算符的实现操作都很直接了当,new运算符实际上是总以标准的C malloc()完成.催然并没有规定一定的如此,相同的情况下delete运算符也总是以标准的C free()完成.

    ...数组的new语意:
      例如如下程序片段:
      int *p_array=new int[5];
      其中vec_new不会真正被调用,因为它的主要功能是把default constructor施行与于class objects所组成的数组的每一个元素身上,倒是new运算符函数会被调用.
      有如:
      struct simple_aggr{float f1,f2;};
      simple_aggr *p_aggr=new simple_aggr[5];
      vec_new()也不会被调用,因为simple_aggr并没有定义一个constructor或destructor,所以配置数组以及清除p_aggr数组的操作,只是单纯地获得内存和释放而已,这些操作有new和delete运算符来完成就可以了.
      然而如果class定义了,一个default constructor,某些版本的vec_new就会调用,配置class objects所组成的数组.
      在delete数组时,应该这样写:
      delete []p_aggr;

    注:一个比较好的设计习惯:最好避免一个base clss指针指向一个derived class objects所组成的数组-如果derived class object比起base 大的话(一般会如此),如果一定得这样做的话,解决之道在于程序员,而不再语言层:
      Point *ptr=new Point3d[10];//Point3d is a derived                 //class of Point
      for(int ix=0;ix<elem_count;++ix)
      {
        Point3d *p=&((Point3d*)ptr)[ix];
      }

      基本上,程序员必须迭代走过整个数组,把delete运算符实施于每一个元素身上,以此方式,调用操作将是virtual,因此,Point3d和Point 的destructor都会施行与数组中的每一个objects身上.

    ...placement operator new语意:
      有一个预先定义好的重载(overloaded)new运算符,称为placement operator new,它需要第二个参数,类型为void*,调用如下:
      class T;
      T *pt=new(arena)T;
      其中arena指向内存中的一个区块,用以方盒子新产生出来的T object.这个预先定义好的placement operator new的实现方法只要将"获得的指针(上例中的arena)"所指的地址传回即可:
      void *operator new(size_t,void *p)
      {
        return p;
      }
      其实,传回地址只是发生操作的一半,另一半是将T constructor自动实施于arena所指的地址上,所以完整的转化代码应该是:
      T *pt=(T*)arena;
      if(pt!=0)
      {
        pt->T::T();
      }
      如果placement operator在原已存在的一个object上构造新的object,而该现有的object有一个destructor,这个destructor并不会调用,调用该destructor的方法之一就是将那个指针delete掉,不过如下程序绝对是个错误:
      delete pt;
      pt=new(arena) T;
      的确,这样做会释放pt所指的内存,但是,下一个指令就要用到pt,因此,应该明确地调用destructor并保留储存空间,以便在使用:
      pt->~T();
      pt=new(arena) T;
    注:C++ Standard中以一个placement operator delete矫正了这个错误,它会对object实施destructor,但不释放内存,所以就不必再直接调用destructor了.
      但是还剩下两个问题,一个是:如何知道arena所指的这块区域是否需要先解构?这个问题在语言层上并没有回答,一个合理的习俗是另执行new的这一端也要负责执行destructor的责任.
      另一个问题关系到arena所表现的真正指针类型.C++ Standard说它必须指向相同类型的class,要不就是一块"新鲜"内存,足够容纳该类型的object,显然,derived class不咋被支持之列.\
      新鲜内存可以这样获得:
      char *arena=newchar[sizeof(Point3d)];
      相同类型的object则可以这样获得:
      Point3d *arena=new Point3d;
      一般而言,placement new operator并不支持多态,被交给neew的指针,应该适当指向一块预先配置好的内存,如果derived class比base class大,那么就会产生很严重的问题.
      在placemen operator被引入C++2.0时会产生一个比较隐晦的问题,比如:
      class Base{int j;virtual void f()=0;};
      class Derived:Base{void f();}
      void f_n()
      {
        Base b;
        b.f();
        b.~Base();
        new(&b)Derived;
        b.f();
      }
      由于上述两个class有相同的大小,所以把derived class放在为base class配置的内存中是安全的,然而要支持对于"经由objects静态调用所有virtual funtions"通常会优化处理,结果,placement new operator的这种使用方式在 C++ Standard中未能获得支持,于是上述程序的行为没有明确的定义:不过大部分编译器的调用结果却是Base::f().

    6.3 临时性对象:
      C++ Standard允许编译器对于临时性对象的产生有完全的自由度,但实际上,由于种种原因,几乎任何表达式如果有这种形式:
      T c=a+b;
      而其中的加法运算符被定义为:
      T operator+(const T&,const T&);
      或是:
      T operator+(const T&);
      那么实现时根本不产生一个临时对象,不过意义相当的assignment叙述句(statement):
      c=a+b;
      就不能够忽略临时对象.
      不管哪一种情况,直接传递c(上例中的目标对象)到运算符函数中是有问题的,由于运算符函数并不为其外加参数调用一个destructor(它期望一块"新鲜的"内存),所以必须在此调用之前调用destructor,然而,"转换"语意将被用来将下面的assignment操作:
      c=a+b;//c.operator(a+b);
      取代为其copy assignment运算符的隐含调用操作,以及一系列的destructor和copy constructor:
      //C++伪码
      c.T::~T();
      c.T::T(a+b);
      以上这些都可以有使用者提供,但是不能保证上述两个操作有相同的语意,因此,一连串的destruction,copy constructor取代assignment,一般而言是不安全的,而且会产生临时性对象,所以这样的初始化操作:T c=a+b;是比较可取的.
      除了,以上两种形式,还有一种形式就是:
      a+b;//没有目标对象;
      这时候有必要产生一个临时对象,以放置运算后的结果.

    ...临时对象的声明周期:
      C++ Standard中说明:临时性对象的摧毁,应该是对完整表达式求值过程中的最后一个步骤.该完整表达式造成临时对象的产生.
      完整表达式,非正式的说法就是:它是被涵括的表达式中最外围的那个,例如((obja>1024)&&(objb>1024))?obja+objb:foo(obja,objb);
      一共有五个算式,内带在一个"?:"完整表达式中.任何一个子表达式所产生的任何一个临时对象,都应该在完整表达式被求值后,才可以销毁.
      当临时性对象是根据程序执行期语意有条件被产生出来时,临时性对象的生命规则就有点复杂了,但是,很明显只有在临时性对象被产生出来的情况下才去摧毁它.

      关于临时对象的生命规则:
      把临时对象的destructor放在每一个算式的求值过程中,可以免除"努力追踪第二个子算式是否真的需要被评估",然而,在C++ Standard的临时对象生命规则中国,这样的方法不在被允许.临时性对象在完整的表达式尚未评估完全之前,不得被摧毁,也就是说,某些形式的条件测试现在必须被安插进来,以决定是否要摧毁和第二个算式有关的临时对象.
      但是,有两个例外,第一个例外发生在表达式被用来初始化一个object时,凡是含有表达式执行结果的临时性对象,应该在存留到object的初始化操作完成为止.
      第二个例外是"当一个临时性对象被一个reference 绑定"时,如果一个临时性对象绑定与一个reference,对象将残留,直到被初始化之reference的声明结束,或直到临时对象的生命范畴结束(视哪一种情况先到达而定).

  • 相关阅读:
    异步加载图片
    彩票项目
    linux 多线程的分离和可链接属性
    C库中system和atexit和exit的使用
    C库中getenv函数
    mode|平均数|方差|标准差|变异系数|四分位数|几何平均数|异众比率|偏态|峰态
    radar chart
    植物基因组|注释版本问题|重测序vs泛基因组
    signals function|KNN|SVM|average linkage|Complete linkage|single linkage
    supervised learning|unsupervised learning
  • 原文地址:https://www.cnblogs.com/suiyu/p/2746089.html
Copyright © 2011-2022 走看看