  • C++中的out-of-line虚函数


    在现实编码过程中,曾经遇到过这样的问题“warning:’Base’ has no out-of-line method definition; its vtable will be emitted in every translation unit”。由于对这个warning感兴趣,于是搜集了相关资料来解释这个warning相关的含义。

        Vague Linkage
        out-of-line virtual method


    在C++实现机制RTTI中,我们大概谈到过C++虚表的组织结构。 但是我们对C++虚表的详细实现细节并没有具体谈及,例如在继承体系下虚表的组织以及在多重继承下虚表的组织方式。


    #include <iostream>
    using namespace std;
    class Base
        virtual void Add() { cout << "Base Virtual Add()!"<< "
    ";  }
        virtual void Sub() { cout << "Base Virtual Sub()!" << "
    "; }
        virtual void Div() { cout << "Base Virtual Div()!" << "
    "; }
    int main()
        Base* b = new Base();
        return 0;



    对象b只存放了虚表的指针“0x00a3cc74”,后面的“0xfdfdfdfd”为Visual Studio在Debug模式下,堆内存上的守护字节。我们跳转到“0x00a3cc74”查看该内存到底存放了什么,如下图所示:





    #include <iostream>
    using namespace std;
    class Base
        virtual void Add() { cout << "Base Virtual Add()!"<< "
    ";  }
        virtual void Sub() { cout << "Base Virtual Sub()!" << "
    "; }
        virtual void Div() { cout << "Base Virtual Div()!" << "
    "; }
    class Derive : public Base
        // 定义Drived类的Sub函数,与父类Base的Sub不同
        virtual void Sub() { cout << "Derive Virtual Sub()!" << "
    "; }
    int main()
        Base* b = new Base();
        Base* d = new Derive();
        return 0;






    这种形式的话,只有从第一个父类继承的虚表的下标和父类虚表的下标是相同的,后面的虚表都要移动一定的偏移量,这样做显然不太漂亮。所以现在Visual Studio不是通过这样的方式,而是将从父类继承的多个虚表分开,以每个父类为一个单位,如下图所示。


    #include <iostream>
    using namespace std;
    class Base1
        int m_base1;
        Base1(int para):m_base1(para){}
        virtual void Add() { cout << "Base1 Virtual Add()!"<< "
    ";  }
        virtual void Sub() { cout << "Base1 Virtual Sub()!" << "
    "; }
        virtual void Div() { cout << "Base1 Virtual Div()!" << "
    "; }
    class Base2
        int m_base2;
        Base2(int para) : m_base2(para){}
        virtual void Mul() { cout << "Base2 Virtual Mul()!" << "
    "; }
        virtual void INC() { cout << "Base2 Virtual INC()!" << "
    "; }
        virtual void DEC() { cout << "Base2 Virtual DEC()!" << "
    "; }
    class Derive : public Base1, public Base2
        int m_derive;
        Derive(int b1, int b2, int d) : Base1(b1), Base2(b2), m_derive(d){}
        virtual void Sub() { cout << "Derive Virtual Sub()!" << "
    "; }
        virtual void INC() { cout << "Derive Virtual INC()!" << "
    "; }
    int main()
        Derive* d = new Derive(1, 11, 22);
        // 此时指针指向的位置不是Derive的开头位置,而是Derive对象中子区域Base2的头部
        Base2* b2 = d;
        // 此时b2只能调用Base2的虚函数
        Base1* b1 = d;
        return 0;


    Vague Linkage

    在C++中,有些创建过程需要占用.o文件的空间,例如函数的定义需要占用.o文件的空间。但是函数能够比较明确地创建到指定的.o文件中,有些创建过程却并没有明确的指定创建到那个编译单元中。我们称这些创建过程需要”Vague Linkage”,及模糊链接。通常它们会在任何需要的地方创建,所以这样创建的信息有可能会有冗余。

        inline函数(Inline Functions)
        类型信息(type_info objects)
        模板实例化(Template Instantiations)



    对于C++虚函数机制,大部分编译器都是使用查找表(lookup table)实现的,也就是虚表。虚表保存着指向虚函数的指针,另外每个含有虚函数的类对象都有一个指向虚表的指针(虚表在多重继承下,有可能有多个)。如果class声明了一个非inline,非纯虚的虚函数,那么这些虚函数中的第一个out-of-line方法就被选为关键方法(key method),那么虚表只会散播到(即定义到)这个关键方法所定义的编译单元中。


    // Base.h
    class Base{
        // 第一函数print为关键方法,虚表只会散播到(定义在)print所定义在的编译单元中
        // 如果print也定义在Base.h,那么所有包含Base.h的所有.cpp都会有一份vtable的拷贝
        // 通过链接器来消除冗余数据
        virtual int print();
        virtual int add(int lhs, int rhs) { return lhs + rhs; }
    // A.cpp
    #include "Base.h"
    // vtable会定义在A.cpp编译单元中
    int Base::print() { cout << "print" << endl;}
    // main.cpp
    #include "Base.h"
    int main() {return 0;}

    为了实现”dynamic_cast”,”type_id”, 异常处理,C++要求类型信息能够完整地写出来(即存储,以便运行时能够获取)。对于多态类(含有虚函数)来说,”type_info”结构体随着虚表一起出现,虚表中会有一个slot来存放type_info结构体的指针,这样才能在运行时,在执行dynamic_cast<>的时候获得对象具体的类型信息。


    ouf-of-line virtual method

    前面我们已经知道虚函数满足vague linkage的条件,有可能需要链接器去消除冗余。


    相对应的std::type_info也会使用这种形式,即vague linkage,从字面意思上看就是说type_info并不是紧紧地绑定在每个编译单元中,而是以一个弱链接的形式出现。所以接下来的任务就交给链接器了,确保在最后的可执行文件中只有一份type_info的结构体对象。

        these std::type_info objects have what is called vague linkage because they are not tightly bound to any one particular translation unit (object file).

        The compiler has to emit them in any translation unit that requires their presence, and then rely on the linking and loading process to make sure that only one of them is active in the final executable.

        With static linking all of these symbols are resolved at link time, but with dynamic linking, further resolution occurs at load time. – [GCC Frequently Asked Questions]


        If a class is defined in a header file and has a vtable (either it has virtual methods or it derives from classes with virtual methods), it must always have at least one out-of-line virtual method in the class. Without this, the compiler will copy the vtable and RTTI into every .o file that #includes the header, bloating .o file sizes and increasing link times. – [LLVM Coding Standards]




    class Base
        // virtual函数全部是默认inline
        virtual int print() { return 0;}
        virtual int Add() { return 1;}
    #include "test.h"
    // test.cpp需要用到虚表,所以虚表应该在test.cpp中生成一份儿
    int main()
        Base* b = new Base();
        delete b;
        return 0;
    #include "test.h"
    // foo.cpp 也用到了虚表所以在编译的时候,在foo.cpp中也应该产生一份儿
    void func()
        Base* b = new Base();
        delete b;



    $g++ -c test.cpp foo.cpp
    $objdump -d foo.o
    // 得到下面结果,说明在foo.o中生成了虚函数定义
    Disassembly of section .text$_ZN4Base5printEv:
    00000000 <__ZN4Base5printEv>:
       0:   55                      push   %ebp
       1:   89 e5                   mov    %esp,%ebp
       3:   83 ec 04                sub    $0x4,%esp
       6:   89 4d fc                mov    %ecx,-0x4(%ebp)
       9:   b8 00 00 00 00          mov    $0x0,%eax
       e:   c9                      leave  
       f:   c3                      ret    
    Disassembly of section .text$_ZN4Base3AddEv:
    00000000 <__ZN4Base3AddEv>:
       0:   55                      push   %ebp
       1:   89 e5                   mov    %esp,%ebp
       3:   83 ec 04                sub    $0x4,%esp
       6:   89 4d fc                mov    %ecx,-0x4(%ebp)
       9:   b8 01 00 00 00          mov    $0x1,%eax
       e:   c9                      leave  
       f:   c3                      ret  
    $objdump -d test.o
    // 得到下面的结果
    Disassembly of section .text$_ZN4Base5printEv:
    00000000 <__ZN4Base5printEv>:
       0:   55                      push   %ebp
       1:   89 e5                   mov    %esp,%ebp
       3:   83 ec 04                sub    $0x4,%esp
       6:   89 4d fc                mov    %ecx,-0x4(%ebp)
       9:   b8 00 00 00 00          mov    $0x0,%eax
       e:   c9                      leave  
       f:   c3                      ret    
    Disassembly of section .text$_ZN4Base3AddEv:
    00000000 <__ZN4Base3AddEv>:
       0:   55                      push   %ebp
       1:   89 e5                   mov    %esp,%ebp
       3:   83 ec 04                sub    $0x4,%esp
       6:   89 4d fc                mov    %ecx,-0x4(%ebp)
       9:   b8 01 00 00 00          mov    $0x1,%eax
       e:   c9                      leave  
       f:   c3                      ret

    我们从上面的结果中看到,确实在test.o和foo.o中都产生了虚函数print()和add()的定义,如果我们使用”readelf -s test.o”查看更详细的信息的话,会发现虚表和type_info在test.o和foo.o也都存在一份拷贝。

    Num:    Value  Size Type    Bind   Vis      Ndx Name
         0: 00000000     0 NOTYPE  LOCAL  DEFAULT  UND
         1: 00000000     0 FILE    LOCAL  DEFAULT  ABS test.cpp
         2: 00000000     0 SECTION LOCAL  DEFAULT    7
         3: 00000000     0 SECTION LOCAL  DEFAULT    9
         4: 00000000     0 SECTION LOCAL  DEFAULT   10
         5: 00000000     0 SECTION LOCAL  DEFAULT   11
         6: 00000000     0 SECTION LOCAL  DEFAULT   12
         7: 00000000     0 SECTION LOCAL  DEFAULT   13
         8: 00000000     0 SECTION LOCAL  DEFAULT   15
         9: 00000000     0 SECTION LOCAL  DEFAULT   17
        10: 00000000     0 SECTION LOCAL  DEFAULT   18
        11: 00000000     0 SECTION LOCAL  DEFAULT   21
        12: 00000000     0 SECTION LOCAL  DEFAULT   22
        13: 00000000     0 NOTYPE  LOCAL  DEFAULT    3 _ZN4BaseC5Ev
        14: 00000000     0 SECTION LOCAL  DEFAULT   20
        15: 00000000     0 SECTION LOCAL  DEFAULT    1
        16: 00000000     0 SECTION LOCAL  DEFAULT    2
        17: 00000000     0 SECTION LOCAL  DEFAULT    3
        18: 00000000     0 SECTION LOCAL  DEFAULT    4
        19: 00000000     0 SECTION LOCAL  DEFAULT    5
        20: 00000000     0 SECTION LOCAL  DEFAULT    6
        21: 00000000    10 FUNC    WEAK   DEFAULT   11 _ZN4Base5printEv
        22: 00000000    10 FUNC    WEAK   DEFAULT   12 _ZN4Base3AddEv
        23: 00000000    14 FUNC    WEAK   DEFAULT   13 _ZN4BaseC2Ev
        24: 00000000    16 OBJECT  WEAK   DEFAULT   15 _ZTV4Base
        25: 00000000    14 FUNC    WEAK   DEFAULT   13 _ZN4BaseC1Ev
        26: 00000000    84 FUNC    GLOBAL DEFAULT    7 main
        27: 00000000     0 NOTYPE  GLOBAL DEFAULT  UND _Znwj
        28: 00000000     0 NOTYPE  GLOBAL DEFAULT  UND _ZdlPv
        29: 00000000     8 OBJECT  WEAK   DEFAULT   18 _ZTI4Base
        30: 00000000     6 OBJECT  WEAK   DEFAULT   17 _ZTS4Base
        31: 00000000     0 NOTYPE  GLOBAL DEFAULT  UND _ZTVN10__cxxabiv117__clas


    我们可以看到在test.o中生成了类Base的虚表和type_info结构体,_ZTV表示虚表,_ZTI表示type_info结构, _ZTS表示type name,注意在gcc的设计中,type_info存放在虚表的第一个slot(Visual Studio是存放在虚表的最后一个slot中)。我们看一下foo.o的相关信息,如下:

    Num:    Value  Size Type    Bind   Vis      Ndx Name
         0: 00000000     0 NOTYPE  LOCAL  DEFAULT  UND
         1: 00000000     0 FILE    LOCAL  DEFAULT  ABS foo.cpp
         2: 00000000     0 SECTION LOCAL  DEFAULT    7
         3: 00000000     0 SECTION LOCAL  DEFAULT    9
         4: 00000000     0 SECTION LOCAL  DEFAULT   10
         5: 00000000     0 SECTION LOCAL  DEFAULT   11
         6: 00000000     0 SECTION LOCAL  DEFAULT   12
         7: 00000000     0 SECTION LOCAL  DEFAULT   13
         8: 00000000     0 SECTION LOCAL  DEFAULT   15
         9: 00000000     0 SECTION LOCAL  DEFAULT   17
        10: 00000000     0 SECTION LOCAL  DEFAULT   18
        11: 00000000     0 SECTION LOCAL  DEFAULT   21
        12: 00000000     0 SECTION LOCAL  DEFAULT   22
        13: 00000000     0 NOTYPE  LOCAL  DEFAULT    3 _ZN4BaseC5Ev
        14: 00000000     0 SECTION LOCAL  DEFAULT   20
        15: 00000000     0 SECTION LOCAL  DEFAULT    1
        16: 00000000     0 SECTION LOCAL  DEFAULT    2
        17: 00000000     0 SECTION LOCAL  DEFAULT    3
        18: 00000000     0 SECTION LOCAL  DEFAULT    4
        19: 00000000     0 SECTION LOCAL  DEFAULT    5
        20: 00000000     0 SECTION LOCAL  DEFAULT    6
        21: 00000000    10 FUNC    WEAK   DEFAULT   11 _ZN4Base5printEv
        22: 00000000    10 FUNC    WEAK   DEFAULT   12 _ZN4Base3AddEv
        23: 00000000    14 FUNC    WEAK   DEFAULT   13 _ZN4BaseC2Ev
        24: 00000000    16 OBJECT  WEAK   DEFAULT   15 _ZTV4Base
        25: 00000000    14 FUNC    WEAK   DEFAULT   13 _ZN4BaseC1Ev
        26: 00000000    70 FUNC    GLOBAL DEFAULT    7 _Z4funcv
        27: 00000000     0 NOTYPE  GLOBAL DEFAULT  UND _Znwj
        28: 00000000     0 NOTYPE  GLOBAL DEFAULT  UND _ZdlPv
        29: 00000000     8 OBJECT  WEAK   DEFAULT   18 _ZTI4Base
        30: 00000000     6 OBJECT  WEAK   DEFAULT   17 _ZTS4Base
        31: 00000000     0 NOTYPE  GLOBAL DEFAULT  UND _ZTVN10__cxxabiv117__clas


    可以发现在foo.o中也生成了虚表和type_info信息,也就是说如果inline虚函数都没有设置成out-of-line的话,那么编译器会向每个需要用到虚表结构的目标文件中散播虚表,虚函数和type_info定义。直到链接的时候,链接器进行冗余消除操作。由于链接器需要消除冗余的type_info和vtable,所以就要求虚表和type_info的符号必须是弱符号(weak symbols),GCC好像永远会将RTTI信息设置为弱符号,即使虚函数中有关键方法(key method)。

        $ c++filt ZNK3MapI10StringName3RefI8GDScriptE10ComparatorIS0_E16DefaultAllocatorE3hasERKS0


    LLVM:multiple typeinfo name
    GCC Frequently Asked Questions

