zoukankan      html  css  js  c++  java
  • C++字节对齐问题

    关于C++字节对齐问题

    关于C/C++的字节对齐

    这两天写解析SWF文件的程序,在结构体指针和从文件里读出来的进行转换的时候遇到一些问题,就是有一个struct A,比如:

    struct A

    {

             char flag;

             int length;

             int id; 

             ....

    };

    然后一个飘逸的 struct A *a = (struct A*)buffer;   // 世界一下清静咯

    可惜在输出a中的成员的时候却发现老是不对,百思不得起解。今晚一想,可能是因为C++的字节对齐问题,所以直接就百度了一些

    C++的字节对齐。看到以下这篇文章说的挺清晰的,就转了过来。

    ________________________________________________________________________________________________________

    关于C/C++的字节对齐

    近期研究C++的数据类型和数据大小时发现,字节对齐实际上是一个C/C++程序猿无法忽视的一个问题.所以进行了初步的研究.

    1.为什么会出现内存对齐问题-从x86 CPU架构说起
    相信绝大多数计算机系和软件学院的学生都学过计算机组成原理这门基础课程,所以不作入门引导了,没有相关背景的能够补补相关课程资料.常有人问我,既然是按字节寻址方式,为何会出现字节对齐问题呢?难道是内存不是连续的吗?
    这个问题实际上和CPU与内存的连接方式有关,我们知道CPU会通过地址总线Address BUS与CPU连接用于寻址,用Data Bus数据总线连接用于获取数据,而内存一般是RAM构成的复杂阵列。

    对于这个RAM阵列(实际内存可能更复杂,可是原理类似), 前16个内存地址排列相应内存单元关系例如以下:



    对比上图,是不是发现,对于每一个内存操作周期,每一个地址实际上能够读取4个bytes的数据呢,那么如果你有一个int型的数据存储在地址1或者2或者 3,那么,是不是一个CPU内存时钟周期不够取出这个数据呢?这样是不是效率会非常低下?这也就是为什么我们须要内存对齐了,尽管现代CPU和编译器已经对 此做了非常多优化,可是C/C++因为特殊性,程序猿必须了解这个细节.

    2.C/C++内存对齐的方式
    C/C++中的结构/类的成员变量在对齐在内存中的排列是与它们摆放的先后顺序相关的,先看看以下的结构

    1 struct malign_a
    2 {
    3    char a;
    4    short b;
    5    char c;
    6    int d;
    7 };

    这个结构的sizeof(malign_a)是多少呢?1+2+1+4 =8?吗?这个实际上不正确,那么,怎样对齐的呢?
    因为char是1个byte,所以无论他在什么位置,都能够用一个内存周期读出数据,short是半个字也就是2 bytes,这个时候假如它的地址是某个边界位置上,那么,也须要两个内存周期来读取,以此类推.所以,内存对齐就是增加填充padding无意义的数据 来保证某个数据位于一个能够通过最少内存周期的位置,比方double型仅仅有地址位于%4等于0的位置,才干保证2个周期读出.

    同一时候对于每一个详细平台,不同的编译器有不同的指定的对齐模式,比方C/C++能够通过

    1 #pragma pack(n) //n为1,2,4,8,16等

    来指定对齐.当然,一般x86 32位机器下,都是默认4字节对齐的.这个n也称为对齐模数.
    对齐策略例如以下:

    1.结构体成员对齐:按某成员数据本身大小以及指定大小中较小者对齐
    2.结构体总体对齐:按全部成员中最大者和对齐模数中较小者对齐

    所以上述结构体按默认对齐方式例如以下:

    1.a是char类型,能够在任何位置,位于位置0
    2.b是short类型,2比默认的4小,所以按2字节对齐,所以在a后面填充1个字节,b必须位于位置2,占两个字节
    3.c是char类型,位于位置4
    4.d是int类型,4<=4,所以按4字节对齐,须要在c后面填充3个字节,位置为8
    5.因为最大成员是4,默认是4,所以结构已经按4对齐,所以总字节数为12


    再把原来的结构体成员位置修改一下:

    1 struct malign_b
    2 {
    3    char a;
    4    char c;
    5    short b;
    6    int d;
    7 };

    这个结构的大小为8,对齐步骤例如以下:

    1.a是char类型,能够在任何位置,位于位置0
    2.c是char类型,位于位置1
    3.b是short类型,2比默认的4小,所以按2字节对齐,这时候恰好位于位置2
    4.d是int类型,4 5.因为最大成员是4,默认是4,所以结构已经按4对齐,所以总字节数为8


    最后为了加深理解,我们来看看以下这个结构按对齐模数2对齐时候的memory layout

    01 #pragma pack(push)
    02 #pragma pack(2)
    03 struct malign_b
    04 {
    05    char a;
    06    int d;
    07    char c;
    08    short b;
    09 };
    10 #pragma pack(pop)

    它的大小为10,当指定为对齐模数2时候

    1.因为a是char,1<2,位于位置0
    2.因为d是int,4>2,所以按2字节对齐,所以必须在a后面填充一个字节,位于位置2,
    3.c是char,位置为6
    4.b是short,所以必须在c后面填充一个字节,位置为8
    5.最大的是4,所以按2对齐,上述结果事实上已经总体是按2对齐,所以总数为10


    我相信通过以上样例,应该能够熟悉字节对齐过程了,假设有不妥之处,敬请留言指出,谢谢.
    原文链接:http://www.cnblogs.com/shihao/archive/2012/01/18/2325580.html
  • 相关阅读:
    学习tornado:介绍
    【Unity Shaders】Using Textures for Effects介绍
    高性能C++网络库libtnet实现:http
    理解WebKit和Chromium: 硬件加速之RenderLayer树到合成树
    【Unity Shaders】Diffuse Shading——使用2D ramp texture来创建一个假的BRDF(双向反射分布函数)
    【Unity Shaders】Diffuse Shading——漫反射光照改善技巧
    ③ 设计模式的艺术-16.访问者(Visitor)模式艺术
    ② 设计模式的艺术-15.观察者(Observer)模式
    ① 设计模式的艺术-14.职责链(Chain of Responsibility)模式
    ⑦ 设计模式的艺术-13.代理(Proxy)模式
  • 原文地址:https://www.cnblogs.com/mengfanrong/p/3762662.html
Copyright © 2011-2022 走看看