原文http://www.cnblogs.com/firing/articles/1996670.html
开头讲个有关大端小端的故事:
端模式(Endian)的这个词出自Jonathan Swift书写的《格列佛游记》。这本书根据将鸡蛋敲开的方法不同将所有的人分为两类,从圆头开始将鸡蛋敲开的人被归为Big Endian,从尖头开始将鸡蛋敲开的人被归为Littile Endian。小人国的内战就源于吃鸡蛋时是究竟从大头(Big-Endian)敲开还是从小头(Little-Endian)敲开。在计算机业Big Endian和Little Endian也几乎引起一场战争。
我们知道在内存中数据是以字节为单位进行存储的,每个地址单元对应着一个字节(byte),一个字节为8位(bite)。但是很多时候数据除了8bit额char外,还有16bit的short,32位的long型(要看具体的编译器),必然存在多字节安排的问题。不同的计算机存放多字节值的顺序不同,有些机器在起始地址存放低位字节(低位先存),即小端模式;有的机器在起始地址存放高位字节(高位先存),即大端模式。基于Intel的CPU,采用的是低位先存。而KEIL C51则为大端模式。大端小端对应着数据在存储器中的存放顺序。
同时,在网络传输中,网络协议需要指定网络字节顺序,TCP/IP协议中使用16位整数和32位整数的高位先存模式,对应我们的大端模式。
下面是两个具体例子:
16bit宽的数0x1234在Little-endian模式(以及Big-endian模式)CPU内存中的存放方式(假设从地址0x4000开始存放)为:
内存地址 | 小端模式存放内容 | 大端模式存放内容 |
0x4000 | 0x34 | 0x12 |
0x4001 | 0x12 | 0x34 |
32bit宽的数0x12345678在Little-endian模式以及Big-endian模式)CPU内存中的存放方式(假设从地址0x4000开始存放)为:
内存地址 | 小端模式存放内容 | 大端模式存放内容 |
0x4000 | 0x78 | 0x12 |
0x4001 | 0x56 | 0x34 |
0x4002 | 0x34 | 0x56 |
0x4003 | 0x12 | 0x78 |
联合体union的存放顺序是所有成员都从低地址开始存放,利用该特性可以轻松地获得了CPU对内存采用Little-endian还是Big-endian模式读写。
写程序判断处理器是Little-endian模式,还是Big-endian模式,可以通过以下程序:
1>.通过将int强制类型转换成char单字节,通过判断起始存储位置。
2 {
3 int i = 1;
4 char *cp = (char *)&i; //前面是指针运算符*,前值类型转换。后面是取地址符号。
5 if (*cp) //如果此时cp指向的内存为1的话,则为小端,否则为大端。
6 printf("Little Endian ");
7 else
8 printf("Big Endian ");
9
10 exit(EXIT_SUCCESS);
11 }
注释:如果小端方式中(i占至少两个字节的长度)则i所分配的内存最小地址那个字节中就存着1,其他字节是0.大端的话则1在i的最高地址字节处存放,char是一个字节,所以强制将char型量p指向i则p指向的一定是i的最低地址,那么就可以判断p中的值是不是1(或者为0,也即是假)来确定是不是小端。
或者如下程序:
{
short int x;
char x0,x1;
x=0x1122;
x0=((char*)&x)[0]; //低地址单元
x1=((char*)&x)[1]; //高地址单元
if (0x11 == x0 && 0x22 == x1)
{
cout << "Big_endian" << endl;
}
else
{
cout << "Little_endian" << endl;
}
}
2>.利用联合体union的存放顺序是所有成员都从低地址开始存放,判断处理器模式。
{
{
union w
{
int a;
char b;
} c;
c.a = 1;
return(c.b ==1);
}
}
以及如下程序:
{
union _dword
{
int all;
struct _bytes
{
char byte0;
char pad[3];
}bytes;
}dword;
dword.all=0x87654321;
return (0x21==dword.bytes.byte0);
}
分析:如果你的处理器调用函数isLittleEndian返回1,那么说明你的处理器为little endian,否则为big endian.注意,如果在little endian处理器上,byte0和pad按内存从低到高的存放顺序:LOW->byte0 pad[0] pad[1] pad[2] ->HIGH;0x87654321按内存从低到高的存放顺序: 0x21 0x43 0x65 0x87, 可见byte0对应到0x21。所以通过判断dword中第一个字节dword.bytes.byte0是否与0x21相等就可以看出是否是little endian。
PS:本文后面几个程序都是从网上摘抄过来的,对于联合体Union不是很清楚的可以参看http://blog.sina.com.cn/s/blog_3fa943920100ob37.html 我觉得这篇博文写的很详细。通过本文对大端小端模式有了一个比较深的理解吧。也希望对读者有些许帮助,谢谢!接下来我会总结下联合Union结构和Struct的区别。