- 试题1:请写一个C函数,若处理器是Big_endian的,则返回0;若是Little_endian的,则返回1
- 解答:
- int checkCPU()
- {
- {
- union w
- {
- int a;
- char b;
- } c;
- c.a = 1;
- return (c.b == 1);
- }
- }
- 剖析:
- 嵌入式系统开发者应该对Little-endian和Big-endian模式非常了解。采用Little-endian模式的CPU对操作数的存放方式是从低字节到高字节,而Big-endian模式对操作数的存放方式是从高字节到低字节。例如,16bit宽的数0x1234在Little-endian模式CPU内存中的存放方式(假设从地址0x4000开始存放)为:
- 内存地址
- 存放内容
- 0x4000
- 0x34
- 0x4001
- 0x12
- 而在Big-endian模式CPU内存中的存放方式则为:
- 内存地址
- 存放内容
- 0x4000
- 0x12
- 0x4001
- 0x34
- 32bit宽的数0x12345678在Little-endian模式CPU内存中的存放方式(假设从地址0x4000开始存放)为:
- 内存地址
- 存放内容
- 0x4000
- 0x78
- 0x4001
- 0x56
- 0x4002
- 0x34
- 0x4003
- 0x12
- 而在Big-endian模式CPU内存中的存放方式则为:
- 内存地址
- 存放内容
- 0x4000
- 0x12
- 0x4001
- 0x34
- 0x4002
- 0x56
- 0x4003
- 0x78
- 联合体union的存放顺序是所有成员都从低地址开始存放,面试者的解答利用该特性,轻松地获得了CPU对内存采用Little-endian还是Big-endian模式读写。如果谁能当场给出这个解答,那简直就是一个天才的程序员。
1. 什么是Big Endian和Little Endian?
在设计计算机系统的时候,有两种处理内存中数据的方法。一种叫为little-endian,存放在内存中最低位的数值是来自数据的
最右边部分(也就是数据的最低位部分)。比如一个16进制数字0x12345678,在内存存放的方式如下:
低地址 ------------------> 高地址
####################################################
值 #0111,1000 #0101,0110 # 0011,0100 # 0001,0010 #
####################################################
地址 # 100 # 101 # 102 # 103 #
####################################################
另一种称为big-endian,正好相反,存放在内存中最低位的数值是来自数据的最左边边部分(也就是数据的最高为部分)。
比如一个16进制数字0x12345678,在内存存放的方式如下:
低地址 ------------------> 高地址
####################################################
值 # 0001,0010 #0011,0100 # 0101,0110 # 0111,1000 #
####################################################
地址 # 100 # 101 # 102 # 103 #
####################################################
从上面的例子可以看到,采用big endian方式存储数据是符合我们人类的思维习惯的
big endian:是指低地址存放最高有效字节(MSB:Most Significant Byte, 最高有效字节),
little endian:则是低地址存放最低有效字节(LSB:Least Significant Byte, 最低有效字节)
谈到字节序的问题,必然牵涉到两大CPU派系。那就是Motorola的PowerPC系列CPU和Intel的x86系列CPU。
IBM, Motorola(Power PC), Sun的机器一般采用大端(big endian)方式存储数据。而x86系列则采用
little endian方式存储数据
是Little Endian还是Big Endian与操作系统和芯片类型都有关系。 具体情形参考处理器手册。
2. 如何判断系统是Big Endian还是Little Endian
在/usr/include/中(包括子目录)查找字符串BYTE_ORDER(或_BYTE_ORDER, __BYTE_ORDER),确定其值。
这个值一般在endian.h或machine/endian.h文件中可以找到,有时在feature.h中,不同的操作系统可能
有所不同。一般来说,Little Endian系统BYTE_ORDER(或_BYTE_ORDER,__BYTE_ORDER)为1234,Big Endian系统为4321
3. 为什么要注意字节序的问题?
在单机环境里的程序不用考虑字节序(endian)的问题,因为字节序的不同是在不同单机环境里的,如果你要在不同单机
之间传递数据,就要考虑字节序的问题,因为数据是按地址存取的,如果你是不同的字节序单机通信,就会导致传输数据
”变异“,例如,把little endian环境的数据0x12345678的指针传递给big endian环境,数据就“变异”为0x78563412
所有网络协议也都是采用big endian的方式来传输数据的。所以有时我们也会把big endian方式称之为网络字节序。当两台采
用不同字节序的主机通信时,在发送数据之前都必须经过字节序的转换成为网络字节序后再进行传输。
在异构主机数据库迁移的过程一定要注意这个,如果字节序不同,可以用rman convert转换字节序(endian)
例如:
RMAN TARGET /
CONVERT TABLESPACE ts1,ts2 TO PLATFORM 'Linux IA (32-bit)' FORMAT '/tempdir/%U';