4.1 C语言中的段
编译器在编译程序的时候,将程序中的所有的元素分成了一些组成部分,各部分构成一个段,所以说段是可执行程序的组成部分。
- 代码段:代码段就是程序中的可执行部分,直观理解代码段就是函数堆叠组成的。代码段由程序中的各个函数产生,函数的每一个语句将最终经过编译和汇编生成二进制机器代码(具体生成哪种体系结构的机器代码由编译器决定)。
- 有些特殊数据会被放到代码段
- C 语言中使用 char *p = "linux" ;定义字符串时,字符串"linux"实际被分配在代码段,也就是说这个"linux"字符串实际上是一个常量字符串而不是变量字符串。
- const 型常量:C语言中const关键字用来定义常量,常量就是不能被改变的量。const的实现方法至少有2种:
- 第一种就是编译将 const 修饰的变量放在代码段去以实现不能修改(普遍见于各种单片机的编译器);
- 第二种就是由编译器来检查以确保 const 型的常量不会被修改,实际上const 型的常量还是和普通变量一样放在数据段的(gcc中就是这样实现的)。
- 有些特殊数据会被放到代码段
- 数据段(也被称为数据区、静态数据区、静态区):数据段就是程序中的数据,直观理解就是C语言程序中的全局变量。放在.data段的变量有2种:
- 第一种是显式初始化为非零的全局变量。
- 第二种是静态局部变量,也就是static修饰的局部变量。(普通局部变量分配在栈上,静态局部变量分配在.data段),未初始化或显式初始化为0的全局变量放在bss段
- 显式初始化为非零的全局变量和静态局部变量放在数据段
- 注意:全局变量才算是程序的数据,局部变量不算程序的数据,只能算是函数的数据
- 数据段又分为 只读数据段(RO Data) 和 读写数据段(RW Data):
- 只读数据段由程序中所使用的数据产生,该部分数据的特点是在运行中不需要改变,因此编译器会将该数据放入只读的部分中。C语言的一些语法将生成只读数据段。
- 读写数据段表示了在目标文件中一部分可以读也可以写的数据区,在某些场合它们又被称为已初始化数据段。这部分数据段和代码段,与只读数据段一样都属于程序中的静态区域,但是具有可写的特点。
- bss段(又叫ZI(zero initial)段):未初始化数据段(BSS), 未初始化数据段常被称之为BSS(英文Block Start by Symbol的缩写)。与读写数据段类似,它也属于静态数据区,但是该段中的数据没有经过初始化。因此它只会在目标文件中被标识,而不会真正称为目标文件中的一个段,该段将会在运行时产生。未初始化数据段只有在运行的初始化阶段才会产生,因此它的大小不会影响目标文件的大小。
- 数据段(.data)和bss段的区别和联系:二者本来没有本质区别,都是用来存放C程序中的全局变量的。区别在于把显示初始化为非零的全局变量存在.data段中,而把显式初始化为0或者并未显式初始化(C语言规定未显式初始化的全局变量值默认为0)的全局变量存在bss段。
- 内存四区:
- 栈区(stack):由编译器自动分配释放 ,存放函数的参数值,局部变量的值等。
- 堆区(heap): malloc
- 数据区:
- 全局区(静态区)(static):全局变量和静态变量的存储是放在一块的,初始化的全局变量和静态变量在一块区域, 未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。
- 常量区 :常量字符串就是放在这里的。 程序结束后由系统释放
- 代码区:存放函数体的二进制代码。
4.2 链接脚本分析
uboot的链接脚本和裸机中的链接脚本并没有本质区别,只是复杂度高一些,文件多一些,使用到的技巧多一些。
脚本路径:u-boot-1.1.6oard100ask24x0u-boot.lds
1 /* 输出格式为 elf32-littlearm, */ 2 OUTPUT_FORMAT("elf32-littlearm", "elf32-littlearm", "elf32-littlearm") 3 /*OUTPUT_FORMAT("elf32-arm", "elf32-arm", "elf32-arm")*/ 4 /* 输出架构为 ARM */ 5 OUTPUT_ARCH(arm) 6 /* 用来指定整个程序的入口地址,所谓入口地址就是整个程序的开头地址,可以认为就是整个程序的第一句指令。有点像C语言中的main。 */ 7 /* _start 就是汇编的起始函数 */ 8 ENTRY(_start) 9 /* SECTIONS 就是整个链接脚本的指定 */ 10 SECTIONS 11 { 12 /* 指定程序的链接地址有2种方法:一种是在Makefile中ld的flags用-Ttext 0x20000000来指定; 13 第二种是在链接脚本的SECTIONS开头用.=0x20000000来指定。 14 两种都可以实现相同效果。这两种技巧是可以共同配合使用的,也就是说既在链接脚本中指定也在ld flags中用-Ttext来指定。两个都指定以后以-Ttext指定的为准。 15 uboot的最终链接起始地址就是在Makefile中用-Ttext 来指定的,注意 TEXT_BASE 变量。最终来源是 Makefile 中配置对应的命令中,在make xxx_config时得到的。 16 若没有配置,则由此处指定*/ 17 . = 0x00000000; 18 19 . = ALIGN(4); /* 4字节对齐 */ 20 /* 代码段 */ 21 /* 在代码段中,必须注意文件的排列顺序,这些顺序会影响编译的时候这些 .o 文件在生成的u-boot.bin 中的排列顺序 */ 22 /* 指定必须放在前面部分的那些文件就是那些必须安排在前16KB内的文件,这些文件中的函数在前16KB会被调用。在后面第二部分(16KB之后)中调用的程序,前后顺序就无所谓了。 */ 23 .text : 24 { 25 cpu/arm920t/start.o (.text) 26 board/100ask24x0/boot_init.o (.text) 27 *(.text) /* 剩下的所有的未指出名字的 .o */ 28 } 29 30 . = ALIGN(4); 31 /* 只读数据段 */ 32 .rodata : { *(.rodata) } 33 34 . = ALIGN(4); 35 /* 普通数据段 */ 36 .data : { *(.data) } 37 38 . = ALIGN(4); 39 /* 自定义段 */ 40 .got : { *(.got) } 41 42 . = .; 43 __u_boot_cmd_start = .; 44 .u_boot_cmd : { *(.u_boot_cmd) } /* 自定义 u_boot 命令段 */ 45 __u_boot_cmd_end = .; 46 47 . = ALIGN(4); 48 __bss_start = .; 49 .bss : { *(.bss) } /* bss 段 */ 50 _end = .; 51 }
链接脚本中除了.text .data .rodata .bss段等编译工具自带的段之外,编译工具还允许我们自定义段。譬如uboot总的.u_boot_cmd段就是自定义段。自定义段很重要。