在一个C语言的运行库中,包含了很多和系统相关的代码,比如输入输出,文件操作,时间日期,内存管理等。比如在输出hello world的程序中我们就需要用到printf.o,文件操作有fread.o, fwrite.o。内存管理有malloc.o。把这些零散的目标文件直接提供给库的使用者,很大程度上会造成文件传输,管理和组织的不方便。于是通常的做法是通过ar压缩程序将这些目标文件压缩到一起。并且对其进行编号和索引。便于查找和检索。就形成了libc.a这个静态库文件。 比如查找关于printf.o的文件可以得到如下的结果。
root@zhf-maple:/usr/lib/x86_64-linux-gnu# ar -t libc.a | grep printf.o
vfprintf.o
vprintf.o
reg-printf.o
fprintf.o
printf.o
snprintf.o
sprintf.o
asprintf.o
dprintf.o
vfwprintf.o
fxprintf.o
iovsprintf.o
fwprintf.o
swprintf.o
vwprintf.o
wprintf.o
vswprintf.o
vasprintf.o
iovdprintf.o
vsnprintf.o
obprintf.o
使用objdump命令可以查看到printf.o的具体符号
objdump -t libc.a | grep printf
printf.o: 文件格式 elf64-x86-64
0000000000000000 g F .text 00000000000000c0 __printf
0000000000000000 *UND* 0000000000000000 vfprintf
0000000000000000 g F .text 00000000000000c0 _IO_printf
0000000000000000 g F .text 00000000000000c0 printf
可以看到printf函数被定义在了printf.o这个目标文件中,那么是否可以这样认为hello world编译出来的目标文件只要和printf.o链接起来,最后就可以形成一个可用的执行文件了? 答案是否定的。原因在于printf.o里面有个”UND”的符号“vprintf”,很明显,printf.o依赖于其他的目标文件。而且vprintf还可能依赖其他的目标文件,这些目标文件都分散在glibc的各个目标文件中。如果手动的一个个收集全不现实。幸好ld链接器帮助我们处理这些复杂的事务。自动寻找所有需要的符号以及它们的目标文件。将这些文件从libc.a中解压出来,最终将它们链接在一起成为一个可执行的文件。就和下图一样
那么我们实际来看下过程实际上是否是这样的呢。我们通过一个最简单的hello world程序来看下
#include <stdio.h>
void main(){
printf("hello world");
}
root@zhf-maple:/home/zhf/c_prj# gcc -static --verbose -fno-builtin test1.c
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-linux-gnu/7/lto-wrapper
OFFLOAD_TARGET_NAMES=nvptx-none
OFFLOAD_TARGET_DEFAULT=1
Target: x86_64-linux-gnu
Configured with: ../src/configure -v --with-pkgversion='Ubuntu 7.2.0-8ubuntu3' --with-bugurl=file:///usr/share/doc/gcc-7/README.Bugs --enable-languages=c,ada,c++,go,brig,d,fortran,objc,obj-c++ --prefix=/usr --with-gcc-major-version-only --program-suffix=-7 --program-prefix=x86_64-linux-gnu- --enable-shared --enable-linker-build-id --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --libdir=/usr/lib --enable-nls --with-sysroot=/ --enable-clocale=gnu --enable-libstdcxx-debug --enable-libstdcxx-time=yes --with-default-libstdcxx-abi=new --enable-gnu-unique-object --disable-vtable-verify --enable-libmpx --enable-plugin --enable-default-pie --with-system-zlib --with-target-system-zlib --enable-objc-gc=auto --enable-multiarch --disable-werror --with-arch-32=i686 --with-abi=m64 --with-multilib-list=m32,m64,mx32 --enable-multilib --with-tune=generic --enable-offload-targets=nvptx-none --without-cuda-driver --enable-checking=release --build=x86_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu
Thread model: posix
gcc version 7.2.0 (Ubuntu 7.2.0-8ubuntu3)
COLLECT_GCC_OPTIONS='-static' '-v' '-fno-builtin' '-mtune=generic' '-march=x86-64'
/usr/lib/gcc/x86_64-linux-gnu/7/cc1 -quiet -v -imultiarch x86_64-linux-gnu test1.c -quiet -dumpbase test1.c -mtune=generic -march=x86-64 -auxbase test1 -version -fno-builtin -fstack-protector-strong -Wformat -Wformat-security -o /tmp/ccnzUpq5.s
GNU C11 (Ubuntu 7.2.0-8ubuntu3) version 7.2.0 (x86_64-linux-gnu)
compiled by GNU C version 7.2.0, GMP version 6.1.2, MPFR version 3.1.6, MPC version 1.0.3, isl version isl-0.18-GMP
GGC heuristics: --param ggc-min-expand=100 --param ggc-min-heapsize=131072
ignoring nonexistent directory "/usr/local/include/x86_64-linux-gnu"
ignoring nonexistent directory "/usr/lib/gcc/x86_64-linux-gnu/7/../../../../x86_64-linux-gnu/include"
#include "..." search starts here:
#include <...> search starts here:
/usr/lib/gcc/x86_64-linux-gnu/7/include
/usr/local/include
/usr/lib/gcc/x86_64-linux-gnu/7/include-fixed
/usr/include/x86_64-linux-gnu
/usr/include
End of search list.
GNU C11 (Ubuntu 7.2.0-8ubuntu3) version 7.2.0 (x86_64-linux-gnu)
compiled by GNU C version 7.2.0, GMP version 6.1.2, MPFR version 3.1.6, MPC version 1.0.3, isl version isl-0.18-GMP
GGC heuristics: --param ggc-min-expand=100 --param ggc-min-heapsize=131072
Compiler executable checksum: ac3d87e224d604834682aa3a3c368d9c
COLLECT_GCC_OPTIONS='-static' '-v' '-fno-builtin' '-mtune=generic' '-march=x86-64'
as -v --64 -o /tmp/ccEf9Amv.o /tmp/ccnzUpq5.s
GNU汇编版本 2.29.1 (x86_64-linux-gnu) 使用BFD版本 (GNU Binutils for Ubuntu) 2.29.1
COMPILER_PATH=/usr/lib/gcc/x86_64-linux-gnu/7/:/usr/lib/gcc/x86_64-linux-gnu/7/:/usr/lib/gcc/x86_64-linux-gnu/:/usr/lib/gcc/x86_64-linux-gnu/7/:/usr/lib/gcc/x86_64-linux-gnu/
LIBRARY_PATH=/usr/lib/gcc/x86_64-linux-gnu/7/:/usr/lib/gcc/x86_64-linux-gnu/7/../../../x86_64-linux-gnu/:/usr/lib/gcc/x86_64-linux-gnu/7/../../../../lib/:/lib/x86_64-linux-gnu/:/lib/../lib/:/usr/lib/x86_64-linux-gnu/:/usr/lib/../lib/:/usr/lib/gcc/x86_64-linux-gnu/7/../../../:/lib/:/usr/lib/
COLLECT_GCC_OPTIONS='-static' '-v' '-fno-builtin' '-mtune=generic' '-march=x86-64'
/usr/lib/gcc/x86_64-linux-gnu/7/collect2 -plugin /usr/lib/gcc/x86_64-linux-gnu/7/liblto_plugin.so -plugin-opt=/usr/lib/gcc/x86_64-linux-gnu/7/lto-wrapper -plugin-opt=-fresolution=/tmp/ccXlQAjV.res -plugin-opt=-pass-through=-lgcc -plugin-opt=-pass-through=-lgcc_eh -plugin-opt=-pass-through=-lc --sysroot=/ --build-id -m elf_x86_64 --hash-style=gnu --as-needed -static -z relro /usr/lib/gcc/x86_64-linux-gnu/7/../../../x86_64-linux-gnu/crt1.o /usr/lib/gcc/x86_64-linux-gnu/7/../../../x86_64-linux-gnu/crti.o /usr/lib/gcc/x86_64-linux-gnu/7/crtbeginT.o -L/usr/lib/gcc/x86_64-linux-gnu/7 -L/usr/lib/gcc/x86_64-linux-gnu/7/../../../x86_64-linux-gnu -L/usr/lib/gcc/x86_64-linux-gnu/7/../../../../lib -L/lib/x86_64-linux-gnu -L/lib/../lib -L/usr/lib/x86_64-linux-gnu -L/usr/lib/../lib -L/usr/lib/gcc/x86_64-linux-gnu/7/../../.. /tmp/ccEf9Amv.o --start-group -lgcc -lgcc_eh -lc --end-group /usr/lib/gcc/x86_64-linux-gnu/7/crtend.o /usr/lib/gcc/x86_64-linux-gnu/7/../../../x86_64-linux-gnu/crtn.o
COLLECT_GCC_OPTIONS='-static' '-v' '-fno-builtin' '-mtune=generic' '-march=x86-64'
关键的3个步骤都已经标粗
第一步:调用cc1程序,cc1实际上是GCC的C语言编译器,它将test1.c编译成临时的/tmp/ccnzUpq5.s
第二步:然后调用as将/tmp/ccnzUpq5.s汇编成临时目标文件ccnzUpq5.o
第三步:GCC调用collect2程序来完成最后的链接,collect2可以看做是ld的一个封装,它会调用ld链接器来完成对目标文件的链接。在最后一步中,我们可以看到至少有下列的目标文件被链接入了最终可执行文件
crt1.o
crtbeginT.o
cEf9Amv.o
crtend.o
crtn.o
crti.o