zoukankan      html  css  js  c++  java
  • Linux高级编程--02.gcc和动态库

    在Linux环境下,我们通常用gcc将C代码编译成可执行文件,如下就是一个简单的例子:

    小实验:hello.c

    #include <stdlib.h>
    #include <stdio.h>
    void main(void)
    {
        printf("hello world!
    ");
    }
    

    可以通过如下指令来编译出一个可执行文件:

    gcc hello.c
    

    执行完该命令后,就会得到一个a.out的可执行文件。

    编译的过程

    前面的例子只是简单的介绍了一下gcc的使用方法,熟悉c编程的朋友就会知道,该步骤其实包含了预处理–>编译–>汇编–>链接四步,这四步分别实现的功能如下:

    • 预处理阶段:主要处理源文件中的#ifdef、 #include和#define命令,展开宏、读取定义的符号等(.i)
    • 编译阶段:检查代码的规范性,把代码翻译成汇编语言(.s)
    • 汇编阶段:是把编译阶段生成的文件转成二进制目标代码(.o)
    • 链接阶段:将汇编阶段生成的机器码汇集成一个可执行的二进制代码文件

    由此可以看出,每一个阶段的输出其实就是下一个阶段的输入,用gcc是可以单独执行这四步的:

    gcc -E hello.c -o hello.i
    gcc -S hello.i -o hello.s
    gcc -c hello.s -o hello.o
    gcc hello.o -o hello
    

    实际上,由于这四个步骤太过于复杂,往往可以像我上面那样全部集中到一个命令中来执行:

    gcc hello.c -o hello
    

    这里我加了一个-o参数来指定输出名称,而不是默认的a.out。

    -o 优化选项, 这个选项不是标准的

    • -O和 -O1指定1级优化
    • -O2 指定2级优化
    • -O3 指定3级优化
    • -O0指定不优化

      gcc hello.c -O3 -O0 hello 当出现多个优化时,以最后一个为准!!

    如果有多个文件,则可以通过如下方式全部集中起来。

    gcc -o test first.c second.c third.c
    

    这个全生成的方式虽然非常简单,但是存在的一个问题就是:当项目较大时,如果只改了一个文件,仍需要重新编译索引文件。

    为了解决这个问题,我们往往把这个编译过程拆分成两步:

    • 将各个.c文件分别编译成.o文件
    • 将所有.o文件链接成执行文件

      gcc –c first.c
      gcc –c second.c
      gcc –c third.c
      gcc -o test first.o second.o third.o

    这样,当third.c文件发生改变时,只需要重新编译third.c和链接即可,这样就省去了未变化文件的编译时间,也就是我们通常所说的增量编译。

    gcc –c third.c
    gcc -o test first.o second.o third.o
    

    从上面的使用方法中我们也可以看到:

    • 当使用-c参数时,若输入文件时.c则会同时执行执行了预处理、编译、汇编三个阶段,直接生成.o文件。
    • 输入文件为.o时,可以直接执行链接操作

    由于程序员往往并不关心前面两个几个阶段生成的输出文件,通常我们也把预处理、编译、汇编三个阶段合并在一起,统称为编译,输入.c,生成.o。

    常用参数:

    前面其实已经演示过-E、–S、–c、–o等几个参数的用法,其中-E及-S很少会用到,-c用于编译生成.o文件,-o用于指定输出文件名称。除了这几个生成控制的参数外,还有许多参数设置,这里主要介绍一下几个常用的:

    包含头文件和库:

    • -Idir :指定编译查找头文件的目录,常用于查找第三方的库的头文件,例:gcc test.c –I../inc -o test。
    • -Ldir :指定链接时查找lib的目录,常用于查找第三方库。
    • -llibrary :指定额外链接的lib库

    宏定义:

    • -DMACRO :以字符串”1”(默认值)定义 MACRO 宏。
    • -DMACRO=DEFN :以字符串”DEFN”定义MACRO 宏,注意中间不能有空格。
    • -UMACRO :取消对 MACRO 宏的定义。

    调试和可执行文件形式:

    • -g :指示编译器,在编译的时产生调试信息。
    • -ggdb :尽可能的生成gdb的可以使用的调试信息(比-g生成的信息更多些)。
    • -static :禁止使用动态库,编译得到的程序会比较大,但可以自由运行。
    • -share :尽量使用动态库,所以生成文件比较小,但是需要系统由动态库。

    告警选项:

    • -Wall :产生尽可能多的警告信息,建议始终带上
    • -Werror :将所有的警告当成错误进行处理

    gcc和g++

    除了gcc编译器外,还有另外一个编译器g++,很多人往往搞不清楚这两个编译器的区别,很多人望文生义的认为gcc只能编c代码,g++只能编c++代码。实际上这两个编译器的主要区别如下:

    1. 后缀为.c的,gcc把它当作是C程序,而g++当作是c++程序来编译,后缀为.cpp的,两者都会认为是c++程序,注意,虽然c++是c的超集,但是两者对语法的要求是有区别的。C++的语法规则更加严谨一些。
    2. 链接的时候gcc不会默认加上-lstdc++选项,而g++会,所以导致gcc编译c++代码时,用到了stl库时会出现链接失败。
    3. gcc不会定义__cplusplus宏,而g++会,这个宏只是标志着编译器将会把代码按C还是C++语法来解释,如果后缀为.c,并且采用gcc编译器,则该宏就是未定义的,否则,就是已定义。

    静态链接库

    有时我们需要将一组代码编成一个库,从而方便其复用。例如,我们调用的STL和系统函数都是以这种方式提供的。另外,当项目工程较大时,为了使其模块化方便分工,有时也需要将其创建自己的链接库。

    代码演示:

    // stack.c
    #include <stdio.h>
    char stack[512];
    int top = -1;
    char pop(void){
        return stack[top--];
    }
    void push(char c){
        stack[++top] = c;
    }
    

    要把stack.c编成lib,需要经过如下两个步骤:

    1. 通过gcc –c命令将stack.c编成stack.o gcc -c stack.c
    2. 通过ar命令将stack.o封装成libstack.a ar cr libstack.a stack.o

    创建测试文件

    // main.c
    #include <stdio.h>
    char pop();
    void push(char c);
    void main(void){
        push('a');
        push('b');
        printf("%c
    ", pop());
    }
    

    链接编译:

    gcc -o run main.c -L. -lstack
    

    上述过程中,用到了条之前没见过的命令ar。ar是archive的缩写,也就是归档的意思,平时我们用得更多的是另一条归档命令tar。ar和tar的功能其实比较类似,但ar命令做了一些额外的处理,它会为被归档的目标文件中的符号建立索引,当和应用程序链接时,建立的这些索引将回收链接过程

    ar命令的参数比较多,如果只是创建lib库的话,通常只用到了cr这两个组合参数。该命令是可以接受多个输入文件,统一合并到一个库中。

    ar cr libtest.a first.o second.o third.o
    

    在通过ar创建lib后,可以通过ar -t命令查看该lib里打包了那些.o文件

    ar -t libstack.a
    stack.o
    

    此外,还可以通过nm命令来查看符号表等更多信息

    nm libstack.a
    stack.o:
    0000000000000000 T pop
    0000000000000021 T push
    0000000000000200 C stack
    0000000000000000 D top
    

    动态链接库

    传统方式下,库函数的链接是在编译器完成的,所有相关对象在编译的时候被整合成一个可执行文件。与此相比,我们也可以把对库函数的链接载入推迟到程序运行的时期,也就是我们所称作的动态链接。

    动态链接的优点

    除了静态链接库所有的模块化和代码复用外,动态链接库还有如下优点:

    1. 可以实现进程之间的库共享:当多个进程共享一个库时(如stl库和一些系统库是基本上大多数程序都用的),动态链接方式可以只在内存中保留一份副本,节约内存。
    2. 升级变得简单:用户只需要升级动态链接库,而无需重新编译链接其他原有的代码就可以完成整个程序的升级(很多Windows的补丁就是这种方式发布的)。
    3. 可以动态载入:当软件比较大的时候,可以根据需要动态载入/卸载相应的链接库,而无需像静态链接的方式那样必须一次性全部载入

    创建动态链接库的方式比较简单,还是按静态链接库的例子,我们只需要通过gcc -shared指令即可创建一个libstack.so的动态库(静态库一般以.a作为扩展名,动态库一般以.so作为扩展名)。

    gcc -c -fpic stack.c
    gcc -shared -o libstack.so stack.o
    

    这里必须带上-fpic,使输出的对象模块是按照可重定位地址方式生成的。

    在链接阶段使用动态库的方式基本上和静态库一致。

    gcc -o run main.c -L. -lstack
    

    编译玩这个程序后,我们执行后却发现,它报动态链接库找不到的错误提示。

    ./run
    ./run: error while loading shared libraries: libstack.so: cannot open shared object file: No such file or directory
    

    我们也可以通过ldd命令查看某程序当前对动态链接库的依赖情况:

    ldd run
    linux-vdso.so.1 =>  (0x00007fff366fe000)
    libstack.so => not found
    libc.so.6 => /lib64/libc.so.6 (0x00002ba53ad1f000)
    /lib64/ld-linux-x86-64.so.2 (0x00002ba53ac03000)
    

    ldd的结果表明了我们生成的libstack.so找不到。因为动态链接库是一个可以共享的文件,因此往往存放在一个公共的位置,在Linux系统中程序查找动态链接库的规则如下:

    • 首先在环境变量LD_LIBRARY_PATH所记录的路径中查找。
    • 然后从缓存文件/etc/ld.so.cache中查找。
    • 如果上述步骤都找不到,则到默认的系统路径中查找,先是/lib然后是/usr/lib。

    很明显,这几个路径都不包含当前路径。要解决上述问题,一个简单的方式就是把当前路径加到环境变量中:

    export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:.
    

    然后再次用ldd名称测试,发现现在就能找到我们的链接库了。

    ldd run
    linux-vdso.so.1 =>  (0x00007fff581ff000)
    libstack.so (0x00002ad148cf0000)
    libc.so.6 => /lib64/libc.so.6 (0x00002ad148e0b000)
    /lib64/ld-linux-x86-64.so.2 (0x00002ad148bd4000)
    

    不过,很多大牛并不建议通过修改LD_LIBRARY_PATH这种方式

    LD_LIBRARY_PATH is not the answer http://prefetch.net/articles/linkers.badldlibrary.html
    Why LD_LIBRARY_PATH is bad     http://xahlee.org/UnixResource_dir/_/ldpath.html
    LD_LIBRARY_PATH - just say no     http://blogs.sun.com/rie/date/20040710
    




  • 相关阅读:
    《例说51单片机(C语言版)(第3版)》——1-3 认识MCS-51的存储器结构
    MySQL5.7中InnoDB不可不知的新特性
    python 抓取日志
    Packet for query is too large (1706 > 1024). You can change this value on the server by setting the
    面对1.3 亿用户数据泄露,企业如何围绕核心数据构建安全管理体系?
    python 正则替换
    python 正则
    没有宫廷内斗,数据库界的延禧攻略
    抽象基类
    ansible -m shell -a 注意单引号和双引号
  • 原文地址:https://www.cnblogs.com/linzhenjie/p/5485549.html
Copyright © 2011-2022 走看看