zoukankan      html  css  js  c++  java
  • GCC/G++编译原理分析

    一、概述

    C和C++编译器是集成的,编译一般分为四个步骤:

    • 预处理(preprocessing)
    • 编译(compilation)
    • 汇编(assembly)
    • 连接(linking)

    gcc

      认为预处理的文件是(.i)是C文件,并且设定C形式的连接;

    g++

      认为预处理的文件是(.i)是C++文件,并且设定C++形式的连接;

    源文件后缀名的一些含义和后续的操作:

    • .c       C源程序        预处理,编译,汇编
    • .C      C++源程序        预处理,编译,汇编
    • .cc       C++源程序  
    • .cxx      C++源程序        预处理,编译,汇编
    • .m       Objective-C源程序   预处理,编译,汇编
    • .i       预处理后的C文件     编译,汇编
    • .ii      预处理后的C++文件   编译,汇编
    • .s      汇编语言源程序     汇编
    • .S      汇编语言源程序     预处理,汇编
    • .h      预处理器文件      通常不出现在命令行上  

    其他后缀名的文件被传递给连接器(linker).通常包括:
      .o 目标文件(Object file)
      .a 归档库文件(Archive file)

    二、具体介绍一下GCC编译步骤

    首先,有以下hello.c源代码

     

    #include<stdio.h>

    int main()
    {
    printf(
    "Hello! This is our embedded world!\n");

    return 0;
    }

     

    (1)预处理阶段

    在该阶段,编译器将上述代码中的stdio.h编译进来,并且用户可以使用Gcc的选项”-E”进行查看,该选项的作用是让Gcc在预处理结束后停止编译过程。


     注意
     Gcc指令的一般格式为:Gcc [选项] 要编译的文件 [选项] [目标文件]

    其中,目标文件可缺省,Gcc默认生成可执行的文件,命为:编译文件.out
     

    [root@localhost Gcc]# Gcc –E hello.c –o hello.i

    在此处,选项"-o"是指目标文件,".i"文件为已经过预处理的C原始程序。以下列出了hello.i文件的部分内容:

    typedef int (*__gconv_trans_fct) (struct __gconv_step *,

             struct __gconv_step_data *, void *,

             __const unsigned char *,

             __const unsigned char **,

             __const unsigned char *, unsigned char **,

             size_t *);

    # 2 "hello.c" 2

    int main()

    {

     printf("Hello! This is our embedded world!\n");

     return 0;

    由此可见,Gcc确实进行了预处理,它把”stdio.h”的内容插入到hello.i文件中。

    (2)编译阶段

    接下来进行的是编译阶段,在这个阶段中,Gcc首先要检查代码的规范性、是否有语法错误等,以确定代码的实际要做的工作,在检查无误后,Gcc把代码翻译成汇编语言。用户可以使用”-S”选项来进行查看,该选项只进行编译而不进行汇编,生成汇编代码。

    [root@localhost Gcc]# Gcc –S hello.i –o hello.s

    以下列出了hello.s的内容,可见Gcc已经将其转化为汇编了,感兴趣的读者可以分析一下这一行简单的C语言小程序是如何用汇编代码实现的。

         .file   "hello.c"

         .section    .rodata

         .align 4

    .LC0:

         .string     "Hello! This is our embedded world!"

         .text

    .globl main

         .type main, @function

    main:

         pushl %ebp

         movl %esp, %ebp

         subl $8, %esp

         andl $-16, %esp

         movl $0, %eax

         addl $15, %eax

         addl $15, %eax

         shrl $4, %eax

         sall $4, %eax

         subl %eax, %esp

         subl $12, %esp

         pushl $.LC0

         call puts

         addl $16, %esp

         movl $0, %eax

         leave

         ret

         .size   main, .-main

         .ident  "GCC: (GNU) 4.0.0 20050519 (Red Hat 4.0.0-8)"

         .section    .note.GNU-stack,"",@progbits

    (3)汇编阶段

    汇编阶段是把编译阶段生成的”.s”文件转成目标文件,读者在此可使用选项”-c”就可看到汇编代码已转化为”.o”的二进制目标代码了。如下所示: 

    [root@localhost Gcc]# Gcc –c hello.s –o hello.o

    (4)链接阶段

    在成功编译之后,就进入了链接阶段。在这里涉及到一个重要的概念:函数库。

    读者可以重新查看这个小程序,在这个程序中并没有定义”printf”的函数实现,且在预编译中包含进的”stdio.h”中也只有该函数的声明,而没有定义函数的实现,那么,是在哪里实现”printf”函数的呢?最后的答案是:系统把这些函数实现都被做到名为libc.so.6的库文件中去了,在没有特别指定时,Gcc会到系统默认的搜索路径”/usr/lib”下进行查找,也就是链接到libc.so.6库函数中去,这样就能实现函数”printf”了,而这也就是链接的作用。

    函数库一般分为静态库和动态库两种。

    静态库是指编译链接时,把库文件的代码全部加入到可执行文件中,因此生成的文件比较大,但在运行时也就不再需要库文件了。其后缀名一般为”.a”。

    动态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在程序执行时由运行时链接文件加载库,这样可以节省系统的开销。动态库一般后缀名为”.so”,如前面所述的libc.so.6就是动态库。Gcc在编译时默认使用动态库。

    完成了链接之后,Gcc就可以生成可执行文件,如下所示。

    [root@localhost Gcc]# Gcc hello.o –o hello

    运行该可执行文件,出现正确的结果如下。 

    [root@localhost Gcc]# ./hello

    Hello! This is our embedded world!

  • 相关阅读:
    个人总结
    第三次个人作业——用例图设计
    结对项目——第二次作业
    结对项目——第一次作业
    第二次个人编程作业
    第一次个人编程作业
    个人总结
    第三次个人作业——用例图设计
    第二次结对作业
    第一次结对作业
  • 原文地址:https://www.cnblogs.com/cnhome/p/1719885.html
Copyright © 2011-2022 走看看