LLVM
1. 说说 LLVM(Low Level Virtual Machine)到底是什么吧
-
先说编译器:编译器是把程序员的代码翻译成机器可以理解的语言的工具;
-
再谈 LLVM:一个模块化和可重用的编译器和工具链技术的集合,Clang 是 LLVM 的子项目,是 C,C++ 和 Objective-C 编译器,因为多模块的复用,所以提供了惊人的快速编译,比 GCC 快3倍。
2. LLVM 是一开始就作为一个完整的编译工具来使用的吗?还是有什么其他故事
LLVM 当时是为了解决一个小问题而开发的:当使用OpenGL 函数库的时候(Mac OS 10.4 和 10.5环境下),比如你要调用这个函数,glVertex3f(),编译器必须将其转化为特定的GPU可以理解的数据。但是这带来一个问题:市面上有海量的GPU,每个GPU的性能和参数也不尽相同,所要求的数据格式也不同。这时 LLVM 可以产生很小的一部分代码去解决这个问题,这是 LLVM 诞生的初衷。
3. LLVM 的 bytecode 和 Apple 现在的 bitcode 有什么不同?
这是历史遗留问题。一开始 LLVM 是开源的,所有代码在转成二进制时就叫做 bytecode -- 因为 java 当年就是这么叫的。当时这一部分有很多问题:比如不能扩展,无法兼容,非常脆弱
然后就到了 LLVM 2.0,当时我重新设计了架构,采用的就是 Bitcode 机制。LLVM 2.0 将所有代码以比特流(bit stream)而不是字节流(byte stream)的形式来编码。这就是 bitcode 这一术语的由来。
主要的工作流程就是现将代码转成比特流,然后相应处理。处理完后再将编码传到其他地方去。
4. Bitcode 这个机制比直接传输二进制有什么好处
好处那是多了去了。首先 编译器工作起来会越来越好。因为通过Bitcode机制,它可以通过编译不同代码来存储各种优化方法,这样下次碰到类似代码,它就会自动启动相关优化机制,使得效率提升。还有个好处是 LLVM 可以让芯片的兼容性变得很好。因为 Apple 每年都在芯片上推陈出新,它们转化为二进制的规则都不尽相同,LLVM 只要每次重新编码并传输成比特流就好了。
当然 Bitcode 也不是万能的。比如它不能解决 32位的 APP 在64位机器上的兼容问题。这个问题其实应该依靠代码逻辑。
补充
补充:LLVM的三层结构
-
第一层:Clang 编译器,负责编译各种语言
-
第二层:代码优化器,通过模块化操作优化代码,是 Bitcode 逻辑的主要部分
-
第三层:代码翻译器,针对不同平台和 GPU 将代码翻译成机器语言
补充:LLDB,llbc++,compile rt
-
LLDB: 一个有着 REPL 的特性和 C++ ,Python 插件的开源调试器。LLDB 绑定在 Xcode 内部,存在于主窗口底部的控制台中;
-
libc++,libc++ ABI: 高性能 C++ 标准库实现,支持 C++ 11
-
compiler-rt:为 LLVM 和 Clang 设计的编译器扩展函数库。针对 __fixunsdfdi 和其他目标机器上没有一个核心 IR (intermediate representation) 对应的短原生指令序列时,提供高度调优过的底层代码生成支持。
ABI 是什么?
-
Application Binary Interface,中文名:应用二进制接口。是 APP 和 操作系统、其他应用之间的二进制接口。它包括以下细节:
-
数据类型的大小、布局和对齐;
-
调用约定(控制着函数的参数如何传送以及如何接受返回值),例如,是所有的参数都通过栈传递,还是部分参数通过寄存器传递;哪个寄存器用于哪个函数参数;通过栈传递的第一个函数参数是最先push到栈上还是最后;
-
系统调用的编码和一个应用如何向操作系统进行系统调用;
-
以及在一个完整的操作系统ABI中,目标文件的二进制格式、程序库等等。