第一章 计算机系统漫游
1.1 信息就是位+上下文
系统中的所有信息,包括磁盘文件,内存中的程序,内存中存放的用户数据以及网络上传送的数据,都是由一串比特表示的。区分不同数据对象的唯一方法是我们读到这些数据对象的上下文。
1.2 程序被其他程序翻译成不同格式
一个程序的生命周期是从一个高级C语言程序开始的,为了能在系统上运行该程序,每条语句都必须被其他程序转换成一系列低级机器语言,然后这些指令按照可执行目标程序的格式打包好,并以二进制文件的形式存储起来。得到可执行目标文件。
这个翻译过程可归为四个阶段,预处理,编译,汇编,链接,四个阶段构成了编译系统。
预处理阶段
预处理器根据预编译指令,对C程序进行文本替换。得到.i文件。
编译阶段
编译器将.i翻译成.s,得到一个汇编语言程序。C语言和Fortran编译器产生的输出文件都是一样的汇编语言。
汇编阶段
将.s文件翻译成机器语言指令,并打包成可重定位目标程序,把存在目标文件.o中。.o是二进制文件。
链接
C语言头文件中中的函数存在了预编译好的目标文件,因此该阶段将调用的函数合并到我们的.o文件中,得到可执行目标文件。该文件可以被加载到内存中由系统执行。
1.3 了解编译系统如何工作的益处
-
优化程序性能
我们需要了解一些机器代码以及编译器如何将C转换为机器代码的方式。不同循环语句的比较,switch和ifelse的比较等。
-
理解链接时出现的错误
-
避免安全漏洞,如缓冲区溢出等
1.4 处理器读并解释储存在内存中的指令
当程序被编译完成后,我们可通过shell指令
linux> ./hello
来运行程序
1.4.1 系统的硬件组成
为了理解运行hello程序时发生了什么,我们需要了解系统的硬件组织。
这是一张近期Intel产品族的模型
总线
贯穿于整个系统的电子管道,携带信息字节并负责在各个部件间传递。总线传输的数是个重要的系统参数。
IO设备
IO设备是系统与外部的联系通道,每个IO设备通过控制器或适配器与IO总线相连。控制器和适配器的差别在于他们的封装方式。控制器是IO设备本身或系统的主印刷电路板,适配器是插在主板插槽上的卡。
主存
主存用来存放程序和数据,由DRAM构成。按字节编址。
处理器
处理器按照指令模型来操作,该模型由指令集架构决定。指定按照严格的顺序执行,并更新PC寄存器。
1.4.2 运行hello程序
shell将hello文件加载到内存中,通过dma技术,文件可以直接从磁盘到内存,不经过cpu。
hello程序将字符串中的字节从主存复制到寄存器,再从寄存器复制到显示设备,输出到磁盘。
1.5 高速缓存至关重要
如上的简单示例说明了一个重要问题,计算机会经常进行IO操作。这些开销减慢了程序运行的速度。因此系统设计者的一个重要目标就是使IO操作尽快完成。
处理器与主存之间存在着巨大的速度差距,并且还在一直扩大。针对这种差异,系统设计者采用了更小更快的高速缓冲存储器作为暂时存储。L1高速缓存通常可达数万字节,访问速度几乎和访问寄存器一样快。通过该方案,能让内存操作基本都在缓存中完成,基于程序局部性原理。
1.6 储存器的层次结构
计算机的各储存部件间形成了层次结构,底层速度快,造价高,容量小,高层相反。通过该层次结构,就可以用高层的价格和容量,达到底层的速度。
1.7 操作系统管理硬件
当我们执行程序时,程序并没有直接访问计算机硬件,而是通过操作系统提供的服务来访问。我们可以把操作系统看作是应用程序和硬件之间插入的一层软件。
操作系统有两个基本功能:
防止硬件被应用程序滥用,向应用程序提供简单一致的机制来控制硬件设备。操作系统通过几个抽象服务来实现,如进程,虚拟内存,文件等。
1.8 系统之间利用网络通信
现代系统经常通过网络和其它系统连接到一起,网络可视作一个IO设备,数据流可以通过网络直接发给另一台机器,不经过本地磁盘,也可通过网络直接读取数据到主存中。
1.9 重要主题
1.9.1 Amdahl定律
对系统的某一部分加速时,其对系统整体性能影响取决于该部分的重要性和加速程度。
由此可知,想要显著加速整个系统,必须提升全系统中相当大部分的速度
1.9.2 并发和并行
-
线程级并发
构建在进程抽象之上,我们能够设计出同时有多个程序执行的系统,这就导致了并发。自20世纪60年代出现时间共享以来,计算机系统就开始有了对并发执行的支持,但只是简单的使任务按时间切换。这种配置称为单处理器系统。
后来随着多核处理器,超线程的出现,我们广泛使用了多处理器系统,将多个CPU(核)集成到集成电路芯片上,每个核都有自己的L1和L2缓存,而共用L3缓存.
而超线程技术则允许一个核并行执行多个控制流。在使用超线程的核中,程序计数器核寄存器有多个备份,共用其他资源。
-
指令级并行
在CPU中,使用流水线技术来极大加快指令的执行。如果指令速度快于一周期一条,则可成为超标量处理器。
-
单指令,多数据并行
许多处理器拥有特殊的硬件,允许一条指令产生多个并行的数据操作。如SIMD指令可以并行加法,通常需要在编程时显式声明。