一、冯诺依曼计算机模型详解
现代计算机模型是基于-冯诺依曼计算机模型
计算机在运行时,先从内存中取出第一条指令,通过控制器的译码,按指令的要求,从存储器中取出数据进行指定的运算和逻辑操作等加工,然后再按地址把结果送到内存中去。接下来,再取出第二条指令,在控制器的指挥下完成规定操作。依次进行下去。直至遇到停止指令。
程序与数据一样,按程序编排的顺序,一步一步地取出指令,自动地完成指令规定的操作是计算机最基本的工作模型。这一原理最初是由美籍匈牙利数学家冯.诺依曼于1945年提出来的,故称为冯.诺依曼计算机模型。
计算机五大核心组成部分
1.控制器(Control):是整个计算机的中枢神经,其功能是对程序规定的控制信息进行解释,根据其要求进行控制,调度程序、数据、地址、协调计算机各部分工作及内存与外设的访问等。
2.运算器(Datapath):运算器的功能是对数据进行各种算术运算和逻辑运算,即对数据进行加工处理。
3.存储器(Memory):存储器的功能是存储程序、数据和各种信号、命令等信息,并在需要时提供这些信息。
4.输入(Input system):输入设备是计算机的重要组成部分,输入设备与输出设备为外部设备,简称外设,输入设备的作用就将程序、原始数据、文字、字符、控制命令或现场采集的数据等信息输入到计算机。常见的输入设备有键盘、鼠标器、光电输入机、磁带机、磁盘机、光盘机等。
5.输出(Output system):输出设备与输入设备同样是计算机的重要组成部分,它把计算机的中间 结果或者最终结果、机器内的各种数据符号及文字或各种控制信号等信息输出出来。微机常用的输出设备有显示终端CRT、打印机、激光印字机、绘图仪及磁带、光盘机等。
下图-冯诺依曼计算机模型图
上面的模型是一个理论的抽象简化模型,它的具体应用就是现代计算机当中的硬件结构设计:
在上图硬件结构当中,配件很多,但最核心的只有两部分:CPU、内存。所以我们重点学习的也是这两部分。
CPU指令结构
CPU内部结构:控制单元、运算单元、数据单元
1.控制单元:控制单元是整个CPU的指挥中心,由指令寄存器IR(Instruction Register)、指令译码器ID(Instruction Decoder)和操作控制器OC(Operation Controller)等组成,对协调整个计算机有序工作极为重要。它根据用户预先编好的程序,依次从存储器中取出各条指令,放在指令寄存器IR中,通过指令译码(分析)确定应该进行什么操作,然后通过操作控制器OC,按确定的时序,向相应的部件发出微操作控制信号。操作控制器OC中主要包括:节拍脉冲发生器、控制矩阵、时钟脉冲发生器、复位电路和启停电路等控制逻辑。
2.运算单元:运算单元是运算器的核心。可以执行算术运算(包括加减乘数等基本运算及其附加运算)和逻辑运算(包括移位、逻辑测试或两个值比较)。相对控制单元而言,运算器接受控制单元的命令而进行动作,即运算单元所进行的全部操作都是由控制单元发出的控制信号来指挥的,所以它是执行部件。
3.存储单元:存储单元包括 CPU 片内缓存Cache和寄存器组,是 CPU 中暂时存放数据的地方,里面保存着那些等待处理的数据(操作指令),或已经处理过的数据(结果数据或者临时数据),CPU 访问寄存器所用的时间要比访问内存的时间短。 寄存器是CPU内部的元件,寄存器拥有非常高的读写速度,所以在寄存器之间的数据传送非常快。采用寄存器,可以减少 CPU 访问内存的次数,从而提高了 CPU的工作速度。寄存器组可分为专用寄存器和通用寄存器。专用寄存器的作用是固定的,分别寄存相应的数据;而通用寄存器用途广泛并可由程序员规定其用途。
下表列出了CPU关键技术的发展历程以及代表系列,每一个关键技术的诞生都是环环相 扣的,处理器这些技术发展历程都围绕着如何不让“CPU闲下来”这一个核心目标展开。
CPU缓存结构
现代CPU为了提升执行效率,减少CPU与内存的交互(交互影响CPU效率),一般在CPU上集成了多级缓存架构,常见的为三级缓存结构
1.L1 Cache,分为数据缓存和指令缓存,逻辑核独占
2.L2 Cache,物理核独占,逻辑核共享
3.L3 Cache,所有物理核共享
存储器存储空间大小:内存>L3>L2>L1>寄存器
存储器速度快慢排序:寄存器>L1>L2>L3>内存
还有一点值得注意:缓存是由最小的存储区块-缓存行(cacheline)组成,缓存行大小通常为64byte
缓存行是什么意思呢?
比如你的L1缓存大小是512kb,而cacheline=64byte,那么就是L1里有512*1024/64个cacheline
CPU读取存储器数据过程:
1.CPU要取寄存器X的值,只需要一步:直接读取。
2.CPU要取L1 cache的某个值,需要1-3步(或者更多):把cache行锁住,把某个数据拿来,解锁。
3.CPU要取L2 cache的某个值,先要到L1 cache里取,L1当中不存在,在L2里,L2开始加锁,加锁以后,把L2里面的数据复制到L1,再执行读L1的过程,上面的3步,再解锁。
4.CPU取L3 cache的也是一样,只不过先由L3复制到L2,从L2复制到L1,从L1到CPU。
5.CPU取内存则最复杂:通知内存控制器占用总线带宽,通知内存加锁,发起内存读请求,等待回应,回应数据保存到L3(如果没有就到L2),再从L3/L2到L1,再从L1到CPU,之后解除总线锁定。
CPU为何要有高速缓存
CPU在摩尔定律的指导下以每18个月翻一番的速度在发展,然而内存和硬盘的发展速度远远不及CPU。这就造成了高性能的内存和硬盘及其昂贵。然而CPU的高速运算需要高速的数据,为了解决这个问题,CPU厂商在CPU中内置了少量的高速缓存以解决I/O速度和CPU运算速度之间的不匹配问题。在CPU访问存储设备时,无论是存取数据或存取指令,都趋于聚集在一片连续的区域中,这就被称为局部性原理。
时间局部性(Temporal Locality):如果一个信息项正在被访问,那么在近期它很可能还会被再次访问,比如循环、递归、方法的反复调用等。
空间局部性(Spatial Locality):如果一个存储器的位置被引用,那么将来他附近的位置也会被引用,比如顺序执行的代码、连续创建的两个对象、数组等。
举个空间局部性原则例子:
1 public class TwoDimensionalArraySum { 2 private static final int RUNS = 100; 3 private static final int DIMENSION_1 = 1024 * 1024; 4 private static final int DIMENSION_2 = 6; 5 private static long[][] longs; 6 7 public static void main(String[] args) throws Exception { 8 /* 9 * 初始化数组 10 */ 11 longs = new long[DIMENSION_1][]; 12 for (int i = 0; i < DIMENSION_1; i++) { 13 longs[i] = new long[DIMENSION_2]; 14 for (int j = 0; j < DIMENSION_2; j++) { 15 longs[i][j] = 1L; 16 } 17 } 18 System.out.println("Array初始化完毕...."); 19 20 long sum = 0L; 21 long start = System.currentTimeMillis(); 22 for (int r = 0; r < RUNS; r++) { 23 for (int i = 0; i < DIMENSION_1; i++) {//DIMENSION_1=1024*1024 24 for (int j=0;j<DIMENSION_2;j++){//6 25 sum+=longs[i][j]; 26 } 27 } 28 } 29 System.out.println("spend time1:"+(System.currentTimeMillis()-start)); 30 System.out.println("sum1:"+sum); 31 32 sum = 0L; 33 start = System.currentTimeMillis(); 34 for (int r = 0; r < RUNS; r++) { 35 for (int j=0;j<DIMENSION_2;j++) {//6 36 for (int i = 0; i < DIMENSION_1; i++){//1024*1024 37 sum+=longs[i][j]; 38 } 39 } 40 } 41 System.out.println("spend time2:"+(System.currentTimeMillis()-start)); 42 System.out.println("sum2:"+sum); 43 } 44 }
运行结果:
Array初始化完毕....
spend time1:856
sum1:629145600
spend time2:2461
sum2:629145600
带有高速缓存的CPU执行计算的流程
1.程序以及数据被加载到主内存
2.指令和数据被加载到CPU的高速缓存
3.CPU执行指令,把结果写到高速缓存
4.高速缓存中的数据写回主内存
CPU运行安全等级
CPU有4个运行级别,分别为:ring 0、ring 1、ring 2、ring 3
Linux与Windows只用到了2个级别:ring 0、ring 3,操作系统内部程序指令通常运行在ring 0级别,操作系统以外的第三方程序运行在ring 3级别,第三方程序如果调用操作系统内部函数功能,由于运行安全级别不够,必须切换CPU运行状态,从ring 3切换到ring 0,然后执行系统函数,jvm创建线程,线程阻塞唤醒是重型操作,因为CPU要切换状态。
JVM创建线程CPU的工作过程:
1.CPU从ring 3切换ring 0创建线程
2.创建完毕,CPU从ring 0切换回ring 3
3.线程执行JVM程序
4.线程执行完毕,销毁线程还得切回ring 0
二、操作系统内存管理
执行空间保护
操作系统有用户空间与内核空间两个概念,目的也是为了做到程序运行安全隔离与稳定,以32位操作系统4G大小的内存空间为例
三、进程与线程
进程:现代操作系统在运行一个程序时,会为其创建一个进程;例如,启动一个Java程序,操作系统就会创建一个Java进程。进程是OS(操作系统)资源分配的最小单位。
线程:线程是OS(操作系统)调度CPU的最小单元,也叫轻量级进程(Light Weight Process),在一个进程里可以创建多个线程,这些线程都拥有各自的计数器、堆栈和局部变量等属性,并且能够访问共享的内存变量。CPU在这些线程上高速切换,让使用者感觉到这些线程在同时执行,即并发的概念,相似的概念还有并行!
线程上下文切换过程:
虚拟机指令集架构主要分两种:
1.栈指令集架构
2.寄存器指令集架构
栈指令集架构
1.设计和实现更简单,适用于资源受限的系统;
2.避开了寄存器的分配难题:使用零地址指令方式分配;
3.指令流中的指令大部分是零地址指令,其执行过程依赖与操作栈,指令集更小,编译器容易实现;
4.不需要硬件支持,可移植性更好,更好实现跨平台。
寄存器指令集架构
1.典型的应用是x86的二进制指令集:比如传统的PC以及Android的Davlik虚拟机。
2.指令集架构则完全依赖硬件,可移植性差。
3.性能优秀和执行更高效。
4.花费更少的指令去完成一项操作。
5在大部分情况下,基于寄存器架构的指令集往往都以一地址指令、二地址指令和三地址指令为主,而基于栈式架构的指令集却是以零地址指令为主。