第四章:存储器管理
1、内存管理概述
1.1、概述
存储器的多层结构:
在计算机系统的存储层次中,寄存器和主存储器又被称为:可执行存储器。
用户程序要在系统中运行,必须先将它装入内存,然后再将其转变为一个可执行的程序,通常都要经过一下三个步骤:
1)编译:由编译程序(Compiler)对用户源程序进行编译,形成若干个目标模块(Object Module);
2)连接:由链接程序(Linker)将编译后形成的一组目标模块以及它们所需要的库函数链接在一起,形成一个完整的装入模块(Load Module);
3)装入:由装入程序(Loader)将装入模块装入内存中;
如图所示:
- 逻辑地址(相对地址、虚地址):用户的程序经过汇编或编译后形成的目标代码的地址,由 CPU 产生;
- 物理地址(绝对地址、实地址):内存中存储单元的地址,可直接寻址;
- 重定位(地址映射):程序和数据装入内存时,需要对目标程序中的逻辑地址进行修改,把逻辑地址装换为内存物理地址的过程;
1.2、程序的装入
在将一个装入模块装入内存时,可以有如下三种装入方式:
- 绝对装入方式
- 可重定位装入方式(静态装入方式)
- 动态运行时装入方式(动态装入方式)
1、绝对装入方式(Absolute Loading Mode)
当计算机系统很小时,且仅能运行单道程序时,完全有可能知道程序驻留在内存的什么位置。此时可以采用绝对装入方式,用户程序进编译后,产生的 绝对地址(物理地址) == 相对地址(逻辑地址)
绝对装入方式(编译时重定位)是在编译时期发生的
2、可重定位装入方式(Relocation Loading Mode)
绝对装入方式只能将目标模块装入到内存中事先指定的位置,这只适用于单道程序环境。而在多道程序环境下,编译程序不可能预知经编译后所得到的的目标模块放在内存的何处。
因此,对于用户程序编译所形成的若干个目标模块,它们的起始地址通常都是从 0 开始的,程序中的其他地址也都是相对于起始地址计算的。此时,不可能再用绝对装入方式,而应采用可重定位装入方式,它可以根据内存的具体情况将装入模块装入到内存的适当位置。
另外,在采用可重定位装入程序将装入模块装入内存后,会使装入模块中的所有逻辑地址与实际装入内存后的物理地址有所不同!
在这种情况下,就会导致数据错误!
正确的做法是:在装入模块在装入内存时,进行重定位,也就是进行进程的址变换,由于这种变换是在装入内存时一次完成的,以后不再改变,故又称为:静态重定位。
- 特点:在装入内存时,一次性将该作业中的程序的指令地址和数据地址全部转换成绝对地址。
- 缺点:程序装入内存后,无法在内存中再移动位置。
3、动态运行时的装入方式(Dynamic Run-time Loading)
动态运行时的装入方式在把装入模块装入内存后,并不立即把装入模块中的逻辑地址装换为物理地址,而是把这种地址装换推迟到程序真正要执行时才进行;
因此,装入内存后的所有地址都仍是逻辑地址,为使地址转换不影响指令的执行速度,这种方式需要一个重定位寄存器的支持。
- 特点:装入模块装入内存后仍然是逻辑地址。只有当程序真正执行到某一步时,才对它进行地址转换。由地址变换机构(MMU部件)自动执行;
- 缺点:需要一定的特殊硬件支持,实现较为复杂;
2、连续分配存储管理方式
2.1、连续分配存储管理方式概述
为了将用户程序装入内存,必须为它分配一定大小的内存空间,连续分配方式是最早出现的一种存储器分配方式;在该分配方式中为用户程序分配一个连接的内存空间,即程序中的代码或数据的逻辑地址相邻,体现在内存空间分配时物理地址的相邻。
连续分配方式有两种:
-
单一连续分配
- 适用于单用户单任务
-
分区式分配
- 适用于多道程序
- 固定分区方式
- 可变分区方式
连续分配方式可分为四类:
- 单一连续分配
- 固定分区分配
- 动态分区分配
- 动态可重定位分区分配
内存分配方式:
2.2、单一连续分配
基本原理:
- 内存分为两个区域:系统区,用户区。内存用户区中仅驻留一道程序,整个用户区为一个用户独占。
- 特征:适用于单用户、单任务的OS。
- 优点:简单、易于管理。
- 缺点:内存空间浪费大,资源利用率低。
2.3、固定分区分配
1、基本原理:
- 将内存空间固定的分为若干区域;
- 分区的大小和位置都固定;
- 系统运行期间不再重新划分;
- 每个分区装入一道作业;
2、划分分区的方式:
3、分区表:
将分区按 大小 排序,建立一张 分区使用表,包含分区起始地址、大小、状态等等。
4、分配过程:
内存中已分配给作业但未被利用的区域称为:内零头(internal fragment)
有作业要装入时,操作系统在分区表中查找 大小能满足 且 未分配 出去的分区,若找到,则实施分配且修改分区表中的状态。否则,拒绝分配。
特点:
- 程序在装入前,内存已被分区,不再改变;
- 每个分区大小不同,适用不同大小的程序;
- 系统要维护分区表;
缺点:
- 实际系统运行时,往往无法预知分区大小;
- 主存空间利用率较低;
- 分区数目预先确定,限制了多道运行程序的数量;
2.4、动态分区分配
1、动态分区分配的基本原理:内存不预先划分好,当进程装入时,根据作业的 需求和内存空间 的使用情况来决定是否分配。
- 若空间足够,则按需求 动态 为之分配 连续的内存空间;
- 否则,令其等待主存空间;
2、动态分区分配要解决的问题:
- 如何管理动态变化的内存分区空间? 数据结构(空闲分区表)
- 如何为装入作业找到合适的空闲分区? 分区分配算法
- 如何分配内存空间?
- 如何回收释放的内存空间?分区回收
- 如何处理内存的碎片?
空闲分区表:用来记录内存空闲区的位置和大小的数据结构。
3、基于顺序搜索的动态分区三种动态分区分配算法:
1)首次适应算法(First-Fit Algorithm)
- 要求:空闲分区按 首址递增 排序;
- 分配:从低址空闲区顺序查找,直至找到第一个满足的空闲区;按需要对其进行划分、分配、保留;
2)最佳适应算法(Best-Fit Algorithm)
- 要求:空闲分区按 大小递增 排序;
- 分配:从表头顺序查找,直至找到 第一个满足 的空闲区;
3)最坏适应算法(Worst-Fit Algorithm)
- 要求:空闲分区按 大小递减 排序;
- 分配:从表头顺序查找,直至找到 第一个满足 的空闲区;
4、分区的回收
目的:回收进程释放分区,登记到空闲分区表中,以便再分配
在修改空闲分区表的过程中,需要考虑释放区与现有空闲区是否相邻?
- 若不相邻:则在空闲区表下方直接增加一项
- 若相邻,则与空闲区合并后更新空闲区表
当进程运行完,释放内存时,系统根据回收区的首址在空闲分区表中查找插入点。
此时可能出现以下四种情况之一:
1)回收区不邻接空闲分区:单独建一表项;
2)回收区上邻接一个空闲分区:合并、改大小;
3)回收区下邻接一个空闲分区:合并、改始址、大小;
4)回收区上下邻接区:合并、改首址、改大小、删除回收区下邻接的空闲分区;
5、内存碎片的处理
紧凑技术
-
原理:将内存中的作业进行移动,使他们相邻接,将分散的小分区拼接成一个大分区,从而有利于作业的装入。
-
特点:以时间换空间
-
优点:消除内存碎片,提高内存利用率
紧凑的时机
- 分区回收时:紧凑频率过大,开销大。
- 分配进程分区时:若不满足,则紧凑。空闲区管理复杂。
- 定期:空闲区管理复杂。
门限值法
-
原理:规定门限值,分割空闲分区时,若剩余部分小于门限值,则此分区不进行分割,将该分区全部分配。
-
特点:管理简单,但存在内零头
离散分配
- 原理:解除程序占用连续内存的限制,把程序分拆成多个部分,分别装入内存的不同分区中。
- 特点:化整为零,利用碎片。
下面要介绍的就是离散分配方式:
3、分页管理基本概念
3.1、分页管理的基本方法
1、离散的基础:将程序的逻辑地址空间和内存物理地址空间划分等大小的卡片。
- 程序空间的划分叫 分页,程序的小片叫 页(Page);
- 内存空间的划分叫 分块,内存的小片叫 块(Frames);
2、离散的分配:程序装入时,按 页 分配其所需的 块
- 程序的一页装入内存的一块中
- 连续页面 所分得物理块 不必连续
注意:最后一页装入时,可能存在 --> 页内碎片
3、特点
- 没有外零头,不受连续空间限制,每块都能分出去。
- 可能有内零头(页内碎片),不存在于最后一页,小于一个页面的大小。
3.2、页面和物理块
页(Pages):把用户程序的 逻辑地址空间 划分成若干个大小相等的 “页”,各页从0开始依次编号,称为页号。
块(Frames):把 内存空间 划分成若干个和“页”大小相同的“块”,同样为它们编号,从0开始,称为块号。
注意:
- 页的大小和块的大小相同
- 页号和块号都是从 0 开始的
- 页和块大小固定且始终保持不变
- 划分由系统自动完成,大小由机器地址结构绝对。页面的典型大小通常为1K、2K或4K(为2的n次幂)
3.3、分页管理的数据结构
1、如何建立程序空间和主存空间的映射?通过页表(Page Table)来记录
页表(Page Table - PT):记录了进程页面,在内存当中对应的物理块号,实现页号到物理块号的地址映射。
注意:
1)每个进程一个页表
2)页表存放在 内存的系统专用区中(为了保证安全性)
3)进程页表的首址和长度存放在 进程的PCB中
2、分页管理方式中,当作业要进入内存,OS如何在内存中找到空闲的物理块,分配给作业呢? 存储分块表(空闲块表)(Memory Block Table - MBT)
整个系统 1 张,记录内存当前物理块的使用情况
在分配之前,还需要知道逻辑地址的页号以及页内偏移量。
3.4、分页管理的地址结构
1、分页存储管理的逻辑地址表示
逻辑地址(Logic Address - LD)可以分解为 页号P 和 页内偏移量(即页内地址)
- 页号(P):LA所在页的编号
- 页内偏移量(W):LA所在页内的偏移
例如:有一个32位的逻辑地址,可转换为如下方式:
0 ~ 11位表示页内偏移,即每页的大小为 212 = 4KB
12 ~ 31位表示页号,即最多允许有220 = 1M 页
2、页号P和页内偏移W的求法
已知逻辑地址 LA
-
页号P:逻辑地址LA所处的页编号: (P = INT[LA / 页的大小 L])
-
页内偏移量W:逻辑地址LA所在的页内偏移量:(W = LA MOD 页的大小 L)
在CPU内部计算 P 和 W 的一种计算方法:
二进制计算机中,右移n位,即为在十进制中除于2的n次幂
4、分页管理地址变换及快表机制
4.1、分页管理的地址映射
功能:将 逻辑地址 转变为 物理地址。
地址映射的过程:
- 地址转换的关键是:页号到物理块号的转换,由 页表 完成
4.2、地址映射机构
1、页表寄存器(PTR):记录当前运行进程的页表始址和长度
2、有效地址的判断:页号 < 页表长度
3、地址映射机构的工作过程
例如:
Q:基本分页管理模式中,CPU要存取一个数据需要访问几次?那几次?
A:两次,第一次访问页表,得到物理地址;第二次访问物理地址,得到数据;
Q:如何提高地址变换的速度呢?
A:这就用到了下面的快表了!
4.3、快表机制(Cache)
1、快表的概念:
- 慢表:页表放在内存中
- 快表:页表放在 Cache 中
2、快表的特点
- 容量小,访问速度快,成本高
- 快表是慢表的部分内容复制
- 地址映射时优先访问快表
若在快表中找到所需的数据,则称为:命中;
没有命中是,需要访问慢表,同时更新快表;
3、快表机制下的地址映射过程:
4、内存的有效访问时间(EAT,Effective Access Time)
不使用快表时:
(EAT = 2t)
(t:一次访问内存的时间)
引入快表后的内存有效访问时间分为
-
查找到逻辑页对应的页表项的平均时间:(a * λ + ( t + λ )( 1 - a))
-
实际物理地址的内存访问时间:(t)
配置了快表后,有效访问时间取决于访问快表的命中率
(EAT = a * λ + ( t + λ )( 1 - a) + t)
(a:命中率;λ:查找快表的时间)
5、分段管理
5.1、分段存储管理方式的引入
为什么要引入分段存储管理方式,可从以下两个方面说明:
一方面是由于通常的程序都可分为若干个段,如主程序段、子程序段A,子程序段B、...、数据段以及栈段等,每个段大多是一个相对独立的逻辑单位;
另一方面,为了实现和满足信息共享、信息保护、动态链接以及信息的动态增长等需要,也都是义段为基本单位。
更具体地说,分段存储管理方式更符合用户,主要是程序员的多方面需求。
- 方便编程
- 信息共享
- 信息保护
- 动态增长
- 动态链接
5.2、分段系统的基本原理
1、分段
- 作业地址空间 按逻辑信息的完整性 被划分为若干个段;
- 每段有段名(或者是段号),每段从0开始编址;
- 段内的地址空间是连续的;
- 许多编译程序支持分段方式,自动根据源程序的情况产生若干个段;
段的长度是由相应的逻辑信息组的长度决定,因此各段的长度并不相等。
整个作业的地址空间由于被分成多个段,所以呈现出二维特性,亦即,每个段既包含了一部分地址空间,又标识了逻辑关系。
其逻辑地址由:段名(段号)和段内地址组成。
分段地址中的地址具有如下结构:
2、段表(Segment Table)
在前面所介绍的动态分区分配方式中,系统为整个进程分配一个连续的内存空间,而在分段式存储管理系统中,则是为每个分段分配一个连续的分区。进程中的各个段,可以离散地装入内存中不同的分区中。
为了保证程序的正常运行,必须要建立从物理内存 --> 逻辑段所对应的位置。为此,在系统中,类似于分页系统,需为每个进程建立一张段映射表,简称"段表"。
每个段在表中占有一个表项,其中记录了该段在内存中的起始地址(又称为"基址")和段的长度;
段表是用于实现从逻辑段到物理内存区的映射的;
- 段号
- 基址:段在内存中物理地址的起始地址
- 段长:每个段的长度
注意:
1)每个进程一个段表。
2)段表存放在内存的系统专用区中。
3)段表的首址和长度在进程的PCB中。
段表可以放在一组寄存器中,利于提高地址转换速度。但更常见的方法是将段表放在内存中。在配置了段表后,执行中的进程可以通过段表,找到每个段对应的内存区。
但段表放在内存中,每访问一个数据,也要访问两次内存。
在分段存储管理方式中,为提高访问速度,也可设置快表。
3、地址变换机构
段表寄存器:存放段表始址和段表长度(TL)
在进行地址变换时,系统将逻辑地址中的段号S与段表长度TL进行比较。
地址映射过程:
- 比较段号S和段表长度TL,若S < TL,则,goto②,否则产生越界中断信号;
- 根据段表的始址和该段的段号,计算出该段对应段表项的位置,从中读出该段在内存的起始地址;
- 再检查段内地址 d 是否超过该段的段长 SL,若 d < SL,goto③,否则发出越界中断信号;
- 将该段的基址与段内地址d相加,即可得到要访问的内存物理地址;
分段系统的地址变换过程:
4、分页和分段的区别
由上述不难看出,分页和分段系统有许多相似之处。比如,两者都采用离散分配方式,且都是通过地址映射机构实现地址变换。但在概念上两者完全不同,主要表现在下述三个方面:
1)页是信息的物理单位。采用分页存储管理方式是为实现离散分配方式,以消减内存的外零头,提高内存的利用率。或者说,分页仅仅只是系统管理上的需要,完全是系统的行为,对用户是不可见的。而分段存储管理方式中的段则是信息的逻辑单位,它通常包含的是一组意义相对完整的信息。分段的目的主要在于能更好地满足用户的需要。
2)页的大小固定且由系统绝对。在采用分页存储管理方式的系统中,在硬件结构上,就把用户程序的逻辑地址划分为页号和页内地址两部分。也就是说直接由硬件实现的,因而每个系统中只能有一种大小的页面,而段的长度却是不固定的,决定于用户所编写的程序,通常由编译程序在对源程序进行编译时,根据信息的性质来划分的。
3)分页的用户程序地址空间是一维的。分页完全是系统的行为,故在分页系统中,用户程序的地址是属于单一的线性地址空间,程序员只需要利用一个记忆符即可表示一个地址。而分段是用户的行为,故在分段系统中,用户程序的地址空间是二维的,程序员在标识一个地址时,既需要给出段名,又需要给出段内地址。
5.3、段页式存储管理方式
1、基本原理
段页式系统的基本原理是分段和分页原理的结合,即先将用户程序分成若干个段,再把每个段分成若干个页,并为每一个段赋予一个段名。
下图中给出了一个作业地址空间的结构,改作业有三个段:主程序段、子程序段和数据段;页面大小为 4KB。在段页式系统中,其地址结构由段号、段内页号、页内地址三部分组成。
在段页式系统中,为了实现从逻辑地址到物理地址的变换,系统中需要同时配置段表和页表。段表的内容和分段系统略有不同,它不再是内存始址和段长,而是页表始址和页表长度
2、地址变换过程
在段页式系统中,为了便于实现地址变换,需配置一个段表寄存器,其中存放段表始址和段长TL
1)首先利用段号S,将它与段长TL进行比较,若S < TL,goto②,否则表示地址越界;
2)利用段号S和段表始址计算出该段所对应的段表项在段表中的位置,从而得到页表始址;
3)再利用逻辑地址中的段内页号P和页表始址,来获得对应页的页表项的位置,也就是找到是哪一页,从而通过页号、页表始址计算出对应的物理块号;
4)最后通过页内地址和物理块号计算出在物理块号中的具体的物理地址;
具体过程如下图所示:
在段页式系统中,为了获得一条指令或数据,须三次访问内存。
第一次:访问内存中的段表,得到页表始址;
第二次:访问内存中的页表,从中取出该页所在的物理块号,并将该块号与页内地址一起形成指令或数据的物理地址;
第三次:访问真正的指令或数据;