2017-2018-1 20155207 《信息安全系统设计基础》第14周学习总结
新的收获
第9章 虚拟存储器
- 虚拟存储器(VM):对主存的抽象概念
- 将主存看成是一个存储在磁盘上的地址空间的高速缓存,在主存中只保存活动区域,并根据需要在磁盘和主存之间来回传送数据
- 三个重要能力:
它将主存看成是一个存储在磁盘上的地址空间的高速缓存,在主存中只保存活动区域,并根据需要在磁盘和主存之间来回传送数据,通过这种方式,高效的使用了主存
它为每个进程提供了一致的地址空间,从而简化了存储器管理
它保护了每个进程的地址空间不被其他进程破坏
9.1 物理和虚拟寻址
- 存储器管理单元:地址翻译,利用存放在主存中的查询表动态翻译虚拟地址
- 物理地址:
计算机系统的主存被组织成一个由M个连续的字节大小的单元组成的数组,每字节都有一个唯一的物理地址PA。
根据物理地址寻址的是物理寻址。
- 虚拟地址
虚拟存储器被组织为一个由存放在磁盘上的N个连续的字节大小的单元组成的数组。
使用虚拟寻址时,CPU通过生成一个虚拟地址VA来访问主存,这个虚拟地址在被送到存储器之前先转换成适当的物理地址(这个过程叫做地址翻译,相关硬件为存储器管理单元MMU)
9.2 地址空间
- 一个包含N=2^n个地址的虚拟地址空间就叫做一个n位地址空间
- 主存中的每个字节都有一个选自虚拟地址空间的虚拟地址和一个选自物理地址空间的物理地址
9.3 虚拟存储器作为缓存的工具
- 虚拟存储器被组织为一个由存放在磁盘上的N个连续的字节大小的单元组成的数组。每个字节都有一个唯一的虚拟地址,这个唯一的虚拟地址是作为到数组的索引的
- 磁盘上数据的内容被缓存在主存中
- 和存储器层次结构中其他缓存一样,磁盘上的数据被分割成块,这些块作为磁盘和主存之间的传输单元
9.4 虚拟存储器作为存储器管理的工具
- 操作系统为每个进程提供了一个单独的页表,也就是一个独立的虚拟地址空间
- 多个虚拟页面可以映射到同一个共享物理页面上
- 将一组连续的虚拟页映射到任意一个文件中的任意位置的表示法称作存储器映射
9.5 虚拟存储器作为存储器保护的工具
- SUP位表示进程是否必须运行在内核(超级用户)模式下才能访问该页
9.6 地址翻译
- CPU中的一个控制寄存器,页表基址寄存器(PTBR)指向当前页表
- n位的虚拟地址包含两个部分:一个p位的虚拟页面偏移和一个(n-p)位的虚拟页号
- MMU利用VPN来选择适当的PTE(页表条目,一个页表其实就是多个页表条目的数组)
- 页面命中,CPU硬件执行的步骤:
处理器生成一个虚拟地址,并把它传送给MMU
MMU生成PTE地址,并从高速缓存/主存请求得到它。
高速缓存/主存向MMU返回PTE。
MMU构造物理地址,并把它传送给高速缓存/主存。
高速缓存/主存返回所请求的数据字给处理器。 - 页面命中完全是由硬件来处理的,与之不同的是,处理缺页要求硬件和操作系统内核协作完成
- 前三步都是一样的
PTE中的有效位为0,所以MMU触发了一次异常,传递CPU中的控制到操系统内核中的缺页异常处理程序。
缺页处理程序确定出物理存储器中的牺牲页,如果这个页面被修改了,则把它换出到磁盘。
缺页处理程序页面调入新的页面,并更新存储器中的PTE。
缺页处理程序返回到原来的进程,再次执行导致缺页的指令。CPU将引起缺页的虚拟地址重新发送给MMU。 - 如果页面没有命中,最后还是处理器再次发送虚拟地址给MMU,不过这次不会导致缺页异常
- LB命中和不命中的情况下处理流程: CPU产生一个虚拟地址, MMU从TLB中取出相应的PTE,MMU将这个虚拟地址翻译成一个屋里地址,并且将它发送到高速缓冲/主存,高速缓存/主存将所请求的数据字返回给CPU。
如果TLB不命中时,MMU必须从L1缓存中取出相应的PTE,新取出的PTE存放在TLB中,可能覆盖一个已经存在的条目。
9.7 案例研究:Intel Core i7/Linux存储器系统
- 处理器包:四个核、一个大的所有核共享的L3高速缓存,一个DDR3存储器控制器。每个核包含一个层次结构的TLB、一个层次结构的数据和指令高速缓存,以及一组快速的点到点连接
- linux为每个进程维护一个单独的虚拟地址空间
- 内核虚拟存储器包含内核中的代码和数据结构
- 内核虚拟存储器的某些区域被映射到所有进程共享的物理页面
- linux页将一组连续的虚拟页面映射到相应的一组连续的物理页面。这就为内核提供了一种遍历的方法来访问物理存储器中任何特定的位置,例如,当它需要访问页表,或在一些设备上执行存储器映射的I/O操作,而这些设备被映射到特定的物理储存器位置时
- 内核虚拟存储器的其他区域包含每个进程都不相同的数据
- task_struct中的一个条码指向mm_struct,它描述了虚拟存储器的当前状态。其中pgd指向第一级页表(页全局目录)的基址。而mmap指向一个vm_area_structs的链表,其中每个vm_area_structs都描述了当前虚拟地址空间的一个区域。当内核运行这个进程时,它就将pgdf存放在CR3控制寄存器中
9.8 存储器映射
- 虚拟存储器区域可以映射到两种类型的对象:
1)unix文件系统中的普通文件:一个区域可以映射到一个普通磁盘文件的连续部分。
2)匿名文件:一个区域也可以映射到一个匿名文件,匿名文件是由内核创建的,包含的全是二进制零。
- 一旦一个虚拟页面被初始化了,它就在一个由内核维护的专门的交换文件(swap file)间换来换去
- 共享对象:一个对象可以被映射到虚拟存储器的一个区域,要么作为共享对象,或作为私有对象
- 私有对象,写时拷贝(copy-on-write):私有对象是使用一种叫做写时拷贝的技术被映射到虚拟存储器中的。如图中所示:只要有一个进程试图写私有区域内的某个页面,那么这个写操作就会触发一个保护策略。它就会在物理存储器中创建这个页面的一个新拷贝,更新页面条目指向这个新的拷贝,然后恢复这个页面的可写
- unix进程可以使用mmap函数来创建新的虚拟存储器区域,并将对象映射到这些区域中
9.9 动态存储器分配
- 需要额外的虚拟存储器时,使用一种动态存储器分配器(dynamic memory allocator)
- 一个动态存储器分配器维护着一个进程的虚拟存储器区域,称为堆(heap)
- 在大多数的unix系统中,堆是一个请求二进制0的区域;对于每个进程,内核维护着一个变量brk,它指向堆的顶部
- 分配器将堆视为一组不同大小的块(block)的集合来维护。每个块就是一个连续的虚拟存储器组块(chunk),要么是已分配的,要么是未分配的
1)显式分配器(explicit allocator):如通过malloc,free或C++中通过new,delete来分配和释放一个块。
2)隐式分配器(implicit allocator):也叫做垃圾收集器(garbage collector)。自动释放未使用的已分配的块的过程叫做垃圾回收(garbage collection)。 - 堆块的格式:
由一个字的头部,有效荷载,和可能的额外填充组成。
将堆组织成一个连续的已分配块和空闲块的序列:
空闲块通过头部中的大小字段隐含地连接着,分配器可以通过遍历堆中所有的块,从而间接地遍历整个空闲块的集合。
- 分配器必须对齐块,使得它们可以保存任何类型的数据对象。在大多数系统中,以8字节边界对齐
- 不修改已分配的块:分配器只能操作或者改变空闲块。一旦被分配,就不允许修改或者移动它
- 碎片
外部碎片:在一个已分配块比有效载荷在时发生的。(如对齐要求,分配最小值限制等)
外部碎片:当空闲存储器合计起来足够满足一个分配请求,但是没有一个单独的空闲块足够大可以来处理这个请求时发生的
- 放置分配的块的策略有:首次适配(first fit),下一次适配(next fit),和最佳适配(best fit)
- 称为分离存储:维护多个空闲链表,其中每个链表中的块有大致相等的大小
9.10 垃圾收集
-
垃圾收集器将存储器视为一张有向可达图
-
Mark%Sweep垃圾收集器由标记(mark)阶段和清除(sweep)阶段组成。标记阶段标记出根节点的所有可达的和已分配的后继,而后面的清除阶段释放每个被标记的已分配块
-
相关函数:
ptr定义为typedef void *ptr
ptr isPtr(ptr p):如果p指向一个已分配块中的某个字,那么就返回一个指向这个块的起始位置的指针b,否则返回NULL
int blockMarked(ptr b):如果已经标记了块b,那么就返回true
int blockAllocated(ptr b):如果块b是已分配的,那么久返回ture
void markBlock(ptr b):标记块b
int length(ptr b):返回块b的以字为单位的长度,不包括头部
void unmarkBlock(ptr b):将块b的状态由已标记的改为未标记的
ptr nextBlock(ptr b):返回堆中块b的后继
9.11 C程序中常见的与存储器有关的错误
- 间接引用坏指针
- 读未初始化的存储器
- 允许栈缓冲区溢出
- 假设指针和他们指向的对象是相同大小的
- 引用不存在的变量
- 误解指针运算
- 造成错位错误
- 引用空闲堆块中的数据
- 引用指针,而不是它所指向的对象
- 引起存储器泄露
代码托管
上周考试错题总结
- ( 单选题 | 1 分)
int x; x的二进制为[10010101], x>>4的值为()
A .
[10010101]
B .
[00001001]
C .
[11111001]
D .
[01010000]
正确答案: C
p40 有符号数进行算术右移
- ( 多选题 | 1 分)
7.1.png
针对以上代码:gcc -c *.c 可以得到m.o,swap.o两个模块,哪些符号会出现在swap.o模块的.symtab条目中()
A .
buf
B .
temp
C .
swap
D .
buffp0
正确答案: A C D
temp是局部变量,不出现在符号表中。
- ( 多选题 | 1 分)
elf.png
用gcc hello.c -o hello 编译hello.c,hello中不存在()节
A .
.debug
B .
.text
C .
.line
D .
.rodata
正确答案: A C
gcc -g 才会出现.debug .line
-
( 单选题 | 1 分)
dll,so文件的链接是运行在()
A .
编译时
B .
加载时
C .
运行时
D .
链接时
正确答案: C
动态链接库在运行时加载 -
( 多选题 | 1 分)
有关exec系列函数,下面说法正确的是()
A .
可以用char[][] 来传递argv
B .
进程调用了exec系列函数后,pid会变
C .
进程调用了exec系列函数后,代码会改变。
D .
system()和exec系列等价。
E .
exec系列函数中带e的要传入环境变量参数
F .
exec系列函数中带v的要传入环境变量参数
正确答案: C E
不能用char[][] 来传递argv,结尾的0(null)无法处理;system=fork+exec+wait;
结对及互评
点评模板:
- 博客中值得学习的或问题:
- xxx
- xxx
- ...
- 代码中值得学习的或问题:
- xxx
- xxx
- ...
- 其他
本周结对学习情况
- [20155223](博客链接)
- 结对照片
- 一起学习了第九章,结对同学没有什么不懂得
学习进度条
代码行数(新增/累积) | 博客量(新增/累积) | 学习时间(新增/累积) | 重要成长 | |
---|---|---|---|---|
目标 | 5000行 | 30篇 | 400小时 | |
14周 | 145/2300 | 1/34 | 7/200 |