zoukankan html css js c++ java

《操作系统导论》第15章 | 地址转换

为了高效地实现内存虚拟化，并提供应用程序所需的灵活性，我们利用基于硬件的地址转换技术。通过该技术，硬件对每次内存访问进行处理（即指令获取、数据读取或写入），将指令中的虚拟地址转换为数据实际存储的物理地址。因此，在每次内存引用时，硬件都会进行地址转换，将应用程序的内存引用重定位到物理内存中实际的位置。当然，仅仅依靠硬件不足以实现虚拟内存，因为它只是提供了底层机制来提高效率。操作系统必须在关键的位置介入，设置好硬件，以便完成正确的地址转换。因此它必须管理内存，记录被占用和空闲的内存位置，并明智而谨慎地介入，保持对内存使用的控制。

假设

我们对内存虚拟化的第一次尝试非常简单，先假设用户的地址空间必须连续地放在物理内存中。为了简单，我们假设地址空间不是很大，即小于物理内存。最后，假设每个地址空间的大小完全一样。在后续章节的讨论中，，我们会逐步地放宽这些假设，从而得到现实的内存虚拟化。

一个例子

为了更好地理解地址转换，我们先来看一个例子。假设我们有如下代码，它从内存中加载一个值，对它加3，再将它放回内存。

void func() {
    int x = 3000;
    x = x + 3;
    ...
}

编译器将这段代码转化为汇编语句，可能像下面这样。它假定x的地址已经存入寄存器ebx，之后通过movl指令将这个地址的值加载到通用寄存器eax，下一条指令对eax的内容加3，最后一条指令将eax中的值写回到内存的同一位置。

128: movl 0x0(%ebx), %eax    ;load 0+ebx into eax
132: addl $0x03, %eax        ;add 3 to eax register
135: movl $eax, 0x0(%ebx)    ;store eax back to mem

假设该进程的地址空间如下所示，可以看到代码和数据都位于进程的地址空间，3条指令序列位于地址128，变量x的值位于地址15KB，其初始值为3000。

如果这3条指令执行，从进程的角度来看，发生了以下几次内存访问：

从地址128获取指令
执行指令（从地址15KB加载数据）
从地址132获取命令
执行命令（没有内存访问）
从地址135获取指令
执行指令（新值存入地址15KB）

从程序的角度来看，它的地址空间从0开始到16KB结束，它包含的所有内存引用都应该在这个范围内。然而，对虚拟内存来说，操作系统希望将这个进程地址空间放在物理内存的其他位置，并不一定从地址0开始。因此我们遇到了如下问题：怎样在内存中重定位这个进程，同时对该进程透明？怎么样提供一种虚拟地址空间从0开始的假象，而实际上地址空间位于另外某个物理地址？下图展示了一个例子，说明这个进程的地址空间被放入物理内存后可能的样子。可以看到，操作系统将第一块物理内存留给了自己，并将上述例子中的进程地址空间重定位到从32KB开始的物理内存地址。剩下的两块内存空闲（16～32KB和48～64KB）。

基址/界限机制

20世纪50年代后期，基于硬件的地址转换在首次出现的时分机器中引入。那时只是一个简单的思想，被称为基址/界限机制，有时又称为动态重定位。具体来说，每个CPU需要两个硬件寄存器：基址寄存器和界限寄存器。这组基址和界限寄存器，让我们能够将地址空间放在物理内存的任何位置，同时又能确保进程只能访问自己的地址空间。

采用这种方式，在编写和编译程序时假设地址空间从零开始。但是，当程序真正执行时，操作系统会决定其在物理内存中的实际加载地址，并将起始地址记录在基址寄存器中。在上面的例子中，操作系统决定加载在物理地址32KB的进程，因此将基址寄存器设置为这个值。

进程运行时所产生的所有内存引用，都会被处理器通过虚拟地址加上基址的方式转化为物理地址。举例来说，对于指令128: movl 0x0(%ebx), %eax，程序计数器首先被设置为128。当硬件需要获取这条指令时，它先将这个值加上基址寄存器中的32KB(32768)，得到实际的物理地址32896，然后硬件从这个物理地址获取指令。接下来，处理器开始执行该指令。这时，进程发起从虚拟地址15KB的加载，处理器同样将虚拟地址加上基址寄存器内容（32KB），得到最终的物理地址47KB，从而获得需要的数据。

界限寄存器为地址空间提供了访问保护。在上面的例子中，界限寄存器被置为16KB。如果进程需要访问超过这个界限或者为负数的虚拟地址，CPU将触发异常，进程最终可能被终止。界限寄存器的用处在于，它确保了进程产生的所有地址都在进程的地址“界限”中。界限寄存器通常有两种使用方式。在一种方式中（像上面那样），它记录地址空间的大小，硬件在将虚拟地址与基址寄存器内容求和前，就检查这个界限。另一种方式是界限寄存器中记录地址空间结束的物理地址，硬件在转化虚拟地址到物理地址之后才去检查这个界限。这两种方式在逻辑上是等价的，简单起见，我们这里假设采用第一种方式。

基址寄存器配合界限寄存器的硬件结构是芯片中的（每个CPU一对）。有时我们将CPU的这个负责地址转换的部分统称为内存管理单元（Memory Management Unit，MMU）。随着我们开发更复杂的内存管理技术，MMU也将有更复杂的电路和功能。

转换示例

为了更好地理解基址加界限的地址转换的详细过程，我们来看一个例子。假设一个进程拥有4KB大小地址空间，它被加载到从16KB开始的物理内存中，一些地址转换结果见下图。

从例子中可以看到，通过基址加虚拟地址（可以看作是地址空间的偏移量）的方式，很容易得到物理地址。虚拟地址“过大”或者为负数时，会导致异常。

硬件支持

现在来总结一下需要的硬件支持（见下表）。首先，正如在CPU虚拟化的章节中提到的，我们需要两种CPU模式。操作系统在特权模式（或内核模式），可以访问整个机器资源。应用程序在用户模式运行，只能做有限的操作。只要一个位，也许保存在处理器状态字中，就能说明当前的CPU运行模式。在一些特殊的时刻（如系统调用、异常或中断），CPU会切换状态。

硬件要求	解释
特权模式	需要，以防用户模式的进程执行特权操作
基址/界限寄存器	每个CPU需要一对寄存器来支持地址转换和界限检查
能够转换虚拟地址并检查它是否越界	电路完成转换和检查界限
修改基址/界限寄存器的特权指令	在让用户程序运行之前，操作系统必须能够设置这些值
注册异常处理程序的特权指令	操作系统必须告诉硬件，如果异常发生，那么执行哪些代码
能够触发异常	如果进程驶入使用特权指令或越界的内存

硬件必须提供基址和界限寄存器，因此每个CPU的内存管理单元都需要这两个额外的寄存器。用户程序运行时，硬件会转换每个地址，将用户程序产生的虚拟地址加上基址寄存器的内容。硬件也必须能检查地址是否有用，通过界限寄存器和CPU内的一些电路来实现。硬件也应该提供一些特殊的指令，用于修改基址寄存器和界限寄存器，允许操作系统在切换进程时改变它们。这些指令是特权指令，只有在内核模式下，才能修改这些寄存器。

在用户程序尝试非法访问内存（越界访问）时，CPU必须能够产生异常。在这种情况下，CPU应该阻止用户程序的执行，并安排操作系统的“越界”异常处理程序去处理。操作系统的处理程序会做出正确的响应，比如在这种情况下终止进程。类似地，如果用户程序尝试修改基址或者界限寄存器时，CPU也应该产生异常，并调用“用户模式尝试执行特权指令”的异常处理程序。CPU还必须提供一种方法，来通知它这些处理程序的位置，因此又需要另一些特权指令。

操作系统的要求

为了支持动态重定位，硬件添加了新的功能，使得操作系统有了一些必须处理的新问题。硬件支持和操作系统管理结合在一起，实现了一个简单的虚拟内存。具体来说，在一些关键的时刻操作系统需要介入，以实现基址和界限方式的虚拟内存，见下表。

硬件要求	解释
内存管理	需要为新进程分配内存从终止的进程回收内存一般通过空闲列表管理内存
基址/界限管理	必须在上下文切换时正确设置基址/界限寄存器
异常处理	当异常发生时执行的代码，可能的动作是终止犯错的进程

在进程创建时，操作系统必须为进程的地址空间找到内存空间。由于我们假设每个进程的地址空间小于物理内存的大小，并且大小相同，这对操作系统来说很容易。它可以把整个物理内存看作一组槽块，标记了空闲或已用。当新进程创建时，操作系统检索这个数据结构，为新地址空间找到位置，并将其标记为已用。我们将在后续章节中讨论地址空间可变的情况。在进程终止时，操作系统会将这些内存放回到空闲列表，并根据需要清除相关的数据结构。

在上下文切换时，操作系统也必须执行一些额外的操作。每个CPU毕竟只有一个基址寄存器和一个界限寄存器，但对于每个运行的程序，它们的值都不同，因为每个程序被加载到内存中不同的物理地址。因此，在切换进程时，操作系统必须保存和恢复基础和界限寄存器。当操作系统决定中止当前的运行进程时，它必须将当前基址和界限寄存器中的内容保存在内存中，放在某种每个进程都有的结构中，如进程结构或进程控制块（Process Control Block，PCB）中。类似地，当操作系统恢复执行或第一次执行某个进程时，也必须给基址和界限寄存器设置正确的值。需要注意，当进程停止时（即没有运行），操作系统可以改变其地址空间的物理位置。要移动进程的地址空间，操作系统首先让进程停止运行，然后将地址空间拷贝到新位置，最后更新保存在PCB中的基址寄存器，令指向新位置。当该进程恢复执行时，新的基址寄存器会被恢复，它再次开始运行。

此外，操作系统必须提供异常处理程序。操作系统在启动时通过特权命令加载这些处理程序。例如，当一个进程试图进行越界访问内存时，CPU会触发异常。在这种异常产生时，操作系统的反应是终止错误进程。操作系统应该尽力保护它运行的机器，因此它不会容忍那些企图访问非法地址或执行非法指令的进程。

下面两幅图按时间线展示了大多数硬件与操作系统的交互。可以看出，操作系统在启动时做了什么，为我们准备好机器，然后在进程（进程A）开始运行时发生了什么。请注意，地址转换过程完全由硬件处理，没有操作系统的介入。在这个时候，发生时钟中断，操作系统切换到进程B运行，它执行了“错误的加载”（对一个非法内存地址），这时操作系统必须介入，终止该进程，清理并释放进程B占用的内存，将它从进程表中移除。从图中可以看出，我们仍然遵循受限直接访问的基本方法，大多数情况下，操作系统正确设置硬件后，就任凭进程直接运行在CPU上，只有进程行为不端时才介入。

查看全文

相关阅读:
u盘重装ubuntu16.04过程遇到的问题
 CTC安装及其错误解决办法：binding.cpp:92:49: error: cannot convert ‘THCudaTensor*’ to ‘const THFloatTensor*’ for argument ‘1’ to ‘int64_t THFloatTensor_size(const THFloatTensor*, int)’
CTC安装错误之：binding.cpp:6:29: fatal error: torch/extension.h: No such file or directory
机器学习入门（1）
python学习笔记（1）
python学习笔记（1）
rpm命令的简介-(转自jb51.net )
centos下安装visual studio code-(来自官网)
ubuntu中安装visual studio code-（转载）
git使用简单教程-（转自linux人）

原文地址：https://www.cnblogs.com/littleorange/p/12775683.html