zoukankan      html  css  js  c++  java
  • 计算机中的层次化存储是个什么鬼?

    写在前面

    撸代码只是程序员的一项最基本的技能,除此之外,还有很多知识需要程序员掌握。【程序员进阶系列】专题,旨在分享程序员想要进一步提升自我,突破发展瓶颈的一系列技术。今天,我们来一起聊聊计算机中的层次化存储结构。

    文章已收录到:

    https://github.com/sunshinelyz/technology-binghe

    https://gitee.com/binghe001/technology-binghe

    层次化存储结构

    首先,问小伙伴们一个问题:计算机的存储结构为什么需要进行层次化的划分呢?

    说的直接一点:就是为了减少经济成本。如果说,CPU的价格非常便宜的话,根本就不需要内存了。可以把所有的内存容量全部都做到CPU里面去,就可以了。但是,事实上,CPU的内存是很精贵的,至今为止,CPU中基本上还是一级缓存和二级缓存。三级缓存比较少见。而且,CPU中的存储容量是非常小的,基本都是KB级别的存储,CPU的内存容量也就几KB,MB级别的CPU内存也是比较少见的。所以,出于经济成本的考虑,计算机中的存储结构是按照层次进行划分的。

    为了能够让小伙伴们更加清晰的理解层次化存储结构,我们先来看一张图。

    由上图,可以看出:

    (1)层次化的存储结构可以分为:CPU、Cache(高速缓存)、主存(内存)、外存(辅存)。

    (2)从上往下,速度越来越慢,容量越来越大。

    局部性原理是层次化存储结构的支撑。

    局部性原理

    一个编写良好的计算机程序常常具有良好的局部性。也就是说。它们倾向于引用临近于其他最近引用过的数据项的数据项,或者最近引用过的数据项本身。这汇总倾向性,就被称为局部性原理,这是一个持久的概念,对硬件和软件系统的设计和性能都有着极大的影响。

    之所以有这个规律,很多人认为原因是:程序的指令大部分时间是顺序执行的,而且程序的集合,如数组等各种数据结构是连续存放的。

    局部性原理讲的是:在一段时间内,整个程序的执行仅限于程序的某一部分,相应地,程序访问的存储空间也局限于某个内存区域。主要分为两类:

    • 时间局部性:如果程序中的某条指令一旦执行,则不久之后该指令可能再次被执行;如果某数据被访问,则不久之后该数据可能再次被访问。
    • 空间局部性:是指一旦程序访问了某个存储单元,则不久之后,其附近的存储单元也将被访问。

    Cache

    针对Cache相关的技术,我们主要来聊聊Cache的概念和映像相关的技术。

    Cache-概念

    这里的Cache表示的是高速缓冲,在计算机的存储体系系统中,Cache是除寄存器外访问速度最快的层次。 使用Cache改善系统性能的依据是程序的局部性原理

    如果以h代表对Cache的访问命中率,t1表示Cache的周期时间,t2表示主存储器的周期时间,以读操作为例,使用“Cache+主存储器”的系统的平均周期为t3,则可以得出如下运算公式。

    t3 = h * t1 + (1 - h) * t2 
    

    其中。(1 - h)又称为失效率,也就是未命中率。

    Cache-映像

    Cache的映像分为三种,分别是:直接相联映像、全相联映像、组相联映像。

    • 直接相联映像:硬件电路比较简单,但冲突率最高。
    • 全相连映像:电路难于设计和实现,只适用于小容量的Cache,冲突率比较低。
    • 组相联映像:直接相联与全相联的折中。

    地址映像是将主存与Cache的存储空间划分为若干大小相同的页(或称为块)。

    例如,一台计算机的主存容量为1GB,划分为2048页,每页512KB;Cache的容量为8MB,划分为16页,每页512KB。接下来,我们由此来详细图解直接相联映像、全相联映像和组相联映像。

    直接相联映像

    我们可以画一组图来表示Cache的直接映像。首先,我们先来简单画一个主存标记、Cache页号和页内地址的示意图。如下所示。

    如上图所示,主存标记为7位,Cache页号为4位,页内地址为19位。

    记录主存区号的示意图如下所示。

    有了上面两张图的基础后,我们再来看直接相联映像的示意图如下所示。

    这里,我们将容量为1GB的主存划分成2048页,总共127个区,每页的容量为512KB。将容量为8MB的Cache划分为16页,每页容量为512KB。

    所谓直接相联映像是指Cache中的0页只能存储主存中0页的内容,这里主存中0页指的是每个区的0页,比如上图中的0区的0页,1区的16页,127区的2032页等。

    在直接相联映像中,只需要记录主存标记、Cache页号和页内地址就能够快速的找到主存中的数据。

    使用直接相联映像有个缺点:那就是如果Cache中的0页,存储了主存中0区0页的内容时,如果此时需要存储主存1区中的16页内容,就只能将主存0区中0页的内容从Cache的0页中清除,然后将主存1区中16页的内容存储到Cache中的0页内。冲突率比较高。细心的小伙伴会发现:这其实是违背局部性原理的。

    直接相联映像访问速度最快,但冲突率最高。

    全相连映像

    我们先来看下全相联映像的主存页标记和页内地址的示意图,如下所示。

    此时,使用11位来标识主存页标记,使用19位来标识页内地址。

    使用全相连映像需要记录主存与Cache的对应关系,如下图所示。

    接下来,我们来看看全相连映像的示意图,如下所示。

    从图中可以看出,Cache中的任何一个也,都可以存储主存中的任何一个页。

    使用全相连映像访问速度最慢,冲突率最低。

    组相联映像

    组相联映像本质上是直接相联映像和全相联映像的折中。同样的,我们先来看组相连映像的存储示意图。

    此时,在组相连映像中,Cache组号使用3位表示,组内页号使用1位表示,页内地址使用19位表示。其中,3位的Cache组号,1位的组内页号和前面的7位构成了主存页标记;3位的Cache组号,1位的组内页号和19号的页内地址构成了Cache地址。

    接下来,我们再来看看主存与Cache的对应关系,如下图所示。

    组相连的映像示意图如下所示。

    由上图可知,在组相连映像中,主存的组与Cache的组是组相联映像关系,而在组内则是通过直接相联映像来访问和存储数据。

    好了,我已经肝不动了。今天就到这儿吧,我是冰河,大家有啥问题可以在下方留言,也可以加我微信:sun_shine_lyz,我拉你进群,一起交流技术,一起进阶,一起牛逼~~

  • 相关阅读:
    Git 之 git原理简介
    Django 之 富文本编辑器-tinymce
    Django 之 Ajax
    Django 之 分页
    Django 之 用redis存储session
    Django 之 自定义中间件
    python 之 多线程、多进程代码
    反转字符串
    青蛙跳台阶
    pandas 之 concat
  • 原文地址:https://www.cnblogs.com/binghe001/p/14423540.html
Copyright © 2011-2022 走看看