zoukankan      html  css  js  c++  java
  • 今天又温习了一下磁盘阵列的概念

    今天公司服务器的磁盘阵列坏了,忘记磁盘阵列到底是怎么回事了。百度了一下,在百度

    百科中找到的解释如下:

    磁盘阵列(Redundant Arrays of Inexpensive Disks,RAID),有“价格便宜且多余
    的磁盘阵列”之意。原理是利用数组方式来作磁盘组,配合数据分散排列的设计,提升
    数据的安全性。磁盘阵列是由很多便宜、容量较小、稳定性较高、速度较慢磁盘,组合
    成一个大型的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。
    同时利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。磁盘阵列还能利
    用同位检查(Parity Check)的观念,在数组中任一颗硬盘故障时,仍可读出数据,在
    数据重构时,将数据经计算后重新置入新硬盘中。
    由来: 加利福尼亚大学伯克利分校(University of California-Berkeley)在1987年,

    发表的文章:“A Case for Redundant Arrays of Inexpensive Disks”。文章中,谈到

    了RAID这个词汇,而且定义了RAID的5层级。柏克莱大学研究其研究目的为,反应当时CPU

    快速的性能。CPU效能每年大约成长30~50%,而硬磁机只能成长约7%。研究小组希望能

    找出一种新的技术,在短期内,立即提升效能来平衡 计算机的运算能力。在当时,柏克莱研究

    小组的主要研究目的是效能与成本。

      另外,研究小组也设计出容错(fault-tolerance),逻辑数据备份(logical data redundancy),

    而产生了RAID理论。研究初期,便宜(Inexpensive)的磁盘也是主要的重点,但后来发现,大量便宜

    磁盘组合并不能适用于现实的生产环境,后来Inexpensive被改为independence,许多独立的磁盘组。

     
    样式
    磁盘阵列其样式有三种,一是外接式磁盘阵列柜、二是内接式磁盘阵列卡,三是利用软件来仿真。
    外接式磁盘阵列柜最常被使用大型服务器上,具可热抽换(Hot Swap)的特性,不过这类产品

    的价格都很贵。
      内接式磁盘阵列卡,因为价格便宜,但需要较高的安装技术,适合技术人员使用操作。
      利用软件仿真的方式,由于会拖累机器的速度,不适合大数据流量的服务器。

    缓存
      磁盘阵列作为独立系统在主机外直连或通过网络与主机相连。磁盘阵列有多个端口
    可以被不同主机或不同端口连接。一个主机连接阵列的不同端口可提升传输速度。
      和目前PC用单磁盘内部集成缓存一样,在磁盘阵列内部为加快与主机交互速度,都
    带有一定量的缓冲存储器。主机与磁盘阵列的缓存交互,缓存与具体的磁盘交互数据。
      在应用中,有部分常用的数据是需要经常读取的,磁盘阵列根据内部的算法,查找
    出这些经常读取的数据,存储在缓存中,加快主机读取这些数据的速度,而对于其他缓
    存中没有的数据,主机要读取,则由阵列从磁盘上直接读取传输给主机。对于主机写入
    的数据,只写在缓存中,主机可以立即完成写操作。然后由缓存再慢慢写入磁盘。
     

    优点
      提高传输速率。RAID通过在多个磁盘上同时存储和读取数据来大幅提高存储系统的
    数据  吞吐量(Throughput)。在RAID中,可以让很多磁盘  驱动器同时传输数据,
    而这些磁盘驱动器在逻辑上又是一个磁盘驱动器,所以使用RAID可以达到单个磁盘驱动
    器几倍、几十倍甚至上百倍的速率。这也是RAID最初想要解决的问题。因为当时CPU的
    速度增长很快,而磁盘驱动器的数据传输速率无法大幅提高,所以需要有一种方案解决
    二者之间的矛盾。RAID最后成功了。
      通过数据校验提供容错功能。普通磁盘驱动器无法提供容错功能,如果不包括写在
    磁盘上的CRC(循环冗余校验)码的话。RAID容错是建立在每个磁盘驱动器的硬件容错
    功能之上的,所以它提供更高的安全性。在很多RAID模式中都有较为完备的相互校验/
    恢复的措施,甚至是直接相互的镜像备份,从而大大提高了RAID系统的容错度,提高了
    系统的稳定冗余性。

    规范
      RAID技术主要包含RAID 0~RAID 7等数个规范,它们的侧重点各不相同,常见的规
    范有如下几种:
      RAID 0  :RAID 0连续以位或字节为单位分割数据,并行读/写于多个磁盘上,因此

    具有很高的数据传输率,但它没有数据冗余,因此并不能算是真正的RAID结构。RAID 0

    只是单纯地提高性能,并没有为数据的可靠性提供保证,而且其中的一个磁盘失效将影响到

    所有数据。因此,RAID 0不能应用于  数据安全性要求高的场合。
      RAID 1  :它是通过磁盘数据镜像实现数据冗余,在成对的独立磁盘上产生互为备份的数据。

    当原始数据繁忙时,可直接从镜像拷贝中读取数据,因此RAID 1可以提高读取性能。RAID 1是

    磁盘阵列中单位成本最高的,但提供了很高的数据安全性和可用性。当一个磁盘失效时,系统可以

    自动切换到镜像磁盘上读写,而不需要重组失效的数据。
      RAID 0+1  : 也被称为RAID 10标准,实际是将RAID 0和RAID 1标准结合的产物,在连续地

    以位或字节为单位分割数据并且并行读/写多个磁盘的同时,为每一块磁盘作磁盘镜像进行冗余。

    它的优点是同时拥有RAID 0的超凡速度和RAID 1的数据高可靠性,但是CPU占用率同样也更高,

    而且磁盘的利用率比较低。
      RAID 2  :将数据条块化地分布于不同的硬盘上,条块单位为位或字节,并使用称为“加重

    平均纠错码(海明码)”的编码技术来提供错误检查及恢复。这种编码技术需要多个磁盘存放检查

    及恢复信息,使得RAID 2技术实施更复杂,因此在商业环境中很少使用。
      RAID 3  :它同RAID 2非常类似,都是将数据条块化分布于不同的硬盘上,区别在于RAID 3

    使用简单的奇 偶校验,并用单块磁盘存放奇偶校验信息。如果一块磁盘失效,奇偶盘及其他数据盘

    可以重新产生数据;如果奇偶盘失效则不影响数据使用。RAID 3对于大量的连续数据可提供很好的

    传输率,但对于随机数据来说,奇偶盘会成为写操作的瓶颈。
      RAID 4 :RAID 4同样也将数据条块化并分布于不同的磁盘上,但条块单位为块或记录。RAID 4

    使用一块磁盘作为奇偶校验盘,每次写操作都需要访问奇偶盘,这时奇偶校验盘会成为写操作的瓶颈,

    因此RAID 4在商业环境中也很少使用。
      RAID 5  :RAID 5不单独指定的奇偶盘,而是在所有磁盘上交叉地存取数据及奇偶校验信息。

    在RAID 5上,读/写指针可同时对阵列设备进行操作,提供了更高的数据流量。RAID 5更适合于

    小数据块和随机读写的数据。RAID 3与RAID 5相比,最主要的区别在于RAID 3每进行一次数据

    传输就需涉及到所有的阵列盘;而对于RAID 5来说,大部分数据传输只对一块磁盘操作,并可进行并
    行操作。在RAID 5中有“写损失”,即每一次写操作将产生四个实际的读/写操作,其中两次读旧的数据

    及奇偶信息,两次写新的数据及奇偶信息。
      RAID 6  :与RAID 5相比,RAID 6增加了第二个独立的奇偶校验信息块。两个独立的奇偶系统

    使用不同的算法,数据的可靠性非常高,即使两块磁盘同时失效也不会影响数据的使用。但RAID 6

    需要分配给奇偶校验信息更大的磁盘空间,相对于RAID 5有更大的“写损失”,因此“写性能”非常
    差。较差的性能和复杂的实施方式使得RAID 6很少得到实际应用。
      RAID 7 :这是一种新的RAID标准,其自身带有智能化实时  操作系统和用
    于存储管理的软件工具,可完全独立于主机运行,不占用主机CPU资源。RAID 7可以看
    作是一种存储计算机(Storage Computer),它与其他RAID标准有明显区别。除了以上
    的各种标准(如表1),我们可以如RAID 0+1那样结合多种RAID规范来构筑所需的RAID
    阵列,例如RAID 5+3(RAID 53)就是一种应用较为广泛的阵列形式。用户一般可以通
    过灵活配置磁盘阵列来获得更加符合其要求的磁盘存储系统。
      RAID 5E(RAID 5 Enhencement): RAID 5E是在RAID 5级别基础上的改进,与RAID 5
    类似,数据的校验信息均匀分布在各硬盘上,但是,在每个硬盘上都保留了一部分未使
    用的空间,这部分空间没有进行条带化,最多允许两块物理硬盘出现故障。看起来,
    RAID 5E和RAID 5加一块热备盘好象差不多,其实由于RAID 5E是把数据分布在所有的硬
    盘上,性能会与RAID5 加一块热备盘要好。当一块硬盘出现故障时,有故障硬盘上的数
    据会被压缩到其它硬盘上未使用的空间,逻辑盘保持RAID 5级别。
      RAID 5EE: 与RAID 5E相比,RAID 5EE的数据分布更有效率,每个硬盘的一部分空
    间被用作分布的热备盘,它们是阵列的一部分,当阵列中一个物理硬盘出现故障时,数
    据重建的速度会更快。
      RAID 50  :RAID50是RAID5与RAID0的结合。此配置在RAID5的子磁盘组的每个

    磁盘上进行包括奇偶信息在内的数据的剥离。每个RAID5子磁盘组要求三个硬盘。RAID50

    具备更高的容错能力,因为它允许某个组内有一个磁盘出现故障,而不会造成数据丢失。而且

    因为奇偶位分部于RAID5子磁盘组上,故重建速度有很大提高。优势:更高的容错能力,具备

    更快数据读取速率的潜力。需要注意的是:磁盘故障会影响吞吐量。故障后重建信息的时间比镜像配置情况下

    实现
      磁盘阵列有两种方式可以实现,那就是“软件阵列”与“硬件阵列”。
      软件阵列是指通过网络操作系统自身提供的磁盘管理功能将连接的普通SCSI卡上的
    多块硬盘配置成逻辑盘,组成阵列。软件阵列可以提供数据冗余功能,但是磁盘子系统
    的性能会有所降低,有的降低幅度还比较大,达30%左右。
      硬件阵列是使用专门的磁盘阵列卡来实现的。硬件阵列能够提供在线扩容、动态修
    改阵列级别、自动数据恢复、驱动器漫游、超高速缓冲等功能。它能提供性能、数据保
    护、可靠性、可用性和可管理性的解决方案。阵列卡专用的处理单元来进行操作,它的
    性能要远远高于常规非阵列硬盘,并且更安全更稳定。
     
    摘自百度百科
      
  • 相关阅读:
    02_Docker在CentOS 6和CentOS 7下的安装
    01_Docker概念简介、组件介绍、使用场景和命名空间
    nginx配置
    JavaScript高级 函数表达式 《JavaScript高级程序设计(第三版)》
    关于最近的一些事情
    3、《构》-3习题(6-9)
    关于叛逆的疑问和感想
    2、《构》-3习题(1-5)
    1、随笔+《构》-3
    svn 迁移至git操作手册
  • 原文地址:https://www.cnblogs.com/xingqiba/p/2317814.html
Copyright © 2011-2022 走看看