欢迎光临
我们一直在努力
广告
广告
广告
广告
广告
广告
广告
广告
广告
广告

RAID阵列的演变:从RAID 0到RAID 6 (raid阵列卡)

0到RAID

RAID(Redundant Array of Inexpensive Disks)冗余磁盘阵列是一种将多个物理硬盘驱动器(HDD)或固态硬盘(SSD)组合成单个逻辑单元的技术。RAID 可用于提高数据存储的性能、可靠性和冗余。RAID 阵列的演变带来了各种 RAID 级别,每种级别都提供了不同的数据保护和性能特征。

RAID 0

RAID 0,也称为条带化(striping),是一种将数据条带化跨越多个磁盘的 RAID 级别。RAID 0 不提供数据冗余,这意味着如果任何一个磁盘发生故障,则整个阵列上的数据都会丢失。但是,RAID 0 可以提供显著的性能提升,因为它允许数据同时从多个磁盘读取和写入。

RAID 1

RAID 1,也称为镜像(mirroring),是一种将数据同时写入两个磁盘的 RAID 级别。如果一个磁盘发生故障,另一个磁盘上的数据副本仍然可用。RAID 1 提供了最高级别的数据保护,但成本也最高,因为它需要与数据容量相同数量的磁盘。

RAID 5

RAID 5 是一种将数据条带化跨越多个磁盘,并在其中一个磁盘上存储奇偶校验信息的 RAID 级别。奇偶校验信息允许在发生磁盘故障时重建丢失的数据。RAID 5 提供了良好的数据保护和性能,使其成为最常用的 RAID 级别之一。

RAID 6

RAID 6 是一种类似于 RAID 5 的 RAID 级别,但它存储两个奇偶校验信息。这提供了更高的数据保护,因为它允许在两个磁盘同时发生故障的情况下重建丢失的数据。RAID 6 的性能通常比 RAID 5 低,但它提供了更高的可靠性。

其他 RAID 级别

除了 RAID 0、1、5 和 6 之外,还有许多其他 RAID 级别,每种级别都提供不同的数据保护和性能特征。以下是一些常见的 RAID 级别:

  • RAID 2:一种块级条带化 RAID,需要专门的硬件支持。
  • RAID 3:一种条带化 RAID,使用专用磁盘存储奇偶校验信息。
  • RAID 4:一种条带化 RAID,在所有磁盘上轮流存储奇偶校验信息。
  • RAID 7:一种 RAID 级别,使用分布式奇偶校验来提供更高的数据保护。
  • RAID 10:一种混合 RAID,它将 RAID 1 和 RAID 0 相结合以提供高性能和冗余。

选择合适的 RAID 级别

选择合适的 RAID 级别取决于以下因素:

  • 数据保护需求:更高的 RAID 级别提供更高的数据保护,但成本也更高。
  • 性能需求:RAID 0 提供最佳性能,而 RAID 6 通常是最慢的 RAID 级别。
  • 成本:RAID 6 是最昂贵的 RAID 级别,因为它需要更多的磁盘。

结论

RAID 阵列已经发展成为数据存储中不可或缺的一部分。RAID 0、1、5 和 6 是最常用的 RAID 级别,每种级别都提供了一组独特的优势和劣势。通过仔细考虑数据保护、性能和成本需求,您可以选择最适合特定应用的 RAID 级别。


介绍 RAID 的级别和概念

RAID 的意思是廉价磁盘冗余阵列(Redundant Array of Inexpensive Disks),但现在它被称为独立磁盘冗余阵列(Redundant Array of Independent Drives)。

早先一个容量很小的磁盘都是非常昂贵的,但是现在我们可以很便宜的买到一个更大的磁盘。

Raid 是一系列放在一起,成为一个逻辑卷的磁盘集合。

RAID 包含一组或者一个集合甚至一个阵列。

使用一组磁盘结合驱动器组成 RAID 阵列或 RAID 集。

将至少两个磁盘连接到一个 RAID 控制器,而成为一个逻辑卷,也可以将多个驱动器放在一个组中。

一组磁盘只能使用一个 RAID 级别。

使用 RAID 可以提高服务器的性能。

不同 RAID 的级别,性能会有所不同。

它通过容错和高可用性来保存我们的数据。

这个系列被命名为“在 Linux 下使用 RAID”。

软件 RAID 和硬件 RAID 软件 RAID 的性能较低,因为其使用主机的资源。

需要加载 RAID 软件以从软件 RAID 卷中读取数据。

在加载 RAID 软件前,操作系统需要引导起来才能加载 RAID 软件。

在软件 RAID 中无需物理硬件。

零成本投资。

硬件 RAID 的性能较高。

他们采用 PCI Express 卡物理地提供有专用的 RAID 控制器。

它不会使用主机资源。

他们有 NVRAM 用于缓存的读取和写入。

缓存用于 RAID 重建时,即使出现电源故障,它会使用后备的电池电源保持缓存。

对于大规模使用是非常昂贵的投资。

硬件 RAID 卡如下所示:

重要的 RAID 概念 校验方式用在 RAID 重建中从校验所保存的信息中重新生成丢失的内容。

RAID 5,RAID 6 基于校验。

条带化是将切片数据随机存储到多个磁盘。

它不会在单个磁盘中保存完整的数据。

如果我们使用2个磁盘,则每个磁盘存储我们的一半数据。

镜像被用于 RAID 1 和 RAID 10。

镜像会自动备份数据。

在 RAID 1 中,它会保存相同的内容到其他盘上。

热备份只是我们的服务器上的一个备用驱动器,它可以自动更换发生故障的驱动器。

在我们的阵列中,如果任何一个驱动器损坏,热备份驱动器会自动用于重建 RAID。

块是 RAID 控制器每次读写数据时的最小单位,最小 4KB。

通过定义块大小,我们可以增加 I/O 性能。

RAID有不同的级别。

在这里,我们仅列出在真实环境下的使用最多的 RAID 级别。

RAID0 = 条带化 RAID1 = 镜像 RAID5 = 单磁盘分布式奇偶校验 RAID6 = 双磁盘分布式奇偶校验 RAID10 = 镜像 + 条带。

(嵌套RAID) RAID 在大多数 Linux 发行版上使用名为 mdadm 的软件包进行管理。

让我们先对每个 RAID 级别认识一下。

RAID 0 / 条带化 条带化有很好的性能。

在 RAID 0(条带化)中数据将使用切片的方式被写入到磁盘。

一半的内容放在一个磁盘上,另一半内容将被写入到另一个磁盘。

假设我们有2个磁盘驱动器,例如,如果我们将数据“TECMINT”写到逻辑卷中,“T”将被保存在第一盘中,“E”将保存在第二盘,’C将被保存在第一盘,“M”将保存在第二盘,它会一直继续此循环过程。

(LCTT 译注:实际上不可能按字节切片,是按数据块切片的。

) 在这种情况下,如果驱动器中的任何一个发生故障,我们就会丢失数据,因为一个盘中只有一半的数据,不能用于重建 RAID。

不过,当比较写入速度和性能时,RAID 0 是非常好的。

创建 RAID 0(条带化)至少需要2个磁盘。

如果你的数据是非常宝贵的,那么不要使用此 RAID 级别。

高性能。

RAID 0 中容量零损失。

零容错。

写和读有很高的性能。

RAID 1 / 镜像化 镜像也有不错的性能。

镜像可以对我们的数据做一份相同的副本。

假设我们有两个2TB的硬盘驱动器,我们总共有4TB,但在镜像中,但是放在 RAID 控制器后面的驱动器形成了一个逻辑驱动器,我们只能看到这个逻辑驱动器有2TB。

当我们保存数据时,它将同时写入这两个2TB驱动器中。

创建 RAID 1(镜像化)最少需要两个驱动器。

如果发生磁盘故障,我们可以通过更换一个新的磁盘恢复 RAID 。

如果在 RAID 1 中任何一个磁盘发生故障,我们可以从另一个磁盘中获取相同的数据,因为另外的磁盘中也有相同的数据。

所以是零数据丢失。

良好的性能。

总容量丢失一半可用空间。

完全容错。

重建会更快。

写性能变慢。

读性能变好。

能用于操作系统和小规模的数据库。

RAID 5 / 分布式奇偶校验 RAID 5 多用于企业级。

RAID 5 的以分布式奇偶校验的方式工作。

奇偶校验信息将被用于重建数据。

它从剩下的正常驱动器上的信息来重建。

在驱动器发生故障时,这可以保护我们的数据。

假设我们有4个驱动器,如果一个驱动器发生故障而后我们更换发生故障的驱动器后,我们可以从奇偶校验中重建数据到更换的驱动器上。

奇偶校验信息存储在所有的4个驱动器上,如果我们有4个 1TB 的驱动器。

奇偶校验信息将被存储在每个驱动器的256G中,而其它768GB是用户自己使用的。

单个驱动器故障后,RAID 5 依旧正常工作,如果驱动器损坏个数超过1个会导致数据的丢失。

性能卓越 读速度将非常好。

写速度处于平均水准,如果我们不使用硬件 RAID 控制器,写速度缓慢。

从所有驱动器的奇偶校验信息中重建。

完全容错。

1个磁盘空间将用于奇偶校验。

可以被用在文件服务器,Web服务器,非常重要的备份中。

RAID 6 双分布式奇偶校验磁盘 RAID 6 和 RAID 5 相似但它有两个分布式奇偶校验。

大多用在大数量的阵列中。

我们最少需要4个驱动器,即使有2个驱动器发生故障,我们依然可以更换新的驱动器后重建数据。

它比 RAID 5 慢,因为它将数据同时写到4个驱动器上。

当我们使用硬件 RAID 控制器时速度就处于平均水准。

如果我们有6个的1TB驱动器,4个驱动器将用于数据保存,2个驱动器将用于校验。

性能不佳。

读的性能很好。

如果我们不使用硬件 RAID 控制器写的性能会很差。

从两个奇偶校验驱动器上重建。

完全容错。

2个磁盘空间将用于奇偶校验。

可用于大型阵列。

用于备份和视频流中,用于大规模。

RAID 10 / 镜像+条带 RAID 10 可以被称为1 + 0或0 +1。

它将做镜像+条带两个工作。

在 RAID 10 中首先做镜像然后做条带。

在 RAID 01 上首先做条带,然后做镜像。

RAID 10 比 01 好。

假设,我们有4个驱动器。

当我逻辑卷上写数据时,它会使用镜像和条带的方式将数据保存到4个驱动器上。

如果我在 RAID 10 上写入数据“TECMINT”,数据将使用如下方式保存。

首先将“T”同时写入两个磁盘,“E”也将同时写入另外两个磁盘,所有数据都写入两块磁盘。

这样可以将每个数据复制到另外的磁盘。

同时它将使用 RAID 0 方式写入数据,遵循将“T”写入第一组盘,“E”写入第二组盘。

再次将“C”写入第一组盘,“M”到第二组盘。

良好的读写性能。

总容量丢失一半的可用空间。

容错。

从副本数据中快速重建。

由于其高性能和高可用性,常被用于数据库的存储中。

图解RAID存储技术:RAID 0、1、5、6、10、50、60

硬盘设备在计算机中容易出现故障,网工们需要关注数据冗余与异地备份。

RAID技术,即廉价冗余磁盘阵列,旨在通过组合多个容量较小、相对廉价的磁盘,以较低成本实现高容量、性能、可靠性和扩展性。

随着磁盘成本降低,RAID技术不再以“廉价”为核心,而是强调“独立”。

RAID通过将数据切割成多个区段并分布存储,提升磁盘阵列整体性能,并通过数据冗余备份确保数据安全性。

它利用数据条带、镜像和数据校验三大技术,根据策略和架构分为不同等级以满足需求。

RAID0将多块磁盘串联,实现并读访问,但不提供冗余策略,单块磁盘故障会导致数据丢失。

RAID1采用磁盘镜像,存储数据副本,确保数据安全性,但存储容量减半。

RAID5与RAID6分别利用奇偶校验位和双重校验保护数据,RAID5提供容量与速度平衡,而RAID6成本更高,支持双重磁盘失效情况。

RAID10结合RAID1与RAID0特性,提供速度与冗余性,适用于全天候运行的应用程序。

RAID50与RAID60是RAID5与RAID0、RAID6与RAID0的结合,分别通过数据条带化与奇偶校验位提升读写性能和可靠性。

综上所述,RAID技术通过组合不同策略与等级,满足不同数据应用的需求,确保数据安全性与性能。

磁盘阵列的RAID级别

1、RAID 0RAID 0是最早出现的RAID模式,即Data Stripping数据分条技术。

RAID 0是组建磁盘阵列中最简单的一种形式,只需要2块以上的硬盘即可,成本低,可以提高整个磁盘的性能和吞吐量。

RAID 0没有提供冗余或错误修复能力,但实现成本是最低的。

RAID 0最简单的实现方式就是把N块同样的硬盘用硬件的形式通过智能磁盘控制器或用操作系统中的磁盘驱动程序以软件的方式串联在一起创建一个大的卷集。

在使用中电脑数据依次写入到各块硬盘中,它的最大优点就是可以整倍的提高硬盘的容量。

如使用了三块80GB的硬盘组建成RAID 0模式,那么磁盘容量就会是240GB。

其速度方面,各单独一块硬盘的速度完全相同。

最大的缺点在于任何一块硬盘出现故障,整个系统将会受到破坏,可靠性仅为单独一块硬盘的1/N。

为了解决这一问题,便出现了RAID 0的另一种模式。

即在N块硬盘上选择合理的带区来创建带区集。

其原理就是将原先顺序写入的数据被分散到所有的四块硬盘中同时进行读写。

四块硬盘的并行操作使同一时间内磁盘读写的速度提升了4倍。

在创建带区集时,合理的选择带区的大小非常重要。

如果带区过大,可能一块磁盘上的带区空间就可以满足大部分的I/O操作,使数据的读写仍然只局限在少数的一、两块硬盘上,不能充分的发挥出并行操作的优势。

另一方面,如果带区过小,任何I/O指令都可能引发大量的读写操作,占用过多的控制器总线带宽。

因此,在创建带区集时,我们应当根据实际应用的需要,慎重的选择带区的大小。

带区集虽然可以把数据均匀的分配到所有的磁盘上进行读写。

但如果我们把所有的硬盘都连接到一个控制器上的话,可能会带来潜在的危害。

这是因为当我们频繁进行读写操作时,很容易使控制器或总线的负荷 超载。

为了避免出现上述问题,建议用户可以使用多个磁盘控制器。

最好解决方法还是为每一块硬盘都配备一个专门的磁盘控制器。

虽然RAID 0可以提供更多的空间和更好的性能,但是整个系统是非常不可靠的,如果出现故障,无法进行任何补救。

所以,RAID 0一般只是在那些对数据安全性要求不高的情况下才被人们使用。

2、RAID 1RAID 1称为磁盘镜像,原理是把一个磁盘的数据镜像到另一个磁盘上,也就是说数据在写入一块磁盘的同时,会在另一块闲置的磁盘上生成镜像文件,在不影响性能情况下最大限度的保证系统的可靠性和可修复性上,只要系统中任何一对镜像盘中至少有一块磁盘可以使用,甚至可以在一半数量的硬盘出现问题时系统都可以正常运行,当一块硬盘失效时,系统会忽略该硬盘,转而使用剩余的镜像盘读写数据,具备很好的磁盘冗余能力。

虽然这样对数据来讲绝对安全,但是成本也会明显增加,磁盘利用率为50%,以四块80GB容量的硬盘来讲,可利用的磁盘空间仅为160GB。

另外,出现硬盘故障的RAID系统不再可靠,应当及时的更换损坏的硬盘,否则剩余的镜像盘也出现问题,那么整个系统就会崩溃。

更换新盘后原有数据会需要很长时间同步镜像,外界对数据的访问不会受到影响,只是这时整个系统的性能有所下降。

因此,RAID 1多用在保存关键性的重要数据的场合。

RAID 1主要是通过二次读写实现磁盘镜像,所以磁盘控制器的负载也相当大,尤其是在需要频繁写入数据的环境中。

为了避免出现性能瓶颈,使用多个磁盘控制器就显得很有必要。

3、RAID0+1从RAID 0+1名称上我们便可以看出是RAID0与RAID1的结合体。

在我们单独使用RAID 1也会出现类似单独使用RAID 0那样的问题,即在同一时间内只能向一块磁盘写入数据,不能充分利用所有的资源。

为了解决这一问题,我们可以在磁盘镜像中建立带区集。

因为这种配置方式综合了带区集和镜像的优势,所以被称为RAID 0+1。

把RAID0和RAID1技术结合起来,数据除分布在多个盘上外,每个盘都有其物理镜像盘,提供全冗余能力,允许一个以下磁盘故障,而不影响数据可用性,并具有快速读/写能力。

RAID0+1要在磁盘镜像中建立带区集至少4个硬盘。

4、RAID: LSI MegaRAID、Nytro和SyncroMegaRAID、Nytro和Syncro都是LSI 针对RAID而推出的解决方案,并且一直在创造更新。

LSI MegaRAID的主要定位是保护数据,通过高性能、高可靠的RAID控制器功能,为数据提供高级别的保护。

LSI MegaRAID在业界有口皆碑。

LSI Nytro的主要定位是数据加速,它充分利用当今备受追捧的闪存技术,极大地提高数据I/O速度。

LSI Nytro包括三个系列:LSI Nytro WarpDrive加速卡、LSI Nytro XD 应用加速存储解决方案和LSI Nytro MegaRAID 应用加速卡。

Nytro MegaRAID主要用于DAS环境,Nytro WarpDrive加速卡主要用于SAN和NAS环境,Nytro XD解决方案由Nytro WarpDrive加速卡和Nytro XD 智能高速缓存软件两部分构成。

LSI Syncro的定位主要用于数据共享,提高系统的可用性、可扩展性,降低成本。

LSI通过MegaRAID提供基本的可靠性保障;通过Nytro实现加速;通过Syncro突破容量瓶颈,让价格低廉的存储解决方案可以大规模扩展,并且进一步提高可靠性。

5、RAID2:带海明码校验从概念上讲,RAID 2 同RAID 3类似, 两者都是将数据条块化分布于不同的硬盘上, 条块单位为位或字节。

然而RAID 2 使用一定的编码技术来提供错误检查及恢复。

这种编码技术需要多个磁盘存放检查及恢复信息,使得RAID 2技术实施更复杂。

因此,在商业环境中很少使用。

下图左边的各个磁盘上是数据的各个位,由一个数据不同的位运算得到的海明校验码可以保存另一组磁盘上。

由于海明码的特点,它可以在数据发生错误的情况下将错误校正,以保证输出的正确。

它的数据传送速率相当高,如果希望达到比较理想的速度,那最好提高保存校验码ECC码的硬盘,对于控制器的设计来说,它又比RAID3,4或5要简单。

没有免费的午餐,这里也一样,要利用海明码,必须要付出数据冗余的代价。

输出数据的速率与驱动器组中速度最慢的相等。

6 、RAID3:带奇偶校验码的并行传送这种校验码与RAID2不同,只能查错不能纠错。

它访问数据时一次处理一个带区,这样可以提高读取和写入速度。

校验码在写入数据时产生并保存在另一个磁盘上。

需要实现时用户必须要有三个以上的驱动器,写入速率与读出速率都很高,因为校验位比较少,因此计算时间相对而言比较少。

用软件实现RAID控制将是十分困难的,控制器的实现也不是很容易。

它主要用于图形(包括动画)等要求吞吐率比较高的场合。

不同于RAID 2,RAID 3使用单块磁盘存放奇偶校验信息。

如果一块磁盘失效,奇偶盘及其他数据盘可以重新产生数据。

如果奇偶盘失效,则不影响数据使用。

RAID 3对于大量的连续数据可提供很好的传输率,但对于随机数据,奇偶盘会成为写操作的瓶颈。

7、RAID4:带奇偶校验码的独立磁盘结构RAID4和RAID3很象,不同的是,它对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘。

在图上可以这么看,RAID3是一次一横条,而RAID4一次一竖条。

它的特点和RAID3也挺象,不过在失败恢复时,它的难度可要比RAID3大得多了,控制器的设计难度也要大许多,而且访问数据的效率不怎么好。

8、RAID5:分布式奇偶校验的独立磁盘结构从它的示意图上可以看到,它的奇偶校验码存在于所有磁盘上,其中的p0代表第0带区的奇偶校验值,其它的意思也相同。

RAID5的读出效率很高,写入效率一般,块式的集体访问效率不错。

因为奇偶校验码在不同的磁盘上,所以提高了可靠性。

但是它对数据传输的并行性解决不好,而且控制器的设计也相当困难。

RAID 3 与RAID 5相比,重要的区别在于RAID 3每进行一次数据传输,需涉及到所有的阵列盘。

而对于RAID 5来说,大部分数据传输只对一块磁盘操作,可进行并行操作。

在RAID 5中有“写损失”,即每一次写操作,将产生四个实际的读/写操作,其中两次读旧的数据及奇偶信息,两次写新的数据及奇偶信息。

9、RAID6:带有两种分布存储的奇偶校验码的独立磁盘结构名字很长,但是如果看到图,大家立刻会明白是为什么,请注意p0代表第0带区的奇偶校验值,而pA代表数据块A的奇偶校验值。

它是对RAID5的扩展,主要是用于要求数据绝对不能出错的场合。

当然了,由于引入了第二种奇偶校验值,所以需要N+2个磁盘,同时对控制器的设计变得十分复杂,写入速度也不好,用于计算奇偶校验值和验证数据正确性所花费的时间比较多,造成了不必须的负载。

我想除了军队没有人用得起这种东西。

10、RAID7:优化的高速数据传送磁盘结构RAID7所有的I/O传送均是同步进行的,可以分别控制,这样提高了系统的并行性,提高系统访问数据的速度;每个磁盘都带有高速缓冲存储器,实时操作系统可以使用任何实时操作芯片,达到不同实时系统的需要。

允许使用SNMP协议进行管理和监视,可以对校验区指定独立的传送信道以提高效率。

可以连接多台主机,因为加入高速缓冲存储器,当多用户访问系统时,访问时间几乎接近于0。

由于采用并行结构,因此数据访问效率大大提高。

需要注意的是它引入了一个高速缓冲存储器,这有利有弊,因为一旦系统断电,在高速缓冲存储器内的数据就会全部丢失,因此需要和UPS一起工作。

当然了,这么快的东西,价格也非常昂贵。

11、RAID10:高可靠性与高效磁盘结构这种结构无非是一个带区结构加一个镜象结构,因为两种结构各有优缺点,因此可以相互补充,达到既高效又高速的目的。

大家可以结合两种结构的优点和缺点来理解这种新结构。

这种新结构的价格高,可扩充性不好。

主要用于数据容量不大,但要求速度和差错控制的数据库中。

12、RAID53:高效数据传送磁盘结构越到后面的结构就是对前面结构的一种重复和再利用,这种结构就是RAID3和带区结构的统一,因此它速度比较快,也有容错功能。

但价格十分高,不易于实现。

这是因为所有的数据必须经过带区和按位存储两种方法,在考虑到效率的情况下,要求这些磁盘同步真是不容易。

赞(0)
未经允许不得转载:优乐评测网 » RAID阵列的演变:从RAID 0到RAID 6 (raid阵列卡)

优乐评测网 找服务器 更专业 更方便 更快捷!

专注IDC行业资源共享发布,给大家带来方便快捷的资源查找平台!

联系我们