【技术分享】服务器做阵列后实际容量解析 (服务器做阵列实际容量)

服务器做阵列后实际容量解析

在服务器的工作中,存储容量是非常关键的一项指标。为保障服务器的数据存储安全和数据无损坏,在存储配置中很多人会选择使用阵列来提高数据的容错性和提高读写效率。

但是,很多人在配置完阵列后会发现,实际可用的存储容量比购买的硬盘总容量要小很多,那么这是为什么呢?

技术背景

为了解释阵列后实际容量问题,我们先来了解一下RD阵列。

RD(Redundant Array of Inexpensive Disks)翻译过来是“廉价磁盘阵列”。RD技术将多个磁盘组合起来,形成一个阵列存储器(Array Storage)。目的是将多个物理磁盘整合为一个逻辑磁盘,提高存储系统的容量和性能,以及保障数据的安全。

常见的RD类型有RD 0、RD 1、RD 5、RD 6、RD 10等。不同的RD级别通过不同的数据切割、分布、保护方法,来实现不同的数据保护和读写效率。

实际容量问题分析

一、RD 0

RD 0是将多个磁盘“条带化(Striping)”组成一个大容量的磁盘,数据无冗余保护。

例如,将两个2TB的硬盘做RD 0。

做完RD 0后,存储器的总容量就会变成4TB。但是,RD 0不具备数据冗余保护能力,如果某一块硬盘出现故障,所有数据都将丢失。

二、RD 1

RD 1是将一份数据完全“镜像(Mirroring)”到另外一块硬盘上,一共需要两块硬盘。

例如,将两块2TB的硬盘做RD 1。

做完RD 1后,存储器的总容量就会变成2TB,因为数据被完全“镜像”到了另一块硬盘上。RD 1的好处是如果其中一块硬盘出现故障,数据还可以从另外一块硬盘上恢复。

三、RD 5

RD 5需要三块以上的硬盘,将数据和每个数据块的校验和写入到不同的物理磁盘上,以实现数据的分布式存储和校验功能。

例如,将三块2TB的硬盘做RD 5。

做完RD 5后,存储器的总容量变成了4TB。为什么不是6TB呢?

因为RD 5采用数据分布式存储和校验,需要用一部分空间来存储校验和(即奇偶校验信息),而不是像RD 1将数据完全“镜像”一份出去。所以,三块2TB的硬盘做RD 5能够使用的容量是4TB左右。

四、RD 6

RD 6是对RD 5的升级,使用两个奇偶校验信息进行校验和存储,以增强数据冗余性和可靠性。

例如,将四块2TB的硬盘做RD 6。

做完RD 6后,存储器的总容量变成了4TB。跟RD 5一样,RD 6也需要用部分空间来存储校验和信息,所以四块2TB的硬盘做RD 6能够使用的容量也是4TB左右。

五、RD 10

RD 10是将RD 1和RD 0结合起来实现的RD级别,需要至少四块硬盘。

例如,将四块2TB的硬盘做RD 10。

做完RD 10后,存储器的总容量变成了4TB。因为RD 10将硬盘划分成两组(每组两块硬盘),分别进行RD 1 “镜像”和RD 0 “条带化”,所以四块硬盘的总容量只有4TB。

从以上分析可以看出,做完RD后实际可用容量比购买的硬盘总容量小很多,这是因为RD需要用部分空间来存储奇偶校验信息和数据切割后的元数据。不同的RD级别的奇偶校验算法和存储元数据方式不一样,所以它们的实际可用容量也会不同。

在实际工作中,我们需要根据不同的数据保护策略、读写性能和容量需求来选择合适的RD级别。同时,也需要充分考虑到RD后的实际可用容量情况,避免出现不必要的容量浪费或容量不足的情况。


数据运维技术 » 【技术分享】服务器做阵列后实际容量解析 (服务器做阵列实际容量)