入门 NAS 掌握这些知识,数据丢失也有“后悔药”(15)

同时为了应对 URE,机械硬盘每个扇区后面有一定 ECC 纠错码,用来纠正错误的数据( SMART 中的硬件 ECC 恢复计数),当然 ECC 也不是万能的,一旦出现连续或者大量的 ECC 错码,ECC 就不能纠正错误的数据了,也就是出现了 SMART 中的报告无法纠正的错误。这个时候就要依靠带保护的 RAID 系统进行纠正数据,如果没有的话,那么那个位置的数据就基本就没有了。

入门 NAS 掌握这些知识,数据丢失也有“后悔药”

图12/15

而普通消费级的硬盘一般是 1e-14/bit,企业级硬盘发生 URE 的概率一般是 1e-15/bit。当然这个数据并不是代表了只有读取了 1e+14 的概率才会遇到一次 URE。遇到 URE 的概率则需要利用更复杂的公式进行计算。由于计算过程非常复杂,这里不进行引入,这里采用的数据均是知乎木头龙的计算结果:

4 个 1TB 硬盘组成的 RAID 5 单盘故障后的重建过程需要读取的数据量为 1e-12 Byte×8 bit/Byte×(4-1)=24Tbit,而读取 24Tbit 过程中没有发生URE的概率则是 (1-1e14)^24e12=78.68%。

推荐阅读