新产品
固态硬盘连续写入1000TB:终于弄死三个!
2014-06-20 13:09  
 TechReport的固态硬盘连续写入耐久性试验仍在继续。将近四个月前,他们公布了600TB节点的情况,所有固态硬盘依然工作正常、性能稳定,只是三星840在以稳定的频率损耗TLC闪存单元,部分MLC闪存的也出现了坏块。

对于这些顽强的家伙,测试人员表示有些“厌倦”了,不打算每100TB公布一次报告,而是直接等1PB,也就是1000TB。

现在,这一里程碑终于达成了,想看热闹的绝对不要走开哟。

还是再次回顾一下参测的固态硬盘吧:

- 海盗船Neutron GTX 240GB

- Intel SSD 335 240GB

- 金士顿HyperX 3K 240GB(两块,分别写入可压缩、不可压缩数据)

- 三星840 250GB

- 三星840 Pro 256GB

前景回顾:

固态硬盘可靠性测试:写入22TB数据之后……

固态硬盘耐用性试验:200TB重压下的坏块

固态硬盘连续写入300TB:Intel 335也“坏了”

固态硬盘连写500TB:个个都是“猪坚强”

固态硬盘连写600TB:这都弄不死你们

迄今为止,已经有三块最终倒下了,占总量的一半,而且死去的方式各不相同。

固态硬盘连续写入1000TB:终于弄死三个!

【第一个牺牲品:金士顿HyperX 3K】

这一款其实有两块,分别测试可压缩、不可压缩数据。你应该能想到,失败的是不可压缩那块。

它最后的写入量是728TB,而可压缩那块只写入了501TB。

第一次出现警告信息是700TB的时候,忽视它继续,725TB时再次报错,而这次来自系统:“Windows检测到一个硬盘错误。立即备份你的数据,以免信息丢失。”

不管它接着继续,又出现了几次警告,只过了3TB就不行了,Anvil开始报错。硬盘还能访问,但是在导出最后一批SMART数据之后就变砖了。

固态硬盘连续写入1000TB:终于弄死三个!

事实上,真正指示寿命的并非闪存颗粒完整性,而是损耗指数(MWI),大部分第一方和第三方工具都以它为基准,指示固态硬盘的剩余寿命。

该指数在出厂时为100,一经使用就开始逐渐降低,最终为0的时候耗尽寿命(理论上仍然可以继续使用一段时间),而它和重新分配的扇区数量是完全无关的。

查看可知,700TB的时候降到了10,728TB时变为零。

再来看看错误趋势:

固态硬盘连续写入1000TB:终于弄死三个!

其实过了上一次的门槛600TB,各种错误就开始迅速增加了,到最后有986个重分配扇区(600TB时仅有10个)、111个编程错误、381个擦除错误。这意味着,失效的扇区里有一半是因为ECC错误校验失败。

HyperX 3K设定了一定比例的冗余容量,但用途是内部管理功能和RAISE(SandForce的冗余技术),能用来重新分配的很少,因此很快就会耗尽。

金士顿表示,寿命到期后硬盘就会拒绝加载,自然就检测不到了。

【第二个牺牲品:Intel SSD 335】

写入量同样达到700TB的时候,SMART信息就发出了失败警告,但是使用起来仍然一切正常,闪存单元也几乎都是完整的,只有一个重分配扇区,还是写入300TB时候出现的。

于是继续写入,但仅仅又过了50TB,也就是到达750TB,最终就崩溃了。负责持续写入的Anvil Storage Utilities工具里出现了写入错误,程序本身也失去了响应。幸运的是,再次启动软件成功了,至少能提取出日志(稍后分析),但不能再继续写入了。

固态硬盘连续写入1000TB:终于弄死三个!

SSD 335写入了700TB之后,WMI指数就已经归零,标志着闪存不再可靠,不能继续使用了。

奇怪的是,写入报错后,SMART也不再返回任何信息,任何工具都无法访问,证明SMART技术已经挂掉。

重启系统,Intel SSD Toolbox里又出现了这块硬盘,仍然检测为存储设备,但容量是0GB,无法访问。

Intel表示,这种结果完全符合预期,写入错误意味着硬盘进入了只读模式,并触发一种自毁模式,让硬盘不再响应。永别了……

固态硬盘连续写入1000TB:终于弄死三个!

【第三个牺牲品:三星840】

TLC闪存的它并不是率先倒下的,仅此一点就可以让大家放心了。它坚持超过了900TB。

其实,刚过200TB她就出现了重分配扇区,之后不断增加,最后有接近3500个,但因为可用的冗余空间较多,所以坚持得比较久一些。

写入量达到900TB的时候,840仍然看起来很正常,三星自己的SSD Magician工具也报告还有不少剩余寿命,但是突然之间,它就挂了,Anvil崩溃,系统和工具都检测不到,只有Intel存储驱动报告了一个未知的三星SATA设备,也只能看看而已。

由于没有任何事先警告,死的又很彻底,最后一段时间的SMART数据就丢失了,无法得知最后确切写入了多少,状态分析也只能截止到900TB。

固态硬盘连续写入1000TB:终于弄死三个!

损耗指数在300TB的时候就变成了零,但是三星自己的工具仍然报告状态健康,继续使用也没问题。

再看可使用的保留空间,一直在稳定减少,但是最后死亡的时候仍有大约40%,理论上还能坚持。由于SMART日志丢失,无法得知死亡的确切原因,可能是突然就坚持不住了。

固态硬盘连续写入1000TB:终于弄死三个!

再看另一个重要参数:不可修复错误。它是在写入300TB时候出现的,有176个,当时用来校验数据完整性的200GB文件确实Hash失败了好几次,不得不重新拷贝,但此后不可修复错误一直没有增加。

在800-900TB之间的某个时刻,不可修复错误数量突然增加了119个,总量达到295个。虽然这时候Anvil没有报错,但这应该就是死亡元凶。

三星表示,840用户最终是应该能看到错误提示的,比如说兼容性错误、蓝屏死机等。至于这里为何突然死亡,还在进一步调查。

固态硬盘连续写入1000TB:终于弄死三个!

【1PB俱乐部:三位坚强斗士】

海盗船Neutron GTX、三星840 Pro、金士顿HyperX 3K(可压缩数据)都挺过了1PB,真是奇迹,因为它们标称的终身写入量没一个超过200TB。

固态硬盘连续写入1000TB:终于弄死三个!

固态硬盘连续写入1000TB:终于弄死三个!

HyperX 3K因为对付的是压缩数据,实际写入闪存的其实只有716TB,节省了几乎三成。

寿命指数最后只剩下了10,不过重分配扇区只有2个,没有编程和擦写错误(不可压缩的有上千错误),闪存状态良好。

它能坚持到何时还不好预测,估计还能使用很长一段时间,就看重分配扇区何时突增了。

固态硬盘连续写入1000TB:终于弄死三个!

三星840 Pro的寿命指数在400TB时就很低了,500TB后为零,700TB后开始大量使用冗余容量,但最后也只用了20%。

SSD Magician显示目前一切良好,但是不敢保证何时会突然死亡。

固态硬盘连续写入1000TB:终于弄死三个!

重分配扇区在600TB之后持续大幅增加,如今已有1836个。每扇区1.5MB,那就是2.7GB,理论上还有很多冗余可用。

固态硬盘连续写入1000TB:终于弄死三个!

海盗船Neutron GTX仍然牛逼得一塌糊涂,寿命指数竟然至今还接近80!重分配扇区至今还是0!真是一个逆天的存在。照这样的趋势下去,至少能坚持到4PB。

坐等海盗船解释……

【性能测试】

再来看看各款固态硬盘的性能趋势,包括那些死去的。

固态硬盘连续写入1000TB:终于弄死三个!
4MB持续读取

固态硬盘连续写入1000TB:终于弄死三个!
4MB持续写入

固态硬盘连续写入1000TB:终于弄死三个!
4KB随机读取

固态硬盘连续写入1000TB:终于弄死三个!
4KB随机写入

大多数都始终如一。HyperX 3K最初曾有明显的随机读取暴涨,但此后基本稳定。

海盗船Neutron GTX一直是最稳健的,不过最后一次持续读取测试出现了大幅度下降,反复测试五次都是如此。原因不明,等到1.1PB的时候再看看。

三星840最后一次随机读取速度有所下滑,可能和将死有关。

固态硬盘连续写入1000TB:终于弄死三个!

平均写入速度也都波澜不惊。840 Pro还在高低跳跃,Neutron GTX还在缓慢增加,真是无语了。

那些突起峰值不用理会,都是每100TB安全擦除后的干净状态。

固态硬盘连续写入1000TB:终于弄死三个!

不妨再看看死去三款固态硬盘最后时刻的表现,很明显都出现了波动,Intel、金士顿的还很轻微,三星840的就激烈多了,只可惜没有死亡前的数据。

【结语:死得其所】

1PB是个里程碑。那些通过了的固态硬盘可喜可贺,没有达成的也不用沮丧,你们同样证明了自己的价值,并且提供了很多宝贵经验。

直到最后时刻,失败的固态硬盘才出现些许性能波动,这证明一款固态硬盘完全可以在整个生命周期内维持良好的性能。

不过,不同设备最后终结的方式略有不同。Intel SSD 335预先设定好了界限,一旦越过就“自杀”,金士顿HyperX 3K则力图压榨出最后一丝潜力。

三星840一直是焦点,最终虽然死的很突然,很蹊跷,但再一次证明TLC闪存也可以很耐用。虽然这是以大量重分配扇区为代价的,但对容量的影响很微小。

尽管测试的样品不多,但完全可以拍着胸脯告诉大家:即便你在固态硬盘上每天不停地写入,只要不是人品太差,700TB也是毫无问题的!

接下来,剩余的三名斗士将继续接受考验……

固态硬盘连续写入1000TB:终于弄死三个!