我应该使用 SSD 还是 HDD 来散列大量数据?

我应该使用 SSD 还是 HDD 来散列大量数据?

单纯从驱动器寿命的角度来看,对于散列数十万个文件来说,哪个更合适 - SSD 还是 HDD?

背景 - 我的硬盘上有我想散列并与电子表格中的数据进行比较的文件,但我觉得散列这么多文件会损坏硬盘,我不能承受失去它。如果我将所有内容复制到 SSD,与 HDD 相比,读取这么多数据对 SSD 寿命的影响会更小吗?

答案1

SSD 和 NAND 芯片的寿命因写入而缩短,而不是读取。对
存储在 SSD 上的文件进行哈希处理会读取它们,甚至反复进行哈希处理也会读取它们,因此 SSD 非常适合这种类型的操作。即使是写入,您也必须写入大量数据,否则这将成为现代 SSD 驱动器的真正问题。
驱动器本身的质量可能与处理方式一样重要。SSD 的操作速度会快得多,这取决于其他因素,例如 CPU 速度、与驱动器通信的总线速度,甚至执行哈希处理的程序的效率和优化。

您的问题中没有说明您是否要将文件复制到驱动器,或者重复将文件复制到那里以进行哈希处理,然后再次将其删除。那(当然)不会一样。

硬盘可以轻松地连续多年完成这项任务,并且一遍又一遍地写入数据,没有什么区别,硬盘的读写速度会慢得多。

其中任何一个或您执行的任何涉及存储的操作,仍然会受益于对数据进行适当的备份,最好在创建后与计算机断开连接,这样如果 SSD 或 HD 出现任何(软或硬)问题,它可以安全地保存在那里。

答案2

没什么区别。SSD 可能更快,但如果它所连接的总线很慢,那就没什么区别了。在我拥有的 2 台 PC 上,在最佳条件下,从内部 SATA SSD 读取的性能几乎翻了一番。在其他 2 台 PC(笔记本电脑)上,也没什么区别。此外,SSD 可以进行的写入次数有限,但一般来说,除非您不断重写这些文件,否则这不是什么大问题。

无论是否在读写,HDD 都在旋转——除非 PC 将其置于休眠状态——而且如今的驱动器不太可能发生故障,除非它们受到严重的撞击(如笔记本电脑)或被水溅到。HDD 恢复专家表示,大多数情况下(>60%)故障是电子故障,而不是物理机械故障。本质上是控制器过热而损坏。SSD 也可能会发生同样的情况,但发热量较低,因此烧坏的可能性也较低。但请记住:SSD 没有 HDD 那样的记录,所以谁知道呢。

因此:购买第二个驱动器,进行备份。

答案3

散列文件主要是一项基于 CPU 的操作,因此这将是瓶颈。单纯从硬盘的角度来看,SSD 将允许文件读取速度更快,但我怀疑与散列本身相比,这不会引人注目。(取决于您使用的散列算法,但在 99% 的情况下,读取文件的速度仍然比散列文件的速度快得多)。

由于您只是在比较哈希值,我假设您没有保存它,因此硬盘操作将只能是读取,在这种情况下它不应该磨损 SSD 驱动器。

编辑:正如卡兰指出的那样,机械驱动器实际上会磨损得更厉害,因为其运动部件在读取过程中的工作量与写入过程中的工作量一样大。

把它们加起来:SSD 对您来说更好、更安全,但纯粹从速度角度来看可能并不重要。

相关内容