具有复制功能的数百万个文件的 Linux 文件系统或 CDN

Question 1

一个目录中有数百万个文件的设计很糟糕，而且会很慢。将它们细分为条目数较少的目录。

使用 RAID 和/或 SSD。这本身并不能解决访问速度慢的问题，但如果你引入多个目录并减少每个目录的文件数量（比如说减少一个或两个数量级），这将有助于防止热点。

考虑 XFS，特别是在使用多个驱动器和多个目录时，它可能会给你带来很好的收益（参见例如这线程以了解要使用的选项。它为 RAID 上的 XFS 提供了一些提示md）。

Answer

一个目录中有数百万个文件的设计很糟糕，而且会很慢。将它们细分为条目数较少的目录。

使用 RAID 和/或 SSD。这本身并不能解决访问速度慢的问题，但如果你引入多个目录并减少每个目录的文件数量（比如说减少一个或两个数量级），这将有助于防止热点。

考虑 XFS，特别是在使用多个驱动器和多个目录时，它可能会给你带来很好的收益（参见例如这线程以了解要使用的选项。它为 RAID 上的 XFS 提供了一些提示md）。

Question 2

就我个人而言，我会：

坚持使用您当前的 FS。按照您的建议将它们拆分成目录，如果您愿意，您仍然可以将其显示为单个目录，例如mod_rewrite（猜测这是一个 CDN 类型的应用程序）
记录需要复制的更改，例如每日/每小时等，以便每次需要同步时，找出需要复制的文件就像diff在日志上运行一样简单（即，您总是同步日志并先同步它们，但在替换它们之前做一个差异来计算还需要复制什么）。

Answer

就我个人而言，我会：

坚持使用您当前的 FS。按照您的建议将它们拆分成目录，如果您愿意，您仍然可以将其显示为单个目录，例如mod_rewrite（猜测这是一个 CDN 类型的应用程序）
记录需要复制的更改，例如每日/每小时等，以便每次需要同步时，找出需要复制的文件就像diff在日志上运行一样简单（即，您总是同步日志并先同步它们，但在替换它们之前做一个差异来计算还需要复制什么）。

相关内容