拥有十万资产（微型 mp3 文件）的 Repo：git 和 GitHub 工作流程？

Question

现在chromium.git有 315k 个文件，gentoo.git 有 90k 个文件，linux.git有 70k 个文件。因此这些文件数量并不罕见，Git 已经针对它进行了优化。

主要是，Git 签出（工作目录）的“.git/index”存储了有关工作树中文件的更多信息 - 它跟踪文件的 inode 编号、inode 更改时间和文件修改时间。如果所有这些参数都相同，则“git add”将假定实际文件也相同。

（是的，缓慢的部分实际上是“git add”，因为这是完成文件扫描和导入的地方 - 后续的“git commit”只是转储已经收集的索引信息。）

如果您的文件组织在深度嵌套的目录中，您可能会发现这些 Git 配置选项很有用（尽管它们只影响本地签出而不影响实际的历史数据库）：index.version=4或feature.manyFiles=true。

Git 并不关心它是否存储的是二进制文件。MP3 文件的实际问题是它们已经压缩，这意味着一个文件与另一个文件有很大不同，因此 Git 的常规存储优化会遇到一些困难。但是，如果文件很少更改，这应该不会造成任何问题。

如果文件很小而且很多，我认为你从 Git LFS 或 git-annex 中获益不多——它实际上可能会让事情慢点因为每个文件都需要通过单独的请求下载到服务器。

Answer 1

现在chromium.git有 315k 个文件，gentoo.git 有 90k 个文件，linux.git有 70k 个文件。因此这些文件数量并不罕见，Git 已经针对它进行了优化。

主要是，Git 签出（工作目录）的“.git/index”存储了有关工作树中文件的更多信息 - 它跟踪文件的 inode 编号、inode 更改时间和文件修改时间。如果所有这些参数都相同，则“git add”将假定实际文件也相同。

（是的，缓慢的部分实际上是“git add”，因为这是完成文件扫描和导入的地方 - 后续的“git commit”只是转储已经收集的索引信息。）

如果您的文件组织在深度嵌套的目录中，您可能会发现这些 Git 配置选项很有用（尽管它们只影响本地签出而不影响实际的历史数据库）：index.version=4或feature.manyFiles=true。

Git 并不关心它是否存储的是二进制文件。MP3 文件的实际问题是它们已经压缩，这意味着一个文件与另一个文件有很大不同，因此 Git 的常规存储优化会遇到一些困难。但是，如果文件很少更改，这应该不会造成任何问题。

如果文件很小而且很多，我认为你从 Git LFS 或 git-annex 中获益不多——它实际上可能会让事情慢点因为每个文件都需要通过单独的请求下载到服务器。

相关内容