gcsfuse 是否将所有数据同步到其所安装的系统?

gcsfuse 是否将所有数据同步到其所安装的系统?

场景:

  • 我已将 gcsfuse 驱动器安装到我的 docker 容器中,以便我可以存储和读取 Google Cloud Storage 中的数据
  • Docker 容器只有几 GB 的存储空间,但我在 Google Cloud Sorage 中可能拥有数 TB 的数据

问题:

gcsfuse 是否会从 Google Cloud Storage 下载所有数据,还是仅在我尝试读取文件时检索文件?相反,一旦我将数据写入已安装的驱动器,该数据是否会保留在本地存储,还是会发送到 GCS 并已删除来自本地存储?

总体关注点,以防我问错了问题

我担心 gcsfuse 挂载的驱动器可能会导致所有容器存储空间耗尽,即使数据实际上存储在 Google Cloud 上。我正在尝试评估这是否是一个合理的担忧,或者 gcsfuse 是否专为处理这种情况而构建。

对于那些要告诉我“只需阅读文档”的人

是的,我试过了。如果这些信息在文件中,那么它就埋得足够深或足够模糊,因此可能值得在这里提出一个问题。

答案1

gcsfuse 不会下载存储桶中的所有数据。它会存储所有已写入但未在本地关闭的文件。对于未弄脏的文件,读取操作直接从 GCS 提供,不会占用本地存储空间。

相关内容