该应用程序是数据保险库、数据集市还是数据仓库?

该应用程序是数据保险库、数据集市还是数据仓库?

我正在从各种源系统导入信息并将其放入本地数据库以进行报告。例如,其中一个来源是 Google Analytics。

以下是此导入过程的一些属性:

  1. 我正在从源系统(例如 Google Analytics)收集数据。
  2. 数据进入我的本地数据库。
  3. 数据单向流动,即,本地数据库上唯一的写访问权限是导入器进程。
  4. 本地数据库是源系统的视图,即它不是上游数据库的完全保真副本。

鉴于这些属性,我的本地数据库是否应该被称为数据集市、数据保险库或数据仓库?

这个词的选择对我来说很重要,因为我们公司将以开源形式发布我们的工具。如果我们使用行业认可的最佳术语来描述我们的工具的功能,那么它将更有价值。

答案1

在查阅了相应的维基百科文章并根据我的经验(尽管在这方面有限)后,我建议采用数据仓库

  • 数据仓库 此术语可能最适合于所描述的应用程序。数据仓库也与 ETL 流程密切相关,这意味着如果您发布 ETL 工具,人们将理解它们与数据仓库协同工作……
  • 数据保险库 这个术语似乎侧重于历史数据的收集
  • 数据库 这个术语主要关注实际数据仓库的一个子集。

我承认,直到这个问题之前,我从未听说过“数据保险库”。最后,在发布和选择“最佳”名称之前,请与市场部核实他们对该名称是否有任何偏好——工具不必总是以其正在执行的操作来命名(尽管我更喜欢这种风格)。

相关内容