数据仓库和数据集市

Anonim

数据仓库与数据集市

您应该首先构建哪个:数据仓库还是数据集市?这是最近一直困扰IT经理的问题。大多数供应商都会说数据仓库很难做,也很昂贵,而且不建议这样做。他们说数据仓库需要很长时间才能构建。此外,他们表示,在此期间,公司面临着许多与公司面临的问题。一些问题是遗留数据的集成,以及管理大量数据的难度。数据集市肯定会从数据仓库中黯然失色,但这些都不是真的。这种误解需要一个彻底的定义和差异引用。但是什么是数据集市和数据仓库?

首先必须知道数据集市代表一个特定的公司。它代表了它的程序,数据,软件和硬件。这意味着每个部门都有单独的数据集市。例如,有一个用于生产的数据集市,用于财务,另一个用于销售部门,另一个用于营销。每个数据集市都有自己的特定功能和特性。它与其他部门的其他数据集市不同,但它们可以协调在一起。数据集市专注于个人和特定部门,这就是它无法处理大数据的原因。星型连接结构数据库用于收集所有数据集市数据库以进行设计。数据集市有两种,即独立数据集市(这是更强大的数据)和依赖数据集市(这是不太强大的数据集市)。必须创建多个独立的数据集市,以便它可以用于组织。

数据仓库很广泛,不仅限于专注于特定部门。它可以代表整个公司;它包括公司数据的所有主题和模型。数据仓库不仅限于与部门和公司的主题领域相关。与数据集市相比,存储在数据仓库中的数据更加详细。数据仓库索引的方式很轻,因为它必须处理大量数据。数据仓库覆盖了公司或公司的大部分区域,这就是处理它需要很长时间的原因。这也是数据集市快速且易于使用,设计和实施的原因,因为它只处理少量数据。这也是数据仓库与数据集市相比更加昂贵的原因。

摘要:

1.

数据集市专注于公司或公司的各个部门,而数据仓库可以代表整个公司或公司。 2.

与可处理大量数据的数据仓库不同,数据集市只能处理少量数据。 3.

数据仓库可能变得昂贵且难以使用,因为它涵盖了公司或公司的广泛部分,而不像数据集市那样经济实惠且方便,因为它涉及公司或公司的小部门。