数据挖掘和数据仓库
数据挖掘与数据仓库
数据挖掘的过程是指计算机科学的一个分支,它处理从大数据集中提取模式。然后使用统计方法和人工智能组合这些组。现代企业中的数据挖掘负责将原始数据转换为人工智能源。数据被操纵,因此能够提供可用于决策的可靠决策。这为企业提供了优于竞争的优势,因为他们拥有可依赖的数据集来提供智能。组织还在数据挖掘中使用分析实践,包括市场营销,监控科学发现和欺诈检测。 还有其他可能与数据挖掘相关的常用术语,例如数据捕获,数据挖掘甚至数据窥探。所有这些都指向数据挖掘的不同变体,这些变量用于抽样可能太小而不能产生统计推断的小数据集。然而,这些对于概述使用中的数据的有效性至关重要,并且可用于在期待达到给定数据群时创建假设。
另一方面,数据仓库是描述组织中用于数据收集的系统的术语。由数据仓库收集的数据是交易系统提供的数据,例如发票,购买记录甚至贷款记录。数据记录取自各个创建点,并在一个屋檐下汇集在一起,即数据仓库。然后报告该数据并以聚合的方式完成报告,以帮助用户做出有效的商业信息决策。要有效工作的数据仓库需要数据源,数据库和报告工具。 因此,可以说数据仓库是用于报告已分析数据的特定目的的数据库。这些数据来自用于报告的不同系统。 为了完成其功能,数据仓库将功能保存在三个不同的层中。这些包括登台,集成和访问。在暂存过程中,原始数据由开发人员存储,仅用于分析和支持。集成层用于数据集成,并具有数据用户的抽象级别。最后,访问层对于从不同的数据用户获取数据非常重要。 数据挖掘和数据仓库都可以称为用于收集商业智能的工具。两者的主要区别在于商业智能的收集方式。因此,可以说已经很好地存储的数据很容易挖掘并因此利用。因此,数据仓库负责使数据挖掘的工作更容易,以便容纳需要在中心位置挖掘的所有相关数据,而不是在数据挖掘必须继续寻找不同位置的数据时。这有助于节省数据挖掘所花费的时间和挖掘中使用的资源。
摘要 数据挖掘是从大型数据集中提取数据的过程。 数据仓库是将所有相关数据汇集在一起的过程。 数据挖掘和数据仓库都是商业智能收集工具。 数据挖掘在数据收集中是特定的。 数据仓库是一种通过将来自组织不同区域的不同位置的数据集中在一起来节省时间和提高效率的工具。 数据仓库有三层,即登台,集成和访问。