数据挖掘和数据仓库
数据挖掘与数据仓库
术语“数据挖掘”和“数据仓库”与数据管理领域有关。这些是数据收集程序,主要用于研究和分析大量数据中的统计数据,模式和维度。
数据挖掘
术语“数据挖掘”用于涉及根据各种观点分析数据并将该数据总结为有用信息的过程。数据挖掘软件处理信息,以便在成本削减或收入增加或两者兼有的情况下调节数据。
数据挖掘程序通过基于用户生成的数据和查询识别特定趋势来跟踪深入研究和信息收集。数据挖掘软件的主要目标是识别异常模式,特别是与财务相关的现场欺诈,并生成引导程序以加强营销。
由于收集了大量数据,主要使用数据挖掘软件。数据通过扫描仪,直接邮件响应,ATM机,Web服务器日志,人口统计数据,闭路摄像机,信用卡交易以及许多其他来源进行。在进行任何分析之前,必须对所有这些信息进行验证和总结。此过程归类为数据仓库。下一步是通过数据挖掘中集成的各种程序对这些信息进行排序。
数据挖掘软件利用各种步骤。第一步是数据的预处理,包括:数据选择,数据清理,噪声消除和数据转换。在创建这些公共信息单元之后,生成新字段。下一步是构建数据挖掘模型。这里生成一个前瞻性模型来总结有用的信息。最后一步是评估数据挖掘模型。
目前数据挖掘是必要的,主要是由于业务竞争日益激烈。这些公司在服务,个性化,安全性和实时企业方面进行竞争。
数据仓库
数据仓库是收集和存储数据的过程,以后可以对数据进行分析以进行数据挖掘。数据仓库是具有大存储容量的复杂计算机系统。来自所有源的数据被定向到此源,其中清除数据以移除冲突和冗余信息。数据仓库的过程实现了集中数据访问。
精心复杂的数据捕获和处理技术是组织建立有效和高效数据仓库设施的主要来源。这些是公司保持盈利能力,效率和竞争优势的重要资产。收集的数据通过称为数据生命周期管理的过程传递。
数据仓库利用相关数据库管理系统的技术作为提取,加载,转换和关系在线应用程序处理。数据仓库技术有四个特征。它们是:基于主题的设计,与数据的集成,状态的非易失性图像,数据的数据和时变视图。
摘要:
- 数据挖掘和数据仓库技术是数据管理系统的一部分。
- 数据仓库主要涉及数据收集,而数据挖掘涉及分析和总结组织的重要信息。
- 数据挖掘和数据仓库过程的技术是不同的。