什么是数据挖掘?( 二 )

数据挖掘(data mining)又称为数据库中的知识发现(KDD),是指从存放在数据库、数据仓库或其他信息库中的大量数据中挖掘出有趣知识的过程。近年来为了推动数据挖掘在实际中的应用,许多研究者对数据挖掘系统的体系结构做了大量的研究工作. 一个结构合理的数据挖掘系统应该具有以下几个特点:1)系统功能和辅助工具的完备性;2)系统的可扩展性;3)支持多种数据源;4)对大数据量的处理能力;5)良好的用户界面和结果展示能力。当前出现的数据挖掘系统主要包括集中式的和分布式的数据挖掘系统,而每种系统的具体结构及其各个组成部分却有多种不同的实现技术和实现方式。

数据挖掘的概念

数据挖掘是通过仔细分析大量数据来揭示有意义的新的关系、趋势和模式的过程+其出现于20世纪80年代后期,是数据库研究中一个很有应用价值的新领域,是一门交叉性学科,融合了人工智能、数据库技术、模式识别、机器学习、统计学和数据可视化等多个领域的理论和技术!数据挖掘作为一种技术,它的生命周期正处于沟坎(chasm)阶段,需要时间和精力去研究、开发和逐步成熟,并最终为人们所接受。由于数据挖掘是数据库中知识发现(knowledge discovery in databases,KDD)的核心步骤(如图1所示),发现了隐藏的模式,所以从模式处理的角度,许多人认为两者是等同的。

推荐阅读