
数字技术与应用
可视化数据挖掘技术的应用研究
,应用研究·
张敏辉1赖麟:
(1.四川教育学院计算机科学系四川成部611130,2.四川教育学院四川成部611130)
摘要;数据挖插方法结合了机器学习,模式识到,统计学,数据库和人工智能等众多领城的知识,是解决从大量信息中获取有用如识,提供决策支待的有效速径,具有广泛的应用前景。本文通过对可视化数据花板进行分类和总站,提出将可视化数据类型和可视化与数据批据站合的忌越,可视化数据抢报技术将成为今后数据挖摄领域中研究的热点。
可视化数据挖摄
信息可视化
关键词:数据挖板
中图分类号:TP317.4 引言
文献标识码:A
文章编号:1007-9416(2010)11-0022-01
可视化技术是一种良好的结果分析工具,在
信息技术的迅速发展已将我们从简单的批处理,联机事务处理的信息处理时代,带人了联机分析处理、数据仓库和数据挖掘的信息分析时代。信息在组织发展中的重要作用越来越得到人们的认同,许多组织都开发了各种信息收集处理系统。这些系统不仅给组织带来信息处理的便利,也给组织带来大量宝贵的数据。这些数据背后隐含着事先未知的,具有潜在有用价值的信息,如何才能发据这些知识,传统的信息处理工具已经不能应付这一要求,我们需要一种方法,自动地分析数据,自动地发现和描述数据中隐含的信息,对数据进行更高层次的分析,以更好的利用这些数据,
1数据挖掘
1.1数据挖拥的定义
数据挖据是指通过从数据库中抽取隐含的、未知的、具有潜在使用价值信息的过程。数据挖掘包含一系列从数据库中发现有用而未发现的模式的技术,通过使用统计分析和模型技术揭示数据集中的模式和关系。
1.2数据挖抵的过程
(1)确定挖掘对象。定义清晰的挖掘对象,认清数据挖掘的目标,2)准备数据,确定数据挖撕对象后,需要选择适合于数据挖掘应用的数,需要对数据进行预处理并分组,以提高数据挖掘的效率、降低模型的复杂程度。(3)挖掘模型的构建,将数据转化成一个针对挖据揭算法建立的分析模型。建立一个适合挖掘算法的分析模型,是数据挖掘成功的关链。(4)数据挖据。对得到的经过转化的数据进行挖掘。(5)结果分析,数据挖出现结果后,对挖掘结果进行解释并且评估。
数据挖掘结果模型评估
数据挖掘引装
数据库或数据仓库服务器
文本文件件
22
图1
数据库/ 数据仓库
数字技术与应用方方数据
许多情况下,利用可视化技术可将数据挖掘结果表现得更清楚,更有利于对数据挖掘结果的分析。
2可视化数据挖据
2.1可视化数据挖掘的定义
可视化数据挖掘技术是用数据可视化技术,从大的数据集中将数据转换为图形或图像,在屏幕上显示出来,并且进行交互处理的理论,方法和技术,可视化数据挖掘是可视化技术和数据挖掘技术的融合。利用可视化可以很清楚地发现隐含的和有用的知识,可规化数据挖据是从大量数据中发现知识的有效途径。把可视化技术应用到数据挖掘之中,有助于人类更好,更方便地理解数据的含义,使用户能在较高的抽象层次上观察数据,方便用户找出潜在模式,更好地理解数据挖摄的结果,
2.2可视化数据挖掘技术的分类
本文结合Fayyad数据挖过程模型121, 将可视化技术主要用于数据挖掘的如下几方面(图1):
(1)数据可视化,数据可视化是将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程,数据能够用多种可视化方式进行描述,如盒状图、三维立方体,曲线,曲面,数据分布图表、连接图等。这种数据的可视化显示能把数据库或数据仓库中数据待性的总体印象提供给用户,让用户明白挖播的方向。
(2)数据挖据过程的可视化。数据挖掘过程可视化是用可视化过程描述数据的挖掘过程。通过此过程,用户可以看出数据是从赐个数据库或数据仓库中取出,怎么抽取,以及清理、集成,预处理的过程,还可以看到数据挖掘采用的方法,结果存储的地址及显示方式。
(3)数据挖掘结果可视化。数据挖掘结果可视化是将数据挖掘后得到的结果,用可视化的形式表现出来,如表示为散列图、盒状图等形式,决策树、关联规则、化规则等也可通过可视化描述,这样便于用户理解数据挖揭的结果。
(4)交互式可视化数据挖据.交互式可化数据挖据是指可规化数据挖掘在交互式的数据挖插过程中,使用可视化工具。用户可以通过交互式手段改变过程所依据的条件,并且观累其影响。通过这种勘探式分析,在不使用自动数据挖据技术的情况下,允许用户高效地寻找和发现模式,帮助用户微出正确的数据挖掘决策。
Digital technokogy and application
米
3数据挖掘结果模型的可视化技
本文采用通用预测建模标准语言PMM L来表示各种数据挖掘结果模型13,PMML 是利用XML本身特有的自描述性和数据分层思想来实现数据挖据模型的播述、管理标准化和可移植性。
xmlns="http://www.dmg.org/PMM L-4_0°
xmlns;xsi="http://www.w3.org/200 1/XMLSchemainstance">
formationDictionary>
- .-
sformations>
4结语
随着数据挖捆技术的深人发展和数据挖掘技术的广泛应用,可视化数据挖涵技术已成为数据挖掘技术领城的热点之一,将可视化技术与数据挖掘过程有机融合已经受到非常广泛的关注。
本文深人研究了数据挖掘技术,可视化技术;研究了数据挖掘技术实施步骤、主要挖掘算法及使用的技术,在后续研究中,对于数据挖掘模块,还要更深人地应用交互技术,加强用户自主性,增加可以将挖据模型
的中间结果数据的功能,参考文献
[1]陈京民编著.数据仓库与数据挖据技术,北京;电子工业出版社,2002,
[2] Simeon J.,Michael H.,Arturas Mazeika.
Visual Data Mining: An Introduction and Overview,Springer Berlin/ Heidelberg. 2008
[3] Hans—J6rg Schulz, Thomas Nocke,Heid run Schumann.A framework for visual data mining of structures,Proceedings o f the 29th Australasian Computer Scien ce Conference.2006,16(19); 157—166.