您当前的位置:首页>论文资料>神经网络在数据挖掘中的应用

神经网络在数据挖掘中的应用

资料类别:论文资料

文档格式:PDF电子版

文件大小:2.2 MB

资料语言:中文

更新时间:2024-12-20 15:28:32



推荐标签:

内容简介

神经网络在数据挖掘中的应用 数字执本与率用
神经网络在数据挖掘中的应用
曲宏锋
(广西师范学院广西南宁530012)
应用研究
摘要着信息技术的发展人们对数据的综合处理未来越重视但是由于数据涉及的范图大、信息的内容杂,导致数据的分析和使用的过程之中存在着一定的问题。而神经网络在数据挖抵中的应用电逐渐得到体现。对数据挖据和神经网络分别进行相关了解,以此为基础对神经网络在数据挖据中应用过程进行分析总结
关键词:数据神经网络数据挖据
文献标识码:A
中图分类号:TP311 1引言
文章编号:1007-9416(2015)12-0117-01
据进行很好的处理,与此同时还能够保证较低的错误率。
4.1数据准备
信息在数据库中被搜集出来通过统计、人工智能、情报检索、在线分析处理、机器学习等多种方法来进行数据的整理和分析,将数据整理的结果应用于商业管理,工程开发、股票管理和科学研究等多个方面。随着社会的不断进步人们对数据的要求也逐渐的增加,通过对数据的收集和分析来解决问提并提供更加可行的方案。而面对数据时代中大量的数据其中有真有伪,如何从中提取隐含在其中对决策有意义的信息,提高信息资源的利用率成为信息时代取须解决的问题。这一需求就要求我们不断推进神经网络的研究和技术深化数字挖掘,才能让神经网络在数据挖掘中进行应用,方便社会中
商业、科研等各领域的使用。 2数据挖据
从海量的数据库中挖据信息的过程挖据就称之为数据挖据(DataMining)。简而言之,数据挖据就是从大量的、随机的数据中,提取隐含在其中的、但是又是潜在有用的信息和知识的过程2
数据挖据的主要流程是获取和整理数据的来源、使用相关的技术和知识、整合和检查数据、删除隐含着错误的数据、建立模型和假设、进行数据挖据、测试和检验数据挖掘结果最终将挖掘的数据进行应用
数据挖掘的主要功能数据的分类是指在数据挖掘的过程中将数据库之中根据不同事物的属性、特点的不同进行划分,利用不同的组类来描绘事物以使对事物进行了解;数据的聚类是指根据分析对象的内在规律将数据库中的数据进行群组的划分,将整个数据库划分出不同的群组,并保证同一群组中数据的相似性以及不同群组之间有一定的差别,数据的关联规则和序列模式是指找出数据库中具有相关性的数据,就是某一事物在发生变化之后与之就有相关性的数据也会发生这一变化,数据的偏差检测是指针对数据中极少数
的极端数据、偏差数据进行分析,找出其中的内在原因。 3人工神经网络
人工神经网络是某种抽象、简化和模拟,根据神经网络的结构和功能,先后提出的神经元模型有上百种。
人工神经网络的主要优势是具有自学习功能。这种自学习功能能够在图像识别的过程中进行使用,只要把多个图像样板和需要识别的结果输人到神经网络之中就能够通过自学习功能对图像进行识别。这一功能对未来的预测具有极其重要的意义。通过人工神经网络对未来进行预测能够为经济、股市,市场等提供发展方向,推动经济发展,通过人工神经网络对一复杂间愿进行大量的计算来寻求优化解。这一功能主要是依靠神经网络的高速运算能力来完成的,
能够在短期内对间题进行优化解。 4神经网络在数据挖据掘中的应用
在最开始神经网络应用于数据挖据之中并不被众人所看好,其主要原因是由于神经网络再解释自身行为上的能力欠缺以及神经网络容易出现过度训练,造成训练数据效果好面检验数据的效果不佳等问题造成的。然而不可忽视的是神经网络在数据挖据应用的过程之中的优势,可以用于数据中有时间单元的情况还能够对噪声数
收稿日期:201510-16
数据准备是整个数据挖掘之中至关重要的一项。只有数据准备的过程之中对数据进行合理处理、定义和表示,才能让数据挖掘的过程之中顺利的对数据进行的使用和分析。
数据清洗是指数据在装入数据库之前,通过基于规则的方法对字段定义域以及其与其他字段的相互关系对数据进行评估,通过可视化的方法将数据集以图形的形式展现出来,能够更快速的分辨脏数据;利用统计学方法更改错误数据,填补缺失数据。数据选择则是通过列和行利用SQL语言对本次数据挖掘所需要的数据进行选择。
数据处理是利用新字段、数据值的比例变换等方法对数据进行个增强处理。这种信息增强处理不仅能够提高数据挖掘的质量而且能够降低数据挖掘的时闻消耗,提高效率。由于神经网络只能够对数值性的数据进行处理,这就要求我们对数据进行转换,将文本数据处理成与之相对应的映射表,从而转化成为神经网络数据挖据算法能够接受的形式。
4.2规则提取
目前,规则提取主要使用的方法有符号方法和连接主义方法两大类。符号方法基于租集理论,决策树等技术支持,对分类知识进行分类规则的转换;而连接主义方法则主要在其结构中进行知识的存储但是不利于人们的理解。神经网络的这一方法不利于数据的挖掘,但由于神经网络分类精度高、鲁棒性好等优点在分类问题中表现突出,大多数的学者更注重专研从神经网络中进行提取规则。
4.3规则评估
在一个数据库之中隐藏着大量规则,为了在给定数据库中取得好的效果要对提取的原则进行最优的评估。规则评估主要从以下几方面进行考虑:首先要覆盖所有神经网络的知识,其次规则判定与神经网络知识相一致,再次判定是否存在相同前提下得出不同结论的规则,最后判断是否存在元余规则。规则的正确性能够保证神经网络中的知识全部被提取,也能够保证提取规则与神经网络的一致性
5结语
目前采用神经网络进行数据挖掘是比较常见的方式,因为能够对大量的数值性数据进行快速的处理,但是仍存在着文字数据等非数值型数据的处理、构造神经网络时要求对其训练许多速等多种问间题。这些问题都需要在将来的神经网络在数据挖据的应用之中逐渐的解决,这些问题的解决能够给神经网络在数据挖掘的应用带来更
强大的生命力,参考文献
[1]沈达安,等.万维网知识挖据方法的研究.计算机科学2000,(2):79-8210.
[2]王利强,等.基于Web的数据挖据.计算机应用.1998(10):9-1211E
[3]张莉芬,黎明.周琳霞.浮点数与格雷二进制混合编码的遗传算法[J].南昌航空工业学院学报2001.15(2):2730.
作者简介:南宏锋(1989一),男,迁宁大连人,广西师范学院2014级硕士研究生,院系:计算机与信息工程学院研究方向计算机应用技术
117
上一章:我国高校图书管理中的数据挖掘平台建设分析 下一章:浅析数据挖掘算法在入侵检测中的应用

相关文章

动态关联规则在网络数据挖掘中的应用 复杂网络数据挖掘在智慧旅游系统中的应用研究 数据挖掘在“工程任务课程化”公路网络建模中的应用 虚拟化技术在网络数据中心建设中的应用探讨 神经网络及其在汽车工程中的应用 典型人工神经网络在图像复原中的应用 神经网络、模糊系统及其在运动控制中的应用 BP神经网络在机床故障诊断应用中的改进