您当前的位置:首页>论文资料>数据挖掘研究综述

数据挖掘研究综述

资料类别:论文资料

文档格式:PDF电子版

文件大小:2.17 MB

资料语言:中文

更新时间:2024-12-20 15:59:51



推荐标签:

内容简介

数据挖掘研究综述 应用研究
数据挖掘研究综述
王栋
(中国普天信息产业股份有限公司北京100080)
联事共开与应用
摘要:大数据时代,所有企业都锋由数据驱动数据将成为企业和公共组织的重要资产。同时,企业更需要高效的大数据工具,让数据资产产生具正的价值。数据挖抵就是运用数据库、人工智能和数理统计等多方面技术从大量的实际应用数据中提取隐含信息和知识的过程,通过高度自动化地分析企业数据,做出归纳性的推理,从中挖据出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策。
关键调:数据挖据大数据市场营销企业决算中图分类号:TP311.13
文献标识码:A
文章编号:1007-9416(2014)02-0080-02
数据挖据又称数据库中的知识发现,是目前人工智能和数据库领域研究的热点问题。数据挖据已广泛地应用到社会的各个领域和行业,如商业领域中的客户关系,产品生产,市场营销等,金融领域中的股票交易市场、投资评估等,天文学领域的气象预报、气象灾害预测等,教育领域的高校学生管理、高校毕业生就业分析、高校教学质量的评估等。可以说,数据挖据实是处在知识创造过程中最核心
的位置,因此做好数据挖据工作具有十分重要的意义。 1数据挖据的定义和本质
对于数据挖掘一般有两种定义,从广义上讲,数据挖据,又称数
据库中的知识发现,是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程,就是从大型数据集中挖掘隐含在其中的、人们事先不知道的,对决策有用的知识的过程,原始数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本、图形和图像数据,基至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的,可以是演绎的,也可以是归纳的。发现的知识可以被用于信息管理,查询优化,决策支持和过程控制等,还可以用于数据自身的维护,从狭义上讲,数据挖揭则是指从特定形式的数据集中提炼知识的过程。
数据挖据的本质是很偶然的发现非预期但很有价值的信息。这说明数据挖据过程本质上是实验性的,数据挖据的一个特定属性就是要处理的是一个大数据集。这就意味着,由于可行性的原因,我们常常得到的只是一个样本,但是需要描述样本取自的那个大数据集。数据挖掘所得到的信息应具有先前未知、有效和实用三个特征。 2数据挖掘的发展背景
在这个信息爆炸的时代,如何从信息的汪洋大海中发现及时有用的知识,提高信息利用率呢?要想使数据真正成为一个公司的资源,只有充分利用它为公司自身的业务决策和战略发展服务才行,否必大量的数据司脂成为垃圾,基全成为包献。因此,面对人北被数据薄没却饥饿于知识的挑战,数据挖掘和知识发现技术应运而生,并得以蓬勃发展,越来越显示出其强大的生命力。
数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。激发数据挖掘的开发、应用和研究有如下四个主要的技术理由:(1)超大规模数据库的出现,例如商业数据仓库和计算机自动收集的数据记录,(2)先进的计算机技术,例如更快和更强大的计算能力和并行体系结构;(3)对巨大量数据的快速访问;(4)对这些数据应用精煤的统计方法计算的能力数据按据的移模块技历数产数十年的发展,其中包括数理统计、人工智能、机器学习。今天,这些成熟的技术,加上高性能的关系数据库弓擎以及广泛的数据集成,让数据挖揭技术在当前的数据仓库环境中进人了实用的阶段,
国内对数据挖掘的研究晚于国外。国家通过自然科学基金对数据挖据掘的研究进行支持,很多科研单位和院校都在这个领域获得了丰硕成果,这些单位包括中科院、清华大学、中国科大、复旦大学等他们的成果为我国在此领域的发展起到了重要作用,得到了学术界的高度重视。
3数据挖据常用的方法
利用数据挖揭进行数据分析常用的方法主要有分类分析、回归分析、聚类分析、预警分析、Web页挖掘等,它们分别从不同的角度对数据进行挖揭。
(1)分类分析。客户细分需要进行客户特征分析,即用数据来描述或给出客户或潜在客户特征的分析过程。它可以应用到客户的分类,客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等,如一个汽车零售商将客户按照对汽车的喜好划分成不同的类,这样营销人员就可以将新型汽车的广告手册直接邮寄到有这种喜好的客户手中,从而大大增加了商业机会
(2)回归分析。如何使用数据挖掘来对不同的旨在保留客户的活动中进行建模将对整鉴个客户保持工作起着重要的作用,这也就是流失模型价值所在,流失模型能预测账号在被激活后或少或停止使用一种产品或服务的行为。它可以应用到市场营销的各个方面,如客户寻求,保持和预防客户流失活动,产品生命周期分析、销售趋势预测及有针对性的促销活动等。
(3)聚类分析。通过分组聚类出具有相似浏览行为的客户,并分析客户的共同特征,更好地了解自已的客户,向客户提供更合适的服务。它可以应用到客户群体的分类,客户背录分析、客户购买趋势预测、市场的细分等。
(4)预警分析。数据挖揭方法可以为风险分析建立分类定位模型。在企业危机管理及其预警中,管理者更感兴趣的是那些意外规则。风险分析是提供产品或服务时存在潜在损失的行业所特有的。常见的风险类型出现在银行业和保险业,银行在放贷时存在金融风险。利用风险分析可以预测一个对象如期还贷或不还贷的可能性。-种贷款如抵押贷款或汽车贷款是安全贷款,另一种贷款如信用卡贷款为不安全贷款
(5)Web页挖据。Web因其易于导航、方便链接,融图形、音额视频信息于一体的优越特性,迅速流行于全球,所载信息量巨大。 Web页挖掘是利用数据挖掘技术从万维网的海量信息和数据中提取各种有用模式和信息,其中涉及到Web技术,数据挖掘、计算机语言学、信息学等多个领域的专业知识。对于企业面言,可以通过Web 页挖掘,收集与企业生存相关的社会环境信息、市场信息、竞争对手信息,客户信息等,及时对外部环境信息和内部经营信息作出反馈和决策,未雨蜀缪,以最快的速度解决企业面对的各种危机和潜在
作者简介:主栋,中国善天信息产业股份有限公司通信产业事业本部制总经理。 80
上一章:智能交通系统中数据挖掘技术的应用研究 下一章:C 语言集成Lotus Notes客户端实现邮件发送

相关文章

信息栅格环境下美军数据策略研究综述 基于点云数据的逆向工程技术研究综述 数据挖掘概念综述 液压挖掘机节能系统与控制策略综述 中医古籍数据库数字化建设发展综述 基于数据采集的能源计量信息系统设计与架构综述 挖掘机支重轮属性综述及损坏原因分析 混凝土碳化研究综述