
数事执术与率用
应用研究
数据挖掘在广播设备运行和维护中的应用
侯利勤
(国家新闻出版广电总局554台河南郑州450100)
摘要:随着信息化在现代化广播发射电台科学发展中的地位和作用越发重要,信息化已经是广播发射电台推递管理创新的迫切需要,是广播发制电台全面可持续发展的不端动力。数据挖抵技术对信息化的现代化广播发射电台的管理、运行和炸护工作有十分的现实意义。
关键词:数据挖抵运行维护
中图分类号:TN913.33
文献标识码:A
文章编号:1007-9416(2014)10-0043-01
随着各类信息化系统在广播发射电台的大量普及和应用,积累和产生了大量的信息数据,这些信息数据包含着很多对我们有用的数据,深人的分析和利用这些数据对我们了解和掌握发射机的参数有着很大作用。数据挖掘概念的引人无疑对广播发射电台的科学维
护、规范运行具有重要的意义。 1数据挖掘的定义
所谓的数据挖掘就是从大量随机的,需杂的,有噪声的数据中提取隐含在其中我们事先不知道,但是对我们有作用的信息和数据的过程。近年来,各行业信息量的激增,引发了诸多学者对数据挖据方法的探索。
我们所说的数据融合、数据分析以及决策支持都属于数据挖掘。数据挖掘要求数据源必须是大量真实包含噪声的;通过挖掘产生的对于我们可以接受的有用数据必须是我们需要的,他不需要是定理式的通用数据,关键是为我们的决策产生作用。原始数据的呈现可以是结构化像关系数据库中的数据,或者是半结构化的文本,图形和图像数据,基至还有分布在网络上的异构型数据等多种存在的形式。发掘数据的方式也是多样的。可以是演绎的,也可以是归纳的。发现的数据我们可以用来优化我们的查询数据,也可以支撑我们的决策或者是对数据自身的维护。因此,数据挖据是一门交叉学科,他为我们对数据低层次的查询应用,提升到挖掘内容,为我们的决定提供支撑。这里所说的知识发现,不是传统意义上的科学定理和科学的公式,实际上,所有发现的知识都是相对的,是有特定前提和约束条件,面向特定领域的,同时还要能够易于被用户理解。最好能用自然语言表达所发现的结果,这无疑对我们提高设备运维的科学化、针对性和实用性有着非凡的意义,
数据挖据技术的意义是可以帮助我们从繁杂元余的数据库里,快速的找的可以为我们所用的隐含的的有价值的信息。数据仓库和数据挖掘都是决策支持新技术,但他们有着完全不同的辅助决策方式。数据仓库中存储着大量的辅助决策的数据,为不同的用户随时提供各种辅助决策的随机查询、综合信息或趋势分析信息。数据挖掘是利用一系列算法挖掘数据中隐含的信息和知识,让用户在决策中使用。
因此,可以简单地说,数据挖揭主要目的是从大量的信息数据
里面挖掘的我们可以用的信息。 2数据挖掘系统的主要组成
采用数据挖掘的广义观点:数据挖掘是从存放在数据库,数据仓库或其它信息库中的大量数据挖掘有趣知识的过程。基于这种观点,典型的数据挖掘系统具有以下主要成分
知识库:这是领域知识,用于指导搜索,或评估结果模式的兴题度。这种知识可能包括概念分层,用于将属性或属性值组织成不同的抽象层。用户确信方面的知识也可以包含在内。可以使用这种知收稿日期:2014-10-07
识,根据非期望性评估模式的兴趣度。领域知识的其它例子有兴起度限制或阅值和元数据,
数据挖掘弓擎:这是构建数据挖掘系统的基础组成部分,有计算的功能模块组成,可以为我们提供像事物关联,分类,演变和偏差之类的分析过程。
模式评估模块:通常,该部分使用兴趣度度量,并与挖据模块交互,以便将搜索聚焦在有趣的模式上。它可能使用兴趣度阅值过滤发现的模式,模式评估模块也可以与挖掘模块集成在一起,这依赖于所用的数据挖掘方法的实现,对于有效的数据挖掘,建议尽可能地将模式评估推进到挖据过程之中,以便将搜索限制在有兴趣的模式上。
图形用户界面:该模块在用户和挖据系统之间通讯,允充许用户与系统交互,指定数据挖掘查询或任务,提供信息、帮助搜索聚焦,根据数据挖掘的中间结果进行探索式数据挖据。此外,该成分还允许用户测览数据库和数据仓库模式或数据结构,评估挖据的模式,以不同的形式对模式可视化。数据挖据涉及多学科技术的集成,包括数据库技术、统计、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息提取、图象与信号处理和室间数据分析。通过数据挖掘,可以从数据库提取有趣的知识、规律,或高层信息,并可以从不同角度观察或测览。发现的知识可以用于决策、过程控制,信息管理、查询处理等等,因此,数据挖据被信息产业界认为是数据库系统
最重要的前沿之一,是信息产业最有前途的交叉学科。 3数据挖据的主要任务
数据挖掘的任务主要对数据进行关联分析以及聚类,预测,偏差等一些分析以此来得出对自已有帮助的数据。
3.1关联分析
关联规则:两个或两个以上变量的取值之间存在某种规律性,就称为关联。数据关联是数据库中存在的一类重要的、可被发现的知识。关联一般分为简单关联、时序关联和固果关联三种。对关联分析为的是找到事物内部存在的关系。常用支持度和可信度两个阅值来衡量关联规则的相关性,并且同时辅助以兴趣度、相关性等参数,从面使得所挖掘的规则更符合我们需求。
3.2聚类分析
聚类是把数据按照相似性归纳成著干类别,同一类中的数据彼此相似,不同类中的数据相异。聚类分析可以建立宏观的概念,发现数据的分布模式,以及可能的数据属性之间的相互关系。
3.3分类
分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。分类是利用训练数据集通过一定的算法而求得分类规则。分类可被用手规则描述和预测。
..··.下转第45页
作者简介:侯利勤(1976一),女河南兼阳人,本科,毕业于河南广搭电视大学,助理工程师,研究方向:广搭电视传输发射,