您当前的位置:首页>论文资料>数据挖掘技术在企业职工培训中的应用

数据挖掘技术在企业职工培训中的应用

资料类别:论文资料

文档格式:PDF电子版

文件大小:182 KB

资料语言:中文

更新时间:2024-12-20 15:34:00



推荐标签:

内容简介

数据挖掘技术在企业职工培训中的应用 应用研究
数据挖掘技术在企业职工培训中的应用
胡玉琦
(太钢职工教育培训中心山西太原030003)
数事教本与用
摘要:本文阐述了数据挖据的基本理论,介结了如何建立职工培训数据仓库,进行概念模型、逆辑和物理模型的设计。通过SqlServer2005 提供的数据挖据模型对职工培训信息进行挖据,得出影响职工培训结果的结论,降低培训成本,提高培训效率。这费分析在企业培训工作的开展与改进有着一定的指导意义。
关键词:数据挖据SqlServer2005职工培训培训成本
中图分类号:TP311.13 1、综述
文献标识码:A
文章编号:1007-9416(2011)11-0120-02
李段名
数据挖据技术在商业、金融业等方面得到了广泛的应用,而在培训领域应用相对较少。企业对职工信息、培训结果等数据的处理一般还停留在简单的数据库管理和查询阶段,还不能发挥其用数据信息为培训工作作出决策的作用。
本文的工作就是以职工培训信息为背景,建立职工培训数据仓库,利用数据挖掘技术对建立的数据仓库进行深人分析,得出有用
的结论指导培训工作,节省企业培训成本,提高培训效率。 2、数据挖据概念
2.1数据挖据定义
数据挖掘是从大量的、不完整的、有噪声的、模糊的和随即的数据中,提取隐含在其中的,人们事先不知道的、潜在的和有价值的信息和知识的过程。
2.2数据挖抵的技术
最常用的数据挖掘技术主要有决策树、关联规则、贝叶斯、神经网络、聚类分析、模糊集和粗糙集等。
2.3数据挖据的步骤
数据的挖据过程主要包括5个阶段:数据准备、数据选择、数据
预处理、数据挖掘、转换模型及模式评价, 3、培训数据仓库的建立
数据仓库研究和解决从数据库中获取信息的问题。通过对在册职工的信息及职工已经获得的培训结果进行分析,可以发现这些信息中包含了大量的基础数据和培训结果数据,
3.1职工培训数据仓库模型设计
概念模型设计完成的工作是界定系统边界和确定主要的主题培训数据库中存贮的是职工的基本信息和培训结果信息,比较单一,又有一定联系。运用数据仓库的理论和方法,对这些数据进行综合、提取,可产生支持培训决策所需要的信息。根据职工的特点及培训结果建立主题的原则,把职工培训结果分析作为主题建立职工培训数据仓库。如图1,
职工学息培训课理得息
数据课 120 成方数糖
抽新
职工炼调结果数据
仓享



数据集市。图1
营含dvo 服务: OLAP服务器
应用服务。
综合变动
分析工具
信息服示
Sfth Xe b
x 2y Gra Cj Zrr p Gzs, 61
学段描速身份证号姓名海年龄学历专业典位名称尚位类别职务名称糖的管速参加工作时间工龄
字段名 PxmID Pxxmsc jsID Fasy Pxnr Pxks
字段名 pxjeiD Pxi Sfzh pxxeID Px jgse 图2
3.2职工培训数据仓库物理设计
字段端递培调项目代码培调项目名标培调讲师代码培认时间培调内客增课时败
字段措速培训结果代码培训结果身份证号培训项首代码培训结果说明
物理模型设计是指数据在数据仓库中的存放形式和数据的组织。本数据仓库的核心数据库采用关系型数据库管理系统SQL server2005。这里列出针对职工培训信息模型的物理结构如图2,
4、职工培训信息挖掘
4.1关联规则
关联规则用来揭示数据与数据之间未知的相互依赖关系,评价标准主要是支持度和置信度。最小支持度表示项目集在统计意义上的最低重要性,最小置信度表示规则的最低可靠性
用P(A)表示事务中出现物品集A的概率,P(BA)表示物品集 A的事务中,出现物品集B的概率,它们的表达式分别为
支持度:Support(A→B)=P(AUB) 置信度:Confidence(A→B)=P(AB)
4.2用关联规则模型分析职工培训信息
本文抽用了职工信息及考试情况数据,用关联规则对这些数据进行操作,得出数据间的相关联系,被抽取的字段分别是单位、姓名、计算机等级等如表1。
(1)数据预处理。为了进行关联规则分析,需对数据进行概化,用符号A表示年龄,分段概化为:A1(小于等于30岁),A2(30岁-40 岁),A3(大于等于40岁)。用符号HH表示是否通过,概化为:HHI(通过)HH2(未通过)。数据进行离散化后,结果如下表2所示:
(2)对数据进行训练。其中通过的记录数为5951,未通过的记录数为1796,占总记录数的23.18%,用关联规则对表进行挖掘,规则如表3,
表中的每一行为一条关联规则,也就是说输入项和预测项有强关联性。
重要性也被称为兴趣度,可以用来对频繁项集和规则的度量。
上一章:数据挖掘在股票方面的应用 下一章:简述信息化行政服务平台在电子政务中发挥的作用

相关文章

数据挖掘技术在企业决策中的应用 起重技术 电力施工企业职工岗位技能培训教材 起重技术/电力施工企业职工岗位技能培训教材 管道安装/电力施工企业职工岗位技能培训教材 管道安装-电力施工企业职工岗位技能培训教材 锅炉钢架安装 电力施工企业职工岗位技能培训教材 锅炉本体安装 电力施工企业职工岗位技能培训教材 厂用电安装(电力施工企业职工岗位技能培训教材)