
最事技术专皮力
数据挖掘技术在教学管理系统中的应用
程俊静林意
(江南大学信息工程学院江苏无锡214122)
应用研究
播要:根据教学管理系统的特点,采用数据挖据技术,介绍了决策树中ID3算法,并以高职院校机械类学生机加工实习为对象,研究了数据挖抵技术在教学管理系统中的应用,为改善课程教学效果提供科季依据。
关键调:数据挖据决策树ID3算法
中图分类号:TP311.5 引言
文献标识码:A
文章编号:10079416(2011)05018502
高等职业院校是培养高索质技能型人才的基地,把学生能力的培养作为教学的核心。这几年,随着计算机技术,通信技术和网络技术的发展,高等职业院校建设了校园网,构建了基于校院网的教学管理系统。通过网络收集、查询、统计、打印各种教学信息,但是,通过深入分析数据,指导教学改革,提高教学质量的工作很薄弱。将数据挖据技术应用于教学管理系统,可以充分发挥教学管理系统的潜能。本文结合盐城纺织职业技术学院机械专业机加工实践课程,使用ID3决策树算法生成决策树分析学生实践考核成绩,找出影响学生成绩的潜在因素并进行分析,为提
高该课程的教学效果提供参考依据。 1、数据挖掘技术
数据挖掘(DataMining.DM)就是对庞大的数据或数据库进行分析,自的是发现未知的关系和以数据拥有者可以理解并对其有价值的新额方式来总结数据[1]。数据挖掘可以帮助人们从数据库、数据仓库相关的数据集中提取出感兴趣的知识,规则或更高层次的信息,主要是分类规则、聚类规则、关联规则、预测趋势等,升可以帮助人们从不同程度上去分析它们,从而可以更加有效地利用数据库。
数据挖掘技术主要有集合论法、决策树法、遗传算法、神经网络方法等。决策树又分为ID3算法、CLS算法、IBLE算法等。数据挖掘技术在大型超市、电信、金融等积累有大量数据的行业有着广泛的应用,在高等院校,学生人数多,课程种类多,成绩数据多,还有大量的与学习成绩相关的因素信息,传统的学习成绩分析方法已经不能满足教学研究的要求,对此可以引入数据挖掘技术找到影响学生成绩的真实原因,制定相应的措施,提高教学质量。
2、决策树ID3算法
ID3是基于信息摘的决策树分类算法,根据属性集的取值选择实例的类别。ID3的算法核心是在决策树中各级结点上选择属性,用信息增益作为属性选择标准,使得在每一个非叶子结点进行测试时,能获得关于被测试例子最大的类别信息,使用该属性将例子集分成子集后,系统的摘值最小。期望该非叶子结点到达各后代叶结点的平均路径最短。使生成的决策树平均深度较小,提高分类速度和准确率。
设S是s个数据样本的集合。假定类标号属性具有m个不同值,定义m个不同类C,(i=1,2,3...m)。设s,是类 C,中的样本数。对一个给定的样本分类所需的期望信息由公式(1-1)给出:
Zp,log(p)
I(1,S2S.)-
万方数据
(11)
S,
其中P,是任意样本属于c,的概率,一般可用s来估计。设S,是子集S,中类C,的样本数。由A划分成子集的摘的
计算公式如(1-2):
+++ [(s,+g)
E(4)=>
台
值越小,子集划分的纯度越高。
(12)
对于给定的子集S,,其期望信息由公式(1-3)给出:
小
Zp,log(p)
I(s)
(13)
由期望信息和摘值可以得到对应的信息增益值,由公式(1-4)得到:Gain(A)_I(s,S..,S.)-E(A)
(1-4)
Gain(A)是由于获得属性A的值而导致的摘的期望压缩,决策树算法就是计算每个属性的信息增益,将具有最高信息增益的属性选作给定集合S的测试属性,创建一个节点,并以该属性
标记,对属性的每个值创建分枝,并且据此划分样本。 3、决策榭在机加工技能考核成绩分析体系应用
3.1数据预处理
高职院校机械类学生都有机加工实习,一般要求通过国家劳动保障部的职业技能考核,考核分为理论知识与操作技能两部分。在课程改革过程中,机加工这种基础性实习的学时被大大压缩,在有限的学时内如何安排理论复习与上床时数,如何针对不同的学生因材施教,我们通过学院教学管理系统的学生成绩库,收集相关的数据,进行数据挖据。我们提取字段有,编号、性别、理论成绩、上床操作时数、操作技能成绩,重新组成一个挖掘数据库,以便在应用数据挖据时操作更加方便高效。提取出的挖掘数据库信息如表1所示。
表1筛选后的操作数据
输号 1 2 3 4 5
床时 96 48 96 48 48
理论较好较差较差较差较好
性别男
男女
成绩优秀及格般及格般
6185