
第36卷,第6期 2016年6月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
Vol. 36,No. 6 ,pp1685-1689
June,2016
基于置信学习机与近红外光谱的煤种快速分类方法
王雅圣,杨梦”,骆志远”,王酉,李光,胡瑞芬 1.浙江大学智能系统与控制研究所,工业控制技术国家重点实验室,江杭州310027
2 . Computer Learning Research Centre , Royal Hollow ay , University of London , Egham Hill, Egham , Surrey TW20 oEX, UK
摘要基于近红外光漫反射谱技术的检测分析具有简单,快捷,安全等优势而被广泛应用于各行各业。应用近红外光谱分析技术实现不同煤种的快速分类,该方法可以替代费时费力费财的传统化学分析方法。同时首次将置信学习机(confidencemachine)引入近红外分析中,实现了对分析结果的风险评估。采集了来自不同矿区共四种不同煤种(肥煤,焦煤,瘦煤和贫瘦煤)的199个煤样本的近红外光谱,通过机器学习的方法针对煤的近红外光谱构建了煤种分类器来实现煤种的快速分类。在近红外分析中引人了置信学习机的分析方式,结合支持向量机(SVM),构建了离线和在线的CM-SVM分类器。置信学习机是一种概率方法,使用概率(CM-SVM)来取代分类超平面(SVM)进行分类,不仅分类效果好于传统的SVM,达到了95.48%的分
定,得到不同置信度下预测区间,该区间的预测正确率是与置信水平严格对应的,对于产品质量控制有非常重要的意义。置信学习机同时是一种在线的学习模型,新样本的不断加入会提高模型的性能,非常适合于工业现场的在线分析。在线的CM-SVM模型随着样本数的增加,预测结果的置信度有所提高,对工业现场近红外分析有重要意义。
关键调近红外光谱:煤种分类;置信学习机;支持向量机
中图分类号:0657.3
引言
文献标识码:A
DOI : 10. 3964/j- issn. 1000-0593 (2016 )06-1685-05
针对利用近红外光谱进行检测信息挖掘的特点,本文中将首次在近红外分析中引人由VladimirVovk和Alexander Gammerman提出的置信学习机(ConfidenceMachine,
煤是我国最主要的能量来源,根据煤的煤化程度以及不
同工业和商业用途,需要接照其理化性质针对不同的应用来进行分类,不同的煤种应用不同,品质和价格也不同,目前对煤种的分类主要依据煤的化学工业分析方法对相关的理化性质进行测定和评价分类,如挥发分,灰分,热值,站结指数等,其结果虽然比较可靠,但是费时费力。
近红外光谱分析是近年来发展迅速的化学分析方式,具有简单快捷,无须对样本进行预处理,成本低廉安全方便等优势1-2],利用化学计量学方法对近红外光谱进行挖掘建模,能够有效地对复杂混合物中的理化性质进行定量以及定性分析3)。近年来已有国内外学者利用近红外对煤质参数(如水分,灰分等)进行分析[4-8],取得良好的效果。本研究利用近红外光谱对煤种探索快速分类的办法,
收稿日期:2015-04-20,修订日期:2015-08-16
CM)-11]。置信学习是一种概率计算框架,能在各种基础算法上改进以进行预测输出,有如下特点:(1)既可以进行“点”预测,也可以进行“域"预测,点预测的同时,给出该预测点的可靠信息,域预测则将所有满足置信度要求的预测值进行输出,在该置信度的规约下,得到的预测结果其风险是确定的。(2适合于在线工作方式,在对样本进行预测后将该样本的类标加人到已知的样本序列中,在预测的同时不断地进行学习。本文将构建基于支持向量机的置信学习机CM-SVM,应用于煤的近红外光谱进行煤种分类,得到分类结果的同时给出分类结果的可靠程度的信息,并且可以根据置信度的设置使错误率得到严格控制的预测区间输出,是一种全新的近红外定性分析方式。同时,构建在线的CM-SVM学习算法,考查样本数增加对分类效果的影响,
基金项目:国家高技术研究发展技划项目(2013AA041201)和浙江省科技计划项目(2015C37062)资助
作者简介:王雅圣,1988年生,浙江大学控制科学与工程学系博士研究生
*通讯联系人
e-mail : 0011377@ zju, edu, cn
e-mail : xuanyu306@ 163, com