
第36卷,第1期 2016年1月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
Vol.36,No.1-pp51-54
January,2016
基于Adaboost及谱回归判别分析的近红外光谱固态发酵过程状态识别
于霜1,2,刘国海"*,夏荣盛”,江辉” 1.苏州工业职业技术学院机电工程系,江苏苏州215000
2.南京航空航天大学机电学院,江苏南京210016 3.江苏大学电气信息工程学院,江苏镇江212013
摘要为了实现固态发酵过程状态的快速监测,以饲料蛋白固态发酵为实验对象,开展了基于近红外光谱分析技术的饲料蛋白固态发酵过程状态定性识别研究。首先利用Antaris直型傅单叶变换近红外光谱仪采集140个固态发酵物样本的近红外光谱,并采用标准正态变换(SNV)光谱预处理方法对获得的原始光谱进行预处理;其次,采用谱回归判别分析(SRDA)法对预处理后的近红外光谱进行特征提取:最后,采用最近邻(NN分类算法作为弱分类器建立固态发酵过程状态识别模型,并对测试集样本进行识别。结果显示,与利用主成分分析(PCA)法和线性判别分析(LDA)法提取的光谱特征建立的识别模型结果相比较,SRDA-NN 识别模型获得的结果最佳,在测试集中的正确识别率达到94.28%;为了进一步提高识别模型的准确率,将自适应提升法(Adaboost)与SRDA-NN方法结合,提出了Adaboost-SRDA-NN集成学习算法来建立饲料蛋白固态发酵过程状态的在线监测模型。通过Adaboost算法提升后的SRDA-NN模型预测性能得到了进一步增强,Adaboost-SRDA-NN模型在测试集中的正确识别率达到100%。试验结果表明:在近红外光谱定性分析模型校正过程中,SRDA方法能有效地对近红外光谱数据进行特征提取,以实现维数约简;另外,Ada boost算法能很好地提升最终分类模型的预测精度。
关键词光谱分析;近红外;特征提取;谱回归判别分析;Adaboost
文献标识码:A
中图分类号:0657.33,0815
引言
近红外光谱分析技术作为一门快速、无损的现代分析技术,已在生物发酵领域取得了一些研究成果[1-。我们采用近红外光谱分析技术对饲料蛋白固态发酵过程进行状态识别。但是由于近红外光谱数据具有高维性和易干扰性的特点,在利用光谱数据建立状态识别模型前,通常会采用相应的特征提取方法对数据进行降维,从而降低模型的复杂度和提高模型的识别准确率。
主成分分析法(principal component analysis,PCA)是一种常用的无监督算法,在进行特征提取时易导致样本间有用类别信息丢失;线性判别分析法(lineardiscrimination analysis,LDA)作为一种经典的有监督算法,能够充分利用样本间已知的类别信息,使投影后的样本具备最佳的可分离性,但是LDA算法面临复杂的广义特征分解问题*;而谱
收稿日期:2014-10-27,修订日期:2015-02-04
DOI : 10. 3964 /j. issn, 1000-0593 (2016 )01-0051-04
回归判别分析法(spectral regressiondiscriminant analysis, SRDA)作为一种新型的特征提取方法,将LDA算法中广义特征分解问题转化为解决一系列正则化的最小二乘问题,大大简化了计算过程。本工作采用SRDA方法对近红外光谱数据进行特征提取,对降维后的光谱数据利用最近邻(nea-restneighbors,NN)算法建立识别模型。为了进一步提高模型的识别准确率,将自适应提升算法(Adaboost)与SRDA-NN方法相结合,提出了Adaboost-SRDA-NN集成学习算法,并成功应用于固态发酵过程的状态识别,与单一的 LDA-NN与SRDA-NN两种方法的识别准确率相比,提升效果显著。
实验部分 1
1.1样本
在GTG-100固态发酵装置中进行饲料蛋白固态发酵实
基金项目:国家申小型企业创新基金项目(12C26213202207),中国博士后科学基金面上项目(2014M550273)资助作者简介:于霜,女,1981年生,苏州工业职业技术学院机电工程系讲师
e-mail : szyushuang@126. com
e-mail : ghliu@ ujs. edu, cn
%通讯联系人