
第34卷,第10期 2014年10月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
Vol. 34,No. 10 -pp2799-2803
October,2014
基于偏最小二乘增量式神经网络的近红外光谱定量分析模型
曹晖,李大航,刘凌*,周延
1.西安交通大学电气工程学院电力设备电气绝缘国家重点实验室,陕西西安710049 2.西安交通大学能源与动力工程学院,陕西西安710049
摘要提出了一种基于偏最小二乘增量式神经网络的近红外光谱定量分析模型。该模型采用典型三层反行偏最小二乘(PS)回归,所得自变量和因变量的历史负简矩阵分别用于确定模型输人层和输出层的初始权值,且自变量的主成分个数作为隐层的节点数。当获得新的样本时,对新数据与历史负荷矩阵组合后进行 PS回归,将所得新的负简矩阵与历史负简矩阵融合后作为模型输人层和输出层新的初始权值,接者使用新样本对模型进行训练来实现增量式更新。将所提模型与PLS、BPNN、基于PLS的BPNN、递归PLS在天然气燃烧烟气近红外光谱数据上测定后比较。对于烟气中二氧化碳浓度的预测,所提模型的预测均方根误差(RMSEP)分别降低了27.27%,58.12%,19.24%和14.26%;对于烟气中一氧化碳浓度的预测,所提模型的RMSEP分别降低了20.65%,24.69%,18.54%和19.42%:对于烟气中甲烷浓度的预测,此模型的 RMSEP分别降低了27.56%,37.76%,8.63%和3.20%。实验结果表明,所提模型不仅通过PLS对BPNN 结构和初始权重的优化,使模型具有较强的预测能力,而且能在已建模型信息的基础上,不访问旧数据而用
新增样本即可完成自身的增量式更新,从而使模型具有较好的稳健性和泛化性。关键词近红外光谱;定量分析;增量式神经网络;偏最小二乘
中图分类号:0657.3文献标识码:A
引言
DOI: 10, 3964 /j. issn. 1000-0593(2014 )10-2799-05
但近红外光谱数据往往含有成百上千个波长变量且分布不均匀,直接使用BPNN则会因为输入量过多而导致不易确定隐层节点的个数,而且输入(出)层初始权值的选择也变得较为
近红外光谱(near infrared spectroscopy,NIR)分析可根据物质特征光谱来实现样品化学组分含量的测定。由于它是-种无损的快速环保分析技术,所以在电力、医疗、化工等领域广泛应用口2)。偏最小二乘法(partialleastsquares, PLS)是近红外光谱定量分析的常用方法,它对自变量中的信息进行综合筛选,从中选取若十具有最佳解释能力的潜变量用于回归建模[3-6]。虽然PLS可以通过解决自变量间多重相关性来提高模型预测精度,但其本质是一种线性回归,不能有效的解决非线性问题"。神经网络能以任意精度逼近任何连续非线性函数3,可在一定程度上解决测量所得光谱呈现的非线性关系。其中反向传播神经网络(back-propagation neural network,BPNN)具有泛化性好、容错能力强和处理速度快的特点,是目前应用最广泛的神经网络模型之一[9]。
收稿日期:2014-05-20,修订日期:2014-07-25
困难,不合适的初始权值可能会使节点变换函数一开始就处于饱和区,从而影响收敛速度且易陷入局部极小0。此外, NIR分析模型通常都是在经过历史样本训练后对样品化学组分进行预测,而不通过新测数据进行自身修正。若用于需连续更新模型的动态过程(如烟气在线检测)时,其仍依靠定期重新训练来实现校准,而不能对以前训练好的参数进行有效的使用。这样,不仅增加了计算成本,而且也限制了其在实际应用中的进一步推广[11.12]。本工作提出了一种基于偏最小二乘增量式神经网络的近红外光谱定量分析模型。该模型采用典型三层BPNN结构,不同波长吸光度和成分浓度分别是模型的输入和输出。在使用历史样本训练模型之前先进行 PLS回归,所得自变量和因变量的历史负荷矩阵分别用于确定BPNN输入层和输出层的初始权值,且自变量的主成分个
基金项目:国家自然科学基金项目(61375055),新世纪优秀人才支持计划项目(NCET-12-0447)和陕西省自然科学基金项目(2014JQ8365)资
助
作者简介:曹晖,1978年生,西安交通大学电气工程学院副教授
e-mail : liul@ mail., xjtu, edu, cn
*通讯联系人
e-mail : huicao@ mail, xjtu. edu. cn