
第32卷,第1期 2012年1月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
Vol. 32, No. 1, pp175-178
January,2012
基于互信息方法的燃油品质光谱分析模型构建与简化
都勇,孙旭东,蔡丽君,刘燕德” 华东交通大学机电工程学院,江西南昌330013
摘要近红外浸反射光谱和紫外吸收光谱分别用于燃油的辛烷值和单芳香族化合物含量的测定,偏最小二乘回归(partialleastsquaresregression,PLSR)用于光谱多元校正模型的构建。基于互信息(mutualinfor mation,MID)理论的变量筛选方法用于模型优化以提高模型的预测精度,降低模型的复杂度。结果表明, MI-PLSR可以有效的提高燃油品质模型的预测精度,简化分析模型。辛烷值的预测均方根误差(rootmean squareerrorofprediction,RMSEP)由0.288减小为0.111,预测相关系数R从0.985提高到0.998,建模变量由401减小为112;单芳香族化合物含量的RMSEP从0.753减小为0.478,R由0.996提高为0.998,建模变量由572缩减为37。说明振动光谱结合MI-PLSR方法可用于燃油品质检测,具有高效率低成本的特点。
关键词近红外光谱;紫外光谱;偏最小二乘回归;互信息;燃油品质
中图分类号:O657.33
引言
文献标识码:A
DOI: 10.3964/j.issn.1000-0593(2012)01-0175-04
基于MI理论的变量筛选可以进一步提高PLSR模型的预测精度,降低模型的复杂度。
在燃油(汽油/柴油)标准中,辛烷值和馏分的烃类组成是油品品质控制的关键指标,因此,这些指标的检测在石油炼制工业中十分重要")。辛烷值和烃类的传统检测方法存在的主要问题是样品用量大、测试周期长和分析费用高,不适于实时生产控制,特别是在线测试。振动光谱(近红外光谱和紫外光谱)分析已广泛用于复杂样品的定性和定量分析,与传统的分析方法相比,振动光谱具有分析速度快、无需样品预处理且应用广泛等特点[34]。因此,本文采用振动光谱分析方法对燃油中亲烷值和烃类物质含量进行定量分析,用于提高燃油品质的检测效率。
燃油是各种烃类化合物的混合物,其振动光谱严重重叠,因此,采用传统的单变量校正方法无法实现某种烃类化合物含量的测定,需采用多元校正方法对其振动光谱进行建模。本文采用振动光谱结合偏最小二乘回归(partialleast squaresregression,PLSR)的多元校正方法分别对汽油中的辛烷值、汽油和柴油中的单芳香族化合物含量进行定量分析,并采用互信息(mutualinformation,MI)理论对构建 PLSR模型的光谱变量进行优化。结果表明,此方法可行。
收稿日期:2011-05-11,修订日期:2011-08-22
理论与算法
振动光谱结合多元校正理论构建定量分析模型时,引起模型不稳定和预副能力较差的主要因素可分为三个方面:光谱干扰(包括背景和噪声等)、余信息(主要是指元余的光谱变量信息)和奇异样本(校正集测量误差较大的样本)。因此,在建立多元校正模型时,进行有效信息变量的筛选,不仅可以简化校正模型,面且可以从精确度和稳健性两方面改善模型的预测能力5]。通过选择包含样品组分性质特征的波长(变量),代替全谱去建立模型,能够得到更好的校正模型。为此,本文引入MI理论,用于有效光谱变量的优选。 1.1基于MI理论的变量选择方法
MI理论可有效的去除光谱(X)中对目标组分含量(Y)不相关的信息。与其他方法不同,MI算法不需要假设光谱X 和目标组分Y间存在某种线性关系。如果X和Y是存在关联密度=(z,y)和边缘密度改(r)和"(y)的连续随机变量, MI定义[7-9]为
基金项目:国家科技支择计划(2008BAD96B04),江西省主要学科学术和技术带头人培养对象计划(2009DD00700)和华东交通大学博士启动
基金项目(01309021)资助
作者简介:郝勇,1978年生,华东交通大学机电工程学院讲师
*通讯联系人
万方数据
e-mail; jxliuyd@163.com
e-mail; haonm@163.com