
第34卷,第11期 2014年11月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
赵振英,林君*:张福东,李军吉林大学仪器科学与电气工程学院,吉林长春130061
Vol. 34 ,No. 11 -pp2948-2952
November,2014
方法,用以剔除光谱数据中的元余信息和干扰信息,提高分析模型的建模效率和预测能力。分别采用相关系数法(CC)、移动窗口偏最小二乘法(MWPLS)和无信息变量消除法(UVE)对油页岩近红外漫反射光谱数据的波长区间进行广选择,研究广不同值、窗口宽度和噪声矩阵对上述方法的影响,建立广所选择波长处的反射率数据和样品含油率标准值间的偏最小二乘(PLS)分析模型,比较了上述方法的选择效果。结果表明:与使用全谱数据建模相比,采用上述方法筛选过的光谱数据均能提高模型的建模效率和预测能力,其中经 UVE法筛选后的光谱数据仅占全谱数据总数的22.8%,模型的RMSECV却降低了9.3%,RMSEP降低了 4. 5%。
关键词油页岩;近红外光谱法;波长选择;相关系数法;移动窗口偏最小二乘法;无信息变量消除法
文献标识码:A
中图分类号:TH744.1
引言
DOI: 10. 3964/j. issn. 1000-0593 (2014)11-2948-05
MWPLS)、遗传算法(geneticalgorithm,GA)等。本工作分别采用前三种方法来选择油页岩近红外漫反射光谱数据中的波长区间,研究、优化了其应用条件,比较广其应用效果,
随着世界范围内石油资源的日益稀缺,各国对油页岩等
非常规能源的开采需求越来越迫切了。我国油页岩资源丰富,但其详细评价还不完善,影响着页岩油的开采进程1,2] 含油率是评价油页岩资源的关键参数。与传统测量方法(低温干馏法)相比,采用近红外光谱技术可实现油页岩含油率的快速、现场测量,能大大提高油页岩资源评估效率并降低分析成本34]
研究表明(-7},在采用近红外光谱技术的偏最小二乘法(partialleastsquares,PLS)建模过程中,应用全部光谱数据建模不仅运算量较大,而且预测能力未必能达到最佳,因此对光谱数据的特征波长或波长区间进行筛选有可能得到更好的定量校正模型。在采用近红外光谱技术分析油页岩含油率时,通过波长选择可在一定程度上剔除光谱数据中易受样品内非油组分、测量环境和仪器噪声等干扰的部分89],达到识别和提取样品光谱数据中烃类物质特征吸收部分的目的,从而有效地提高校正模型的预测能力和稳健性5汀。
常用的波长选择方法有[5-7]:相关系数法(correlationcoef-ficient,CC)、无信息变量消除法(uninfomativevariableselimi-nation,UVE)、移动窗口偏最小二乘法(movingwindowPLS,
收稿日期:2013-11-21,修订日期:2014-03-10
1方法原理 1.1相关系数法
CC法5是将校正集光谱矩阵中每个波长对应的光谱数据向量(x)和组分浓度向量()进行相关性计算,得到波长相关系数(R)图,相关系数绝对值R越大的波长所对应的光谱数据对组分浓度计算的重要性越高。因此,可通过设定 R阅值,选取IR大于阅值的波长所对应的光谱数据建立校正模型。R的计算方法
Z(i-)(y-y)
R
(
其中x=(
Cx)/ny=(
y)/n,n为校正集的样品数
1.2移动窗口偏最小二乘法
MWPLS法5是通过将一个数据窗口沿着光谱波长轴连续移动,每移动一次,即采用交互验证方式建立一个模型
基金项目:国家潜在油气资源(油页岩勘探开发利用)产学研用合作创新项目子课题(0SR-02-04)资助作者简介:赵振英,女,1986年生,吉林大学仪器科学与电气工程学院博士研究生
e-mail : zhaozhenying88@163. con
e-mail : lin_jun@ jlu. edu, en
*通讯联系人