
第34卷,第6期 2014年6月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
Vol, 34, No, 6 , pp1707-1710
June,2014
近红外光谱法分析油页岩含油率中异常样品识别和剔除方法的研究
君,张怀柱*
赵振英,林
吉林大学仪器科学与电气工程学院,吉林长春
130061
摘要研究了漫反射近红外(NIR)光谱法分析油页岩含油率过程中异常样品的识别和剔除方法。在近红外光谱定量分析中,环境变化和操作失误等都会产生异常样晶,异常样晶的存在会导致模型的预测能力下降,因此异常样品的别除是建模过程中的关键步骤。分别采用主成分分析一马氏距离(PCA-MD)法和半数重采样(RHM)法识别油页岩光谱数据申的异常样晶,通过别除异常样晶后所建的偏最小二乘(PLS)分析模型
对异常样晶别除结果的影响,比较了单独和同时应用PCA-MD及RHM法识别并别除异常样品后所得PLS 模型的预测能力。结果表明:与所有样品参与建模时预测偏差均方根(RMSEP)相比,采用PCA-MD法时阔
27.5%;同时采用PCA-MD法和RHM法时RMSEP降低了44.8%,研究内容有效地提高了分析模型的预测能力。
关键词近红外光谱;异常样晶别除;油页岩;含油率
中图分类号:0657.3
引言
文献标识码:A
DOI: 10, 3964/j. issn. 10000593(2014)06170704
当光谱数据矩阵不具有良好的正交性时无法采用MD法,采用主成分分析-马氏距离(principalcomponentanalysis-ma-halanobis distance,PCA-MD)法可以解决上述间题["],基于
随着石油资源的日渐短缺和油价的不断上涨,油页岩等非常规能源的开采越来越受到世界各国重视1-汀。含油率是油页岩资源评价的重要参数,其传统测量方法为低温干确法4,仪器装置复杂,耗时较长,且无法实现现场或原位测量)。近红外(nearinfrared,NiR)光谱属于分子振动光谱,主要是含氢基团(CH,OH,NH,SH,PH等)基频振动的倍频和合频"},因此适合测量富含碳氢化合物的油页岩样品。近红外光谱技术具有仅器简单、测量快速等优点,将其应用于油页岩含油率的测量可以提高对油页岩资源的评价效率,促进我国油页岩资源的开采进程."
在近红外光谱法分析油页岩含油率的过程申,个别样晶
组分异常、环境变化、粉末样晶保存不当和仪器的随机误差等都可能引起异常光谱数据的产生。异常样品数据会影响实验数据的整体分布,最终将影响所建模型的预测能力,因此识别并别除异常样品是建立可靠的分析模型的先决条件[-] 马氏距离(mahalanobisdistance,MD)法是一种传统的异常样品识别方法,但由于其计算过程需要矩阵求逆运算,所以
收稿日期:2013-07-17,修订日期:2013-10-08
最小协方差行列式法的半数重采样(resamplingbyhalf means,RHM)法是目前被推荐用于检测光谱数据中存在多个异常样品时的方法之一,其计算过程申不需要对矩阵求逆,可直接计算出各样品的RHM得分,算法简单,结果直观[-,本工作将PCA-MD法和RHM法应用到近红外光谱法分析油页岩含油率的过程中,提高了分析模型的预测能力。
1算法实现 1.1
PCA-MD
近红外光谱主要由含氢基团基频振动的倍频与合频叠加构成,故其光谱数据矩阵通常不是正交矩阵,无法直接用于计算样品间的马氏距离.本文采用PCA对油页岩光谱数据进行降维,以消除其中的重叠信息,对行列数分别为(样品数目)和m(波长数目)的光谱数据矩阵Xx>进行PCA运算后,可得到载荷矩阵COEFx>和得分矩阵SCOREax",其
基金项目:国家潜在油气资源(油页岩勘探开发利用)产学研用合作创新项目子课题(OSR-02-04)资助
作者简介:赵报英,女,1986年生,吉林大学仪器科学与电气工程学院博士研究生
通讯联系人
email.; huaizhuzhang@jlu, edu. cn
e-mail : zhaozhenying88(@163. com