
第31卷,第4期 2011年4月
学与光
谱分析
服
Spectroscopy and Spectral Analysis
VoL 31,No. 4.pp997-1000
Aprif.2011
多区间主成分交互验证法用于气体光谱定性分析
任利兵,尉昊赞,李岩
清华大学精密仪器与机核学系,精密测试技术及仪器国家重点实验室,北京100084
摘要提出了-种多区间主成分交验证法。该方法根据目标气体的光谱特征吸收峰,在全光谱范围内划分出多个特征波数区间,同时,对单组分气体构成的参考光谱矩阵在划分出的特征波数区间内做主成分分析,依据特征波数风间内累计献率大于99%的主分数和单组分气体在特征区内光谱最大值的排序,识别出百标气体可能含有的组分,再提取这些可能组分的特征波数区,将这此区闻与目标气体的特征波数区间遥一比对,以确认或排除目标气体实际含有的组分。由于在多个特征吸收区间上进行主成分分析,避免了组分“漏选现象;由于使用了组分光谱特征波数区与且标气体光谱特征波数区的匹配验证,避免了组分“多
选"的可能。模拟和实验数据表明,该方法可对多组分的目标气体进行准确有效的定性。关键词主成分分析;红外光谱;定性分析;多区间
中图分类号:(657.3
引言
文献标识码:A
DOl: 10. 3964/j. issn. 1000-0593(2011)04-0997-04
影响到了定性分析的准确性。
除上述方法外,也有学者应用人工神经网络(artificial ncural network,ANN)和遗传算法(genetic algorithm,GA)
应用中红外(4000~400cm1)光谱技术监测环境气体是近年米新兴的一个研究热点,基于中红外傅里叶光谱仪搭载长光程气体池的气体分析系统在工业污染、环境监测等场合正获得越来越多的应用"。但是国内外应用中红外光谱定性气体组分的报道较少,更多的文献集中在气体定量分析上,因为大部分的研究场合而向的分析对象仍属色体系12,即目标气体组分已知的体系。面对一此应急场合如火灾现场、反恐事件的检测,其面临的气体分析对象可能为灰色或黑色体系,即日标气体的组分部分已知或完全末知,此情况下,光谱的定性成为首要问题,因为光谱的定性准确程度会影响到基于最小二乘原理的光谱定量分析的精度
典型的光谱定性算法主要是距离判别法43,该算法源
自近红外(12800~
f000cm
)光谱领域,面向的分析对象
为固体和液体,分析使用的区间是样品光谱的全波数区间,通过计算全波数区间上样品光谱与参考光谐的点对点距离之和,按照路离和从小到大排序,给出样品光谱中可能含有的位于参考谱中的组分。这种距离判别算法,给出的定性结果只是样品光谱与参考光谱间相似程度的排序,通常需要实验人员根据排序结果和光谐指纹区进一步确认,才能获得最终的定性结果,且该方法对样品含有组分较多,组分吸收峰之间存在交登的情况,往往不能给出止确的相似度排序,最终
进行光谱定性,此类方法的定性准确率较高,但起需要事先对大量实验数据进行统计分析,建模存在训练时间或送代计算时间过长的间题,如果要扩展可识别组分的数日,则需要重新训练,因此该方法在定性灰色或黑色体系时,定性结果的准确性无法保证,模型的扩展性和易读性较差。
基于上述情况,本文提出了一种用于气体光谱定性分析的多区间主成分交验证方法。
1多区间主成分交互验证法
主成分分析(principlecomponent analysis,PCA)(+)的本质是数据降维,即用少数有代表性的变来描述多变量问题,使得这些少数变域之间满足方差差异最大原则。就光谱定性来说,在多个光谱特征波数区间上引人PCA分析可以消除光谱噪声、光谱共线性对定性结果的影响,从而提取出最能代表目标气体组成的"主元"数目,这些"主元”数目与目标气体含有的实际组分数接近,不过,应用PCA提取出的主元”变,通常是原变的线性组合,且在提取“主元”过程中,已依据方差从大到小的原则,对“主元”进行了排序,从物理意义上,这些“主元”已不能直接代表目标气体含有的组分。但起,在已获得特征区“主元”数目的情况下,可将该
收稿日期:2010-08-25,修订日期:2010-12-05
基金项目:国家自然科学基金项H(60827006)和中德科学基金合作项目(GZ404(303/2)资助
作者简介:任利兵,1981年生,清华大学精密仪器与机械学系博士研究生万方数据
e-mail; rlb07@mails, tsinghua, edu. cn