
第30卷,第12期 2010年12月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
Vol.30,No.12.pp3384-3387
December, 2010
基于粗糙集核优化的支持向量机在多组分污染
气体定量分析中的研究与应用
陈媛媛1-2,张记龙12,李晓12,田二明12,王志斌1-2,刘智超2
1.中北大学电子测试技术国家重点实验室,山西太原030051
2.中北大学山西省光电信息与仪器工程技术研究中心,山西太原030051
摘要研究基于粗糙集核优化的支持向量机(RS-SVM)在红外光谱定量中的应用。通过粗髓集分类的方法对多组分污染气体红外光谱对应的特征波长段进行核函数初始数据的优化,再将优化后的核函数带人支持向量机,从而将二维混合光谱信息投影到高维空间,再进行单种气体浓度的反演运算。通过采用LS-SVM 和PCA-SVM两种典型的光谱数据处理算法作对比,对五种混合气体各组分定量分析进行比较。当光谱可分度高时,三种方法的预测值帮接近标准值,平均误差接近于0.13;而当光谱可分度低时,RSSVM的预测
值比前两种更精确,且当待测种类越多时,该方法精度和运算时间的优势越显若。关键词光谱学;粗稳集;支持向量机;多组分污染气体;定量分析
中图分类号:(433.1文献标识码:A
引言
DOI: 10. 3964/j. issn. 1000-0593(2010)12-3384-04
持向量机等,但这个方法常常只能考单变量的回归,从而失去了多组分是量的优势。
粗糙集[12.13]是针对模期知识进行分类的一种方法,是根
随着城市人口的密集、车辆的增多,环境间题益恶化,空气污染成为评价生存环境优劣的重要指标,研究多组分污染气体监测技术具有实际意义(1.门。多组分污染气体的红外光谱分析在工业废气、汽车尾气、垃圾燃烧废气等监测领域具有广泛的应用价值。红外光谱技术[3.4]具有反应快、操作方便、可多组分定量等优点,用于混合气体红外光谱检测的主要方法有主成分分析法[§](PCA)、偏最小二乘法[6.](PLS)、人工神经网络法[8.9(ANN)、支持向量机e.)(SVM)等。
支持向量机是由核函数将低维空间的待测数据映射到高维空间的一种机器学习方法。由于在低维空间中多种信息椎互重叠、交叉,不利于将各种信息提取出来,所以采用将其分别映射到符合各自物理意义的空间,再对该多维空间中各个维上的数据分别求解可得到各个组分的浓度。在混合光谱求解中,探测得到的混合光谐就是初始的二维空间,将其按照每种组分特有的光谱特性作为边界条件可得到多维空间集合,从而反演每一组分的浓度。常用的组合方式有最小二剩法-支持向量机、主成分分析-支持向量机、多因变量回归-支
据待测数据属性的上、下近似及边界区实现的,不需要大呈的前期学习,只要预先计算设定相糙度、道近条件等就可以很好地实现模糊概念的分类。对于单一气体检测时,特征波长的选择是确定的,面对于未知浓度的混合气体特征波长的选择是受其他气体吸收波长影响的,所以在混合气体检测中采用非单一变量同归的方法更合理。
由于环境监测过程中混合气体各成分的浓度是随意的,所以为了精确计算各组分浓度常常需要大数据作为训练样本。但实际过程中无法提供海基的数据样本,所以为了在有限样本的基础上提高检测精度就需要优化算法。本义采用以模糊分类为基础的数据挖拥方法(相糙集分类)对选择相对好区分的特征波长这个模糊概念进行特征妇类,避免了海样本的训练,再由支持向量机将混合光谱映射到多维空间,最后在每一维上单独求解即可得到各组分的浓度。
1
原理及模型
1.1
粗糙集分类
收稿日期:2009-11-16,修订日期:2010-02-18
基金项目:国家白然科学基金项目(60572019),重点实验室基金项目(9140C1204070709),山西省科技攻关项日(20090321044)和山西省研
究生优秀创新项目(20081017)资助
作者简介:陈媛媛,女,1980年生,中北大学电子测试技术国家重点实验室讲师万方数据
e-mail; chenyuanyuan_1234@163, com