
第33券,第4期 2013年4月
学与光谱
光谱
分析
Spectroscopy and Spectral Analysis
相关向量机在污水硝氯检测中的应用
曾甜玲,温志渝,温中泉
Vol. 33, No. 4. pp1048-1051
April,2013
重庆大学新型微纳器件与系统技术国家重点学科实验室,重庆大学微系统研究中心,重庆400030
摘要针对地表水质的复杂性以及紫外光谱数据维数高、谱带重叠严重的特点,提出将相关向量机算法应用于硝氮的连续紫外光谱分析,实现了对实际污水硝氮的快速准确无污染检测。首先介绍了相关向量机算法原理,然后在分析制药污水紫外吸收光谱的基础上选取230~245nm紫外吸光度数据用于建模,应用多元线性回归、偏最小二乘方法、经典支持向量机方法(SVM)和相关向量机方法分别建立硝氮回归模型并比较分析模型性能。实验结果表明:相关向量机模型预测更准确,模型更稀疏,预测速度快,检测结果的相
对满量程误差控制在4.5%以内,适用于对复杂组成成分的实际污水硝氮的有效快速检测。关键调相关向量机;硝氮;水质监测;贝叶斯学习;紫外光诺
中图分类号:TP274;O657.32
引言
文献标识码:A
水中的硝酸盐氮是水体富营养化的一项重要指标,它可以反映水体受污染的程度"。生活污水、造革废水、酸洗废水、农田排水等受污染的水体中含大量的硝酸盐3,而过多的硝酸盐氮不仅危害环境,对人体也有害,因此国家规定饮用水中硝氮的含量不得超过10mg·L-"。对水中的硝氮含量进行实时监测,对人体健康、环境保护等方面具有重大意义。
由于硝酸根离子在紫外区域有较强的吸收,因此可利用紫外吸光度检测水体中硝酸盐氮的含量[3)。Cawsei于1967 年提出通过直接在210nm处测定吸光度来计算硝酸根的含量,该方法虽筒便易行,但应用于实际污水测试时,受有机物的紫外吸收影响和浊度较大,且选取的波长点太少,测出结果稳定性差。结合直接连续紫外光谱分析方法和多元校正建模方法将克服上述方法的缺点,目前常用的建模方法有线性建模方法如多元线性回归(MLR)、主成分回归(PCR)、偏最小二乘回归(PLS)等和非线性建模方法神经网络(ANN)和支持向量机回归(SVR)等方法。MikaelKarlsson等采用PLS 方法[5]结合连续紫外光谱分析建立了市政污水硝氮模型,预测精度高于MLR方法;由于水体是一个复杂的非线性系统,采用线性建模方法存在其局限性,倪雪春等基于支持向量机测定硝酸钠与干扰物铁离子、铬离子混合溶液中硝氮含量,样本回收率在96.83%~103.20%之间[2),虽然支持向量机
DOI; 10. 3964/j. issn. 1000-0593(2013)04-1048-04
性能要优于现存其他很多线性和非线性多元校正方法,但也存在一些缺点:(1)核函数必须满足Mercer条件;(2)需要估计惩罚参数C和不敏感参数E,通常需采用交叉验证方法来确定这两个参数,从而增加了计算量;(3).无法得到机率式的预测(")。
相关向量机(RVM)是一种新的机器学习方法,它具有与SVM相同的函数形式和相当的泛化性能,但它无需估计正规化参数,基函数也无需满足Mercer条件,并且能给出预测的概率信息,解的稀疏性也远远高于SVM",在保证精度的同时提高了预测速度。
因此,对制药污水这样一个复杂组成成分水体,为快速有效地从各物质重登的紫外吸收光谱中提取出硝氮吸收的有用信息,本文提出将RVM建模方法应用于对污水硝氮的预测,并与其他方法进行性能对比。
相关向量回归原理
2000年,Tippingl在贝叶斯框架下提出了一种与SVM 相似的稳疏概率模型RVM。对于回归间题,给定一个训练集(x,t),x,ER,ER,输人向量x,和目标标量t有如下映射关系
t, = y(x,, w) +ei, t = y+e
(1)
假设《&),是被此独立的随机变数,误差=(e1,,,s)中各元素相互独立地服从均值为0,方差为。的高斯分布。w=(w,*,wM)为权值向量,y(i,w)可以表示为
收稿日期:2012-09-03,修订日期:2012-11-20
基金项目:国家(863计划)项目(2009AA04Z327)和国际科技合作项目(2009DFB10440)资助
作者简介:曾甜玲,女,1983年生,重庆大学光电工程学院博士研究生万方数据
e-mail; tlzeng@foxmail. com