
第35卷,第6期 2015年6月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
时间序列三维荧光光谱的异常值检测
于绍慧,张玉钩”,赵南京
1.合肥师范学院数学与统计学院,安徽合肥230061
Vol. 35,No. 6 -pp1624-1627
June,2015
2。申国科学院安微光学精密机械研究所环境光学与技术重点实验室,安徽合肥230031
“三内在特性,提出了一种有效的异常值检测方法。在时间维结合方差提取异常值可能性最大的波长点;通过对异常值存在方式的分析,在任意两个三维荧光光谱的相似度基础上给出广光谱维上的累积相似度:最后利用时间维的校正矩阵对所有三维荧光光谱的每个波长点荧光强度进行修正并计算对应的累积相似度,从而根据累积相似度对异常值进行判断。时间维校正矩阵的采用不仅提高了算法的有效性而且其特征区域的选择大大减少了光谱维相似度的计算量。相关的数值试验表明光谱维选取50%的波长点仍然能有效对异常值进行检测。
关键词时间序列;三维荧光光谱;异常值;特征区域
文献标识码:A
中图分类号:0433.4
引言
DOI : 10, 3964 /j. issn. 1000-0593 (2015 )06-1624-04
光谱异常值检测不仅计算量大,而且忽视时间序列本身特有的性质。时间序列由于其特殊性,其异常点的检测又有特定的方法14,15]。
近年来,光谱探测技术已经被应用到食品质量和水质污染等在线检测领域。三维荧光光谱不仅具有快速,易操作,没有二次污染等特点,而且包含了更多的有用信息,在水污染]和食品质量检测[23]中发择挥着越来越重要的作用。相关学者也开始了利用二阶校正方法对在线三维荧光光谱的研究。Carstea利用自组织映射分析了在线监测的两个星期的三维荧光光谱。Murphy>利用PARAFAC方法讨论了城市水回收系统的在线监测数据。Hur"则结合UV光谱和荧光光谱对实时监测的水质进行了分析。Oto利用偏最小二乘估计了ATP浓度。Sanchez利用PARAFAC方法对DOM进行了长期的评估[8.9]
连续在线监测获取的三维荧光光谱数据往往有复杂的背景干扰,因此分析结果都不是很理想。但是在线监测获取的时间序列三维荧光光谱不仅包含大量有用信息而且具有时间序列的特性,而上述相关文献-9都没有充分利用时间序列三维荧光光谱的数据特点。对具有时空特性的时间序列三维荧光光谱数据进行定性和定量分析之前,去除异常值通常是一项首要和重要的任务,它关系者后续相关算法的有效性口。为此,相关学者对三维荧光光谱的异常点检测进行了相关的探讨[11-13]。然而结合定性和定量分析算法的三维荧光
收稿日期:2014-03-19,修订日期:2014-07-02
本文充分利用时间序列三维荧光光谱时间维的特点和光谱维的丰富信息提出了一种有效的异常值检测方法。
理论分析
1.1时间维上的校正矩阵
时间序列三维荧光光谱是按照时间的先后次序采集生成的多个三维荧光光谱,引人指标t表示对应的时间,从而有三维荧光光谱时间序列xI,x,*,xr,.**,其中xERxK, t一1,2,,J表示发射波长点,K表示激发波长点。所有的x沿时间轴排列后生成一个三维数据阵XERXX,其中T表示时间点。作为时间序列,其相邻的两个采样3t, 3(+1)通常具有一定的相似性。
从X提取JXK个时间序列
X, =(xA, xM,***, x), j=l, 2, .*, J.
k=l,2,,K,i=l,2,..,(JXK) 计算si的方差
(x)
处
T
,i=1,2,...,(JXK).
基金项目:国家自然科学基金项目(61308063,61378041),安微省自然科学基金项目(1308085QF111)资助
作者简介:于绍慧,1978年生,合肥师范学院数学与统计学院副教投
e-mail : shaohuiy@ hfte -edu .cn
(1)