
第34卷,第1期 2014年1月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
Vol.34,No.1.pp263-266 January,2014
流形判别分析和支持向量机的恒星光谱数据自动分类方法
刘忠宝,王召巴2*,赵文娟
1.中北大学计算机与控制工程学院,山西太原030051 2,中北大学信息与通信工程学院,山西太原030051 3.山西大学商务学院信息学院,山西太原030031
摘要尽管经典的分类方法支持向量机SVM在天文学领域广泛应用,但其只考虑类间的绝对间隔而忽略类内的分布性状,因而分类性能有待于进一步提升。鉴于此,提出一种新颖额的基于流形判别分析和支持向量机的恒星光谱数据自动分类方法。该方法引入流形判别分析的两个重要概念:基于流形的类内离散度M 和基于流形的类间离散度M&。所提方法找到的分类面同时保证M最小且M:最大。可建立相应最优化间题,然后将原最优化问题转化为QP对偶形式求得支持向量和判别函数,最后利用判别函数判断测试样本的类属。该方法的最大优势在于进行分类决策时,不仅考虑样本的类间信息和分布特征,而且还保持了各类的
局部流形结构。SDSS恒星光谱数据上的比较实验表明该方法的有效性关键词自动分类;恒星光谱数据;流形判别分析;支持向量机
中图分类号:TP391
文献标识码:A
引言
DOI; 10., 3964 /j. issn. 1000-0593 (2014 )01-0263-04
光谱分类方法,其最大优势在于无需对分类器训练便可实现增量式学习和并行实现:L等将面向光谱数据的局部特征分类方法在计算机视觉中成功应用",覃冬梅等提出一种新额
恒星光谱数据分类是天体数据分析与处理的主要任务之一,也是恒星和星系天文学的一个重要研究方向。随着光谱数据规模的不断增大,传统的数据处理方式变得无能为力,迫切需要提出计算机自动光谱处理新技术。
近些年,光谱数据自动分类问题逐渐成为国外学者的研究热点,一些重要的研究成果不断涌现:在国外,Autoclass 是一种基于贝叶斯统计的分类方法,其最大特色在于可以发现一些新的光谱类型:Gulati等利用两层BP神经网络对恒星光谱次型进行分类"};Jones在进行光谱次型分类时利用多个BP神经网络[3];Starck将小波变换方法应用在光谱分析中];Mahdi提出基于无监督人工神经网络的自组织映射算法,其最大特色在于不需要训练数据便可直接对光谱进行分类[];Navarro等提出的人工神经网络系统通过在温度、光度敏感的光谱中选择线-强指数集进行训练实现对低信噪比的光谱有效分类-」;Adam通过选择高质量的光谱源实现对光谱数据的有效分类了。在国内,罗阿理在Strack方法的基础上利用多尺度小波滤波器自动确定小波变换的最大变换级数*};李乡儒等提出基于最近邻方法的类星体与正常星系
收稿日期:2013-03-28,修订日期:2013-06-28
的基于主成分分析和支持向量机的光谱分类方法:刘中由等提出基于小波特征的M型星自动识别方法";许馨等提出基于广义判别分析的光谱分类方法,该方法通过非线性映射将样本映射到高维空间并利用线性判别分析方法实现光谱分类;杨金福等提出核覆盖算法,该方法将核技巧与覆盖算法相结合,通过在特征空间抽取支持向量实现光谱自动分类;赵梅芳等针对活动星系核光谱中发射线的不同特征,采用自适应增强方法实现实现光谱自动分类1;蔡江辉等提出的基于谓词逻辑的分类规则后处理方法在保证分类准确率不降低的前提下大幅提高了自动分类的效率[2]
由于人类对宇宙的认识还相对匮乏,如何利用面向光谱数据的自动分类方法实现未知天体的识别成为当今天文界的研究热点之一。支持向量机(supportvectormachine, SVM)3是一种经典的模式分类方法,具有稳定的分类性能和优良的泛化能力,因而备受中外学者的推崇并广泛应用于光谱分析、信息检索、机器学习等领域。但SVM易受到输人数据仿射或伸缩等变换的十扰,其原因是该方法进行分类决策时只考类间的绝对间隔而忽略各类的分布性状。与此同
基金项目:国家自然科学基金项目(61202311)和山西省高等学校科技创新项目(20131112)资职作者简介:刘忠宝,1981年生,中北大学计算机与控制工程学院博士研究生
e-mail : liu_zhongbad hotmail .con
*通讯联系人e-mail:wzb15851@163.com