
第35卷,第4期 2015年4月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
基于局部均值的K-近质心近邻光谱分类
Vol. 35,No. 4 -ppl103-1106
April,2015
屠良平1,3,魏会明",王志衡”*,韦鹏”,罗阿理”,赵永恒
1.辽宁科技大学理学院,辽宁鞍山114051
2.河南理工大学计算机科学与技术学院,河南焦作454000
3.中国科学院光学天文重点实验室,国家天文台,北京100012
摘要天体光谱包含着许多重要的关于天体的物理和化学信息,如天体表面的有效温度、重力加速度以及化学丰度等,天体光谱的处理和分析对天文研究具有重要的科学意义。一些大型巡天计划的实施(如 SDSS,LAMOST等)使我们获得了海量的天文光谱数据,因此天文光谱数据的自动分类成为重要的科学研究课题,然而面对如此海量的光谱数据,一些传统的光谱自动分类方法已经不适用,迫切需要寻找高效率的光谱自动分类技术。研究了基于局部均值的K-近质心近邻(local mean-basedK-nearest centroid neighbor, LMKNCN)算法在恒星(Star)、星系(Galaxy)和类星体(Quasar,QSO)的光谱分类中的应用。LMKNCN算法的基本思想是根据近质心近邻原则,从每一类训练样本集中为待测样本点选取个近质心近邻点,然后根据每一类中所选取的个近质心近邻点的均值点到待测样本点的距离来判别x的所属类别。针对美国 SDSS-DR8的天体光谱数据,对比了K-近邻、K-近质心近邻、LMKNCN三种算法在恒星、星系和类星体的光谱分类中所表现的性能,结果表明三种方法中,LMKNCN算法对这三种光谱的识别率高于其他两种算法或者与其相当,而且其平均分类正确率高于另外两种算法,特别是在类星体的识别率上表现的更好。表明
该算法对天文光谱大数据的快速处理和有效利用具有重要的意义。关键词光谱分类;K-近邻;近质心近邻;K-近质心近邻
文献标识码:A
中图分类号:TP391.4
引言
D0I. 10. 3964 /i issn: 1000-0593 (2015 )04-1103-04
应增强(adaboost)算法研究广宽线和窄线活动星系核的识别间题;赵旭俊等提出了基于分类模式树的恒星光谱自动分类方法];段福庆等结合了模板匹配和交叉相关的思想,提
天体光谱主要是由连续谱、特征谱线和噪声组成,包含了许多重要的天体信息,如有效温度、重力加速度以及各种元系的化学丰度等。通过分析天体光谱所包含的信息,有助于进一步了解和研究物质在宇宙中的分布特点等重大科学问题。因此,对天体光谱的处理和分析具有重要的科学意义。
随着美国斯隆数字巡天(SDSS)",英澳天文台的6度视场星系红移巡天(6f)"}以及我国的郭守敬天文望远镜(LAMOST)3等巡天计划的实施,我们获得了海量的天文光谱数据,面对如此海量的光谱数据,一些传统的光谱自动分类方法已经不再适用,迫切需要寻求高效率的光谱的自动分类技术。赵梅芳等利用K近邻方法(K-nearest neighhor, KNN)研究广活动星系核和星暴星系的分类、利用自适应径向基神经网络研究了类星体和星系光谱的分类以及利用自适
收稿日期:2014-03-02,修订日期:2014-06-29
出了一种基于相似性度量的光谱分类和红移测量方法,将天体光谱分为恒星、星系和类星体,该方法与其他方法不同的是,它能够同时解决光谱分类和红移测量的间题。季乡债等提出了一种基于相容性度量的K-近邻方法,并使用该方法研究广活动星系和活动星系核的光谱分类。因为恒星、星系和类星体的分类在光谱分类中具有一定的代表性和科学意义,因此我们研究了基于局部均值的K近质心近邻的恒星、星系和类星体的光谱分类。
近质心近邻原则 1
对于某个待测样本点x,选取其近质心近邻(nearest centroid neighhorhood,NCN)点的原理是其所选取的近质心
基金项目:国家自然科学基金项目(61202315,61273248),辽宁省教育厅项目(L2012098)资助作者简介:屠良平,1977年生,辽宁科技大学理学院副教授,中国科学院国家天文台博士后
e-mail : tlp_kd@163. com
*通讯联系人e-mail:wzhenryeyou.com