
第35卷,第12期 2015年12月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
Vol. 35,No. 12 -pp3524-3528
December: 2015
一种新的恒星光谱间距离度量方法:残差分布距离
刘杰1,潘景昌1*,罗阿理1,2,韦鹏”,刘猛1 1.山东大学(威海)机电与信息工程学院,山东威海264209
2申国科学院光学天文重点实验室,申国科学院国家天文台,北京100012
摘要距离度量是光谱巡天数据处理中的一个重要研究内容,其定义了一种不同光谱间的距离计算方法,以此为基础可进行光谱的分类、聚类、参数测量及离群数据挖掘等工作。距离度量方法的好坏在一定程度上影响广分类、聚类、参数测量及离群数据挖趣的效果及性能,同时随者大规模恒星光谱巡天项目的开展,如何针对恒星光谱定义更为有效的距离度量方法成为其数据处理中一个非常关键的问题。基于此问题,在充分考虑到恒星光谱的特点及其数据特征的基础上,提出一种新的恒星光谱间的距离度量方法:残差分布距离。该距离度量有别于传统计算恒星光谱间距离计算方法,利用该方法计算恒星光谱间的距离时,首先将两条光谱归一化到同一尺度下,然后计算对应波长处的残差,以残差谱分布的标准差作为距离度量。该距离度量方法可用于恒星分类、聚类以及恒星大气物理参数测量等应用中。本文以恒星光谱细分类为例来比较检验该距离度量方法,结果表明该方法定义的距离在分类时能更为有效的刻画不同类别光谱间的差距,可以很好的用于相关应用中。同时还研究广信噪比对该距离度量方法的影响:残差分布距离一定程度上受光谱
信噪比影响,信噪比越小,对距离的影响越大;在信噪比大于10之后,残差分布距离对分类的影响很小,关键词恒星光谱;距离度量;残差分布;恒星分类;恒星聚类;参数测量
中图分类号:P12
引言
文献标识码:A
DOI : 10, 3964/j. issn. 1000-0593(2015 )12-3524-05
其中F和F2分别为两条按照同一波长采样或插值后对应的流量值,n为波长采样点的个数。欧式距离定义了n维空间中两条光谱的距离。通常在计算两条光谱的欧式距离前,
大天区面积多自标光纤光谱望远镜(LAMOST,文称郭守敬望远镜)1-2}是我国于十五期间建设的大型基础科学研究设施,是一台专用于光谱巡天的望远镜。自2011年10月开始先导巡天以来,已观测到近400万条光谱"},如何对如此庞大的数据进行有效的处理是当前面临的一个重要问题。分类及参数测量是天体光谱巡天数据处理中一个重要的内容。当前最常用的方法是给定一个模板库,然后在观测数据和模板库数据之间进行模板匹配。在模板匹配方法中,模板库的质量4和距离度量是两个重要的影响因素,同时两者对结果的影响也是耦合的。当前在恒星光谱的处理中,被广泛应用的距离度量有三种。
(1)欧式距离
两条光谱间的欧式距离定义如下
d=
(Fl:—F2:)
收稿日期:2014-04-16,修订日期:2014-08-05
(1)
首先要对光谱进行归一化处理,将光谱归一化到同一尺度。
(2)卡方距离
卡方距离是在欧式距离基础上提出来的一种考虑误差因素的距离度量方式,其定义如下
C(Fl:F2.)/EI
d=
(2)
各符号定义和式(1)相同,其中E1是F1对应的采样误差。卡方距离在欧式基础上以误差作为权值,定义n维空间里两条光谱的一个加权距离。卡方距离被广泛应用在天文巡天数据的处理中,如SSPP中对恒星参数的测量5、SDSS DR9中的光谱的分类]、UlySS对恒星大气物理参数的测量等。
(3)余弦距离
余弦距离和上述两种距离有所不同,其定义如下
基金项目:国家自然科学基金项目(U1431102,11473019,11303036)资助
作者简介:刘杰,1979年生,山东大学(威海)机电与信息工程学院实验师
e-mail : pj@ sdu .edu -cn
"通讯联系人
e-mail : lj2002@ sdu .edu .cr