您当前的位置:首页>论文资料>一种晚型天体光谱离群数据挖掘系统

一种晚型天体光谱离群数据挖掘系统

资料类别:论文资料

文档格式:PDF电子版

文件大小:2.95 MB

资料语言:中文

更新时间:2024-12-20 15:18:36



推荐标签:

内容简介

一种晚型天体光谱离群数据挖掘系统 第34卷,第5期 2014年5月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
一种晚型天体光谱离群数据控掘系统
蔡江辉,杨海峰,赵旭俊,张继福
太原科技大学计算机科学与技术学院,山西太原030024
Vol. 34 ,No. 5 -pp1421-1424
May,2014
摘要探索海量的M型恒星中具有磁活动、巨星等较特殊、稀有的天体,对于后续观测、银河系结构、演化等科学研究具有重要的意义,针对M型恒星光谱特征线出现在子空间中的局部偏离,设计并实现广晚型恒星离群数据挖掘系统。首先采用稀疏因子和稀疏度系数度量样本在属性空间上的分布特征,并在此基础上对M型恒星光谱特征线进行离散化、降维等预处理,获得光谱子空间:然后采用微粒群算法搜索离群子空间,并证认子空间内光谱是否离群;此外,选择SDSSM型光谱特征线指数集为样本,实验分析了稀疏因子和稀疏度系数的设置对离群结果的影响,并将离群挖掘结果与SDSS提供光谱型等参数对照,表明利用该
系统实现晚型恒星光谱特征线局部离群数据挖掘是可行并有价值的。关键词局部离群;光谱特征线;子空间
中图分类号:TP311:
文献标识码:A
引言
DOI; 10. 3964 /j. issn. 1000-0593 (2014 )05-1421-04
self-organizing map[] , clustering(*] , PSO (particle sw arm op-timization)"等。(2)特殊天体搜索。如Zhang等提出天体离群光谱的自动检测技术;Wei等的MCLOF(MonteCarlolo-
近年来大型巡天项目(SDSS,LAMOST2/等)的不断实施,新观测技术的出现,获得了大量的大数据集,LAM-OST先导巡天发布光谱数据48方余条,包括恒星、星系、类星体以及一些未知类型的天体,其中M型恒星、无其是温度低于3500K的光谱6万余条3」,在这类海量恒星光谱数据集中存在一些具有氢原子发射线、具有磁活动、巨星等特殊、奇异、稀有的天体,通过数据挖掘方法寻找这类天体,为此类天体的科学研究提供有价值的信息、为巡天后续观测提供依据,具有重要的意义。
近年来,数据挖掘“技术在天文领域的应用受到了国内外学者越来越多的关注,国际虚拟天文台联盟(International VirtualObservatoryAlliance,IVOA)于2010年在美国加州理工学院举办了首届astroinformatics会议,并决议数据挖掘是IVOA最近发展研究的重要方向之一。主要研究集中在以下儿个方面:(1)光谱类型识别。对光谱类型识别是天体光谱数据处理及分析的基本环节,常用的pipeline采用模板匹配的方法,对模板库质量(产、细)要求较高,并且面对大数据集,其效率不高,数据挖掘的兴起为天体光谱类型的识别注人了新的活力,近期比较常用的方法有PCA(principal component analysis )) , ANN (artificial neural network )[6) ,
收稿日期:2013-08-29,修订日期:2013-12-24
cal outlier factor)方法,可以发现SDSSDR8(sloan digital sky surveydata release8)中双星、碳星等稀有光谱1o],Zhang等基于概念格的天体光谱识别方法等。(3)相关性分析。 Graham等采用MIC(maximalinformationcoefficient)挖掘参数空间特定参数间的相关性并采用Symbolicregression获得相应函数关系式[12];Cai等通过构造加权FP(frequentpat-tern)树来提取特征线间的关联规则3]。因此,数据挖掘技术在天文数据分析及处理中具有重要的应用价值
M型恒星光谱有效温度较低,光谱红端分子带特征明
显,而光谱蓝端以及原子线的特征相对较弱(也存在特殊情况),利用这种特点,可以对光谱数据进行降维,本工作出发点就是在这种属性子空间上寻找局部偏离,从而达到离群数据挖掘的效果。首先,采用相关性分析可以删除允余属性及在各种属性维组合中都处于稠密区域的数据对象,有效地实现数据集降维和缩小的目的;对通过微粒群算法搜索离群子空间以及稀疏因子、稀疏度系数等参数设置进行了描述;实验及系统运行结果验证了M型光谱局部离群数据挖掘的可行性,为稀有、特殊的天体提供搜索手段以及进一步研究的依据。
基金项目:国家自然科学基金项目(41372349,61272263),山西省自然科学基金项目(2012011011-4)资助
作者简介:蔡江辉,1978年生,太原科技大学计算机学院副教授
e-mail : jifuzh@ sina .com
*通讯联系人
e-mail : cjhjf@ sohu, com
上一章:WinCC在磨选分级系统中的应用 下一章:数据挖掘技术在医院信息系统中的应用探讨

相关文章

一种基于属性权值和wk-距离的天体光谱异常特征线挖掘方法 线指数特征空间内恒星光谱离群数据挖掘与分析 基于Isomap算法的恒星光谱离群点挖掘 基于模糊大间隔最小球分类模型的恒星光谱离群数据挖掘方法 一种基于单元型红外光谱辐射计的成像光谱数据获取系统设计 WSN数据流离群点挖掘研究 一种基于约束概念格的恒星光谱数据自动分类方法 一种添加历史数据的近红外光谱特征提取方法研究