
第35卷,第12期 2015年12月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
基于深层信念网络的太赫慈光谱识别马帅,沈韬1,2*,王瑞琦,赖华,余正涛
1.昆明理工大学信息工程与自动化学院,云南昆明650500 2.昆明理工大学材料科学与工程学院,云南昆明65050C
Vol. 35 ,No. 12 -pp3325-3329
December: 2015
摘要特征提取和分类是太赫兹光谱识别的关键。部分物质在太赫兹波段内没有明显的吸收峰,难以人工定义、提取特征及分类识别,为此,结合深度信念网络(deepbelief network,DBN)和K-NearestNeighbors(KNN)分类器的优点,提出广一种基于DBN的太赫慈光谱识别方法。首先利用S-G滤波和三次样条插值对 ATP, acetylcholine_bromide, bifenthrin, buprofezin, carbazole, bleomycin, buckminster 和 cylotriphosp-hazene在0.9~6THz内的太赫兹透射光谱进行归一化处理;然后由两层受限波尔兹曼机(restrictedBoltz-mannmachine,RBM)构建DBN模型,并采用逐层无监督的方法训练模型,以自动提取太赫兹光谱特征;最后用KNN分类器对8种物质的太赫慈透射光谱进行分类。结果表明,使用DBN自动提取的光谱特征, KNN分类器、BP神经网络、SOM神经网络和RBF神经网络的分类准确率达到广9O%以上,且KNN分类器的识别率优于其他三种分类器:采用DBN自动提取物质的太赫兹光谱特征大大减少了工作量,在海量光谱数据识别中具有产阔的应用前景。
关键词太赫兹光谱;深层信念网络;特征提取;KNN
文献标识码:A
中图分类号:059
引言
DOI: 10. 3964/j. issn. 1000-0593(2015)12-3325-05
对上述物质进行识别。使用主成分分析法能有效的消除元余信息,但在获取太赫兹光谱特征时需人工选择要保留的主分量。随着太赫兹光谱数据量不断增加,采用人工定义与选择
太赫兹波拥有光子能量低、生物和化学物质能在太赫兹波段形成唯一的“指纹谱”等"独特的优点,在诸如无损检测、质量控制、生物医学等23领域具有广阔的应用前景。近年来,国内外对太赫慈光谱技术在物质的检测与识别方面的应用进行了一定程度的研究。Zhong等4使用最小距离分类器和神经网络算法成功地对2,4-DNT,Theophylline,RDX 和GlutamicAcid进行识别;Liang等5使用自组织特征映射(SOM)神经网络准确地识别出了六种毒品:梁美彦等"利用径向基神经网络对11种毒品进行识别,实验结果表明其训练及识别速度优于BP神经网络和SOM神经网络:Pan等[7] 对纯毒品和掺假毒品的太赫兹光谱进行识别,发现支持向量机(SVM)可用于毒品的含量分析。以上研究为人工定义太赫慈光谱特征,若物质的太赫慈光谱没有明显的峰值特征,则难以人工定义它们。Chen等"、Ge等9采用主成分分析法分别对生物大分子、小麦的太赫兹光谱进行主成分分解,选择贡献率较大的主分量作为太赫兹光谱特征,再使用分类器
收稿日期:2014-08-27,修订日期:2014-11-28
太赫兹光谱特征的方法工作量大、效率低。深度学习是从 2006年开始重新兴起的一种自动学习特征的方法,能更有效的处理海量数据,在语音、图像以及自然语言处理领域已取得了巨大的成功口0,但在太赫慈光谱识别方面还未见有报道。我们提出了一种基于深层信念网络的太赫兹光谱识别方法:首先对太赫兹光谱数据进行预处理,并将其作为DBN 的输人,然后DBN自动地从太赫兹光谱数据中学习合适的特征,最后用KNN分类器对八种物质的太赫兹光谱进行识别和分类,
基于DBN的太赫兹光谱识别方法 1
1.1理论基础 1.1.1RBM
RestrictedBaltzmannmachine(RBM)可看作由可视层和隐含层组成的无向图模型,一个有m个可视单元和n个隐层
基金项目:国家自然科学基金项目(61302042)),昆明理工大学自然科学研基金项目(KKZ3201451015)资助作者简介:马帅,1988年生,昆明理工大学信息工程与自动化学院硕士研究生
e-mail : mashuaihpu@ 163. con
*通讯联系人e-mail:shentao@kmust,edu,cn