
第31卷,第11期 2011年11月
光谱学与光谱,
分析
Spectroscopy and Spectral Analysis
Vol. 31,No. 11, pp3010-3013
November,2011
基于Mann-Whitney非参数检验和SVM的竹类高光谱识别
芸
陈永刚,丁丽霞,葛宏立,张茂震,胡
浙江农林大学,断江省森林生态系统碳循环与固碳减排重点实验室,环境科技学院,浙江临安311300
摘要以毛竹、雷竹和考顺竹野外高光谱数据为基础,在非参数统计理论和模式识别的基础上,提出了利用Mann-Whitney非参数检验筛选竹类间最佳特征区分波段及利用支持向量机识别竹类的间题。研究结果表明:(1)毛竹与雷竹之间的最佳区分波段为503~655,689~732,7571000,1038~1084,1238~1311 1404~1591,1682~1800,1856~1904和1923~2500nm,毛竹与举顺竹之间的最佳区分波段为350~ 386,731~1430,1584~1687,1796~1873nm,雷竹与孝顺竹之间的最佳区分波段为355~356,498~ 662,689~745和1344~2500nm;利用Mann-Whitney非参数检验方法可以分别消除30.0%,57.7%和 35.8%的无效区分波段。(2)在最佳区分波段内,利用支持间量机的SMO算法进行高光谱竹类识别,模型精度分别为98.4%,93.5%和95.1%,模型泛化精度分别为93.3%,90.0%和86.7%,表明此方法可有效区分和识别竹亚科中的不同竹类。
关键词
Mann-Whitney检验;高光讲,SVM;竹亚科
中图分类号:S771.8
引言
文献标识码:A
DOI; 10. 3964/j. issn. 10000593(2011)11301004
量.光谱仪波长范围为350~2500nm,共2151个波段,波长精度为士1nm。在浙江省浙江农林大学校院架竹园内采集竹类光谱数据。在竹叶新鲜状态下,使用光谱仅的植被高密
高光谱数据波段多、数据允余度大,利用高光谱数据进行数据识别时,选择提取特征光谱至关重要2),王渊、王志辉等分别利用光谱微分技术对油菜、南方常见树种进行高光特征选择及识别并取得了较好的效果。张健榈等利用非参数同归与最近邻方法实现了一种有效的恒星光谱自动分类方法,RickArchibald等利用SVM算法对AVIRIS影像进行特征提取和识别[3]。邢飞、王因圆等采用支持间量机进行光谱特征提取和识别,发现支持向量机识别精度高且有较强的泛化能力。但是连今还无利用Mann-Whitney非参数检验进行竹类高光谱特征波段提取和SVM光谱识别竹类的报道,本文提出了在Mann-Whitney非参数检验筛选竹类间最佳区分波段的基础上,而后,利用支持向量机SMO算法来区分识别同一竹亚科中三种不同的竹类,并在实验中验证了该方法的有效性和可行性。
数据与方法 1
仪器设备与数据获取 1.1
竹类数据采用ASDFieldspecProFR野外光谱辐射仪测
度探头进行光谱测量,每测完10片叶面进行一次标准白板的校正,以保证数据的准确性。以竹业科中毛竹、雷竹、孝顺竹3种外形较相似的竹类进行试验,每种竹类采集45份叶片样本,其中30份记录作为学习样本数据,15份作为测试样本数据。
1.2Mann-Whitney非参数检验
非参数检验是一种与总体分布状况无关的检验方法,它不依赖于总体分布的形式,不考虑被研究对象为何种分布及分布类型是否已知。当样本规测值的总体分布类型术知或知之其少,无法背定其性质,不具备参数检验的应用条件时,非参数检验极具应用价作[4,5)。平均值是数据中心位置的一种很白然的测度,但其缺点是对极端值异常敏感,面中位数却对极端值不敏感,是数据中心位置的稳定测度*)。1947年 Mann和Whitney在Wilcoxon非参数检验的基础上,提出针对独立.非成对样本总体间是否存在显著差异的Manr Whitney检验L"]。Mann-Whitncy检验以中位数为测度,其假设检验原假设为H:X,=Y,与备择假设为H:Xi≠Y,,其中X,和Y:为两个数据总体的中位数。其有结点时大样本近似的Z值修正公式为式(1)所示)。
收瑞日期:2011-02-22,修订日期:2011-06-29
基金项目:国家自然科学基金项日(30771725,30972360)和浙江省教育厅项目(Y201017891》资助
作者简介:陈水例,1980年生,新江农林大学环境科技学院讲师
万方数据
e-mail; cyg_gis@163. com