
第31卷,第9期 2011年9月
光谱学与光谱分
析
Spectroscopy and Spectral Analysis
Vol. 31,No.9. pp2471-2475
September,2011
基于概率潜语义分析模型的高光谱影像层次聚类分析
易文斌1.2,慎利1.2,齐银凤1-3,唐
宏1-4.5
1.北京师范大学地表过程与资源生态国家重点实验室,北京100875 2.北京师范大学资源学院,北京100875
3,国土环境与灾害监测国家测绘局重点实验宅,江苏徐州
221116
4.矿山空间信息技术国家测绘局重点实股室,河南焦作454010
100875
5,北京师范大学环境演变与自热灾害教育部重点实验室,北京
摘要将概率潜语义分析模型(PLSA)应用于高光谱影像聚类,提出一种基于语义信息的影像象类方法。首先,利用ISODATA算法获取影像的初次案类结果,从而形成PLSA模型中的视觉词;其次,利用影像分割算法对高光谱影像进行分制,并将分制体作为PLSA模型的文档;再次,利用多种最佳聚类类别数估计方法确定PLSA模型的潜语义主题的个数;进面估计PLSA模型的参数,获得概率主题内视觉词的概率分布和每个分割体中各概率主题的混合比例:最后利用统计模式识别方法获取每个影像文档中各个视觉词对应的潜语义主题的类型,从而实现影像的层次案类分析,相关实验结果表明,本文的层次聚类结果较K一
MEANS算法、ISODATA算法象类结果的面向对象特性更明显,其与真实地物的空间分布更接近。关键调概率潜语义分析模股;高光谱影像;层次聚类;语义信息
中图分类号:O433.4
引言
文献标识码:A
DOI: 10. 3964/j issn 10000593(2011)09247105
机场模型的聚类算法需要在象类精度与计算效率之间进行取含{"]。与基于像元案类对应的是基于对象的聚类分析,该算法的基元为影像对象,因此该聚类分析能够有效利用分制斑
随着卫星与传感器技术的飞速发展,利用各种机载和星载传感器,可获取大量的多时相、多波段、多分辨率的对地观测数据,其被广泛应用于各类地理信息系统的基础数据的更新与业务运行,作为遥感领域的重要数据源之一,高光谱影像具有光谱信息丰富、波段窄、波段数量多等特点,使得其数据存储管理与影像分析难度日益增加("),为了有效利用海量高光谱影像信息,快速、非监督的影像象类分析具有十分重要的现实意义(3),
影像象类在基于特征空间的数据分析中得到广泛应用,其也可被理解为一种非监督的影像分剂",遥感影像的案类算法整体上可被划分为两大类;基于像元的聚类]与基于对象的象类("),其中基于像元的影像聚类算法,由于通常假设像元空间上相互独立,会使影像的象类结果产生明显的斑点效应"),作为一种改进,马尔可夫随机场模型(MRF)在像元层面有效地引人像元的邻域空间信息,能有效地提高影像案类的精度,但其运算量十分巨大,从而造成基于马尔可夫随
块之间的空间关系信息,因而能够取得较高的案类精度*"),但基于对象的聚类结果严重依赖于分割算法,而目前没有通用的影像分割算法(",
概率潜语义分析模型(probabilisticlatentsemanticanaly sis,PLSA)是一种自然语言分析技术,该模型通过分析文档与词的共生矩阵,可较好地提取文档的语义信息(18),随着计算机技术的发展,该模型及其扩展模型已广泛应用于自然图像的图片标注()、场景分类(2)、图像检索(等间题。借签 PLSA模型在自然图像分析的成功经验,许多研究者将其作为遥感影像分析和信息挖掘的重要手段,如Akcay等人利用形态学的分析技术并结合PLSA模型进行了人工建筑地物目标的识别与分析,实现各类目标的自动识别与分析",周晖等人利用PLSA模型将舰船目标表述为潜在主题的概率组合,并利用统计模式识别方法对获取的潜在主题进行判别,使得光学遥够图像舰船检测具有很好的准确性与鲁棒性(),综上所透,将PLSA模型应用到高分辨率逐感影像的信息提
收稿日期:2010-11-03,修订日期:2011-03-10
基金项目:国家自然科学基金项目(40901217,41071259)和高等学校博士学科点专项基金项目(20090003120017)资助
作奢商介:易文域,1984年生,北京师范大学资源学院博士研究生
e-mail, hongtang@bnt, edu cn
■通讯联系人
万方数据
e-mail;wenbinrs@foxmail.com