
第31卷,第7期 2011年7月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
Vol.31,No.7.pp1847-1851
July,2011
多种群精英共享遗传算法在异常光谱识别中的应用
延2.
曹
晖,周
1.西安交通人学电气工程学院,陕西西安710049 2.西安交通大学能源与动力工程学院,陕西西安
710049
摘要提出了一种基于多种群精美共享遗传算法的异常光谱识别方法。该方法应用于红外光谱数据的分析,并在除异常光谱样本后使用偏最小二乘方法进行建模。与使用蒙特卡洛交义验证、留一交义检验、马氏距离以及传统遮传算法进行异常光谱识别的方法相比,所提方法将水分预测模型的预测误差平方和(PRESS)分别降低了72.4%,39.5%,39.5%和14.5%;将脂防含量的预测模型的PRESS值分别降低了 86.2,75.9%,84.9%和19.9%;将蛋白质含量的预测模型的PRESS值分别降低了56.5%,35.7% 35.7%和18.2%。实验表明,所提方法不仅能适应不同成分光谱数据的异常识别,面且剩除异常光谱数据
后所建立的模型具有较高的预测能力和较好的稳健性。关键词异常光谱识别:遗传算法;多种群;精英共享
中图分类号:0657.3 引言
文献标识码:A
DOl: 10. 3964/j. issn. 1000-0593(2011)07-1847-05
多个种群同时进行搜案且每个种群的优良个体在各种群之间得以共享,从而防止了局部最优解的产生。该方法对经典近红外光谱数据集进行分析,在删除异常样本后进行PLS建
光谱定量测量技术是通过建立物质浓度与光谱之间的预测模型,从而实现该物质的间接测(13)。但由于操作失误、参数变化和环境干扰等原因,使得采集到光谱数据中往往含有异常样本。如果直接使用这些数据进行建模,会直接降低所建模型的预测精度(45)。因此,对异常光谱的识别是光谐分析中必不可少的环节。
马氏距离是异常光谱识别的常用指标之一。有利用马氏距离的平均值加两倍马氏距离的标准差作为阔值来判定光谱样本是否异常,也有根据马氏距离排序来确定异常光谱的方法"。根据光谱数据和所建模型预测值之间的差异来进行异常光谱识别也是比较常用的方法[7]。该方法一般是通过偏最小二乘法(partial linearsquares,PL.S)建模,然后根据样本的残差大小来判断其是否为异常光谱(*)。此外还有在PLS建模的基础上,采用留一法交义检验确定异常光谱数据[’,以及利用蒙特卡交义验证建立一定数量的PLS模型后,按照预测误差平方和(PRESS)排序,并根据样本在不同模型中出现频次来完成异常光诺的识别",H。
本文提出了一种基于多种群精英共享遗传算法的异常光谱识别方法。该方法在对光谱样本逐个编码的基础上,采用收稿日期:2011-01-03,修订日期:2011-04-20
模。实验表明,本文所提方法不仅在一定程度上克服了传统遗传算法中的过早收敛问题,而且与常用异常光讲识别方法相比,由本文所提方法删除异常光谱数据后所建立的模型具有较高的预测能力和较好的稳健性。
计算方法
本文将异常光谱的识别看作为一个选择优化问题,即通过优化筑法的搜索,确定出光谱数据集中的异常样本并删除,而保留下的样本则为可用于建模的正常光谱数据,从面保证了所建模型的预测精度。遗传算法是一种基于生物界自然选择和遗传机理的优化算法且具有自适应全局搜索的特点,但由于容易出现个体趋同而产生早熟现象12),使其在实际应用时不能给出令人满意的最优解。为解决这一间题,本文提出了一种多种群精英共享遗传算法(multi-populatione litistssharedgeneticalgorithm,MPESGA),并将其应用于异常光谱的识别上。该算法使用二进制数对光谱数据集中的每个样本逐一编码,即,“0”表示样本是异常光谐数据,而“1” 则说明其为正常数据。在用于异常光谱识别时,该算法根据
基金项目:教育部博士点基金项日(20090201120005)和国家白然科学基金项目(61005058)资助
作者简介:警晖,1978年生,西安交通大学电气工程学院讲师
*通讯联系人万方数据
e-mail: yan. zhou@mail., xjtu. edu. cn
e-mail: huicao@mail. xjtu edu cn