
第34卷,第5期 2014年5月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
Vol.34,No.5-pp1264-1269
May,2014
近红外高光谱图像结合CARS算法对鸭梨SSC含量定量测定
李江波1,2,彭彦昆”,陈立平1,黄文倩1
1.北京市农林科学院北京农业智能装备技术研究中心,北京100097 2,中国农业大学工学院,北京100083
摘要高光谱数据量大、维数高且原始光谱噪声明显、散射严重等特征导致光谱建模时关键波长变量提取困难。基于此,提出采用竞争性自适应重加权算法(CARS)对近红外高光谱数据进行关键变量选择。鸭梨作为研究对象。采用决定系数产、预测均方根误差RMSEP和验证集标准偏差和预测集标准偏差的比值 RPD值进行模型性能评估。基于选择的关键变量建立PLS模型(CARS-PLS)与全光谱变量建立的PLS模型进行比较发现CARS-PLS模型仅仅使用原始变量中15.6%的信息获得了比全变量PLS模型更好的鸭梨SSC 含量预测结果,,RMSEP和RPD分别为0.9082,0.3120和3.3005。进一步与基于蒙特卡罗无信息变量MC-UVE和遗传算法(GA)获得的特征变量建立的PLS模型比较发现,CARS不仅可以去除原始光谱数据中的无信息变量,同时也能够对共线性的变量进行压缩去除,该方法能够有效地用于高光谱数据变量的选择。结果表明,近红外高光谱技术结合CARS-PLS模型能够用于鸭梨可溶性固形物SSC含量的定量预测。从而为基于近红外高光谱技术预测水果内部品质的研究提供了参考。
关键词近红外高光谱;可溶性固形物;鸭梨;变量选择;竞争性自适应重加权算法
中图分类号:0657.33文献标识码:A
引言
DOI : 10, 3964/j issn. 1000-0593(2014 )05-1264-06
法(successive projections algorithm,SPA)8],X-载荷法(X loadingweights)[9],回归系数(regression coefficients)10),无信息变量消除(uninformativevariable elimination,UVE)叫)
近年来,由于高光谱成像技术融合了传统成像学和光谱
学,可以同时获取农产品的空间信息和连续光谱信息,受到了国内外农产品品质无损检测领域研究学者的青崃2]。然而,通常现代高光谱谱仪具有较高的光谱分辨率,获得光谱数据集包含数百个样本和变量。原始高光谱数据中包含有大量无用的、不相关的信息,这些信息能够前弱光谱模型的预测性能。数以百计的光谱数据中也包含着大量的共线性和允余信息。因此,在利用高光谱数据进行农产品内部晶质定量和定性分析前进行有效的变量选择是非常必要的。通过变量选择可以获得更易解释并且性能更稳定的模型3」。目前,大部分与变量选择的相关研究是基于传统可见-近红外光谱或近红外光谱数据,针对高光谱数据进行变量选择的应用研究并不多。这些变量选择方法包括区间偏最小二乘(interval PLS,iPLS)、组合间隔偏最小二乘(synergyinterval PLS, siPLS)5」、移动窗口偏最二乘(movingwindowPLS,MW-PLS)*]、遗传算法(geneticalgorithms,GA)、连续投影算
收稿日期:2013-07-03,修订日期:2013-10-25
蒙特卡罗无信息变量消除(MonteCarlo-uninformativevaria-bleelimination,MC-UVE)2]等。在这些方法中,iPLS,si-PLS和MWPLS方法通常可以获得光谱变量中的几个特征光谱区域,而不能确定关键的变量。X-载荷法和回归系数法通常需要根据先验光谱知识进行手动选取。SPA在直接光谱变量选取时所选取的变量可能存在较低的信噪比。相比之下,直接采用MC-UVE和GA算法能够获得较好的变量选择效果。
鸭梨为梨果中重要的品种之一,是我国北方的一种重要的水果。可溶性固形物含量SSC是水果的一个非常重要的品质。目前,基于高光谱成像技术对SSC测定的研究报道较少,并且这些报道也主要集中于可见-近红外高光谱技术3」,而关于近红外高光谱技术的研究报道更少。
竞争性自适应重加权算法(competitiveadaptivere-weightedsampling,CARS)是一种最近才提出的较新的变量选择理论4,该方法在对无信息变量进行有效去除的同时,
基金项目:申国博士后科学基金项目(2012M520193)和北京市博士后科研活动经费(2013ZZ-70)资助
后e-mail : lijb nercita.org. cn
作者简介:李江波,1982年生,北京市农林科学院北京农业智能装备技术研究中心博士后
*通讯联系人e-mail:huangwq@nercita.org-cn