
第34卷,第10期 2014年10月
光谱学与光谱分析 Spectroscopy and Spectral Analysis
Vol. 34 ,No. 10 -pp2701-2706
October,2014
Vis-NIR光谱模式识别结合SG平滑用于转基因甘蔗育种筛香
刘桂松”,郭昊淞,潘涛*,王继华”,曹干
1.光电信息与传感技术广东普通高校重点实验室(暨南大学),广东广州510632 2.广东省农业科学院作物研筑所,广东广州510640
摘要以Savitzky-Golay(SG)平滑筛选,主成分分析(PCA)分别结合有监督的线性判别分析(LDA)、无监替的系统聚类分析(HCA),应用于转基因甘育种筛查的可见-近红外(Vis-NIR)无损检测。提出兼顾随机性、稳定性的定标、预测、检验框架:取由间种植处于伸长期其蔗叶样晶456个,具有Bt基因和Bar基因的转基因样品(阳)306个,非转基因样品(阴)150个;随机选取156个为检验集(阴性50、阳性106),余下为建模集(阴性100、阳性200,其300),建模集再随机划分为定标集(阴性50、阳性100,其150)、预测集(阴性50、阳性100,共150共50次:扩充SG平滑点数,同时删除绝对值偏小的高阶导数模式,共264个平滑模式用于模型筛选:采用前3个主成分两两组合,再根据模型效果选出最优主成分组合:基于所有定标、预测集划分和SG平滑模式,建立SG-PCA-LDA和SG-PCA-HCA模型,根据平均预测效果优选参数,使模型具有稳定性;最后用检验集进行模型检验。经SG平滑后,PCA-LDA和PCA-HCA的建模精度、稳定性均显著改善;最优SG-PCA-LDA模型阳性、阴性样品检验识别率分别达到94.3%和96.0%;最优SG-PCA-HC.A 模型阳性、阴性样品检验识别率分别达到92.5%和98.0%。结果表明:Vis-NIR光谱模式识别结合SG平滑
可用于转基因甘蔗叶的准确识别,提供了一种简便的转基因甘蔗育种筛查方法。关键词转基因甘蔗育种筛查;Vis-NIR光谱;SG平滑;PCA-LDA;PCA-HCA
中图分类号:0433.4:
文献标识码:A
引言
DOI: 10, 3964/j. issn. 1000-0593(2014 )10-2701-06
电磁波,主要反映的含氢基团X一H(如C一H,N一H和 0一H等)振动的倍频和合频吸收。由于近红外光谱吸收强度弱,对大多数样品,不需要进行预处理便可直接测量,在
甘蔗是主要的糖料作物,我国的蔗糖产量居世界第三位。甘蔗的附加值较高,除制糖外,还用于造纸及燃料乙醇的生产等。甘蔗多生长在高温高湿地区,易受多种有害生物的威胁,其中虫害尤为产重。随者现代农业生物技术的发展,甘蔗转基因育种日益受到重视。目前,将含有抗虫基因(Bt)和抗除草剂基因(Bar)导人入首廉中,对现有甘廉优良晶种进行遗传改良,可有效提高首薰抗虫和抗除草剂能力。在转基因甘蔗育种时,必须判定所导入的外源基因是否在甘植株成功表达。目前的基因筛查方法主要是分子生物学的检测技术,其方法复杂,需要使用多种试剂和较高的专业操作技能,不便于大规模应用。研究简便、快速的转基因筛查方法具有重要应用价值。
近红外(NIR是介于可见(Vis)和中红外(MIR)之间的收稿日期:2014-05-15,修订日期:2014-07-23
快速、实时、无损检测方面具有明显优势,成功应用于农业3.4]、食品5,6]、石油化工[7.$]、生物医学9,10]等领域。此外,近红外光谱也可以反映基因变异相关的蛋白质分子吸收信息,已成功应用于基因遗传病1]、转基因农作物11]的检测。
实际上,转基因甘蔗与非转基因甘蔗的蛋白质分子存在差异,它们都含有大量的含氢基团X一H,因此,近红外光谱可用于分析甘蔗基因变异信息,但目前还未见相关应用研究成果报道,
在近红外光谱模式识别中,为了解决数据高维数、共线
性(奇异)间题,通常需要进行降维和特征提取,本文采用带用的主成分分析(PCA)方法。考虑到一维主成分过于简单、三维以上主成分过于复杂,拟采用两维主成分的模式:选取
基金项目:国家自然科学基金项目(61078040),广东省科技计划项目(2012B031800917),广州市科技计划珠江科技新星专项
(2104J2200073),广州市科技计划项目(2014Y2-00002))资助
作者简介:刘桂松,1990年生,暨南大学信息科学技术学院数学系硕士研究生
*通讯联系人e-mail:tpan@ jnu.edu.en
e-mail : liuguisong@ live, com