
第30卷,第11期 2010年11月
学
与光谱分
析
光
Spectroscopy and Spectral Analysis
Vol. 30, No. 11,pp2958-2961 November,2010
小波聚类方法和近红外光谱技术用于药片种类判别
方利民,林敏”
中国计量学院计最测试工程学院,浙江杭州
310018
摘要对310个药片样品的近红外光谱数据进行了聚类分析。首先使用小波变换对光谱数据矩阵进行多尺度分解,在进行有效压缩之后,采用经典分类方法对合适选取的小波系数组合进行聚类分析,提出了小波聚类方法。该方法分别用于实验室药片、中试药片和规模生产药片样品的分析,按药片样品的组成得到4个类别。结果表明,对实验室药片和中试药片样品分类的精确度均达到100%;对于规模生产药片的分类,共 120个样品中只有1个样品被错误划分,精确度也高达99.2%。近红外光谱技术结合小波聚类方法的案类性能是令人满意的,相比经典象类分析,更加快速,易于使用,对制药行业药片质量以及成本控制均有积极作用。
关键词近红外光谱;小波分析;案类;判别分析;药片
中图分类号:0657.3
引言
文献标识码:A
DOI: 10. 3964/j. issn. 1000-0593(2010)11-2958-04
变量多(波长点数多)、数据允余、有效信息难以提取等问题,并利用分解得到的特征小波系数进行象类分析,分析对象为310个药片的NIR数据集。
药品的生产制造过程包含多个精密而且复杂的阶段,除
最终成品外,每个阶段的中间成品都需要进行质量控制。由于工艺时间长、中间产品物理性质不同等,使得分析测试的过程昂得复杂、费时,传统的方法急需改进"]。新的药品最终产品及中间成品的质量控制方法需要具有高效性、尤破坏,而且分析过程无需溶液(溶剂)等,近几年快速发展的光谱分析技术引起了广大药学领域研究者的极大兴趣(2-},其中,近红外(nearinfrared,NIR)光谱分析技术的快速、低成本、无破坏性、样品无需预处理、易于在线应用等优点使其在制药领城得到了广泛的应用(4)
小波分析技术可用于去噪、压缩和特征提取,在NIR光谐分析中已被广泛使用,包括定量和定性分析"),NIR技术在药物定性分析,如种类判别、原材料产地鉴别、中间产品的辨识等,都逐渐得到了应用7.8)。小波聚类算法是Misiti 等"]最近提出的新的分析方法,该方法使用小波变换对数据进行分解,利用多尺度特征,选择最优小波系数组合作为基构成小波空间,在此空间对信号进行聚类。小波聚类方法充分利用了小波分析的去噪、压缩和特征提取功能,可极大地提升聚类效果,
本文将小波聚类算法用于NIR光谱,以解决光谱信号的收稿日期:2009-12-08,修订日期:2010-03-12
1
实验数据与方法
1.1
数据
数据为UniversityofCopenhagen提供的药片NIR光谱数据以及相应的活性成分含量值(单位;Wt%)[],样本数量为310个,按照活性成分含量的不同分为A,B,C,D四种药片,按照试验阶段的不同又可分为三类:实验室(Labo ratory-Scale)药片样品70个,中试(Pilot-Scale)药片样品120 个,规模生产(Full-Scale)药片样品120个,均含A,B,C,D 四种,药片的详细信息可参见文献[10].样品在粉末状进行 NIR光谱采集,波长范围10507~7400cm~1,采样间隔为8
cm-"。图1为药片的近红外光谱图。 1.2
小波分析
给定小被函数及最大分解层数J,信号X"的离散小波分解可由下式表示
+ev=ox
台
(1)
其中,A"和D}"分别是信号X"在第j层的近似系数和细节系数。在以小波函数作为基函数的条件下,每个信号都可
基金项目:国家自然科学基金项目(10972207)和浙江省科技计划项月(2008C23085)资助
作者简介:方利民,1983年生,中国计景学院计就测试工程学院硕土研究生
·通讯联系人
万方数据
e-mail; linm@cjlu, edu, cn
e-mail;fanglm1004@163,com