
ICS 01.040.17 N 04
GB
中华人民共和国国家标准
GB/T298582013
分子光谱多元校正定量分析通则
Standard guidelines for molecular spectroscopy multivariate calibration quantitative analysis
2013-11-12发布
2014-04-15实施
中华人民共和国国家质量监督检验检疫总局
中国国家标准化管理委员会 发布
GB/T29858—2013
前言
本标准按照GB/T1.1一2009给出的规则起草。 本标准使用重新起草法参考美国材料与试验协会标准ASTME1655一05《红外多元定量分析通
则》编制,与ASTME1655一05的一致性程度为非等效。
本标准由中华人民共和国科学技术部提出。 本标准由全国仪器分析测试标准化技术委员会(SAC/TC481)归口。 本标准负责起草单位:北京化工大学。 本标准参加起草单位:石油化工科学研究院、中国食品药品检定研究院、中国人民解放军总后勤部
油料研究所、北京市农林科学院、国家粮食局科学研究院、中国农业大学、浙江大学、中国石油石油化工研究院、中国农业科学院、中国计量科学研究院、红云红河烟草(集团)有限责任公司。
本标准主要起草人:袁洪福、王家俊、田高友、褚小立、戴连奎、王艳斌、宋春风、胡爱琴、尹利辉、 王纪华、闵顺耕、薛雅琳、张萍、李红梅。
1
GB/T29858—2013
分子光谱多元校正定量分析通则
1范围
本标准规定了采用分子光谱多元校正定量测定样品成(组)分浓度(含量)或样品性质的指导原则。 本标准适用于中红外光谱(约4000cm=1~400cm-l)和近红外光谱(约780nm~2500nm)范围
的分子光谱。
2规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文
件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T3358.1统计学词汇及符号第1部分:一般统计术语与用于概率的术语 GB/T6379.2测量方法与结果的准确度(正确度与精密度)第2部分:确定标准测量方法重复
性与再现性的基本方法
GB/T8322分子吸收光谱法术语 GB/T 27407 实验室质量控制 1利用统计质量保证和控制图技术 评价分析测量系统的性能
3术语和定义
GB/T3358.1、GB/T8322界定的以及下列术语和定义适用于本文件。
3.1
校正 calibration 将一组样品的成分浓度或性质与其光谱进行关联,建立模型的过程。
3.2
校正模型calibrationmodel 表达一组样品的成分浓度或性质与其光谱之间关联关系的数学表达式。
3.3
校正样品 calibration samples 用来建立校正模型的样品,其成分浓度或性质数据已知。
3.4
预测 Jestimate 用校正模型和样品的光谱计算样品成分浓度或性质的过程。
3.5
预测值 estimatevalues 用校正模型和样品光谱计算所得到的样品成分浓度或性质数据。
3.6
验证样品validationsamples 用来验证模型性能的样品,其成分浓度或性质数据已知。
1
GB/T29858—2013
3.7
多元校正multivariatecalibration 用一个以上波长或频率,将一组样品的成分浓度或性质与其光谱进行关联,建立模型的过程。
3.8
参考方法 referencemethod 用于测定校正样品和验证样品成分浓度或性质数据的分析方法,通常为标准方法或是推荐认可的
方法。 3.9
参考值referencevalues 参考数据referencedata 用参考方法测定的校正样品或验证样品成分浓度或性质结果。
3.10
模型验证 model validation 用验证样品来检验校正模型预测值与参考值之间一致性的过程。
3.11
异常值outliers 因含有极端组成,致使其光谱不具代表性,在建模过程中表现为杠杆值较大,对模型结果有强烈影
响的高杠杆值样品对应的数据点,或因数据测定误差较大或数据录人错误等原因,模型预测值与参考值具有显著性差异的样品对应的数据点。 3.12
未知样品 品unknownsamples 其成分浓度或性质数据未知的样品。
3.13
模型内插modelinterpolation 对成分浓度或性质数据处于校正模型涵盖范围内的样品进行预测的过程。
3.14
模型外推modelextrapolation 对成分浓度或性质数据处于校正模型涵盖范围外的样品进行预测的过程。 注:包括两种模型外推:
待测样品的成分与校正样品相同,但浓度超出了所有校正样品涵盖的浓度范围;待测样品包含校正样品中不存在的成分。
-
3.15
校正标准误差 standarderrorof calibration;SEC 校正均方根误差 rootmeansquareerrorofcalibration;RMSEC 在多元校正中用来评价校正模型的预测能力,采用校正样品参考值和预测值计算的标准误差。
3.16
交互验证标准误差 standarderror of crossvalidation;SECV 交互验证均方根误差rootmeansquareerrorofcrossvalidation;RMSECV 在多元校正中用来评价校正模型的预测能力,采用校正样品参考值和使用交互验证的预测值计算
的标准误差。
2
GB/T29858—2013
3.17
验证标准误差standarderrorofvalidation;SEV 验证均方根误差rootmeansquareerrorofvalidation;RMSEV 预测标准误差standarderrorofprediction;SEP 预测均方根误差rootmeansquareerrorofprediction;RMSEF 在多元校正中用来评价校正模型的预测能力,采用验证样品参考值和预测值计算的标准误差。
3.18
预测残差平方和predictiveresidualerrorsumofsquare;PRESS 在多元校正中用来选择建模最佳主成分数或潜变量数,采用校正样品参考值和使用交互验证的预
测值计算的残差平方和。 3.19
模型传递 calibrationmodeltransfer 通过控制制造精密度使不同光谱仪器间保持一致性或通过数学方法对光谱或校正模型进行修正,
使得在一台光谱仪器上建立的校正模型能够在其他光谱仪器上有效使用的过程。 3.20
模型更新 model updating 当待测样品组成与组成变化范围有别于校正样品,或因仪器老化或配件更换导致光谱产生新变化
时,通过加人新样品,增加校正模型适用范围的过程。 3.21
光程 星opticalpathlength 在分子光谱测量过程中,测量光束经过样品的距离。
3.22
可行性模型1 feasibility calibration model 当不能确定是否可利用分子光谱建立多元校正模型时,进行可行性研究.确认样品分子光谱与其成
分浓度或性质间是否存在关联关系而建立的探索模型。
4方法概述
4.1本标准方法基于分子光谱信息作为多元校正的因变量信息进行分析。其分析原理是,样品组成变化引起样品属性变化,同样也引起属性之一分子光谱的变化。样品成分浓度或性质变化与对应的分子光谱变化之间存在着相关关系。本标准方法即是基于这一相关关系,通过采用多元校正方法建立校正模型,然后应用校正模型和未知样品光谱实现定量预测未知样品一种或多种成分浓度或性质的一种快速分析方法。 4.2本标准为校正模型建立、校正模型验证以及用校正模型进行预测提供指导。模型建立、验证过程主要包括:首先,收集一组具有代表性浓度或性质变化范围的校正样品和验证样品,组成校正集和验证集;使用仪器测定校正集和验证集的分子光谱,采用参考方法测定样品的浓度或性质参考值;然后,将测定的光谱数据和浓度或性质参考值进行预处理,选择合适的化学计量学方法将预处理后的校正集光谱数据和浓度或性质参考值进行关联,通过矩阵运算,把光谱矩阵和浓度或性质矩阵联系起来,建立校正模型;使用验证集光谱和校正模型计算验证集预测值,并与验证集浓度或性质参考值比对,评价校正模型的预测能力和模型的有效性;根据评价结果决定校正模型能否使用或更新。 4.3本标准采用化学计量学中多元校正方法建立校正模型。多元线性回归MLR、主成分回归PCR和偏最小二乘法PLS是常用方法,适用于光谱变化与浓度或性质变化呈线性相关关系或接近线性相关关系的体系,具有较强的模型内插或模型外推能力。神经网络等方法适用于光谱变化与浓度或性质变化
3
GB/T 29858—2013
呈非线性关系的体系,模型内插或模型外推能力较弱。其他多元校正方法也可以用于建立校正模型,但不能检测异常值或异常样品,也不能利用本标准的步骤进行模型验证。采用统计检验方法检测校正模型建立过程中的异常值或异常样品、模型外推得到的预测值、分子光谱多元校正分析方法重复性以及分子光谱多元校正方法与参考方法一致性。
5仪器
5.1本标准用来测定分子光谱的仪器包括中红外光谱和近红外光谱仪器。仪器种类包括通用型仪器、 专用型仪器、在线仪器和便携式仪器。 5.2仪器测定的光谱可以是波长或频率连续光谱,也可以是波长或频率离散光谱。提供的光谱数据应包括吸光度数据和波长或频率数据。 5.3光谱数据利用计算机采集和存储。 5.4仪器关键技术指标视具体应用要求确定,主要包括波长或频率范围、波长精密度、分辨率、信噪比、 光谱测量精密度和同型号仪器之间光谱一致性等指标。 5.5仪器应配备光谱测量软件和化学计量学软件。化学计量学软件应具有样品光谱及浓度或性质数据录入、存取和数据格式转换、光谱预处理、多元校正建模与验证以及预测未知样品浓度或性质等功能。 5.6仪器配备的测样附件应视待测样品形态确定,主要包括透射、漫反射、漫透射、积分球、衰减全反射、光纤探头等附件。 5.7考量仪器能否用于分子光谱多元校正分析的最重要指标是光谱测量重复性。一般在全波长或频率范围内或者建模采用的波长或频率范围内,推荐不经过预处理,多次重复光谱吸光度标准偏差小于设定的光谱偏差最大限值。该限值由用户通过研究建模所用仪器的实际情况和所建模型的精密度要求来设定,以使测量光谱重复性符合模型精密度要求, 5.8考量仪器能否用于分子光谱多元校正模型传递的最重要指标是仪器间光谱一致性,一般在全波长或频率范围内或者建模采用的波长或频率范围内,推荐不经过预处理,仪器间多次重复光谱吸光度标准偏差小于设定的光谱偏差最大限值。该限值由用户通过研究建模所用仪器的实际情况和所建模型的精密度要求来设定,以使测量光谱重复性符合模型精密度要求。
6光谱测量
6.1光谱测量应遵循在光谱测量过程中最大限度避免引人误差的原则,以减少对校正模型预测能力的不利影响。 6.2多元校正分析依据为比耳定律,即均匀样品中某物质吸收强度与该物质浓度呈线性关系。样品的吸光度定义为透过率T倒数的常用对数,如式(1):
A=log1(1/T)
+*..( 1 )
透过率T定义为光透过样品后的能量与人射光能量的比值。反射方式测量时,使用反射率R代替透过率。反射率定义为光经样品反射后的能量与人射光能量的比值。
注:式A=log1。(1/R)在用于反射时不属于定义,而是用于描述反射率R与吸收物质浓度之间的线性关系,对于
-些应用领域,其他线性函数可能更适用,例如,Kubelka-Munk。
6.3不同的仪器,可能会使用不同的背景信号测量方式。对所有校正样品、验证样品和待测未知样品的光谱测量应使用同一背景信号测量方式。 6.4对校正样品的光谱测量,宜采用每采集一个样品光谱之前,采集一次背景信号的测量方式,以消除背景或仪器性能随时间漂移对光谱测量精密度带来的不良影响。 6.5校正样品光谱、验证样品光谱和待测未知样品的光谱,应以同样的方式采集,光谱测量中任何变化
4
GB/T 298582013
未包含在校正模型中都将会带来误差。 6.6对于不均匀样品如颗粒等,宜采用多次重复测量光谱的平均光谱,使测定的光谱对样品整体具有代表性。 6.7环境因素对光谱测量精密度影响不可忽视,应注意控制环境对光谱测量精密度的影响。例如,如果样品保存在冰箱或冷藏室内,光谱测量前,应将样品放置在环境中,当其温度和环境温度达成平衡后再测量。 6.8光谱测量过程中应避免因样品本身发生变化而引起光谱变化。如避免样品光照时间过长造成某些样品成分如水分损失引起光谱变化。 6.9在正式采集光谱前,宜通过可行性研究实验,计算同一样品多次重复装样测量光谱的偏差,作为确定光谱测量时样品重复测量次数的重要依据。 6.10注意仪器长期稳定性对光谱测量精密度的影响。 6.11宜避免样品中待测成分光谱吸收强度过大或饱和产生非线性光谱响应。
校正样品的选择
7
7.1为建立一个良好的校正模型,校正集中的样品应包含使用该模型预测的未知样品中可能存在的所有化学成分,且校正集的化学成分浓度范围应涵盖使用该模型预测的未知样品中可能遇到的浓度范围:以保证未知样品的预测是通过模型内插进行分析的;校正集浓度或性质范围最好还应大于或等于参考方法的再现性标准偏差即再现性除以2.77大小的5倍,至少不低于3倍。在整个变化范围内,校正集中样品的化学成分浓度是均匀分布的;校正集中的样品数量应足够多,以能统计确定光谱变量与校正成分浓度或性质之间的关系。 7.2根据待测样品的复杂性,确定建立校正模型所需样品数量。如待测样品含有较少的浓度变化成分,则存在的光谱变量数较少,使用相对数量较少的校正样品便可确定光谱与样品成分浓度或性质之间的关系。如待测样品含有较多的浓度变化成分,则需较多数量的校正样品建立校正模型。对复杂的混合物,获得理想的校正集非常困难。只有通过建立模型初步确定模型所需光谱变量,才能确定校正样品数量是否足够。 7.3对于应用多元校正方法建模,如果使用3个或更少的变量数建立校正模型,剔除异常样品后校正集应至少含有24个样品;如果使用大于3的变量数建立校正模型,剔除异常样品后校正集应至少含有6k个样品,如果建模数据进行了均值中心化预处理,剔除异常样品后校正集应至少含有6(十1) 个样品,这样能够保证模型中含有至少20个自由度以进行统计检验,同时保证有足够的样品数量确定光谱变量与校正成分浓度或性质之间的关系。上述样品数量要求仅为满足统计学的最低要求,实际中应根据影响建模因素(如环境温度变化等)和可行性,探索确定合适的样品数量。
注:通常,MLR的变量数为波长或频率数量;PCR为主成分数;PLS为主成分数或潜变量数。 7.4宜使用主成分分析PCA方法对校正集光谱进行探索性分析,检查校正集是否有异常的分布或聚类,指导剔除异常样品或相同或极为相近的样品。
注:别除异常样品时可能会使一部分信息丢失,因此需谨慎除异常样品。为提高统计分析的可靠性,建议对每次
剔除后的光谱进行检验,并将别除的数量控制在一定的比例之内,
7.5不同类型的样品可能会使校正集的空间分布形成多个子集。可根据每个子集建立校正模型,提高模型对未知样品预测的稳健性。
8验证样品的选择
8.1验证集中的样品应包含使用模型分析的待测样品中可能存在的所有化学组成。
5