近红外光谱分析基础数据准确性的研究_第1页
近红外光谱分析基础数据准确性的研究_第2页
近红外光谱分析基础数据准确性的研究_第3页
近红外光谱分析基础数据准确性的研究_第4页
全文预览已结束

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

近红外光谱分析基础数据准确性的研究

基础数据的准确性近红外光谱技术(nir)是20世纪90年代以来最著名的光谱分析技术之一。NIR分析技术具有分析速度快、效率高、成本低、不需要预处理、无污染、易于实现无损在线分析等特点,加上近红外光谱多种测量方式如漫反射、透射和透反射等,能够测定各种各样的物态样品的光谱。因此,近红外光谱分析已被广泛地应用到石油化工、农业、食品、生化、医药临床、造纸和环保等领域。NIR分析技术有别于大多数传统分析方法,是一种间接分析技术,要通过校正模型的建立来实现对未知样本的定性或定量分析。校正模型是在一组已知待测组成或性质(称为基础数据)且具代表性样品(称为校正集样品)的基础上经化学计量学方法建立的。对于体系简单的混合物,通过人工配制的方式便可得到一组理想的校正集样品,但近红外光谱分析方法遇到的大多数分析对象是复杂的样品体系,如测量汽油的烯烃含量、小麦的蛋白质含量等,对于这些较难通过配制方式获得校正集样品,必须收集实际样本,通过现行的标准方法或常规方法(称为基础方法)来得到建立模型所必需的基础数据。因此,基础数据的准确性是影响近红外光谱分析结果的一个重要因素。本文以人工配制的四组分混合物校正集样本和实际的汽油校正集样本为例,通过人为增加基础数据误差的方法,研究了基础数据的准确性对对近红外光谱分析结果的影响。1实验部分1.1测试样本的选择(1)用苯、甲苯、二甲苯和异辛烷试剂,人工配制了50个四组分混合物样本,以苯含量作为分析对象,基础数据由配制过程中称重得到,苯含量的分布范围为1.0%~6.5%。通过K-S方法选取30个样本组成校正集,验证集则由剩余的20个样本组成。(2)收集了135个重整汽油样品,以研究辛烷值(RON)为分析对象,基础数据由GB5478方法测定,RON的分布范围为90.0~104.5。通过K-S方法选取100个样本组成校正集,验证集则由剩余的35个样本组成。1.2仪器、设备和检测仪器:NIR-6000在线近红外光谱仪(石油化工科学研究院研制,北京英贤仪器有限公司制造),5cm流通池,CCD检测器,700~1100nm。光谱采集:以空气为参比,样品放入2min后开始扫描,环境温度:(22±5)℃。1.3最佳主因子数的确定采用偏最小二乘方法(PLS)建立定量校正模型,最佳主因子数由交互验证法所得的预测残差平方和(PRESS)确定。模型由校正集标准偏差(SEC)和验证集标准偏差(SEP)等指标进行评价。1.4处理数据各种光谱预处理方法、偏最小二乘校正方法和模型评价指标等算法均由Matlab语言编制。2结果与讨论2.1基础数据准确性对nir分析结果的影响在建立模型时,首先将光谱进行一阶微分处理,并对基础数据进行中心化预处理,参与PLS回归的光谱区间通过近红外光谱-苯含量的相关系数图来选择。表1列出了校正和预测结果,图1给出了校正和预测过程中苯含量的实际-预测相关图,由结果可以看出,校正集的SEC与验证集的SEP相当,NIR测定苯含量的准确性(SEP)约为0.1(w%)。由于该体系是通过称重配制的,称重的准确性为0.001g,考虑操作过程引入的误差,苯含量基础数据的准确性约为0.05(w%)。为考察基础数据准确性对NIR分析结果的影响,人为给校正集样本的苯含量增加误差,重新按照上述步骤建立校正模型,并对20个验证集样本的苯含量进行预测,通过SEP来评价基础数据准确性对NIR分析结果的影响。分别通过以下3种方式增加基础数据的误差:(1)对校正集样本原始基础数据xi添加绝对误差Δx(w%),即xi±Δx,其中Δx取正值,对偶数序号样本采用加号,奇数序号的样本采用减号,校正集样本序号是随机排列的;(2)对校正集样本原始基础数据xi添加相对误差xi×r%,即xi±xi×r%,其中偶数序号样本采用加号,奇数序号的样本采用减号;(3)对校正集样本原始基础数据xi添加正态分布的随机误差Δxi,即xi±Δxi,其中随机误差Δxi通过MATLAB软件自动生成,以标准偏差为误差的指标。按照基础数据误差添加方式(1)对校正集样本苯含量依次加上或减去0.1%~1.0%(w%)的绝对误差,考察基础数据准确性变差对模型及其预测结果的影响。图2给出了SEC和SEP随绝对误差Δx的变化曲线。图3为绝对误差为±0.7(w%)时,校正集交互验证过程的结果以及验证集的预测结果。可以看出,随着基础数据准确性变差,SEC和SEP都相应变大,但SEP的增长幅度远小于SEC,说明尽管基础数据在一定范围内存在较大的绝对误差,但用其所建立的NIR校正模型仍能得到较准确的预测结果。按照基础数据误差添加方式(2)对校正集样本苯含量依次加上或减去1%,5%,10%,15%和20%的相对误差,SEC和SEP随相对误差r%的变化见图4,由此可以看出,如果建模所用基础数据存在一定程度的相对误差,仍能得到较准确的预测结果。图5是按照基础数据误差添加方式(3)对校正集样本苯含量添加五组标准偏差为0.1~0.5的正态分布随机误差(其对应的绝对误差范围分别为±0.2w%,±0.4w%,±0.5w%,±0.8w%和±0.9w%)所得到的SEC和SEP,图6为添加标准偏差为0.4的随机误差时,校正集交互验证过程的结果以及验证集的预测结果。可以看出,与误差添加方式(1)和(2)的结果相似,随着基础数据添加随机误差的增加,SEC显著增加,但SEP增加缓慢,当校正模型的SEC增大到0.55w%时,仍能得到较好的预测结果(SEP=0.18w%)。2.2基础数据准确性的影响研究辛烷值(RON)是评价汽油抗爆性能的重要指标之一。在研制催化剂、优化工艺过程及汽油调和等方面,重整汽油辛烷值是一项必不可少的评价参数。RON模型建立过程与四组分体系完全相同,表2列出了校正和预测结果,由结果可以看出,SEC与SEP相当,假定标准方法测定RON为零误差,则NIR测定重整汽油RON的准确性(SEP)约为0.24个辛烷值单位。为考察基础数据准确性对NIR分析重整汽油RON的影响,采用与四组分混合体系完全相同的3种误差添加方式,对校正集样品的RON基础数据,分别重新建立校正模型,并对35个验证集样本的RON进行预测。结果表明,3种误差添加方式对重整汽油RON分析结果的影响与四组分混合体系得到的规律几乎完全一致。限于篇幅,本文只给出了添加随机误差对RON分析结果的影响。图7是按照基础数据误差添加方式(3)对校正集样本RON添加七组标准偏差为0.1~0.7的高斯分布随机误差(其对应的绝对误差范围分别为±0.2,±0.4,±0.5,±0.8,±1.1和±1.3辛烷值单位)所得到的SEC和SEP,图8为添加标准偏差为0.7的随机误差时,校正集交互验证过程的结果以及验证集的预测结果。可以看出,随着基础数据添加随机误差的增加,SEC显著增加,但SEP增加缓慢,当校正模型的SEC增大到0.80时,仍能得到较好的预测结果(SEP=0.31)。以上结果表明,实际建立NIR分析模型时,可以将交互验证过程中偏差相对较大的样本保留在校正集中(偏差一般不应超过基础测试方法再现性要求的1.5~2.0倍),这样可在基本不影响模型预测能力的前提下,增加模型的稳健性和适用性。3建立近红外分析模型通过以上研究,得到以下结论:(1)基础数据的准确性对近红外分析模型及其预测结果都有一定的影响,基础数据越准确,所建立模型的精度越高,其对未知样本的预测结果也越准确。(2)尽管近红外光谱分析模型是由基础数据回归得到的,但近红外光谱方法有可能得到更接近真值的预测结果。尤其对于精度相对较差的测试方法提供的基础数据,通过大量样本的近红外光谱分析和化学计量学统计处理,将有可能得到更精确的预测结果。(3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论