【THz光谱稀疏表示及多特征提取方法分析案例5700字】_第1页
【THz光谱稀疏表示及多特征提取方法分析案例5700字】_第2页
【THz光谱稀疏表示及多特征提取方法分析案例5700字】_第3页
【THz光谱稀疏表示及多特征提取方法分析案例5700字】_第4页
【THz光谱稀疏表示及多特征提取方法分析案例5700字】_第5页
已阅读5页,还剩13页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

THz光谱稀疏表示及多特征提取方法分析案例目录 1 1 3 4 6 9 本实验采用的THz仪器为Zomega公司的Z3系列THz时域光谱仪,Z3是一款产生和检测宽频THz脉冲的THz时域光谱仪。系统主要由Z3光谱仪、THz理图如图14所示。时间延迟时域光谱仪的一个关键能力是调整泵浦光和探测光束之间的时系统的THz源为光纤激光器,发射器为GaAs光导天线,接收器采用的为ZnTe功率为100mW或者功率更高时,峰值的动态范围大于70dB。a.典型太赫兹时域系统原理图.b.光谱图确化锌1/4波片偏振器泵浦光从光谱仪的后部进入,系统在前部有三个端□,根据应用需要发送THz束。TAC软件和上面显示的连接器总线可以控制Z3。光导天线通过飞秒激光脉冲产生的光电流的时间变化和施加在电极上的偏置产生THz波。在系统光变了泵浦光和探测光的强度比。探测光与线性慢扫描延时级相互作用,在激活对包含THz电场振幅信息的探测束的极化变化非常敏感。通过测量来自探测器的光电流与时间延迟的关系,得到了THz脉冲的时间波形。对实测THz波电场的快速傅里叶变换得到THz信号的频谱。将蔗糖、果糖、麦芽糖和乳糖四种分析纯样品作为定加压至10MPa并保持5min后松开油阀,取下工作台上的模具,将推磨套套在模时样品被压制成直径为13mm的圆薄片,要确保圆薄片的种压制30个,共得到120组样品。混合样品的制备首先要确定混合物的比例。本作品研究中制备两组混合物,聚乙烯在THz波段相当于透明物质,蔗糖与聚乙烯混合物中蔗糖的含量分别设置为10%、20%、30%、40%、50%、60%、70%、80%和90%。葡萄糖与小麦粉萄糖的含量分别设置为1%、3%、5%、10%、20%、30%和40%。因为单个样品的样品,虽然电子天平的精度为0.1mg,但直接称取2mg不能很容易实现,所以1.3太赫兹光谱数据光学特征果糖、乳糖、麦芽糖、蔗糖经过THz时域光谱仪检测的时域光谱图如图15所示,参考信号为THz光谱仪扫描空气产生的信号,由于每个压片的厚度不同,不同的糖类相对于参考信号的时间延迟不同。糖类样品信号的幅度相对于参考信号有所衰减,因为样品表面会产生一定的反射,所以相对于参考信号幅度范围有所减小。图16为四种糖类的时域光谱瀑布图,可以看到每种糖类的信号变换情况,乳糖信号波动较大,麦芽糖信号波动最小。麦芽糖3035参考信号果糖乳糖麦芽糖60%、70%、80%和90%。与参考信号之间的时间延迟随着蔗糖浓度的增加逐渐减小。信号的幅度范围随着蔗糖浓度的增加逐渐增加。图17为蔗糖与聚乙烯混合物时域光谱瀑布图。参考信号90%蔗糖80%蔗糖70%蔗糖60%蔗糖50%蔗糖40%蔗糖30%蔗糖20%蔗糖10%蔗糖THz时域光谱仪测得的信号为时域光谱信号,信号不仅在时间域有改变,在频率域也有相位、幅度等信息,为了直观的显示被测样品的频域特征,将时域光谱进行傅里叶变换得到频域光谱。经计算得到蔗糖、果糖、乳糖和麦芽糖的频域光谱,相对于参考信号,四种糖类的幅度范围有所减小,其中蔗糖、果糖和乳糖幅度范围相似,麦芽糖幅度范围最小。频域光谱瀑布图如图18所示,显示了每种糖类频域光谱具体波动变化。频率(THz)果糖、乳糖、麦芽糖和蔗糖的吸收系数光谱瀑布图如图19所示,可以看到乳糖在0.53THz、1.36THz和1.83THz左右有明显的吸收峰,蔗糖在1.41THz左右有明显的吸收峰,果糖在1.31THz左右有明显的吸收峰,由于噪声的影响麦芽糖的吸收系数光谱看不到明显的吸收峰,因此需要后续进行预处理。果糖1.4太赫兹光谱稀疏表示模型研究稀疏表示又意为稀疏采样,其与压缩感知相互联系,DavidDonoho首先提出压缩感知理论,压缩感知理论定义为,当信号处于稀疏或压缩状态时,原始信号可通过部分采集信号实现重新构建。稀疏采样、编码测量和重构算法为压缩感知技术理论的三个主要模块。压缩感知是稀疏表示理论推导出的重要结论,可以克服很多领域的困难,是信号处理中一种新型的信号采样方法。在信号处理中,如何从大量杂波信号中提取出关键成分是研究的重要任务。在稀疏表示出现之前,传统的采样方法是香农采样定理,采样的程序一般包括采样、编码、压缩、传输和解码。传统的采样方法很难对海量的数据进行有效的采样,并且占用内存大。稀疏表示将采样和编码压缩相结合,利用更高效的采集方式对原始样本进行采样,继而再通过最优重构算法对样本进行重构。稀疏表示后的信号集数据量相比于原始信号有相当大程度的减小。基于该特点有大量关于稀疏表示理论的算法被提出,可以有效的解决信号重构等问题,并且可以节省大量的采样时间和样本存储空间。稀疏表示模型如图20所示。求解稀疏系数的方法可以分为四种:贪婪算法、约束优化策略、逼近算法和同伦算法。K图20稀疏表示太赫兹光谱图像经过预处理后,再进行稀疏采样,采用OMP算法进行稀疏编码,K-SVD算法进行字典更新。为了提高后续定性定量模型的效率,将时域、频域、吸收系数和折射率四种光学特征分别进行稀疏表示。对本作品研究的定性、定量分析数据分别开展研究,THz光谱稀疏表示计算流程图如图21所示:用OMP算法求解X利用SVD算法分解E货训练Fig.21Flowchartofsparserepresentationalgo图22所示。稀疏系数矩阵稀疏系数矩阵稀疏表示稀疏系数矩阵稀疏表示稀疏系数矩阵稀疏表示稀疏系数矩阵稀疏表示稀疏系数矩阵稀疏表示稀疏系数矩阵稀疏表示稀疏系数矩阵稀疏表示稀疏系数矩阵稀疏表示稀疏系数矩阵稀疏表示稀疏系数矩阵稀疏表示稀疏系数矩阵稀疏表示稀疏系数矩阵稀疏表示品吸收系数频域吸收系数吸收系数折射率折射率折射率频域时域时域频域时域图22太赫兹光谱数据稀疏表示处理过程Fig.22Sparserepresentationo为了验证稀疏表示在THz光谱数据处理上的高效性,将式PCA、LDA、LLE和ISOMAP等进行对比,选取了蔗糖、果糖、乳糖和麦芽为模型的输入,构建SVM分类模型,对比结果如表10所示。表10稀疏表示与常见降维方法对比结果Table10Comparisonresultsbetweenspa模型精确度召回率耗时/s从表10中可以看到,THz光谱稀疏表示后作为SVM分类模型的输入相比其1.5太赫兹光谱多特征提取方法研究THz光谱检测样品时常见的四种光谱特征有时域、频域、吸收系数和折射率,虽然稀疏表示可以大大降低模型的训练时间,但是只选用吸收系数作为模型的输入模型的准确率有待提高,本章将稀疏表示后的光谱数据进行单一特征与多特征对比,最终寻找最合适的特征组合方式。介绍糖类样品的分类模型、蔗糖与聚乙烯混合物的定量分析模型以及葡萄糖与小麦粉混合物的定量分析模型三种模型,分别进行多特征提取并分析结果。将蔗糖、葡萄糖、麦芽糖和果糖四种糖类的时域、频域、吸收系数和折射率四种特征分别进行百分位滤波预处理,然后进行稀疏表示,将稀疏表示的系数作为SVM分类模型的输入,糖类单一模型精确度趋势图如图23所示。蔗糖和聚乙烯混合物中蔗糖浓度为10%、20%、30%、40%、50%、60%、70%、80%和90%。将混合物的时域、频域、吸收系数和折射率进行百分位滤波预处理后进行稀疏表示,然后采用PLS回归模型进行定量分析。将数据集按照7:3的比例划分为校正集和预测集。单一特征定量分析模型中频域稀疏表示后PLS模型表现最差,校正集确定系数R²仅为0.180,预测集确定系数R²仅为0.149。吸收系数模型表现最优,确定系数R²最大,均方根误差最小,预测集相对于校正集确定系数有所减小,均方根误差有所增加,但在四种评价模型中仍是最优的。单一特征定量分析模型有待优化,后面继续进行多特征定量分析。蔗糖和聚乙烯混合物单一特征定量模型确定系数趋势图如图24所示。校正集预测集单一特征模型葡萄糖与小麦粉混合物中葡萄糖的浓度分别为1%、3%、5%、10%、20%、30%和40%,对混合物进行定量分析,首先将得到的四个特征进行百分位滤波预处理,然后对四种特征分别进行稀疏表示,最后将稀疏表示后的光谱特征进行PLS定量分析。折射率作为单一特征输入,定量模型表现相对较差,在四个特征中确定系数R²最小,均方根误差最大,校正集确定系数R²为0.466,预测集确定系数R²为0.463,RMSEC为0.101,RMSEP为0.102。时域作为单一特征输入,模型性能相对最好,校正集确定系数R²为0.937,预测集确定系数R²为0.897,确定系数在四种特征中最大,RMSEC为0.035,RMSEP为0.044,均方根误差最小。图25为葡萄糖与小麦混合物定量模型确定系数趋势图,吸收系数的校正集与预测集确定系数相差较大。时域频域吸收系数折射率图25葡萄糖与小麦粉混合物定量模型确定系数趋势图两特征稀疏表示特征提取,将四个特征光谱采用百分位滤波预处理后分别进行稀疏表示,得到各自的稀疏表示系数,将四个稀疏表示系数进行两两组合,组合后的特征作为分类模型或定量模型的输入,得到结果。将四种糖类的特征进行上述处理,两两组合有六种组合方式,将组合后的两特征作为分类模型的输入可以看到吸收系数和折射率作为分类模型的输入精确度最低,精确度为0.49。时域和吸收系数作为分类模型的输入,模型的精确度最高为0.95。两特征分类模型的平均精确度为0.72,相对于单一特征输入模型两特征输入模型精确度提高0.11。图26为糖类两特征分类模型精确度趋势图,相对于单一特征精确度趋势图整体吸收系数+折射图26糖类两特征分类模型精确度趋势图Fig.26Accuracytrendgraphofcarbohydratetwo-featureclassifica系数,将四个稀疏表示系数进行组合,分别输入到SVM分类模型和PLS定量模型中。糖类四特征稀疏表示分类结果可知四特征稀疏表示SVM分类模型精确度为0.98,相对于三特征稀疏表示SVM模型平均精确度提高0.07,结果表明多个特征组合可以有效的提高分类模型的精确度。图27为单特征与多特征模型精确应用在THz光谱的分类模型中,以提升模型的分征和四特征输入到糖类SVM分类模型、蔗糖-聚乙烯混合物PLS定量模型和葡THz光谱数据是具有线性和非线性关系的高维数相邻平均法平滑、FFT滤波、百分位滤波、一阶导数、一阶导数+平滑、二阶导采用稀疏表示对预处理后的THz

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论