化学计量学基础ppt课件_第1页
化学计量学基础ppt课件_第2页
化学计量学基础ppt课件_第3页
化学计量学基础ppt课件_第4页
化学计量学基础ppt课件_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.高等设备分析-化学计量学,发表者:杜一平,化学数据分析,实验数据化学分析:单点数据设备分析:多维数据的维数增加0维-标量的一维向量二维-矩阵三维张量样本数增加数据量增加的倾向,数据库,大量数据, 大数据(bigdata )大数据量明显信息量大,但是发掘有用信息困难的数据处理方法的研究越来越重要:化学计量学方法的应用不限于分析化学学科:相关学科, 收集不同产地南丰橘子HPLC指纹,收集江西(18个)、福建(18个)、湖南(18个)和广西(10个)南丰橘子样品, 有机溶剂提取后进行HPLC分析,对64个HPLC色谱进行主要成分分析: X=USVT特征量:前3个主要成分特征量所占的比例,58.0%、11.2%、8.4%,剩下21.4%Scores散点图:样品点分类,光谱数据和定量三维图像图像光谱数据图像蛋白质的各级结构(a )主结构(b )二次结构- Glu-val-thr-ASP-Gly - helix- sheet (c ) t quaternarystructure的肽链在空间上卷曲特定的三维空间结构,数据表示-数字化,0维-标量: x=2; 一维向量:x=1357; 二维-矩阵:X=; 3维张量:Z=X1X2X3,1971年,瑞典化学家斯瓦蒂. wold(umeauniversity )在申请基金时,提出了化学计量学名词。chem-istry-metricschemometricsecono-mics-metrics econometrics、化学计量学概述、br cer.kowalskiuniversityofwashington,他们被公认为化学计量学的创始人美国Bruce.R.Kowalski非常赞赏这个称呼。 此后,1974年与斯瓦蒂. wold合作成立了国际化学计量学学会。 运用化学计量学介绍、数学、统计学、计算机科学和其他相关学科的理论和方法,优化化学测量过程,从化学测量数据中最大限度地获得有用的化学信息。 化学中的一门分支学科(分析化学)多学科交叉的新学科,化学计量学的定义,问题解决策略:分析化学以计算机为手段,利用数学和统计学的方法实现数据分析。早期化学计量学、数理统计方法。 从20世纪70年代开始,在统计学、数学、行为科学、经济计量学等领域进行研究,分析化学学科的独特分支化学计量学。 70年代以来,随着分析仪器、并用分析仪器的发展,数据容量迅速增加。 大量数据的有用信息,需要发掘方法。 90年代以后,逐渐成熟,应用广泛。 计算机、分析仪器、其他学科的发展需求-生命科学、材料科学、能源等。 化学计量学的发展,典型的化学计量学应用,传统的定性定量分析:多变量分辨率、多变量校准仪器的测定信号处理:数据处理方法、优化方法模式识别:污染源识别、疾病诊断、中药识别实验设计:分子设计和药物设计:新药发现与结构性能关系(QSAR )研究过程分析:工业过程的监视与制化学计量学的基本特征多维数据:向量、矩阵、张量。 多变量数据来自各种测量:典型的是仪器分析数据。 信息提取方法:利用多种手段持续发展的科学,利用测量信息,平滑化化学计量学研究内容,寻求主要成分分析,化学计量学方法:常用数据处理方法,平滑化是去除或减少噪声提高信噪比的数学方法。 平滑,窗口移动平均法,x=a0a1j2j2.apjp,Savitzky-Golay平滑法-多项式拟合,=(YtY)-1Ytx,=,x=a0a1j2. apjp,Savitzky-Golay平滑加权系数表(在用于紫外-可见光谱分析的导数分光光度分析近红外光谱分析中,在使用二阶或一阶导数光谱进行定性定量分析的电化学分析中,可以利用溶出伏安法曲线的导出来去除或减少其他成分的干扰,提高被测定成分的信噪比。 很多种类的分析设备已经作为一种固定的方法嵌入设备的数据处理软件中。 求导,1 .差分法,2.Savitzky-Golay伪法,x=a0 a1j a2j2 . apjp一次微分: dx/dj=a12a2j.papjp-1j=0的情况下,dx/dj|j=0=a1二次微分: d2x/djj=2a 在papjp-2j=0的情况下d2x/djj2|j=0=2a2j=0的情况下(即对应的窗口的中心点),各阶微分计算的公式dqx/djq|j=0=q! 美联社, 窗口宽度k=9,p=4,三次导数公式,d3x/djj3| j=0=1/198 (-14x-47x-313 x-29x-1-9x1- 13 x2-7x 314 x4 ),拟合,实验数据理论解释研究变量之间的关系: y 函数拟合基本思想,=f(a,x)Ei=-yi=f(a,xi)-yi差和e2,线性函数拟合y=a bx1 cx2,y=f(a,x) e,拟合计算工具,Excel,MATLAB 3360 b=fit (右击增加趋势图表、主成分分析、主成分分析PCA最基本的化学计量学方法之一广泛应用于多种复杂的化学计量学方法,主成分分析、四个产地的南丰橘子样品HPLC分析X:464632,64个HPLC色谱图主要成分分析: X=USVT特征值:前3个主成分特征值所占的比例,58.0%、11.2%、8.4%馀数21.4%Scores散布图:样本点分类,重要降维方法的基本思想:将测量矩阵y中的各个变量线性组合,形成新的变量主成分计算的原则是主成分表达的分散最大,化学意义上含有的信息最多。 计算方法:计算方差最大的各变量的线性组合,从得到第一主成分的剩馀矩阵(即测量矩阵y )中减去第一主成分的表示部分,根据方差的最大原则,计算各剩馀变量的线性组合,依次计算得到第二主成分的第三、第四、主成分。 新变量互相正交。 方差指示表示的信息量,并且可以用于评估主分量分解注释的信息百分比。 将Matlab法U,s,V=svds(X,n )、主成分分析、多主成分、多投影方向多维主成分分解(n)x=x1x2.xn投影到vi1vi2vint上得到新的变量yi,vi1vi2vint是系数向量,即所有n个新的变量组成矩阵Yyi=vi1x1 vi2x2 vinxn,(I=1,2,n ),例如,在高分子液晶材料在不同的温度下结晶的情况下,结构液晶材料. infraredtransmissionpectraof 11-layerlbfilmsofflc-1 measuredatroomandelevatedtempreratures . temperaterraturedependencesofthefrequencysofthech2stricationstretchingband (a ) c=ostretchingbandofthepartnearthechirlarbonato andthephenylringstretchingband (c ) for the 11-layerlbfilmsofflc-1 . pc1vs.temperatureplottinboth 40-80c (a )和27-55c (c ) temperatureintervalsandthosenfilmeasuredtempreraturerange (b ) atrangeof 1450-1745 cm-1 for the 11-layerlbfilmsofflc-1 . 多元校正多元分辨率模式识别定量结构效果优化方法校正-定量分析古典分析化学的校正方法-校正曲线y=cx e多量校正y= y1y2. ym =c x1x2. XM ey=c 1x1c2x2. cnxn ey=xce,多量校正, 多线性回归MLR多线性回归方法-最小二乘法: y=Xc ee=y-Xc残差平方和s=ete=(y-xc ) t (y-xc )=yty-yt (xc )-(xc ) ty (xc ) t (xc )=yty-ytxc-ctxyctxtxc=yty-2 ytxcctxtxc=-2 XT y2 xtxc=0的话xtxc=xty=(xtx )-1 xtymatlab : c=inv (x* x ) x* y,多元线性回归解具有优秀的统计学性质的多元线性电路=x相关系数: R2=1-残差平方和RMS多线性回归应用建模和浓度计算y=Xc e, 常见的多变量校正方法多线性回归,MLR,y=Xc e主成分回归法,PCR用PCCA计算主成分,取前面的几个主成分Z=Xv进行MLR,用y=zce=xvc进行最小二乘回归,PLS用与PCA相似的方法计算主成分(称为PLS因子) 向量机、SVM人工神经网络、ANN、4种不同的液体表面活性剂、羟值相关性、酸价相关性、NIR光谱PLS修正结果(两个成分修正)、分解解决干扰问题,即从混合成分复合测定信号识别、分析被测定成分“纯”的分析信号利用多个分析信道(波长、保持时间等)的信息进行识别称为多变量识别,也称为多变量识别。 多元分析近年来多变量分析方法在化学计量学中的研究和应用非常活跃,特别是在分析色谱重叠峰方面取得了很大的成功。多变量分辨率算法的许多渐进因子分析法(EvolvingFactorAnalysis )窗口因子分析法(WindowFactorAnalysis )直观导出式进化特征投影法(heuristicevinglatentprotojections ) 正交投影分辨率子窗口因子分析法、麦草高温高压分解气相产物、GCMS分析通过HELP分析在保存期间共确定了45个成分,模式识别从20世纪60年代初开始发展迅速,首先被应用于信息科学和人工智能领域,如图像识别、语音识别。 模式识别交叉学科:统计学、计算机科学、人工智能和专家系统、控制论、应用学科(生物学、心理学、语言学、化学等)等。 化学模式识别是利用针对现有模式识别技术和化学问题特征发展的模式识别技术,处理分析化学数据,研究解决化学问题,它是化学计量学的重要组成部分。 化学模式识别方法已经分析了化学、物理化学、无机化学、药物化学、食品化学、农业化学、医药化学和环境化学等学科,取得了很多成果。化学模式识别、监视模式识别:距离判别分析法、Fisher判别分析法、Beayes判别分析法依次判别分析法、线性学习机、k邻域判别法、势函数判别法、人工神经网络判别法等无监视的模式识别:聚类分析特征投影的降维显示方法:主成分分析的投影显示法, SIMCA方法、基于偏最小二乘分解的特征投影法等模式识别方法:定量结构活性关系(quantitativestructureactivityrelationship,QSAR ),简称定量结构效应关系,研究化学结构与化学物质的生物活性的关系,研究物质的化学成分和结构吗这是化学计量学的重要分支。 定量效果关系、药物设计:是现代新药开发工作的重要一环,自20世纪60年代以来,经过40多年的持续探索和努力,现代药物设计的策略和方法已经丰富起来。 最基本的药物设计方法是从一组(如几十个)小分子化合物的结构和生物活性数据中,利用定量结构效应的关系方法,研究其结构和活性关系规律,在此基础上预测新化合物的生物活性(药效),进行高活性分子的结构设计。 分子设计:材料分子设计,荧光探针分子设计等。 定量结构效果关系研究:化学结构描述符:化学结构数字定量结构效果关系建模:模型的构建、现代优化方法、现代优化方法-搜索全局最佳解模拟退火法遗传算法人工神经网络蚁群算法、遗传算法(genetic AC 自然进化的特征在20世纪60年代与美国的michone大学的约翰霍利非常感兴趣,他和他的学生们融入了自然进化的思想,提出了机器学习的新算法,并将其命名为遗传算法。 1975年,Holland出版了一种有影响力的独占adaptationinnaturalandartificialsystems,遗传算法为人们所熟知。遗传算法基本思想、生物遗传基本单位个体染色体(基因)种群繁殖过程进化规律:优胜劣化,遗传算法基本思想个体编码:染色体群体生成反复运算: 3种进化适应性值评价,遗传算法由6个基本操作组成:1)编码:基于问题待解决的特征2 )初始集团的生成:随机生成n个初始连锁构造数据,将各连锁构造数据称为一个个体,n个个体构成一个集团。 3 )适应性值评价检查:适应性函数表示个体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论