




已阅读5页,还剩82页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
高等仪器分析-化学计量学,发表者:杜一平,化学数据分析,实验数据化学分析:单点数据仪器分析:多维数据的维数增加0维-标量的1维向量2维-矩阵3维张量样本数增加数据量越来越大,数据库、 大量数据量明显信息量多,但发掘有用信息困难的数据处理方法研究越来越重要:化学计量方法的应用不仅限于分析化学学科:相关学科,色谱数据:不同的人参色谱指纹图谱数据和定量校准曲线, 光谱图像数据,地图三维图像光谱数据的图像,蛋白质构造的预测,图ProteinDataBank中的蛋白质构造的成长倾向图(lastupdatedonnov.6, 2005 ),蛋白质的各级结构(a ) primary structure (b ) secondarystructurealu-Glu-val-thr-ASP-pro-Gly - helix- sheet (c ) tertiary structure (d ) quaternet 一维向量:x=1357; 二维-矩阵:X=; 三维张量:Z=X1X2X3在1971年瑞典化学家斯威特. wold(umeauniversity )申请基金时,提出了化学计量学(Chemometrics )名词。 chem-istry-metricschemometricsecono-mics-metrics econometrics,化学计量学介绍,br cer.kowalskiuniversityofwashington,他们被公认为化学计量学的创始人。 美国Bruce.R.Kowalski非常赞赏这个称呼。 后来,1974年与斯瓦蒂. wold合作成立了国际化学计量学学会。 采用化学计量学介绍、数学、统计学、计算机科学等相关学科的理论和方法,优化化学测量过程,从化学测量数据中最大限度地获取有用的化学信息。 化学中一个分支学科(分析化学)多学科交叉的新学科、化学计量学的定义、问题解决策略:分析化学以计算机为手段,利用数学和统计学方法实现数据分析。 早期的化学计量学,数理统计方法。 从20世纪70年代开始,在统计学、数学、行为科学、经济计量学等领域进行了研究,分析了化学学科的独特分支化学计量学。 70年代以来,分析仪器、并用分析仪器的发展,数据容量迅速增长。 大量数据的有用信息需要挖掘方法。 90年代以来,逐渐成熟,应用广泛。 计算机、分析仪器和其他学科的发展需求-生命科学、材料科学、能源等。 化学计量学的发展,化学计量学的典型应用,传统定性定量分析:多元分辨率,多元校准仪器的测量信号处理:数据处理方法,优化方法环境化学中的污染源识别,环境质量预测食品,农业,医药化学中的试验设计和复杂样本分析在医药化学中的分子设计, 新药发现及结构性能关系(QSAR )研究石油化学中化学模型的识别、光谱与物质特性的关系化学工程学科的过程分析、过程诊断、控制与优化。 我国的化学计量学在国际上具有很高的地位。 多为现有算法应用较少的新算法和算法改进:湖南大学中南大学同济大学中国科技大学南开大学石油化学科学研究院等中国化学计量学的发展与现状、俞汝勤集团、湖南大学、化学与生物传感技术和计量学国家重点实验室、梁逸曾集团、中南大学、 化学化工学院、邵学广组、南开大学、中国科技大学、李通化组、同济大学化学系、倪永年组、南昌大学、化学计量学的基本特征多维数据:向量、矩阵、张多元数据来自各种测量:典型的仪器分析数据。 信息提取方法是利用测量信息、化学计量学的研究内容,顺利求出主要成分的分析,简单的化学计量方法:常用的数据处理方法,平滑化或去噪,提高信噪比的数学方法。平滑、窗口移动平均法,x=a0 a1j a2j2 . apjp,Savitzky-Golay平滑法-多项式拟合、=(YtY)-1Ytx,=,Savitzky-Golay平滑加权系数表(多项式阶数为2或3 )提高信号的分辨率并减少噪声。 在用于紫外可见光谱分析的导数光度分析的近红外光谱分析中,在使用二维或一维导数光谱进行定性定量分析的电化学分析中,可以利用溶出伏安法的导出去除或减少其它成分的干扰,从而提高被测量成分的信噪比。 许多种类的分析仪器已作为一种固定的方法被纳入仪器的数据处理软件中。 求导、1 .差分法、2.Savitzky-Golay拟合法、x=a0 a1j a2j2 . apjp一次微分: dx/dj=a12a2j.papjp-1j=0时,dx/dj|j=0=a1二次微分: d2x/DJ j j2=2a2a6a3j. (p-1 ) pap jp-2 j=0的如果djj2|j=0=2a2j=0(即,对应窗口的中心点),则各阶导数计算的公式dqx/djq|j=0=q! ap、窗口宽度k=9、p=4、三阶导数表达式、d3x/djj3| j=0=1/198 (-14x-47x-313 x-29x-1-9x1- 13 x2-7x 314 x4 )、拟合、实验数据理论解释研究变量之间的关系: y=f(x )、多个变量、y=f(x1,x2, ) 线性函数拟合=a bxEi=-yi=(a bxi)-yi差和e2最小。 y=f(a,x ),线性函数y=a bixi,I=1,2,m对数函数y=a blogx,z=logx,y=a bz指数函数y=aebx,lny=lna bx,z=lny=a1 bx,以曲线拟合函数形式,在信号分辨率下以高斯曲线和洛伦兹曲线模拟各单一分量的信号、高斯曲线、洛伦兹曲线、混合函数曲线、曲线拟合函数形式、拟合计算工具、Excel、Matlab:b=fit(X,y,fittype )功能强,点中曲线、右选择追加趋势图、主成分分析、主成分分析PCA最基本的化学计量方法之一, 许多复杂化学计量方法的基础应用广泛,主成分分析,NIRspectra38x1501,变量间相关严重表现能力下降变量过多的病态系统计算误差增加解决方案的降维变量正交,y=a bixi,x,重要降维方法的基本思想:线性组合测量矩阵y中的各变量,形成新变量,主主成分的计算原则是所得主成分表达方差最大、化学意义最大的信息。 计算方法:计算方差最大且各变量的线性组合,从得到第一主成分的馀数矩阵,即从测量矩阵y中减去第一主成分的表示部分,根据方差的最大原则计算各馀数变量的线性组合,依次计算得到第二主成分的第三、第四、主成分。 新变量相互正交。 将Matlab法U,s,V=svds(X,n )、主成分分析、多个主成分、多投影方向多维主成分分析(n)x=x1x2.xn投影到 VI1VI2. vin t以获得新变量yi, VI1VI2. vin t为系数向量,即投影方向。 所有n个新变量构成矩阵yyi=vi1x1vi2x2, vinxn,(I=1,2,n ),例如,structureandthesphasettemperaturesofflc-1 . infraredtransmissionpectraof 11-layerlbfilmsofflc-1 measuredatroomandelevatedtempreratures . temperaterraturedependencesofthefrequencysofthech2stricationstretchingband (a ) c=ostretchingbandofthepartnearthechirlarbonatom (b ) andthephenylringstretchingband (c ) for the11-layerlbfilmsofflc-1 . PC1vs.temperatureplottinboth 40-80 c (a )和27-55 c (c ) temperatureintervalsandthosenfilmeasuredtempreraturerange (b ) atrangeof 1450-1745 cm-1 for the11-layerlbfilmsofflc-1 .2012年秋,在江西省南丰县白舍町某果园采集了99个南丰柑,在广西柳州某果园采集了60个南丰柑(南丰引进品种)。 在桔子赤道方向的3点测定近红外光谱图,取平均值。 对光谱进行主要成分分析。 前两个主要成分可以解释的方差占全部主要成分方差的72%,反映了原始数据的大部分信息。例2南丰柑的鉴别、校正量分析古典分析化学的校正方法校正曲线y=cx e多变量校正y= y1y2. ym =c x1x2. XM ey=c1x1c2x2. cnxn ey=xce,多变量校正多线性回归方法-最小二乘法: y=Xc ee=y-Xc残差平方和s=ete=(y-xc ) t (y-xc )=yty-yt (xc )-(xc ) ty (xc ) t (xc )=yty-ytxc-ctxyctxtxc=yty-2 ytxcctxtxc=-2 XT y2 xtxc=0,则xtxc=xty=(xtx )-1 xtymatlab : c=inv (x* x ) x 多线性回归解的统计性质:表示未知浓度c的无偏估计最小二乘估计方差应用cov()=2(XtX)-1多线性回归解的性能指标=(xtx)-1xty =X相关系数: R2=1-残差平方和RMS多线性回归或建模以及浓度计算y=Xc e的常见多维校正方法,多线性回归, MLR,y=Xc e主成分回归法,PCR以PCA计算主成分,取前几个主成分Z=Xv进行MLR,y=ZC-e=xvc-e偏最小二乘回归的PLS以PCA这样的方法计算主成分(称为PLS因子),取前几个因子Z=Xv进行MLR,y=ZC-e=xvc-e偏最小二乘回归支持向量机、SVM人工神经网络、ANN、4种不同液体表面活性剂、羟值相关性、酸值相关性、NIR谱PLS校正结果(两种成分校正),解决干扰问题,即从混合成分复合测量信号中识别和分析测量成分“纯”的分析信号。 将利用多个分析信道(波长、保持时间等)的信息进行识别称为多变量识别,也称为多变量识别。 多元分析,近年来多元分析方法在化学计量学中的研究和应用十分活跃,尤其在分析色谱重叠峰上取得了很大成功。 多变量分析算法渐进因子分析法(EvolvingFactorAnalysis )、窗口因子分析法(WindowFactorAnalysis )、直观的导出式进化特征投影法(heuristicevolvinglatentprotojections )、 正交投影分辨率法(OrthogonalProjectionresolution )、子窗因子分析法(SubwindowFactorAnalysis )等通过HELP分析在保存期间确定合计45个成分,模式识别(PatternRecognition )正在研究从20世纪60年代初开始迅速发展,首先是信息科学和人工智能领域中使用的如图像识别、语音识别。 模式识别交叉学科:统计学、计算机科学、人工智能与专家系统、控制论、应用学科等,包括生物学、心理学、语言学、化学等。 化学模式识别是利用针对现有模式识别技术和化学问题特点发展的模式识别技术,处理分析化学数据,研究解决化学问题,它是化学计量学的重要组成部分。 化学模式识别方法已经对化学、物理化学、无机化学、药物化学、食品化学、农业化学、医药化学和环境化学等学科进行了分析,取得了很多成果。 化学模式识别是监视的模式识别:距离判别分析法、Fisher判别分析法、Beayes判别分析法、逐次判别分析法、线性学习机、k邻域判别法、势能函数判别法、人工神经网络判别法等无监视的模式识别:聚类分析特征投影的降维显示法:主成分分析的投影显示法, 有SIMCA法、偏最小二乘分解特征投影法等模式识别方法:近红外光谱,2个患者的2个不同日期间隔5分钟采集1个光谱,每次获得约70个光谱的近红外光谱277个: 277个谱分为4类: A1是第一患者在第一天采集的谱,A2是第一患者在第二天采集的谱,B1是第二患者在第一天采集的谱,B2是第二患者在第二天采集的谱。 结果:不同患者的皮肤等组织特征不同,对光谱采集有影响的光谱采集日期不同光谱也不同,温度、湿度等条件也可能影响光谱。定量结构活性关系(quantitativestructureactivityrelationship,QSAR )简称定量结构效应关系,研究化学结构与化学物质生物活性的关系,研究从物质的化学成分和结构定量预测化学特性的方法。 这是化学计量学的一个重要分支。 定量效应关系、药物设计:是现代新药开发工作的重要环节,自20世纪60年代以来,经过40多年的持续探索和努力,现代药物设计策略和方法已经丰富多采。 最基本的药物设计方法是从一组(如数十个)小分子化合物的结构和生物活性数据中,利用定量的结构效应关系方法研究其结构和活性关系规律,据此预测新化合物的生物活性(药效),进行高活性分子的结构设计。 分子设计:材料分子设计、荧光探针分子设计等。 定量结构效应关系研究:化学结构描述符:化学结构数字定量结构效应关系建模:模型构建、现代优化方法-搜索全局最优解模拟退
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 南昌影视传播职业学院《临床病理学技术》2024-2025学年第一学期期末试卷
- 2025企业金融面试题及答案解析
- 2025民建公务员面试题及答案
- 2025绿色金融考试题库及答案
- 2025历届公务员面试题及答案
- 潍坊年终活动方案策划公司(3篇)
- 供水设备施工方案(3篇)
- 东莞活动策划方案范文大全(3篇)
- 学生读书日策划活动方案(3篇)
- 合伙协议合同范本英文
- 高考小说阅读导练:蒙太奇、意识流、冰山理论专项(理论指导+强化训练+参考答案)
- 市政工程综合管网及道路施工组织设计方案
- 关于成立建筑垃圾循环利用公司策划书
- 医院义诊与公益活动管理制度
- 上肢骨折功能锻炼
- (完整版)初等数学研究答案
- 13.1 磁场 磁感线 课件 高二上学期物理人教版(2019)必修第三册
- 园林局城市绿化养护手册
- 2024年重庆市北碚区小升初数学综合练习卷含解析
- 河南教材-中式面点技艺(第3版) 教学指南
- 2022版科学课程标准题库
评论
0/150
提交评论