主成分分析与主成分回归.ppt_第1页
主成分分析与主成分回归.ppt_第2页
主成分分析与主成分回归.ppt_第3页
主成分分析与主成分回归.ppt_第4页
主成分分析与主成分回归.ppt_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

* /bbs 1. Introduction1. Introduction 主成分分析与主成分回归 Principal Component Analysis and Regression 2. PCA2. PCA 3. PCR3. PCR ? * /bbs 1. Introduction 1.1 1.1 ChemometricsChemometrics 1.2 Necessary Knowledge1.2 Necessary Knowledge 1.1 Chemometrics 1.1.1. 1970S发展 1.1.2. 交叉学科 1.1.3. 现代仪器 1.1.4. 一个例子 1971:瑞典人S. Wold 基金项目定名时首提 1974:S. Wold 和B.R. Kowalski 倡议在西雅图首开学术会 议 新创学术刊物 J. Chem. Info. Comp. Sci. J. Chemometrics Chemom. Intell. Lab. Syst. 化学计量学与计量关系 Chemometrics Stoichiometry 需要化学计量学 获得更多信息 BACK 应用数学、统计学、与计算机 科学的手段设计或优化量测方 法,并通过解析数据最大限度 地获取化学及相关信息。 化学 分析化学 数学 统计学 计算机科学 接口 A New trend in Analytical Chemistry - -Hyphenated Instrument (聯用儀器) Separation Instrument Signal Instrument HPLC DAD (diode-array detector) GC MS (Mass-spectrometer) HPLC-DAD vGet more data 3D chromatogram HPLC chromatogram of nuclueside of Cordyceps Sinensis (冬蟲草) at one wavelength GC-MS GC chromatogram of peptic powder (平胃散) Mass spectrum taken at retention time 10.2 minutes BACK Two-way data containing both chromatography and spectra; Data matrix with more than 80 Megabytes; Data base of lots of chemical standards 梁逸曾教授的经历 美国标准局16组分PAH混合物标样(Sulpeco) 已知峰9为苯并a蒽和屈,峰14为苯并芘和二苯并蒽的二组分重叠峰 BACK Next 芴芴、苊、菲三混合、苊、菲三混合 Peaks 5 and 6 in the plot 峰5、峰6的演进特征投影图 峰5的前5个特征值依次为16382,2436,1294,22,11 分辨所得的芴、苊、菲、蒽的色谱与光谱 化学学报 1998,中国科学 1998,ChemLab. 1999 BACK 线性代数 1.2 Necessary Knowledge on Linear Algebra 1.2.1 矢量Vector 1.2.2 线性相关 1.2.3 矩阵Matrix 1.2.3 秩Rank 一组溶液的光谱集合 一条光谱 同物质不同浓度的光谱 混合溶液中的物种数 BACK 矢量:n个有顺序的数a1, a2, an组成的数组。 k11+ k22+ + kmm=0 线性组合:k1+ k2。 就称为,的 行矢量:(a1, a2, an);列矢量t 。 问:由,组成的矩阵, rank最大为几? 1 =( 1 2 3 4 5 6 ) 2 =( 6 5 4 3 2 1 ) 3 =( 1 1 1 1 1 1 ) 1+ 23 =0 Grade dik received by student i from professor k is 矩阵: 一组相同大小的矢量组合 经典例子: 教授给学生打分 True score of student i Relative loading(importance) given by professor k j: factors (i,e., subjects) chem., physics, math., etc. Four students three professor two subject: Chemistry and English Professors 1 2 3 Students 1 2 3 4 Students 1 2 3 4 Professors 1 2 3 factors 1 2 1 2 Factors 3教授给4学生写留学推荐信 S is the matrix of true scores, called the score matrix L is the matrix of importance, called the loading matrix 得分矩阵载荷矩阵 我是laozhu 高等分析化学讲稿 主成分分析 / 矩阵的秩:对于A(mn), 其秩是A中 最大线性无关的行数(或列数)。 秩组分数? 秩为几?三种组分,吸收光谱各不相同(s1, s2 ,s3) 6组溶液,各组分浓度不同 吸光度矩阵A(206) Rank =Number of Rank =Number of EigenvalueEigenvalue秩秩= =不为不为0 0的特征值的数目的特征值的数目 矩阵: 一组不同浓度组合的混合溶液测得的光谱集合 矢量: 一条光谱 我是laozhu 高等分析化学讲稿 主成分分析 / Eigenvalue 特征值 奇异值分解法:Y=USVt S: 对角矩阵,收集了Y的特征值 U: 标准列正交矩阵(Scores Matrix) Vt:标准行正交矩阵(Loadings Matrix) 用Matlab 很方便!一句话! BACK * /bbs 2. PCA 主成分分析 Principal Component Analysis 2.1 2.1 目的目的 1 1 2.2 2.2 基本步骤基本步骤 2 2 2.3 2.3 应用实例应用实例 3 3 2.1 主成分分析(PCA)的目的 BACK 现代仪器获得 两维数据(矩阵) 矩阵处理 确定秩为多少 确定复杂分析体系 中的物种数 PCA的目的-定性 有几种物种species 定性 2.2 PCA的步骤 BACK 矩阵分解 真实误差法 收集特征值 特征值比值法 Y=USVt 在S中 比较RSD与RE Max BACK NIPALS分解 矩阵分解 奖金10000元 = 100001 50002 100100 110000 Y=TP 奇异值(SVD)分解 Single Value Decomposition Y=USVt S: 对角矩阵,收集了Y的特征值 U: 标准列正交矩阵(Scores Matrix) Vt:标准行正交矩阵(Loadings Matrix) 用Matlab 很方便!一句话! 怎么分解? 看了头大! 分解成正交矩阵的乘积 Y(mn)有d个主成 分 真实误差法-确定主成分数d +表示来自主因子0表示来误差 = 真实误差RE (Real Error,可以知道?) RE=RSD (剩余标准偏差) Residual Standard Deviation 确定或设定RE d=1n-1计算RSD(d) d=1 RSD(d)RE YES 此时d即为主成分数 No d=d+1 RSD与实际误差 是否吻合 判断标准 BACK 相邻特征值比值法 出现最大值时 相应的d 表示最小成分信号的 表示最大噪声信号的 显著差异 BACK 2.3 PCA的应用实例 BACK 混合色素中 组分数的确定 反应过程中 组分数的确定 一组一组食用色素混合溶液食用色素混合溶液 测得吸光度矩阵测得吸光度矩阵 Y Y 151566 ddd/d+1 RSD 14.6084.10.1174 21.1301.80.0599 30.614564.00.0017 40.00961.150.0015 50.00841.160.0013 PCA结果 组分数 nc=3 722722的噪声水平的噪声水平0.0020.002 3 0.6145 64.0 0.0017 同样的样品同样的样品 用用Agilent 8453Agilent 8453 ddd/d+1 RSD 15.73611.70.0464 20.4902.50.0195 30.19964.30.0004 40.00312.10.0003 50.00151.90.0002 PCA结果 组分数 nc=3 噪声水平噪声水平0.00020.0002 3 0.199 64.3 0.0004 实际上有3种色素 胭脂红柠檬黄日落黄 反过来,已知主成分数时 PCA: 通常可以正确判定主成分数 根据RSD 判断仪器的噪声水平 判断操作者的操作水平 使用7220.00100.0040 BACK 我是laozhu 高等分析化学讲稿 主成分分析 / 实例讨论-for a chemical reaction 三种化学成分A、B、C,光谱线性无关 Model 1:Consecutive 1st order reaction Result: Rank=number of component=3 我是laozhu 高等分析化学讲稿 主成分分析 / Matrix two-way data 光谱矩阵 S动力学矩阵 Q 两维数据矩阵Y Y = QST 我是laozhu 高等分析化学讲稿 主成分分析 / 日落黄电解降解 最 终 产 物 无 吸 收 有 中 间 体 吗 ? 我是laozhu 高等分析化学讲稿 主成分分析 / 日落黄电解降解 ddd/d+1 RSD 14.1476.000.0255 20.69125.800.0012 30.02682.350.0007 40.01141.180.0005 50.00970.0003 组分数 d=2 PCA 结果 我是laozhu 高等分析化学讲稿 主成分分析 / PCA确定组分数 nnn/n+1 RSD 123.06010.60.06171 22.1862.40.02411 30.910215.70.00014 40.0043.50.00008 50.0011.20.00007 60.0010.00007 最终产物 有吸收 d=3 我是laozhu 高等分析化学讲稿 主成分分析 / 实例讨论 三种化学成分A、B、C,光谱线性无关 Model 2: nc=3, rank=2 Y = QST 我是laozhu 高等分析化学讲稿 主成分分析 / 实例讨论 Model 3:Parallel reaction nc=3, rank=? A C B o1 o2 o1= or o2 o1= o2=1 k2qB-k1qC=0 线性相关 rank=2 我是laozhu 高等分析化学讲稿 主成分分析 / 实例讨论Model 3:Parallel reaction nc=3, rank=? A C B o1 o2 o1=0, o2=1 -dA/dt=k1+k2A dB/dt=k1 dC/dt=k2A 线性无关 rank=3 我是laozhu 高等分析化学讲稿 主成分分析 / PCA确定组分数 Y = load(E:Hp8453BBOH15.txt); U, S, V = svd(Y); lmd=diag(S); n=size(lmd,1); for k=1:n-1 sumlmd=0; for j=(k+1):n sumlmd=sumlmd+lmd(j)*lmd(j); end RSD(k)=sqrt(sumlmd/(nw*(nt-k); end PCA:Conclusions 根据矩阵的秩确定化学成分数 组分无吸收No! 谱线性相关亏秩! 某组分信号太弱复杂!好大学问! BACK * /bbs 3. PCR 回归 Principal Component Regression 3.1 3.1 概念概念 1 1 3.2 3.2 基本步骤基本步骤 2 2 3.3 3.3 应用实例应用实例 3 3 3.4 3.4 提醒提醒 3 3 3.1 PCR:概念 BACK 主成分分析PCA PCR多元校正之一 因子分析FA 主成分回归PCR 多元校正MC 相似概念常常混用 步骤略异侧重不同 解决多组分同时测定问题 定 量 3.2 PCR:基本步骤 K-矩阵法 K-Matrix Method 数学模型 实验测量数据矩阵 Size: nwns 吸光系数矩阵 Size:nwnc 混合浓度矩阵 Size:ncns 建模/校正 See next 预测 已知K,解出未知样浓度 单样品 多样品 3.2 PCR:基本步骤 SVD分解SVD分解 分离 重组 广义 逆 建模 未知样 预报 与K矩阵法相比 仅一次求逆过程 剔除了主成分模型误差 系数矩阵P意义不明确 但用于预报是正确的 BACK Y :波长数nw=8; 溶液数ns=6; 组分数nc=3 Y V t U S nc=3 U后3列 Vt后3行 误差信息 剔除后 Y0 V *t U* S* 广义逆矩阵 多元线性回归MLRMulti

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论