主成分分析与主成分回归_第1页
主成分分析与主成分回归_第2页
主成分分析与主成分回归_第3页
主成分分析与主成分回归_第4页
主成分分析与主成分回归_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、主成分分析与主成分回归principal component analysis and regression1. introduction1.1.1. 1970s发展1.1.2. 交叉学科1.1.3. 现代仪器1.1.4. 一个例子1971:瑞典人s. wold 基金项目定名时首提1974:s. wold 何b.r. kowalski 倡议在西雅图首开学术会议 新创学术刊物 j. chem. info. comp. sci. j. chemometrics chemom. intell. lab. syst.化学计量学与计量关系chemometrics stoichiometry需要化学计量学

2、获得更多信息back应用数学、统计学、与计算机科学的手段设计或优化量测方法,并通过解析数据最大限度地获取化学及相关信息。化学 分析化学数学 统计学计算机科学 接口separation instrumentsignalinstrumenthplc dad (diode-array detector)gc ms (mass-spectrometer) 100 200 300 400 500 600 700 800 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 x 10 6 retention time(s) intensity a b 3d chromatogramhplc chro

3、matogram of nuclueside of cordyceps sinensis (冬蟲草冬蟲草) at one wavelengthgc chromatogram of peptic powder (平胃散平胃散)mass spectrum taken at retention time 10.2 minutesback05101520253035-2000200400600800100012001234567891011121314 time/minmaubacknext-0.0500.050.10.15-0.15-0.1-0.0500.050.10.15peak 6peak 5p

4、c1pc2 bback66.577.588.5050001000015000 time/minmaua123422024026028030032034036038000.050.12341b wavelength/nma线性代数1.2.1 矢量vector1.2.2 线性相关1.2.3 矩阵matrix1.2.3 秩rankback矢量:矢量:n个有顺序的数a1, a2, an组成的数组。k11+ k22+ + kmm=0线性组合:线性组合:k1+ k2。 就称为,的行矢量:行矢量:(a1, a2, an);列矢量t 。问问:由由,组成的矩阵组成的矩阵, rank最大为几?最大为几? 线性无关

5、:一系列数k不存在,只有都是零才成立。 1 =( 1 2 3 4 5 6 ) 2 =( 6 5 4 3 2 1 ) 3 =( 1 1 1 1 1 1 )1+ 23 =0grade dik received by student i from professor k isnjjkijnkinkikiiklslslslsd12211.true score of student irelative loading(importance) given by professor kj: factors (i,e., subjects) chem., physics, math., etc. 234213

6、412332133123221321231213112242124122321231222212212212121121421141213211312122112121121111433323134232221241312111lslslslslslslslslslslslslslslslslslslslslslslslsddddddddddddprofessors 1 2 3students12342313221221114232221241312111llllllssssssssstudents1234professors 1 2 3factors 1 212factors3教授给教授给4

7、学生写留学推荐信学生写留学推荐信 loadingsscoresdatalsds is the matrix of true scores, called the score matrixl is the matrix of importance, called the loading matrix得分矩阵载荷矩阵矩阵的秩矩阵的秩:对于a(mn), 其秩是a中 最大线性无关的行数(或列数)。 秩组分数?秩组分数?秩为几?秩为几?三种组分,吸收光谱各不相同(s1, s2 ,s3) 6组溶液,各组分浓度不同 吸光度矩阵a(206)00.10.20.30.40.50.60.70.83604104605

8、1000.10.20.30.40.50.60.7360410460510奇异值分解法奇异值分解法:y=usvt s: 对角矩阵,收集了y的特征值 u: 标准列正交矩阵(scores matrix) vt:标准行正交矩阵(loadings matrix) 用matlab 很方便!一句话!从s中找出不为0的对角元素的数目。back2. pca 主成分分析 principal component analysisback现代仪器获得两维数据(矩阵)矩阵处理确定秩为多少确定复杂分析体系中的物种数pca的目的-定性有几种物种species定性back矩阵分解真实误差法收集特征值特征值比值法y=usvt在

9、s中比较rsd与re1ddmaxbacknipals分解奖金10000元=10000150002100100110000y=tp奇异值(svd)分解single value decompositiony=usvt s: 对角矩阵,收集了y的特征值 u: 标准列正交矩阵(scores matrix) vt:标准行正交矩阵(loadings matrix) 用matlab 很方便!一句话!怎么分解?看了头大!分解成正交矩阵的乘积y(mn)有d个主成分njndjjdjjj1120122)()()(+表示来自主因子0表示来误差 minjijijyy112)(=真实误差re (real error,可以

10、知道)re=rsd (剩余标准偏差)residual standard deviation)(/)(120dnmrsdndjj确定或设定确定或设定re d=1n-1计算计算rsd(d) d=1 rsd(d)reyes此时此时d即为主成分数即为主成分数nod=d+1rsd与实际误差是否吻合判断标准back1dddr出现最大值时相应的d 表示最小成分信号的表示最大噪声信号的 显著差异back020406012345back混合色素中组分数的确定反应过程中组分数的确定00.10.20.30.40.50.60.70.8360410460510pca结果组分数 nc=33 0.6145 64.0 0.0

11、01700.10.20.30.40.50.60.7360410460510pca结果组分数 nc=3 3 0.199 64.3 0.0004实际上有3种色素胭脂红柠檬黄日落黄反过来,已知主成分数时根据rsd判断仪器的噪声水平判断操作者的操作水平使用7220.00100.0040back三种化学成分三种化学成分a、b、c,光谱线性无关光谱线性无关model 1:)exp(1ajjtkq)exp()exp(21121bjjjtktkkkkq)exp()exp()exp(1211211cjjjjtktkkkktkqcba21 kkconsecutive 1st order reaction0.00.

12、20.40.60.81.00102030405060t/min-1qresult: rank=number of component=3光谱矩阵 s动力学矩阵 q两维数据矩阵yy = qst2002122242362482602720244800.10.20.30.40.50.60.7aw/nmt/min0.00.20.40.60.8240290340390440490540/ nma最终产物最终产物无吸收无吸收有中间体有中间体吗吗?pca 结果组分数 d=20.00.20.40.60.81.0255270285300/ nma最终产物最终产物有吸收有吸收d=3三种化学成分三种化学成分a、b、

13、c,光谱线性无关光谱线性无关model 2:)exp(1ajjtkqjjjqqqacb1 c banc=3, rank=2y = qstmodel 3:parallel reactionnc=3, rank=?acbo1o2o1= or o2)(exp(21ajjtkkq)(exp(1 21211bjjtkkkkkq)(exp(1 21212cjjtkkkkkqo1= o2=1k2qb-k1qc=0线性相关rank=2model 3:parallel reactionnc=3, rank=?acbo1o2tkekkkkq22121a1tkq1btkekktkq211211co1=0, o2=1

14、da/dt=k1+k2adb/dt=k1dc/dt=k2a线性无关rank=3y = load(e:hp8453bboh15.txt);u, s, v = svd(y);lmd=diag(s);n=size(lmd,1);for k=1:n-1 sumlmd=0; for j=(k+1):n sumlmd=sumlmd+lmd(j)*lmd(j); end rsd(k)=sqrt(sumlmd/(nw*(nt-k);end根据矩阵的秩确定化学成分数组分无吸收no!谱线性相关亏秩! 某组分信号太弱复杂!好大学问! back3. pcr 回归 principal component regress

15、ionback主成分分析pca pcr多元校正之一因子分析fa 主成分回归pcr 多元校正mc 相似概念常常混用步骤略异侧重不同解决多组分同时测定问题定量k-矩阵法 k-matrix methodkcy 数学模型实验测量数据矩阵size: nwns吸光系数矩阵size:nwnc混合浓度矩阵size:ncns建模/校正1)(ttccycksee next预测已知k k,解出未知样浓度单样品un1un)(ykkkctt多样品un1un)(ykkkctttusvy svd分解svd分解分离eyy0重组t *0vsuy广义逆t *1*0)(usvy建模0cyp未知样预报ununununpycpyc与k

16、矩阵法相比仅一次求逆过程剔除了主成分模型误差系数矩阵p意义不明确但用于预报是正确的 backtusvy y :波长数nw=8; 溶液数ns=6; 组分数nc=3yv tusnc=3u后3列vt后3行误差信息剔除后t *0vsuy y0v *tu*s*t *1*0)(usvy广义逆矩阵多元线性回归mlrmultiple linear regressionk-矩阵法 建模相当于单波长单组分的工作曲线kcy 矩阵除法即乘以其逆矩阵方阵可求逆)(ttcckyc kcccckccyc11)()(ttttcyk/已知c c back多元线性回归mlrmultiple linear regressionk-矩阵法 建模建模/校正(相当于单波长单组分的工作曲线)cyk/kcy 矩阵除法即乘以其逆矩阵 方阵可求逆)(ttcckyc kcccckccyc11)()(ttttback光度法多组分同时测定速差动力学多组分同时测定电化学谱的分辨及多组分测定多元校正滴定其他矩阵数据线性关系-比耳定律加和性-共同响应,最好无协同正交程度-波谱不严重重叠标准集c-混合组成,不必纯组分一些作者报道了几乎完全线性相关的体系固定系列波长/电位/时间/ph/etc 矩阵行列-一一对应backclear;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论