



下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、王笑(孝)权安徽省五河县临北乡石家村卫生室 主成分分析又称主分量、主轴分析,实质就是对较多的变量在尽量保存原信息的情况下加以线性概括。在此过程前, 为消除变量量纲不同造成的影响, 首先要对各原始指标进行标准化处理。 迄今为止, 所见教材的主成分分析”实质都是用求得主成分再对原始变量的回归分析。教材的通病都是未详细说明最后的回归过程,往往令初学者感觉到莫名其妙。目前,由网上的一些所谓的主成分分析”可知,或者其资料不适用主成分分析,还有根本就不是主成分分析。有鉴于此,现利用网上获得的数据,进行主成分分析的探讨。1 资料与方法1.1 资料来源资料来源于中华人民共和国卫生部网站1,我国“2006 年工
2、业部门职业病发病及死亡情况”,剔除其中的第 1、2、14 号无意义指标,以及末尾的观测其它”,剩余 11 个指标,观测值有缺失则用 0 补齐。程序分别赋这些指标为 x1-x11,其名称标签见附件 1;余详见数据 1。数据 12006 年工业部门职业病发病及死亡情况相关数据namex1x2x3x4x5x 6x7x8x9x10 x11煤炭45672124103401301570石油2410140010140电力110110281 011161核工业冶金049406504002015900000305324110有色金属3331193133412013884451900110293375023811
3、电子701431200 0511330兵器70402200011360船舶180101100020化工10321053622089170244医药5080150119810铁道646202101041交通6116014306680建材698176051 0103200建设地质矿产126253123381103405001230010水利农业森林工业223217002000100000022500011001010000轻工1891610132941012324213纺织航空航天20121200012011140052360410商业110200312020邮电石化工业回收加工业29001101
4、52002060000010000012000001.2 方法将数据1 倒入 SAS9.1 逻辑库sasuser 后调用,程序默认对原始数据标准化后进行主成分分析。根据观察的需要对初步运行后的输出数据编程带入,以了解更多内容(见附件 1)。2 结果输出结果表明:各个主成分贡献率没有出奇的大,本资料适用于主成分分析;且前 4 个主成分累计贡献率达到 0.8112,每个的特征值都1,符合一般主成分个数选取标准,可以选取 4 个主成分,见输出 1。输出 1 相关矩阵的前 5 个特征值、贡献率EigenvaluesoftheCorrelationMatrixEigenvalueDifferencePr
5、oportionCumulative14.061904931.526008420.36930.369322.535896521.220978090.23050.599831.314918430.303976160.11950.719341.010942260.298151440.09190.81123 讨论各主成分与标准化变量的相关系数说明了主成分被这些指标影响的强度,由 rz1x 可见:各标准化指标与 z1 均成正相关,由于主成分 1 受 x2-x5、x7、x10 支配可以理解 z1 是产生急性、严重职业病的综合指标,可能是毒性强,、浓度高的有害物质迅速导致工作人员发病、呼吸道损害、中毒乃至
6、死亡;z2 其实与 z1 是对立性综合指标,反映低浓度生产、生活环境下的慢性损害,x1 支配 rz2x 表明随着环境有毒物质浓度降低,呼吸道损害下降,但是这种相对较好一点的有毒环境仍然避免不掉会损害人的皮肤、眼睛等防护薄弱地方;x6 与 x7 各自单独支配主成分 z3(见 rz3x)、z4(见 rz4x),它们表达的是与 z1、z2 完全不同的信息,z3 不是环境毒害物质造成的,实际是长期暴露在某种场合,防护不当的后果;z4 是环境有害因素慢性长期作用人体,损害人体的免疫系统、导致免疫监视混乱,丧失杀死、清除机体内的异变细胞功能。标准化变量与主成分的详细关系见输出 2。输出 2 主成分与准化指
7、标的相关系数namerz1xrz2xrz3xrz4xx10.59571-0.71288-0.285740.03795x20.66688-0.65136-0.16550-0.13085x30.884860.38006-0.018180.09209x40.440390.405630.29572-0.25224x50.767080.215930.36782-0.19094x60.311940.008830.721940.43830 x70.64136-0.462500.212090.33249x80.505340.68292-0.254760.28210 x90.304900.60786-0.532
8、430.33055x100.75893-0.29938-0.26026 -0.04144x110.513840.329150.02268-0.62498在实际工作中,要用每个主成分对全部原始变量回归建立起主成分回归方程,使分析有意义。用回归方程中的系数、截距对应各自的自变量(原始变量)编程带入 SAS 运行,即能观察各部门职业病的符合情况, 又可对新样品的主成分归属进行判读。 事实上该过程并不需要研究者额外费心, 因为这个过程就是 SAS程序自动输出的主成分得分(输出 3)而已。由于各主成分包含职业病的属性不同,观测受某主成分的支配量最大时,那么相应工业部门工作人员职业病病种,特征信息就包含在
9、该主成分中。各观测主成分得分及分类见输出 3。输出 3 根据主成分得分对观测的判别归类Obsnamez1z2z3z4g1煤炭4.80628-5.73054 -2.002430.6828322石油-1.12318-0.36420-0.25621-0.1573113电力-0.83878-0.28533-0.11621-0.3654214核工业-1.50940-0.25718-0.14052-0.0985915冶金2.612730.721070.19429-3.8380246有色金属3.17963-0.813741.37801-0.5665017机械1.641830.55132-0.501730.3
10、755918电子0.391291.720520.076080.0539329兵器-0.812330.90634-1.458370.81899310船舶-1.47388-0.243140.00184-0.00501111化工3.650424.82568-2.592391.40049212医药-0.985830.26187-0.305470.32627113铁道-1.22241-0.21814-0.05596-0.28756114交通-1.00402-0.084990.077750.27589115建材-0.47419-0.64732-0.624670.10248316建设0.122651.185
11、781.23910-1.02345317地质矿产-1.42439-0.33828-0.17242-0.08197118水利-1.45709-0.37322-0.15203-0.13854119农业-0.36656-0.610113.003822.38548320森林工业-1.45231-0.26919-0.068500.03247121轻工4.771121.108262.749000.68439122纺织-0.17623-0.42846-0.44198-0.19643323航空航天-1.41781-0.15992-0.20594-0.03345124商业-1.28329-0.273410.29
12、0080.30555125邮电-1.44519-0.078120.03885-0.22250126石化工业-1.39624-0.17381-0.13145-0.07545127回收加工业-1.312820.068260.17745-0.354171主成分分析是其它分析前对数据的预处理过程,例如因子分析、对应分析、判别、聚类、秩和比、回归等。一般的主成分分析实际是主成分回归分析,并最终通过建立的回归方程完成新样品判别分析。由此可帮助人们认识不同工业部门的职业病风险情况,有针对的采取防护措施,减少或延缓职业病的发生、发展。1 中华人民共和国卫生部网站.2006 年工业部门职业病发病及死亡情况,ht
13、tp:/ 1:有关分析程序procstandarddata=sasuser.wxq163out=wmean=0std=1;/*调用逻辑库数据*/varx1-x11;procprincompdata=sasuser.wxq163prefix=zout=wx;/*主成份分析*/varx1-x11;procprintdata=wx;datarx;setsasuser.wxq16;r1=z1*sqrt(e1);r2=z2*sqrt(e2);r3=z3*sqrt(e3);r4=z4*sqrt(e4);procprintdata=rx;varr1-r4;/*各主成分于标准化变量相关系数*/datawxq1638;mergewx(keep=z1-z4)sasuser.wxq163;a1=abs(round(z1,0.1);a2=abs(round(z2,0.1);a3=abs(round(z3,0.1);a4=abs(round(z4,0.1);maxa=MAX(OFa1-a4);ifa1=maxatheng=1;ifa2=maxatheng=2;ifa3=maxatheng=3;ifa4=maxatheng=4;/*利用主成分得分对观测判断分组*/keepx1-x11z1-z4g;procprintdata=wxq1638;procregdata=wxq1638;la
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网络直播调光台租赁及集成服务合同
- 知识产权保护与授权合作合同
- 数据要素流通与信用体系建设合作协议
- 国际跨区域房地产投资合作管理服务合同
- 线上线下融合商场摊位产权分割与电商运营合同
- 《数值分析》课件
- 《二年级美术上册课件-动漫创作》
- 《TMR型立磨介绍》课件
- 八年级上册美术《第1课 美术是人类文化的造型载体》课件
- 2025年安全生产知识竞赛题题库及答案(共100题)
- 呼吸衰竭病人护理课件
- 运动员健康证明表
- 语文考试作文格子纸-word文档
- 家庭护工合同范本
- 手表买卖合同协议书
- 《错误是最好的成长机会》主题班会课课件
- 直接作业环节的“7+1”安全管理制度课件
- 烟花爆竹行业特种作业人员安全管理培训
- 婴幼儿体格测量胸围的测量
- 幼儿园故事课件:《胸有成竹》
- 锂离子电池内阻的影响因素
评论
0/150
提交评论