




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、相关与回归分析一、一种事物与另一种事物的相互联系程度 及性质的分析。 前面已经讲过: 次数资料X2独立性检验,就是一种相关分析。 连续性资料相关分析。 两个具有相互依存的现象,一种现象的数值常常 伴随另一种现象的数值变化,呈现相偕变异,称 为相关。直线相关曲线相关矩阵相关相关系数衡量现象间相互关系的尺度。决定系数衡量相关程度的尺度,不表示 相关性质。相关系数0 1 正相关现象间变量关系成正比。 0 -1 负相关现象间变量关系成反比。 0 无关独立事件。 1 直接相关(x-x) (y-y)=0 无关(x-x) (y-y)0(x-x) (y-y)=1(x-x) (y-y)=0无关(x-x) (y-
2、y) 3.355 p 0.765 p2.179 P0.532 P1.96 p0.05 否定H0,接受HA,相关显著。、H0:P1=P2(两样本相关系数相等) HA:P1P2例:6.17 P288页: r10.83 n114 r20.81 n211问:两个相关系数之间的差异是否显著?解:当:r10.83时, Z1 1/2ln(1+0.83)-ln(1-0.83)1.1881 当:r20.81时, Z2 1/2ln(1+0.81)-ln(1-0.0.81)1.1270 Z1-Z2 1.1881-1.1270U=1/(n1-3)+1/(n2-3) =1/(14-3)+1/(11-3) =0.1315
3、因为:U0.05(双侧)1.96 0.13150.05结论:接受H0:P1=P2 r1与r2两个相关系数间的差异不显著。6、相关系数的合并: a、必须是相关系数间无显著差异才能合并。 合并的原则: b、不是将r值平均,而是将Z值加权平均。 Z值加权平均的公式为: (n3)Z Z 自由度上例(p288页,例6.17) r Z dfn3 ( n3)Z r10.83 Z1=1.1881 14-3=11 13.0691 r20.81 Z2=1.1270 11-3=8 9.0160 df19 (n3)Z22.0851 (n3)Z 22.0851 Z 自由度 = 19 =1.1624 1+r因为:Z=1/
4、2ln( 1-r )所以:2Z=ln(1+r)/(1-r)取反对数: (1+r)/(1-r)antiln(2Z) 1+rantiln(2Z)(1-r) 1+r antiln(2Z)- antiln(2Z)r r+ antiln(2Z) r antiln(2Z)-1 rantiln(2Z)+1= antiln(2Z)-1 antiln(2Z)-1 antiln(21.1624)-1 r antiln(2Z)+1 antiln(21.1624)+1 0.8218所以:水稻籽粒蛋白质含量与赖氨酸含量两个相关系数合并 后的相关系数是:r0.8218。再举一个合并相关系数的例子:例:调查我国18岁男子2
5、64人,肺活量与身高的:r10.395 同龄女子37人,肺活量与身高:r20.269。问:18岁的青年男女,肺活量与身高的相关系数是多少?首先将r值转换成Z值:r Z df (n3)Zr10.395 Z1=1/2ln(1+0.395)-(1-0.395)=0.4177 264-3261 109.0197r20.269 Z2=1/2ln(1+0.269)-(1-0.269)=0.2758 37-334 9.3772 df295 118.3969 (n3)Z 118.3969 Z 自由度 = 295 =0.4013 antiln(2Z)-1 antiln(20.4013)-1 r antiln(2
6、Z)+1 antiln(20.4013)+1 0.3811结论:18岁青年男女的肺活量与身高的相关系数是0.3811。7、多个相关系数差异显著性的X2检验法: H0:P1=P2=P3=Pi HA:P1P2P3Pi例:统计工人、农民、医生、教师四种不同职业的人的年龄 和血压的相关系数资料如下:职业 r n n3 Z (n3)Z工人 r10.6421 163 160 Z1=1/2ln(1+0.6421)-ln(1-0.6421)=0.7617 121.8720农民 r20.6372 79 76 Z2=1/2ln(1+0.6372)-ln(1-0.6372)=0.7534 57.2584教师 r30
7、.7921 182 179 Z3=1/2ln(1+0.7921)-ln(1-0.7921)=1.0770 192.7830医生 r40.6764 54 51 Z4=1/2ln(1+0.6764)-ln(1-0.6764)=0.8224 41.9424 =466 =412.8558 (n3)Z 412.8558 Z 自由度 = 466 =0.8660X2=(Zi-Z)2(ni3) (0.7617-0.8860)2160+(0.7534-0.8860)276 +(1.0770-0.8860)2179+(0.8224-0.8660)251 10.5448查表:X20.05,3=7.815 X20.0
8、1,3=11.345 10.54487.815 P0.05结论:否定H0,接受HA。相关系数间的差异显著。 说明年龄与血压的相关因不同的职业而异。8、组内相关: 简单相关也叫组间相关。是研究性质上不同的两种 现象间的关系。 组内相关成对的观察单位研究同一现象间的关系 (性质上相同) 例如:成对染色体长度间的相关。 动物孪生个体体重间的相关。 由于两个观察值性质相同,具体观察时难于区别究竟哪一个属于X,哪一个属于Y,所以理论上取平均值。设:n对观察值, 故:观察总数2n X+Y 其重量的平均数为:XY= 2n 将平均数代入相关系数公式,可以导出: 2(X-XY)(Y-XY) r (X-XY)2+
9、(Y-XY)2例:10胎孪生牡羊产后一个月体重间的组内相关。 (见下表)孪生第一个个体孪生第二个个体(X-XY)(Y-XY)XX-XY(X-XY)2YY-XY(Y-XY)226-41629-11+433+3932+24+620-1010024-636+6028-2429-11+224-63628-24+1233+3937+749+2135+52534+416+2032+2433+39+627-3935+525-1532+2429-11-2290-10216310+10146114XY=(X+Y)/2n (290+310)/21030 2(X-XY)(Y-XY) 2114 r (X-XY)2+(
10、Y-XY)2 216+146 0.6298显著性检验:方法一:t法H0:P=0(总体无相关)t=r / Sr=r/(1-r2)/(n2) 0.6298=(1-0.62982)/(10-2)=2.2933查表:t0.05,82.306 2.29330.05结论:接受H0,总体无相关 相关不显著 低方法二:r值查表法HO:P=0(总体无相关)n28 K=1(单个样本)查表:r0.05,80.632 0.62980.05结论:接受H0,总体无相关 相关不显著 中方法三:r z (U法)H0:P=0(总体无相关)当r0.6298时 Z=0.7411U=Z n3 =0.741110-3 =1.9607U
11、0.05=1.961.96071.96 P0.05结论:否定HO接受HA, 相关显著 高三种检验方法U测验最灵敏9、组内相关的推广应用: 如:研究三胞胎、四胞胎体重间的相关,其公式为: X+Y+M XYM = MN M表示变量的个数 M(X-XYM)(Y-XYM)(M-XYM)r =(X-XYM)2+(Y-XYM)2+(M-XYM)210、等级相关用等级表示的变数的相关研究(成对的等 级变数之间的相关研究)。 如:鸡蛋的大小与蛋壳颜色深浅的相关 植物花的颜色与开花迟早的相关只能用等级表示例:甲乙两个水稻品种在13个地区种植的产量等级:地区号 甲品种等级乙品种等级dd21523927700312
12、111141100513130061112-117910-1183.54-0.50.259880010109111165111223-11133.56-2.56.25d221.5 6d2 621.5rk= 1 - n(n2-1) 1- 13(132 -1) 0.9409 等级相关系数只是一种粗略的估计。11、净相关(偏相关)净相关是组内相关研究的一种 特殊研究方法。特殊在,每次 固定其它的变量,而只研究其 中的一对变量。这样,可排除 其它变量因素的干扰,得到的 相关系数仅反应两个变量的相 关,故称净相关。之所以称偏, 是根据偏回归系数而来的。 一级净相关有三个变量,每次固定一个,研究其中两 个
13、。因而有C31=3个一级净相关: r12,3 r13,2 r23,1 二级净相关有四个变量,每次固定两个,研究其中两个。 因而有C42=6个二级净相关: r12, 34 r13, 24 r14, 23 r34, 12 r24, 13 r23, 14 二级以上净相关研究计算烦琐,实用价值也不大。一般研究上应用较多的是一级净相关。其公式为: r12r13r23 r12,3 (1-r132) (1-r232) r13r12r23 r13,2 (1-r122) (1-r232) r23r12r13 r23,1 (1-r122) (1-r132)例:橡胶树病情指数与最冷月平均温度及一月份平均温度 13年
14、的资料。年份 病情指数最冷月平均温度一月份平均温度X1*X2X1*X3X2*X3X1X12X2X22X3X3219630.40.1615.3234.0915.3234.096.126.12234.09196452.32735.2915.8249.6416.4268.96826.34857.72259.12196511.8139.2415.2231.0415.2231.04179.36179.36231.04196651.62662.5617.6309.7617.9320.41908.16923.64315.04196742.71823.2916.3265.6916.3265.69696.019
15、69.01265.69196841.51722.2515.5240.2515.5240.25643.25643.25240.25196933.71135.6915.8249.6415.8249.64532.46532.46249.64197112.5156.2515.022515.0225187.5187.5225197236.61339.5615.8249.6415.8249.64578.28578.28249.64197350.72570.4916.025616.0256811.2811.225619742.56.2513.7187.6913.7187.6934.2534.25187.69
16、197535.21239.0416.2262.4416.6275.56570.24584.32268.9219760.40.1613.1171.6115.1228.015.246.04197.81371.915580.23201.33132.49204.63231.985978.416040.153179.93第二步:求简单相关系数: x1x2x1x2/nr12x12-(x1)2/nx22-(x2)2/n 5978.41371.9201.3/13 (15580.23371.92/13)(3132.49201.32/13) 0.7954r130.7716r230.8693第三步:求净相关系数:
17、r12r13r23 0.79540.77160.8693 r12,3(1-r132) (1-r232) (10.77162)(10.88932) 0.3964 r13r12r23 0.77160.79540.8693 r13,2(1-r122) (1-r232) (10.79542)(10.86932) 0.2676 r23r12r13 0.86930.79540.7716 r23,1(1-r122) (1-r132) (10.79542)(10.77162) 0.6629比较:简单相关(组间相关) 净相关(组内相关) r120.7954 r12,30.3954 r130.7716 r13,2
18、0.2627 r230.8693 r23,10.6629 由于受另一变量的影响 消除了另一变量的影响 夸大了两者的相关密切 是合理的衡量相关的尺度。 程度。第四步:净相关系数显著性检验(U测验法) 当:r12,30.3954时, z1/2ln(1+0.3954)ln(10.3954)0.4182 Uz/1/(n3)zn30.4182/(10-3)1.3225 U0.05(双侧)1.96 1.32250.05 结论:接受H0,相关不显著。 即:橡胶树的病情指数与最冷月平均气温关系不密切。当:r13,20.2627时 z1/2ln(1+0.2627)ln(10.2627)0.2690 U0.269013-30.8507 0.85070.05结论:接受H0,相关不显著。 即:橡胶树的病情指数与一月份平均气温关系不密切。当:r23,10.6629时, z1/2ln(1+0.6629)ln(10.6629)0.7980 U0.0.798013-32.5234 U0.05(双侧
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- YY 0948-2025心肺转流系统一次性使用动静脉插管
- 新解读《GB-T 30590-2014冷冻饮品分类》
- 重庆灾难预警解读课件
- 新解读《GB-T 5616-2014无损检测 应用导则》
- 人教版八年级数学上册《角的平分线》同步练习题(附答案)
- 建筑施工-安全培训课件-学安全生产法-行安全生产事
- 老年人肺炎疾病知识培训课件
- 老年人美食知识培训内容课件
- 老年人知识培训题课件
- 老年人照料课件
- 2023-2025北京高一(上)期末数学汇编:常用逻辑用语(人教B版)
- 迈瑞注射泵的操作流程
- 数据共享保密协议书
- 空调系统故障应急预案
- 2025年高考政治学科命题原则、命题趋势、考查重点与导向解读
- 手术室安全知识
- 临床带教方案
- DL-T 5876-2024 水工沥青混凝土应用酸性骨料技术规范
- 全国第三届职业技能大赛(无人机驾驶(植保)项目)选拔赛理论考试题库(含答案)
- 运动解剖学课件完整版
- 地下室管理制度
评论
0/150
提交评论