《线性相关分析》ppt课件_第1页
《线性相关分析》ppt课件_第2页
《线性相关分析》ppt课件_第3页
《线性相关分析》ppt课件_第4页
《线性相关分析》ppt课件_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十三章 线性相关分析第一节 线性相关的概念 一、概念:相关系数一、概念:相关系数correlation coefficient又又称称Pearson积差相关系数,用来阐明具有直线关系的两积差相关系数,用来阐明具有直线关系的两变量间相关的亲密程度与相关方向。变量间相关的亲密程度与相关方向。以符号r表示样本相关系数, 符号表示其总体相关系数。 相关系数没有单位,其值为相关系数没有单位,其值为-1 r 1-1 r 1。r r值为正值为正表示正相关,表示正相关,r r值为负表示负相关,值为负表示负相关, r r绝对值反绝对值反响两变量间相关关系的亲密程度,绝对值越大阐响两变量间相关关系的亲密程度,绝

2、对值越大阐明相关关系越亲密,明相关关系越亲密, r r的绝对值等于的绝对值等于1 1为完全相为完全相关,关,r=0r=0为零相关。为零相关。 二、 计算公式 样本相关系数的计算公式为22()()()()XYXX YYXX YYlrllXXYY13-1 例例13-2 续例续例13-1计算表计算表13-1中体中体重指数和收缩压的相关系数。重指数和收缩压的相关系数。解:解:1绘制散点图,察看两变量之间能否有绘制散点图,察看两变量之间能否有线性趋势。线性趋势。 从图从图13-1可见,体重指数与收可见,体重指数与收缩压之间呈线性趋势,且方向一样,为正缩压之间呈线性趋势,且方向一样,为正相关。相关。2计算

3、相关系数。从表计算相关系数。从表13-1的合计栏中,的合计栏中,已得出根本数据:已得出根本数据: 10.63150.912.635051.6836XYXX YYlrll 三、运用线性相关系数三、运用线性相关系数r时应留意的问题:时应留意的问题: 1. r只表示两个服从正态分布的随机变量之间只表示两个服从正态分布的随机变量之间线性关系的亲密程度和相关方向,线性关系的亲密程度和相关方向,r=0只能说只能说X与与Y之间无线性关系,并不能说之间无线性关系,并不能说X与与Y之间无任何关之间无任何关系。系。 2. 相关关系并不一定是因果关系。相关分析的相关关系并不一定是因果关系。相关分析的义务就是对相关关

4、系给以定量的计算和描画。义务就是对相关关系给以定量的计算和描画。第二节 相关系数的假设检验20, 212rrrtnSrn13-2 例例13-3 续例续例13-1 根据样本相关系数,根据样本相关系数,对总体相关系数对总体相关系数=0进展假设检验。进展假设检验。 解:解: 1. t检验法检验法 检验步骤如下:检验步骤如下: 1建立假设,确定检验水准建立假设,确定检验水准 。H0: =0变量间不存在线性相关关系;变量间不存在线性相关关系;H1: 0变量间有线性相关关系;变量间有线性相关关系;05.0检验步骤 2计算检验统计量 本例n=16,r=0.91,按公式13-220.91108.265310.

5、9110/ 162rt2. 查表法查表法 根据自在度根据自在度 ,查附表,查附表13相关系数相关系数r界值界值表,表, , ,本例,本例r =0.91,所以,所以P0.01,按按 水准回绝水准回绝H0,接受,接受H1,与,与 t 检验结论一样。检验结论一样。140 .0 1 / 2 ,1 42 .9 7 7t0.01/2,14rtt05.0第四节第四节 相关系数的可信区间相关系数的可信区间rZ1tanhrrZ11ln21 统计推断包括假设检验和区间估计,前面已学过相关系数的假设检验,假设检验只是回答了总体相关系数 能否存在的问题,假设想知道的 大致范围,就需求计算的 可信区间。 由于由于r呈非

6、正态分布,故不能直接用呈非正态分布,故不能直接用r求可信区间,而求可信区间,而是首先对是首先对r作作Z转换,以消除这种偏态转换,以消除这种偏态 式中为tanh为双曲正切函数,tanh-1为反双曲正切函数, SZ为Z的规范误。 转换后的转换后的Z统计量服从方差为统计量服从方差为 的正态分布,用下式计算的正态分布,用下式计算Z统计量总体均数的统计量总体均数的1001- %可信区间。当可信区间。当 时,时,即为即为95%可信区间。可信区间。3/, 3/2/2/nuZnuZ3/2/nuZ1/(3)n0.05最后,对此区间的上下限作反变换,最后,对此区间的上下限作反变换,Zrtanh1122zzeer例

7、例13-4 续例续例13-1 例例13-2中,求得样本相关系数中,求得样本相关系数r=0.9110,求求 的的 95%可信区间。可信区间。11tanhtanh 0.9110 1.5334Zr2 0.98982 2.07702 0.98982 2.0770110.760.9711eeee/ 2/31.53341.96 /163 =0.98982.0770Zun第五节 直线回归与相关运用的本卷须知 1根据分析目的选择变量及统计方法 直线相关用于阐明两变量之间直线关系的方向和亲密程度,X与Y没有主次之分; 直线回归那么进一步地用于定量描写应变量Y对自变量X在数值上的依存关系,其中应变量的定夺主要依专

8、业要求而定,可以思索把易于准确丈量的变量作为X,另一个随机变量作Y,例如用身高估计体外表积。 两个变量的选择一定要结合专业背景,不能把毫无关联的两种景象勉强作回归或相关分析。 相关关系不一定是因果关系,能够仅是外表上的伴随关系,或两个变量同时受另一要素的影响,如小孩的身高和小树的树高同时受时间的影响,在校儿童的鞋的大小和阅读技艺同时受年龄的影响。 不能只根据相关系数r的绝对值的大小来推断两事物景象之间有无相关以及相关的亲密程度,而必需对r进展相关系数的假设检验。另外,不要把相关系数的显著性误解为两事物或景象相关的强度,例如对于相关系数的假设检验来说,P0.01比P0.05更有理由以为相关关系成

9、立,但并不能得出前者比后者相关关系更亲密的结论,相关关系的强度是用r的绝对值来反映的。 2进展相关、回归分析前应绘制散点图第一步1 散点图可调查两变量能否有直线趋势;2 可发现异常点outlier。 散点图对异常点的识别与处置需求从专业知识和现有数据两方面来思索,结果能够是现有回归模型的假设错误需求改动模型方式,也能够是抽样误差呵斥的一次偶尔结果甚至过失误差。需求仔细核对原始数据并检查其产生过程认定是过失误差,或者经过反复测定确定是抽样误差呵斥的偶尔结果,才可以谨慎地剔除或采用其它估计方法。3资料的要求 直线相关分析要求 X与Y 服从双变量正态分布; 直线回归要求至少对于每个 X 相应的 Y 要服从正态分布,X可以是服从正态分布的随机变量也可以是能准确丈量和严厉控制的非随机变量; * 对于双变量正态分布资料,根据研讨目的可选择由 X 估计 Y 或者由 Y 估计 X ,普通情况下两个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论