相关系数与P值的一些基本概念_第1页
相关系数与P值的一些基本概念_第2页
相关系数与P值的一些基本概念_第3页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、相关系数与P值的一些基本概念注:在期末论文写作过程屮,关于相关系数与假设检验结果的表达方式,出现了一些概念 问题。这篇文档的内容是对一些相关资料进行整理后的结果,供感兴趣的同学参考。如果 需要更确切的定义,请进一步参阅统计分析类的教材。1.相关系数常用Pearson? s correlation coefficient,计算公式与传统概念上的相同,即:cov(X,r) E(x -PXY =常用符号r表示。1WrW 1常用如果用于评估数据点与拟合曲线间的关联程度,则一般用相关系数的平方值表示,符号为R2, 0 R2 1典型示例如下图。R 2相差不大,但显然数据规律完全不同。因此,一般需要结合拟合

2、曲线图表给出R 2 ,才有参考价值。1250"/iaoc7 50-5 00-2 50-aoo-RLine 盘 0.66T0.0050010 00150020.00qR Sq Linear 丄 0.66612.00-10 00-8,00-Y4 6,00-4 00-2.00-ooo-R Sq Linear =ODD 5 0D 10 0015 0020 000 005.00 WOO 15 0020 00相关系数另一方面的应用是用来评估两组数据Z间相互关联的程度,简单来说,就是判断一下两参量之间是否“相关”,有3种可能的情况,如下面的图所示。Negative correlationXPosi

3、tivecorrelatioucorrelatiou此时的相关系数一般用r表示。下图给出了不同r取值的例子。(a)* * * 朿汗 r » aoo心* #r 序Hr>0 ,正相关。x增大,y倾向于增大;r<0 ,负相关。x增大,y倾向于减小;r=0 ,不相关。x增人,y变化无倾向性;显然,如果只是用来判断两参量之间的“关联”性质,00.70与r=0.70应该是相同的。所以也可用(常见)r的绝对值表达。用文字表述“关联”程度时,可参考下面的取值范围建议: .0 0-.19 .20-39 .40-.59 .60-.79 .80-1.0Spearman correlationl

4、weak4eak" 4hmoderate" strong "veiy strong"需要注意的是,这种相关系数的计算方法给出的r值,实际上反映的是“线性相关”的程度,如果两者虽然相关,但不是线性的,很可能给出不是很靠得住的结果,观察下面的例 子。左下角图中,两参量显然相关,但“线性”程度不够,所以PearsonJ s correlation coefficient只有0.88。另外一种相关系数的计算方法,Spearman correlation coefficient ,用来评估两参量之间的“单调相关性”。如上面左下角图中的Spearman相关系数=1。

5、Spearman correlation coefficient计算公式为:6刀輕 1)其中,n为样本数,血= 下面的图是一些例子:G = °4 = 12. P 值(p-values )P值是配对t检验 (paired t-test)计算过程中得到的结果。用来评估前面所述相关程度计算结果的“显著程度”。在常用统计软件SPSS中,卩值(p-value ,有时显示为 Sig-value )的计算是建立在如下两个假设基础上的:无效假设(null hypothesis ) Ho: r 0 ,两参量间不存在“线性”关联。备择假设(alternative hypothesis ) H仁r 0 ,

6、两参量间存在“线性”关联。如果计算出的P值很小,比如为0.001,则可说“有非常显著的证据拒绝Ho假设,相信Fh假设,即两参量间存在显著的线性关联”。P值的数值大小没有统计意义,只是将其与某一个阈值进行比对,以得到二选一的结论。关于P值的判断阈值,可参照下面给出的建议: p > 0.1 implies no evidenee to reject Ho 0.05 < p < 0.01 implies some weak evidence to reject Ho 0.01 < p < 0.05 implies evidenee to reject Ho p <

7、 0.01 implies strong evidence to reject Ho典型的阈值取为0.05 ( 5%)。因此判断规则如下:PW0.05,拒绝无效假设,接受备择假设,即“存在显著的线性关联”P>0.05,拒绝无效假设失败。注意:如果不是这样,',从而得出上面所给出的判断方式中,确切的结论是以“ pW阈值”为标准的, 而是“ p>阈值”,则只能给出检验失败的结论,不能说“接受无效假设 “存在显著线性关联”的结论。P值只用于二值化判断,因此不能说P值=0.06比0.07 “更好”。为更好地理解,下面给出例子。> 0425-11.C01?001300U0D1

8、希016001700两参量Hb、PCV,经SPSS软件计算得到如下结果:CorrelationsHbPCVHbPearson Correlation1.877"Sig. (2-tailed).000N14uPCVPearson CorrelationJ77M1Sig. (2-tailed).000N1414Correlation is significant at the 0.01 level (2- tailed).结论可表达为;“对于所采集到的14个样本值,计算了两参量Hb、PCV之间的Pearson相关系数,两参量之间存在显著正相关(r=0.88, N=14, p<0.0

9、01 ) ”。需要注意的是,相关程度未必能够代表两参量之间存在因果关系。比如上面的例子,只能说明Hb、PCV之间存在关联,而不是“Hb导致PCV变化”。footlength )与阅cr1读能力(reading ability)之间的关系。Q0bodQ QCOOA0 0 0O30这种统计分析的结论,与具体的实验设计方式关系很大,需要特别关注是否存在一些隐 藏在数据背后的因素。下面是一个极端一些的例子,分析儿童足底长度(Fo&tltngith用SPSS计算,可得到足底长度与阅读能力之间“显著相关”的结果(r=0.88,N=54,p=0.003 ) o然而,如果考虑到年龄,则可发现这种“显著

10、相关”很可能是 靠不住的,如下图。Aga 慣E010Foot length下面的图是分年龄的统计结果。可以看到,无法得到“显著相关”的结论。Age (years) = 8 c-.AilingFo>ik?iaft只 wy KyPMHIOfl CCTO细他10阴(込T .l.403NIBIB *;:PMfS<Ki2佃i珂卩4*M)<03N18tB心啊刑)AAge (years) = 10£# »il»aFont hngmd址II险Ftgdliip Mill*P*aracn ComhitonSig (2 isSed)060HIVFoGt lonylrPearson

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论