相关回归过程_第1页
相关回归过程_第2页
相关回归过程_第3页
相关回归过程_第4页
相关回归过程_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

相关回归过程第一页,共二十八页,2022年,8月28日一、目的要求1.掌握直线相关与回归分析的意义、用途与假设检验。2.掌握直线相关与回归分析的区别与联系。3.了解SAS中的proccorr、procreg过程且能对结果作分析。第二页,共二十八页,2022年,8月28日二、线形相关1.资料要求:X、Y服从双变量正态分布的连续型变量。2.方法:计算两变量的线性相关系数(pearson)。3.公式:

4.相关系数的统计推断(1)查表法(2)t检验第三页,共二十八页,2022年,8月28日线性相关应用中注意的问题1.r接近零并不意味着两变量间一定无相关性2.一个变量的数值人为选定时莫做相关3.出现异常值时慎用相关4.相关未必真有内在联系5.分层资料盲目合并易出假象第四页,共二十八页,2022年,8月28日实例表15名健康成人凝血时间与凝血酶浓度测量值第五页,共二十八页,2022年,8月28日SAS程序DATAC;INPUTXY@@;cards;1.1141.2131.0150.9151.2131.1140.9160.6171.0140.9161.1150.9161.1141.0150.717;PROC

GPLOT;

PLOTY*X;

PROC

CORR;

VARXY;RUN;第六页,共二十八页,2022年,8月28日SAS输出结果:第七页,共二十八页,2022年,8月28日SAS输出结果:

TheCORRProcedure2Variables:XYSimpleStatisticVariableNMeanStdDevSumMinimumMaximumX150.980000.1698714.700000.600001.20000Y1514.933331.27988224.0000013.0000017.00000第八页,共二十八页,2022年,8月28日SAS输出结果:

PearsonCorrelationCoefficients,N=15Prob>|r|underH0:Rho=0XYX1.00000-0.92646<.0001Y-0.926461.00000<.0001相关系数rP值第九页,共二十八页,2022年,8月28日三、秩相关

1.资料要求:不满足正态分布或总体分布未知的两连续型变量。

2.方法:利用两变量的秩次大小作线相关分析,计算spearman相关系数。

3.公式:与线性相关一样。

4.相关系数的统计推断(1)n≤50,查表法(2)n>50,t检验第十页,共二十八页,2022年,8月28日实例第十一页,共二十八页,2022年,8月28日SAS程序DATAex4;INPUTxy@@;CARDS;121313821651310042625402……;PROC

CORR

SPEARMAN;

VARxy;RUN;第十二页,共二十八页,2022年,8月28日

TheCORRProcedureVariables:x

SimpleStatisticsVariableNMeanStdDevMedianMinimumMaximumx12791.00000612.64508640.00000121.000002004y121.083331.240110.5000003.00000SAS输出结果:第十三页,共二十八页,2022年,8月28日

SpearmanCorrelationCoefficients,N=12Prob>|r|underH0:Rho=0xyx1.00000-0.422250.1715y-0.422251.000000.1715SAS输出结果:相关系数rP值第十四页,共二十八页,2022年,8月28日四、分类变量的关联性分析属两种属性独立性的χ2检验—定性变量之间的联系。1.方法:根据两个定性变量交叉分类计数所得的频数资料做关联性分析。2.类型:交叉分类2×2表的关联性分析

2×2配对资料的关联性分析

R×C表分类资料的关联性分析第十五页,共二十八页,2022年,8月28日SAS程序DATAex5;INPUTrcf;CARDS;1130121021172225;PROC

freq;

tablesr*c/chisq;Weightf;RUN;第十六页,共二十八页,2022年,8月28日

r*c表的统计量统计量自由度值概率----------------------------------------------------------

卡方19.98150.0016似然比卡方110.23570.0014连续校正卡方18.62020.0033Mantel-Haenszel卡方19.85970.0017Phi系数0.3489

列联系数0.3294Cramer的V0.3489SAS输出结果:第十七页,共二十八页,2022年,8月28日五、线形回归-前提假设线性(linear)独立(independent)正态(normal)等方差(equalvariance)

恰好为“LINE”。第十八页,共二十八页,2022年,8月28日线形回归的概念表达式b的意义a的意义的意义的意义的意义第十九页,共二十八页,2022年,8月28日回归参数的估计最小二乘法(leastsquareestimation,LSE)基本思想:使各实测值Y与回归直线上对应的估计值之差的平方和为最小,在这个准则下,可导出a、b的最小二乘估计。

第二十页,共二十八页,2022年,8月28日回归系数的统计推断t检验方差分析第二十一页,共二十八页,2022年,8月28日六、直线回归与相关的区别与联系联系正负符号相同:假设检验等价:用回归解释相关:

换算关系:

第二十二页,共二十八页,2022年,8月28日直线回归与相关的区别与联系区别计量单位:应用:相关表示相互关系,回归表示依存关系。对资料的要求不同:当X和Y都是随机的,可以进行相关和回归分析;当Y是随机的(X是控制的),理论上只能作回归而不能作相关分析;

I型回归:X是精确控制的;II型回归:X是随机的。由X推算Y,由Y推算X第二十三页,共二十八页,2022年,8月28日实例某地一年级12名女大学生的体重与肺活量数据如下,试求出肺活量对体重的直线回归方程。体重(kg)X424246464650505052525858肺活量(L)Y2.552.202.752.402.802.813.413.103.462.853.503.00

第二十四页,共二十八页,2022年,8月28日sas程序-数据步

datak;inputxy@@;cards;422.55422.20462.75462.40462.80502.81503.41503.10523.46522.85583.50583.00;第二十五页,共二十八页,2022年,8月28日sas程序-过程步proc

plot;plotx*y="a";proc

reg;modely=x/clbclmcli;run;clb计算并输出参数估计值的可信区间上、下限cli

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论