医学统计学基础-多元回归及相关_第1页
医学统计学基础-多元回归及相关_第2页
医学统计学基础-多元回归及相关_第3页
医学统计学基础-多元回归及相关_第4页
医学统计学基础-多元回归及相关_第5页
免费预览已结束,剩余30页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元回归优点多个自变量影响一个因变量时;排除混杂;揭示交互;交大医学院生物统计学教研室多元线性回归应用条件自变量和应变量之间的关系是线性关系;各观测单位相互独立;残差服从正态分布;残差满足方差齐性;交大医学院生物统计学教研室多元回归计算liil

yyliylij

(xi

xi

)

2

(

y

y)

2

(xi

xi

)(

y

y)

(xi

xi

)(x

j

x

j

)交大医学院生物统计学教研室l11b1

l12

b2

l1kbk

l1

yl21b1

l2

k

bk

l2

y┅

lkk

bk

lky

l22

b2┅

lk

2

b2lk1b1b0

y

b1

x1

b2

x2

bk

xkl

yy

U

QU

b1l1

y

b2

l2

y

bk

lky

Q

/(n

k

1)sy

.12

k交大医学院生物统计学教研室例题分析例6.4

某地29名13岁男童身高(cm),体重(kg)及肺活量(L)数据如表7.1。求由身高、体重推算肺活量的回归方程。交大医学院生物统计学教研室例号身高(x1)体重(x2)肺活量(y)1135.132.01.752139.930.42.003163.646.22.754146.533.52.505156.237.12.756156.435.52.007167.841.52.758149.731.01.509145.033.02.5010148.537.22.2511165.549.53.0012135.027.61.25交大医学院生物统计学教研室分析步骤b0=-0.5657y

=b0+b1x1+b2x2先计算以下中间结果按式建立正规方程组解得b1=0.005017,b2=0.054061将b0

,b1

,b2代入得y=-0.5657+0.0050x1+0.0541x2交大医学院生物统计学教研室(4)进行显著性检验:整个方程和各个回归系数H0:β1=0,β2=0

H1:β1,β2不都等于0。U=0.005017×61.79483+0.054061×51.15948=3.0758Q=lyy-U=5.63362-3.0758=2.5578变异来源度平方和均方FU23.07581.537915.6327Q262.55780.0984lyy285.6336交大医学院生物统计学教研室s

y.12

2.5578

/(29

2

1)

=0.3137剩余标准差(Residual

Standard

Deviation)衡量方程的稳定性,剩余标准差越小,方程越稳定。注意:多元回归经检验

H0:β1=0,β2=0时,不能保证各个自变量的βi都不等于0,也即每个自变量的作用都显著;必须对每个自变量进行检验,看它的作用是否显著。所需要的方程是既要整个方程有显著意义,也要每个自变量都有显著作用。交大医学院生物统计学教研室偏回归系数概念y=b0+b1x1+b2x2b1是指当将x2的作用加以固定后,x1改变一个单位时y平均将改变b1个单位。b1的符号为正,则x1与y的变化方向相同,即x1增加时,y也增加;当b1的符号为负时,则x1增加时,y就减少。例题b1=0.0050它指的是对于体重相同的13岁男童,其身高每增加1cm,则肺活量平均就要增加0.0050L交大医学院生物统计学教研室标准偏回归系数的概念例题b1=0.0050,它指的是对于体重相同的13岁男童,其身高每增加1cm,则肺活量平均就要增加0.0050L,b2=0.0541,则意味着对于身高相同的13岁男童,其体重每增加1kg,则肺活量平均就要增加0.0541L。此处b2虽比b1大,不能说x2对y的作用比x1大,因为b1和b2的单位不同,两者不能相比,如果要比较x1,x2对y的作用大小,必须把b1,b2标准化,化成没有单位的标准偏回归系数bi交大医学院生物统计学教研室偏相关系数概念简单相关系数,因为它只考虑了x1

,x2之间的相互影响,而未注意到其他变量对x1和x2可能有的影响。所谓偏相关系数指的是当把x1

,x2以外的其他变量对它们的影响都扣除掉(或平衡掉)以后,x1

,x2之间的相关系数。如果x1

,x2与周围其他变量没什么关系的话,则用简单相关系数来表示x1

,x2之间的相关性是可行的;如果存在着对x1,x2关系密切的其他变量,则r就不能确切地表示x1

,x2之间的真实关系,这就需要用到偏相关系数一级偏相关系数,二级偏相关系数。交大医学院生物统计学教研室多元相关系数概念多元相关系数用R表示,它是y与期望值之间的简单相关系数,也可理解为y与自变量组合之间的相关系数,其值是0~1。R2称为多元回归方程的决定系数,其值介于0~1之间,R2越接近1,说明回归方程的效果越好。否则该方程的效果不令人满意。R2也可用于检验多元回归方程的显著性,即方差分析变形。交大医学院生物统计学教研室逐步回归方法所要建立的回归方程不仅要求该方程须有显著意义,而且被引入方程的每个自变量也都须有显著作用,这样的方程称为“最优”方程。逐步回归分析基本思想:引入变量-检验-再引入(或剔除)-检验-方程中所含自变量都显著而又没有新的作用显著的自变量可引入方程。交大医学院生物统计学教研室两点说明逐步回归得到的“最优”回归方程仅保证方程内自变量都显著而方程外自变量都不显著;不能保证得到校正R2最大,或CP统计量最小,或剩余标准差最小的回归方程;有时两个或几个自变量,它们单独对y的作用都不大,但它们的交互作用却对y有很大影响,用通常的逐步回归方法时这几个自变量都无法进入方程。交大医学院生物统计学教研室最优子集回归把一切可能自变量组合的方程都求出来,然后选出一个符合最优标准的回归方程。这个方法称为最优子集回归或所有可能子集回归。最优子集回归中常用的最优准则:相关指数R2最大、校正R2最大、CP统计量最小。交大医学院生物统计学教研室SAS程序1data

dat1;input

x1

x2

y;cards;model

y=x1

x2/stb;135.132.01.75run;139.930.42.00163.6...46.22.75proc

reg

data=dat1simple

corr;交大医学院生物统计学教研室程序说明model语句的等号右边加上各自变量名。model语句后的选择项stb表示要求输出标准偏回归系数。交大医学院生物统计学教研室程序结果SourceDFSum

ofSquaresMeanSquareF

ValueProb>FModel23.075731.5378715.6320.0001Error262.557890.09838CTotal285.63362Root

MSE0.31366R-square0.5460Dep

Mean2.20690Adj

R-sq0.5110C.V.14.21255交大医学院生物统计学教研室Variable

DF

Parameter

StandardT

for

H0:Prob>|T|StandardizedEstimateErrorParameter=0EstimateINTERCEP1-0.5656641.24012711-0.4560.65210.00000000X110.0050170.010575440.4740.63920.09352150X210.0540610.015983773.3820.00230.66682420交大医学院生物统计学教研室偏相关SAS程序proccorrdata=dat1;var

x1;with

y;partial

x2;run;proccorrdata=dat1;var

x2;with

y;partial

x1;run;交大医学院生物统计学教研室1'PARTIAL'Variables:X21'VAR'Variables:X11'WITH'Variables:YYX10.092630.6392偏相关程序结果交大医学院生物统计学教研室1'PARTIAL'Variables:X11'VAR'Variables:Y1'WITH'Variables:X2X1Y0.552760.0023交大医学院生物统计学教研室例题分析二例6.6某中医研究室欲用较易测得的指标来推算每搏心输出量。为此,测定了136例的(AGE)、收缩压(PS)、舒(PD)、脉图收缩期面积(AS)、脉图舒张期面积(AD)、脉率(PR)及每搏心输出量(Y),见表7.3(只显示了部分数据)。试用多元回归分析求得推算Y的回归方程。交大医学院生物统计学教研室SAS程序data

dat4;input

no

agecards;ps

pd

asr

y;133906025.12444.6739055.862341127027.16643.9307951.92...;reg

data=dat4

simple

corr;y=age

pspd

as r/stb

p;procmodelrun;交大医学院生物统计学教研室程序说明本例数据比较多,也可以把数据输入到一个数据文件中,然后在数据步中用INFILE语句读入数据而建立数据集。MODEL语句后的选择项STB表示要求输出标准偏回归系数。MODEL语句后的选择项P表示要求输出各例的估计值和残差。交大医学院生物统计学教研室逐步回归SAS程序data

a;infile

'svreg.dat';input

age

ps

pd

pr

as

ad

sv;run;proc

reg

data=a

simple

corr;model

sv=age

ps

pd

as r

/

selection=stepwiseslentry=0.10

slstay=0.10

stb

details

p;run;交大医学院生物统计学教研室程序说明model语句后面的选择项“selection=stepwise”表示要进行逐步回归,该选择项缺省时进行多元回归。选择项“slentery=”或简写为“sle=”确定选入变量的P值;选择项“slstay=”或简写为“sls=”确定剔除变量的P值;本例都为0.10。选择项“stb”表示要输出标准偏回归系数。选择项“details”表示要打印出剔选过程的详细情况。选择项“p”表示要输出应变量的估计值和残差。交大医学院生物统计学教研室程序结果Statistics

for

Entry:

Step

1DF

=

1,134Variable

Tolerance

R**2F

Prob>FAGE1.0000000.04956.98460.0092PS1.0000000.03534.90790.0284PD1.0000000.06599.44700.0026AS1.0000000.01612.19540.1408AD1.0000000.06489.28240.0028PR1.0000000.00761.02900.3122Step

1 Variable

PD

Entered

R-square

=

0.06585739 C(p)

=23.47723651交大医学院生物统计学教研室DF Sum

of

SquaresMean

SquareF

Prob>FRegression16920.918010876920.918010879.450.0026Error13498168.54394207732.60107419Total135105089.46195294VariableParameterEstimateStandardErrorType

IISum

of

SquaresF

Prob>FINTERCEP21.1036077620.92094629745.449649371.02

0.3149PD0.870947930.283363636920.918010879.45

0.0026交大医学

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论