第14章 直线回归分析_第1页
第14章 直线回归分析_第2页
第14章 直线回归分析_第3页
第14章 直线回归分析_第4页
第14章 直线回归分析_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、李晓松主编李晓松主编. . 医学统计学医学统计学( (第第3 3版版). ). 北京北京: : 高等教育出版社高等教育出版社, , 2014.2014.第十四章第十四章陈卫中陈卫中 副教授副教授公共卫生系流行病与卫生统计学教研室公共卫生系流行病与卫生统计学教研室20222022年年6 6月月2626日星期日日星期日l例例14.1 探讨男性腰围探讨男性腰围(WC)与腹腔与腹腔内脂肪内脂肪面面积积(VAT)的关系的关系-利用腰围预测腹腔内脂肪面积利用腰围预测腹腔内脂肪面积l随机抽取了随机抽取了20名男性名男性志愿受试者志愿受试者l测量测量其腰围其腰围(cm),并采用磁共振成像法测量其腹腔内,并采用

2、磁共振成像法测量其腹腔内脂肪面积脂肪面积(cm2)引例引例内容提要内容提要概念和用途概念和用途分析步骤分析步骤模型中参数的估计模型中参数的估计l研究变量间数量依存关系,并研究变量间数量依存关系,并以函数的形式以函数的形式表达这种表达这种关系的统计学关系的统计学方法方法回归分析回归分析数量依存关系的专业解释数量依存关系的专业解释l从专业上来看,存在数量依存关系的变量间从专业上来看,存在数量依存关系的变量间的关系的关系-因果关系因果关系l影响因素作用于研究对象必然事物的发生或所处状态影响因素作用于研究对象必然事物的发生或所处状态产生影响产生影响(效应效应) l影响因素不同水平产生的效应不同影响因素

3、不同水平产生的效应不同-伴随关系伴随关系l ZXYl根据被预测变量根据被预测变量(Y)的类型及函数形式不同的类型及函数形式不同-简单线性回归简单线性回归(Simple linear regression)-多元线性回归多元线性回归(Multivariate linear regression)-logistic回归回归(Logistic regression)-Cox回归回归(Cox regression)-非线性回归非线性回归(Curve regression)常见的回归形式常见的回归形式l是是一种研究两变量间数量依存关系,并寻找最能一种研究两变量间数量依存关系,并寻找最能代表这种关系的直线

4、的统计方法代表这种关系的直线的统计方法-回归:数量依存关系回归:数量依存关系-简单:两变量简单:两变量lY:被预测的变量,称为被预测的变量,称为因变量因变量(dependent variable)或反应变量或反应变量(response variable)必须是定量变量必须是定量变量lX:Y所依存的变量所依存的变量,称为自变量称为自变量(independent variable)或解释或解释变量变量(explanatory variable)可用可用数字进行表达数字进行表达-线性:直线函数线性:直线函数简单线性回归简单线性回归内容提要内容提要概念概念和用途和用途分析步骤分析步骤回归分析的应用回归

5、分析的应用1. 明确明确X、Y,并定量化,并定量化2. 确定确定回归回归模型模型:绘制散点图绘制散点图3. 估计模型中的参数估计模型中的参数,形成,形成回归方程回归方程4. 绘制回归绘制回归函数图形函数图形5. 回归分析的统计推断回归分析的统计推断6. 回归模型诊断回归模型诊断7. 回归方程回归方程预测效果预测效果的评价的评价回归分析回归分析的基本步骤的基本步骤l确定因变量确定因变量 (结局变量,结局变量,Y)与自变量与自变量 (X)-因果因果关系:医学关系:医学常识、专业常识、专业意义确定意义确定-伴随关系:伴随关系:研究目的研究目的确定确定X、Y1. 明确明确X、Y,并定量化,并定量化2.

6、 确定确定回归回归模型模型:绘制散点图绘制散点图3. 估计模型中的参数估计模型中的参数,形成,形成回归方程回归方程4. 绘制回归绘制回归函数图形函数图形5. 回归分析的统计推断回归分析的统计推断6. 回归模型诊断回归模型诊断7. 回归方程回归方程预测效果预测效果的评价的评价回归分析回归分析的基本步骤的基本步骤l根据资料,绘制根据资料,绘制散点图散点图-建立坐标系建立坐标系-每个每个点表示一个观测对象点表示一个观测对象-点的密集程度和趋势来表示两个变量间的数量点的密集程度和趋势来表示两个变量间的数量关系关系确定回归模型,散点图确定回归模型,散点图的绘制的绘制表表14.1 2014.1 20名男性

7、志愿受试者腰围和腹腔内脂肪面积的测量值名男性志愿受试者腰围和腹腔内脂肪面积的测量值编号编号腰围腰围(cm)腹腔内脂肪面积腹腔内脂肪面积(cm2)编号编号腰围腰围(cm)腹腔内脂肪面积腹腔内脂肪面积(cm2)181.369.81193.5108.2285.661.212103.8129.0385.980.31397.5110.4487.875.51498.3123.3579.075.71599.7105.5682.585.41687.283.1795.2102.51784.172.0896.199.61888.0100.0994.497.819101.0105.01090.6100.92088.

8、3127.7506580951101251407580859095100105110腹腔内脂肪面积腹腔内脂肪面积(cm2)腰围腰围(cm)散点图的绘制散点图的绘制20名男性志愿受试者腰围和腹腔内脂肪面积的测量值散点图名男性志愿受试者腰围和腹腔内脂肪面积的测量值散点图81.3,69.8506580951101251407580859095100105110腹腔内脂肪面积腹腔内脂肪面积(cm2)腰围腰围(cm)绘制散点图的意义绘制散点图的意义l是否存在线性趋势是否存在线性趋势-散点完全在一条直线散点完全在一条直线上上lY变量的变异完全由变量的变异完全由X变量的变化来解释变量的变化来解释确定性关系确

9、定性关系-散散点未完全落在一条直线,只存在线性点未完全落在一条直线,只存在线性趋势趋势lY变量的变量的变异不完全变异不完全由由X变量的变化来解释变量的变化来解释非非确定性关系确定性关系-不存在回归关系不存在回归关系-不存在线性关系不存在线性关系l有无异常点有无异常点l有无混杂因素影响有无混杂因素影响同质性同质性506580951101251407580859095100105110腹腔内脂肪面积腹腔内脂肪面积(cm2)腰围腰围(cm) y= + x (98.3, 123.3) + 98.3iiixy确定回归模型确定回归模型l说明说明1个因变量和个因变量和1个自变量间数量依存关系,个自变量间数量

10、依存关系,并用并用线性函数表达线性函数表达-非确定性关系非确定性关系直线回归模型的表达直线回归模型的表达常数常数项项截距截距回归系数回归系数斜率斜率残差残差回归部分回归部分y xxiiiyx随机部分随机部分20,Nl y|x= + x:X确定时其值不再变化,确定时其值不再变化,故故又称又称为固定部分为固定部分-统计学意义:统计学意义:X为某一定值时为某一定值时Y的总体均数,又的总体均数,又称为条件均数称为条件均数-专业意义:专业意义:X为某一定值时为某一定值时Y的预测值的预测值l截距截距(intercept), 或或 0表示表示-回归直线在回归直线在Y轴上的截距,即轴上的截距,即x=0时时Y的

11、条件均数的条件均数回归部分回归部分81.3cm2|81.396.392.1196.392.11 81.375.19cmy xy xxix - -00y xl亦亦称回归系数称回归系数(regression coefficient), 表示表示-X每每变化变化1个单位时个单位时,Y平均平均变化变化 个个单位单位l =0,X与与Y之间之间无数量依存无数量依存关系关系l 0,X与与Y之间存在数量之间存在数量依存依存关系关系协同变化的方向协同变化的方向l 0,X、Y同同向变化向变化l 0,X、Y反向变化反向变化斜率斜率(slope)11(1)y xy xy xy xxx -残差残差(residual)l

12、 =Y-( + X),实测实测值与条件均数之间的差异值与条件均数之间的差异-为随机误差,无方向性为随机误差,无方向性-假定其假定其服从正态分布服从正态分布l总体均数为总体均数为0l方差方差 2,且不随,且不随x的变化而变化的变化而变化与与X无关无关-残差间相互独立残差间相互独立20,NCov,0ij 1. 明确明确X、Y,并,并定量化定量化2. 确定确定回归回归模型模型:绘制散点图绘制散点图3. 估计模型中的参数估计模型中的参数,形成,形成回归方程回归方程4. 绘制回归绘制回归函数图形函数图形直线直线5. 回归分析的统计推断回归分析的统计推断6. 回归模型诊断回归模型诊断7. 回归方程回归方程

13、预测效果预测效果的评价的评价简单线性回归分析简单线性回归分析的基本步骤的基本步骤22()(),iiiiyaxbyyQ a b-iiieyabx-2iiyy- yabx506580951101251407580859095100105110腹腔内脂肪面积腹腔内脂肪面积(cm2)腰围腰围(cm)iiyy-l最小二乘法最小二乘法(least square estimate, LSE)-使实际使实际数据数据中中y的实测值与模型预测值的实测值与模型预测值 之之差的差的平方和达到平方和达到最小最小-建立建立关于关于a、b的的一阶偏导数,整理得到正规方一阶偏导数,整理得到正规方程组,最终获得程组,最终获得回

14、归方程系数回归方程系数的估计值的估计值系数估计方法系数估计方法2()()()xyxxlxxyyblxx-aybx-22,()iiiiQ a byaxbyy-2020iiiiiQyabxxaQyabxb - - y yabx例题回归方程例题回归方程22006.6492.11cmcm950.778xyxxlbl296.39cmaybx- -96.392.11yx -yabxeyey xyx数学数学模型模型回归方程回归方程-截距截距a=-96.39cm2,表示腰围为,表示腰围为0cm时,腹腔内时,腹腔内脂肪面积的平均估计值为脂肪面积的平均估计值为-96.39cm2-回归系数回归系数b=2.11cm2

15、/cm,说明腰围每增加,说明腰围每增加1cm,腹腔内脂肪面积平均增加腹腔内脂肪面积平均增加2.11cm2-当腰围当腰围x=81.3cm时时l与实测值与实测值69.8cm2之间的差距为残差之间的差距为残差296.392.11 81.375.19cmy -,腹腔,腹腔内脂肪面积内脂肪面积平均估计值平均估计值2169.875.195.39cme - -96.392.11yx -1. 明确明确X、Y,并,并定量化定量化2. 确定确定回归回归模型模型:绘制散点图绘制散点图3. 估计模型中的参数估计模型中的参数,形成,形成回归方程回归方程4. 绘制回归直线绘制回归直线5. 回归分析的统计推断回归分析的统计

16、推断6. 回归模型诊断回归模型诊断7. 回归方程回归方程预测效果预测效果的评价的评价简单线性回归分析简单线性回归分析的基本步骤的基本步骤20名男性志愿受试者腰围和腹腔内脂肪面积的测量值散点图及回归线名男性志愿受试者腰围和腹腔内脂肪面积的测量值散点图及回归线506580951101251407580859095100105110腹腔内脂肪面积腹腔内脂肪面积(cm2)腰围腰围(cm)1. 明确明确X、Y,并,并定量化定量化2. 确定确定回归回归模型模型:绘制散点图绘制散点图3. 估计模型中的参数估计模型中的参数,形成,形成回归方程回归方程4. 绘制回归直线绘制回归直线5. 回归分析的统计推断回归分

17、析的统计推断6. 回归模型诊断回归模型诊断7. 回归方程回归方程预测效果预测效果的评价的评价简单线性回归分析简单线性回归分析的基本步骤的基本步骤回归分析的统计推断回归分析的统计推断yabxeyey xyx数学数学模型模型回归方程回归方程表达两变量间的数表达两变量间的数量依存关系量依存关系用用X的变化解释的变化解释Y的变异的变异回归模型的假设检验回归模型的假设检验l目的:排除抽样误差的影响,确定回归关系目的:排除抽样误差的影响,确定回归关系确实存在确实存在1.建立检验假设,确定检验水准建立检验假设,确定检验水准H0:无直线回归关系,即:无直线回归关系,即 =0H1:存在直线回归关系,即:存在直线

18、回归关系,即 0 =0.052.选定检验方法,计算检验统计量选定检验方法,计算检验统计量方差分析法:对方差分析法:对整个回归模型进行整个回归模型进行检验检验t检验检验法:对回归系数法:对回归系数(及截距及截距)进行检验进行检验506580951101251407580859095100105110腹腔内脂肪面积腹腔内脂肪面积(cm2)腰围腰围(cm)222yyyyyy-95.65y SSSSSS回总剩yyyyyy-x0P(x0, y) yyy-y 2222yyyyyyyyyy-22yyyyyy- 20yyyy-1vn-总1v回2vn-剩回总剩 yy-方差分析法方差分析法-SS总总 :未:未考虑

19、考虑x与与y的的回归关系回归关系时时y的的总总变异变异-SS回回 :y的的总变异总变异中能用中能用x的变化解释的的变化解释的y的变异的变异-SS剩剩 :y的的总变异中无法总变异中无法用用x解释解释的部分的部分SSSSSS回总剩回总剩3.确定确定P值,做出统计推断值,做出统计推断F=26.9241, 1=1, 2=18,查查F界值表,得界值表,得P0.001,故拒,故拒绝绝H0( =0),接受,接受H1 ( 0)方差分析法方差分析法方差分析结果方差分析结果SS MSFP回归分析回归分析4235.10 14235.10 24.92 0.001残差残差3058.55 18169.92 总变异总变异7

20、293.65 19回归系数的抽样分布回归系数的抽样分布l回归系数回归系数b是根据样本信息获得的,为样本是根据样本信息获得的,为样本统计量统计量-分布:分布:-标准误:标准误:2,bbN b2bbbtt nS- -未知222bxy xy xSSSSyySSSMSnn-剩剩t 检验法检验法3.确定确定P值,做出统计推断值,做出统计推断t=4.9924, =18查查t界值表,得界值表,得P0.001,故拒绝,故拒绝H0( =0),接受接受H1 ( 0)t检验结果检验结果系数估计值系数估计值标准误标准误tPIntercept-96.39 38.58 -2.50 0.0224 腰围腰围2.11 0.42

21、 4.99 0.0001 回归分析的统计推断回归分析的统计推断yabxeyey xyx数学数学模型模型回归方程回归方程表达两变量间的数表达两变量间的数量依存关系量依存关系用用X的变化解释的变化解释Y的变异的变异l点估计:点估计:b l区间估计:区间估计:回归系数回归系数 的估计的估计2bbtt nS-2,22,22,22,22,22,2111nnnnbbbnnP btttbP bttSP btSbtS- - - -系数区间估计结果系数区间估计结果系数估计值系数估计值标准误标准误Lower CI95%Upper CI95%Intercept-96.39 38.58 -177.44 -15.35

22、腰围腰围2.11 0.42 1.22 3.00 总体条件均数总体条件均数 y|x的的估计估计l通过通过20人样本信息获得的腰围和腹腔内脂肪人样本信息获得的腰围和腹腔内脂肪面积间的回归方程为面积间的回归方程为-当腰围当腰围x=90cm时时-腰围为腰围为90cm个体个体的腹腔内脂肪的腹腔内脂肪面积的总体均数面积的总体均数如何估计?如何估计?96.392.11yx -296.392.11 9093.51cmy -总体总体条件均数条件均数 y|x的的估计估计l点估计:点估计:l区间估计区间估计-在在x为定值为定值xp时,时, 亦为样本统计量亦为样本统计量-分布:分布:px xpyab x2,pppx

23、xy x xy x xyN2py x xpppx xy x xy x xytt nS- -未知1ppy xy x xxxxSSnSS-|ppx xy x xy总体条件均数总体条件均数 y|x的的估计估计l区间估计区间估计-当置信当置信度度1- 为为95%,腰围腰围x=90cm:-回归回归直线直线的的1- 置信置信带带(confidence band)l将将x取不同值时取不同值时y的条件均数的条件均数置信区间置信区间的上下限分别连的上下限分别连起来形成的两条弧形线间的起来形成的两条弧形线间的区域区域2,22,21pppppx xx xnny x xy xy x xP ytSytS- -93.51

24、2.101 5.0276= 82.95, 104.075070901101307580859095100105110腹腔内脂肪面积腹腔内脂肪面积(cm2)腰围腰围(cm)条件均数条件均数 x|y的的95%置信带置信带5070901101307580859095100105110腹腔内脂肪面积腹腔内脂肪面积(cm2)腰围腰围(cm)1. 明确明确X、Y,并,并定量化定量化2. 确定确定回归回归模型模型:绘制散点图绘制散点图3. 估计模型中的参数估计模型中的参数,形成,形成回归方程回归方程4. 绘制回归直线绘制回归直线5. 回归分析的统计推断回归分析的统计推断6. 回归模型诊断回归模型诊断7. 回

25、归方程回归方程预测效果预测效果的评价的评价简单线性回归分析简单线性回归分析的基本步骤的基本步骤残差残差(residual)l =Y-( + X),实测实测值与条件均数之间的差异值与条件均数之间的差异-为随机误差,无方向性为随机误差,无方向性-假定其假定其服从正态分布服从正态分布l总体均数为总体均数为0l方差方差 2,且不随,且不随x的变化而变化的变化而变化与与X无关无关-残差间相互独立残差间相互独立20,NCov,0ij 残差图残差图-40-30-20-1001020304060708090100110120130残差残差腹腔内脂肪面积预测值腹腔内脂肪面积预测值(cm2)20名男性志愿受试者腰

26、围与腹腔内脂肪面积残差图名男性志愿受试者腰围与腹腔内脂肪面积残差图残差图残差图l用途用途-残差是否服从正态分布残差是否服从正态分布 的诊断的诊断-离群值离群值识别识别-线性诊断线性诊断-残差方差齐性的诊断残差方差齐性的诊断-独立性独立性诊断诊断l自变量与残差的独立性诊断自变量与残差的独立性诊断l残差之间的残差之间的独立性独立性诊断诊断 ye ye ye ye ye1. 明确明确X、Y,并,并定量化定量化2. 确定确定回归回归模型模型:绘制散点图绘制散点图3. 估计模型中的参数估计模型中的参数,形成,形成回归方程回归方程4. 绘制回归直线绘制回归直线5. 回归分析的统计推断回归分析的统计推断6.

27、 回归模型诊断回归模型诊断7. 回归方程回归方程预测效果预测效果的评价的评价简单线性回归分析简单线性回归分析的基本步骤的基本步骤预测或拟合效果预测或拟合效果评价评价l决定系数:决定系数:-反映反映回归拟合效果,回归贡献的相对程度,即回归拟合效果,回归贡献的相对程度,即在应变量在应变量y的总变异中,用的总变异中,用y与与x回归关系所能解回归关系所能解释的释的比例比例l本本例例R2=0.5812SSRSS回总方差分析结果方差分析结果SS MSFP回归分析回归分析4235.10 14235.10 24.92 ,尚不能认为,尚不能认为X对对Y有有影响影响作用作用个体个体y值的预测区间值的预测区间l通过

28、通过20人样本信息获得的腰围和腹腔内脂肪人样本信息获得的腰围和腹腔内脂肪面积间的回归方程为面积间的回归方程为-当腰围当腰围x=90cm时时-腰围为腰围为90cm大多数个体的腹腔内脂肪面积的波大多数个体的腹腔内脂肪面积的波动范围?动范围?96.392.11yx -296.392.11 9093.51cmy -个体个体y值的预测区间值的预测区间l当当x为某一定值为某一定值xp时时,个体,个体y值值的的波动范围波动范围-1- 为为95%,腰围腰围x=90cm腹腔内脂肪面积的腹腔内脂肪面积的95%参考值范围为:参考值范围为:2,22,21pppppx xx xx xnny x xy x xP ytSy

29、ytS- -11ppy xy x xxxxxSSnl-93.512.101 13.9713= 64.16, 122.86条件条件均数均数 x|y的的95%置信区间和个体置信区间和个体y值值95%预测区间预测区间 204060801001201401607580859095100105110腹腔内脂肪面积腹腔内脂肪面积(cm2)腰围腰围(cm)204060801001201401607580859095100105110腹腔内脂肪面积腹腔内脂肪面积(cm2)腰围腰围(cm)直线回归分析其它注意事项直线回归分析其它注意事项 l分析分析要要有实际有实际意义意义l回归关系不一定回归关系不一定是因果是因

30、果关系关系l为提高分析的准确性,为提高分析的准确性,观察对象数观察对象数n 5l自变量自变量X为定量变量时,为定量变量时,取值范围尽可能取值范围尽可能大大l对自变量对自变量X的分布的分布无特殊无特殊要求要求-只需严密只需严密控制或精确测量的控制或精确测量的数据,可以用数值数据,可以用数值加以表达即可加以表达即可自变量自变量的量化的量化l自变量自变量X既可以是定量变量,也可以是定性既可以是定量变量,也可以是定性变量变量-定量变量定量变量l如如自变量自变量和因变量存在线性关系和因变量存在线性关系,则直接以原,则直接以原变量取变量取值引入模型值引入模型l如自变量与应变量是非线性关系,则需作如自变量与

31、应变量是非线性关系,则需作适当变换适当变换,如如x2、logx等等,直到变换后与应变量成,直到变换后与应变量成线性关系线性关系l转化为有序多分类转化为有序多分类/二分类数据二分类数据-定性变量:需定量化后方可引入定性变量:需定量化后方可引入模型模型可直线化的曲线回归可直线化的曲线回归类型类型函数形式函数形式变量变换变量变换直线化结果直线化结果(+ )对数曲线指数曲线幂函数双曲线S型曲线lglg+yabxyabx K10bxbxyaeyabyax1bayx1a bxKyLelglg+xxxx K lnlgyyyy ln ,lnxx yy1,1xx yylnKyLyyL- -yabxlnlgyab

32、xyabx lnlgyabxyabx yabxyabx 定性变量的量化定性变量的量化l二分类定性变量:常用二分类定性变量:常用0,1指示。如性别:指示。如性别:l无序多分类定性变量无序多分类定性变量-以哑以哑变量变量(dummy variables)形式形式纳入纳入l有序多分类定性变量有序多分类定性变量(等级变量等级变量)-以以0、1、2、c-1来来表示表示c个类别直接纳入个类别直接纳入-以哑变量形式引入以哑变量形式引入模型模型10X男性女性(非男性)哑哑变量变量(dummy variable)l亦亦称指示变量称指示变量(indicator variable)-适用于适用于l无序定性自变量无序

33、定性自变量l有序定性自变量,但与有序定性自变量,但与因变量因变量不不呈呈线性关系线性关系-有有c个类别个类别的定性变量用的定性变量用c-1个哑变量进行表达个哑变量进行表达l确定哑变量所表明的类别确定哑变量所表明的类别l1代表个体代表个体属于该哑变量属于该哑变量所表明的所表明的类别,类别,0代表个体不代表个体不属于属于所表明的所表明的类别类别l为减少冗余,用为减少冗余,用c-1个哑个哑变量表达变量表达c个类别个类别年龄年龄赋值赋值(X)哑变量哑变量D0(0)D1(10)D2(18)D3(65)001000101010018200106530001哑变量生成示例哑变量生成示例哑变量的生成哑变量的生

34、成李晓松主编李晓松主编. . 医学统计学医学统计学( (第第3 3版版). ). 北京北京: : 高等教育出版社高等教育出版社, , 2014.2014.表表9.1 喂养不同喂养不同饲料的大鼠红细胞数饲料的大鼠红细胞数(1012/L)普通饲料普通饲料10%大豆饲料大豆饲料yij4.784.654.656.923.984.444.046.163.445.993.776.673.655.294.914.704.795.055.316.014.055.675.164.684.385.52nstP(2-tailed) 普通饲料普通饲料124.38 0.63 -3.77 0.001 10%大豆饲料大豆饲

35、料125.52 0.84 喂养不同喂养不同饲料的大鼠红细胞数饲料的大鼠红细胞数(1012/L)t检验结果检验结果t检验检验回归分析结果回归分析结果l以红细胞数为以红细胞数为y,组别,组别(g)为自变量为自变量0110%g普通饲料大豆饲料系数系数标准误标准误tP截距截距4.38 0.214 20.4650.001 组别组别1.14 0.303 3.7740.001 喂养喂养2种种不同饲料的大鼠红细胞数不同饲料的大鼠红细胞数(1012/L)回归分析结果回归分析结果4.38 1.14yg014.384.38 1.14 15.52ggyy 表表9.1 喂养不同喂养不同饲料的大鼠红细胞数饲料的大鼠红细胞

36、数(1012/L)普通饲料普通饲料10%大豆饲料大豆饲料15%大豆饲料大豆饲料yij4.784.656.804.656.925.913.984.447.284.046.167.513.445.997.513.776.677.743.655.298.194.914.707.154.795.058.185.316.015.534.055.677.795.164.688.034.385.527.30方差分析方差分析例例9.1资料的资料的方差分析方差分析结果结果变异来源变异来源SS MSFP组间变异组间变异52.13 226.0642.920.001组内变异组内变异20.0433 0.60总变异总变异

37、72.16352.06l以红细胞数为以红细胞数为y,组,组别定量化纳入别定量化纳入回归分析回归分析组别组别定量化定量化普通饲料普通饲料010%大豆饲料大豆饲料115%大豆饲料大豆饲料20123456789-10123RBC(1012/L)组别组别例例9.1喂养喂养不同饲料的大鼠红细胞数不同饲料的大鼠红细胞数(1012/L)散点图散点图回归分析回归分析l以红细胞数为以红细胞数为y,组别以哑变量纳入,组别以哑变量纳入010%10110%g非大豆饲料大豆饲料015%15115%g非大豆饲料大豆饲料组别组别groupg10g15普通饲料普通饲料00010%大豆饲料大豆饲料11015%大豆饲料大豆饲料2

38、01表表9.1 喂养三种不同饲料的大鼠红细胞数喂养三种不同饲料的大鼠红细胞数(1012/L)回归分析结果回归分析结果例例9.1资料资料的回归模型方差分析的回归模型方差分析结果结果变异来源变异来源SS MSFP回归回归52.13 226.0642.920.001剩余剩余20.0433 0.60总变异总变异72.16352.06回归分析结果回归分析结果系数系数标准误标准误tP截距截距4.38 0.22 19.46 0.001 g101.14 0.32 3.59 0.001 g152.92 0.32 9.19 0.001不同不同饲料的大鼠红细胞数饲料的大鼠红细胞数(1012/L)回归分析结果回归分析

39、结果4.38 1.14102.9215ygg10 0, 15 010 1, 15 010 0, 15 14.384.38 1.145.524.382.927.30ggggggyyy李晓松主编李晓松主编. . 医学统计学医学统计学( (第第3 3版版). ). 北京北京: : 高等教育出版社高等教育出版社, , 2014.2014.例例11.9(P146) l抽样调查抽样调查了了891名名中学生中学生的吸烟的吸烟状况状况-该该市中学生吸烟率是否有随年级增加而增高的市中学生吸烟率是否有随年级增加而增高的趋势趋势年级年级调查调查人数人数吸烟吸烟人数人数吸烟率吸烟率(%)初一初一1441711.81初

40、二初二1481912.84初三初三1352518.52高一高一1574126.11高二高二1685532.74高三高三1397251.80合计合计89122925.70表表11.13 某市不同年级中学生吸烟某市不同年级中学生吸烟率率(%)趋势线图趋势线图01020304050607080初一初一初二初二初三初三高一高一高二高二高三高三吸烟率吸烟率(%)某某市不同年级中学生吸烟市不同年级中学生吸烟率率(%)率的线性趋势率的线性趋势分析分析l分析目的:某事物的发生率是否随着某因素分析目的:某事物的发生率是否随着某因素分层等级呈线性变化趋势分层等级呈线性变化趋势l研究方法:调查研究研究方法:调查研究

41、l变量类型变量类型-自变量:年级,有序多分类定性变量自变量:年级,有序多分类定性变量/等级变量等级变量-应变量:是否吸烟,二分类定性变量应变量:是否吸烟,二分类定性变量l已知:样本数据,已知:样本数据,R 2列联表列联表R 2列联表列联表形式形式x未未发生数发生数发生数发生数合计合计发生发生率率(%)1n10n11n1.p112n20n21n2.p21ini0ni1ni.pi1RnR0nR1nR.pR1合计合计n.0n.1n.p.1R 2列联表形式列联表形式分析过程分析过程l分析事物发生率分析事物发生率(Y)与某等级变量与某等级变量(X)间的线间的线性数量依存关系性数量依存关系-定性变量的定量化:定性变量转换为数值定性变量的定量化:定性变量转换为数值lx年级年级:1, 2, 3, , Rls吸烟吸烟:吸烟:吸烟=1,不吸烟,不吸烟=0-线性模型:线性模型:-模型系数的估计模型系数的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论