![[理学]第9章 直线相关与回归.ppt_第1页](http://file.renrendoc.com/FileRoot1/2018-12/25/8e522f40-6896-45b9-9d82-2f5380aebafd/8e522f40-6896-45b9-9d82-2f5380aebafd1.gif)
![[理学]第9章 直线相关与回归.ppt_第2页](http://file.renrendoc.com/FileRoot1/2018-12/25/8e522f40-6896-45b9-9d82-2f5380aebafd/8e522f40-6896-45b9-9d82-2f5380aebafd2.gif)
![[理学]第9章 直线相关与回归.ppt_第3页](http://file.renrendoc.com/FileRoot1/2018-12/25/8e522f40-6896-45b9-9d82-2f5380aebafd/8e522f40-6896-45b9-9d82-2f5380aebafd3.gif)
![[理学]第9章 直线相关与回归.ppt_第4页](http://file.renrendoc.com/FileRoot1/2018-12/25/8e522f40-6896-45b9-9d82-2f5380aebafd/8e522f40-6896-45b9-9d82-2f5380aebafd4.gif)
![[理学]第9章 直线相关与回归.ppt_第5页](http://file.renrendoc.com/FileRoot1/2018-12/25/8e522f40-6896-45b9-9d82-2f5380aebafd/8e522f40-6896-45b9-9d82-2f5380aebafd5.gif)
已阅读5页,还剩59页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,第九章 双变量回归与相关,环境与公共卫生学院 叶晓蕾,2,资料特点:每个观察对象有两个变量。,概念,3,类似上例的问题: 年龄-身高; 肺活量-体重; 药物剂量-动物死亡率,双变量资料,统计资料,单变量资料:X 双变量资料:X,Y 多变量资料:X1,X2,XK,Y,4,相关与回归是研究两个或多个变量之间相互关系的一种分析方法。,数据结构,5,两变量(X,Y),无关系,有关系,函数关系,相关(回归)关系,圆周长: y = 2r,直线关系,曲线关系,直线相关与回归,曲线拟合,6,回归:是研究变量之间在数量上依存关系的一种方法。 相关:是研究随机变量之间相互联系密切程度和方向的方法。 直线相关与回归:只涉及两个变量,而且分析是否呈直线关系,是回归和相关分析中最简单的一种。又称简单相关和回归。,概念:,7,直线相关与回归的一般步骤:,绘制散点图,直线相关分析,直线回归分析,求相关系数,相关系数假设检验,结论,求回归系数和截距,列出回归方程,回归系数假设检验,8,一、直线回归(linear regression),1. 直线回归方程,:应变量Y的平均估计值 a:截距(intercept) b:回归系数(regression coefficient),注意直线回归方程与函数方程的不同,9,应用条件 线性(linear)、独立性(independent)、正态性(normal)、等方差(equal variance)“LINE”。 线性自变量与应变量的关系是线性的。用散点图判断。 独立性任意两个观察值互相独立。 正态性在任意的自变量X的取值处,应变量y均服从正态分布。 等方差在任意的自变量X的取值处,应变量y的方差均相同。,10,11,例1,12,20名糖尿病人的血糖水平与胰岛素水平的散点图,SPSS,13,回归直线的求法 原理(最小二乘法),各散点距离回归直线的纵向距离(残差)平方和为最小而得到直线。,14,计算:,回归直线必通过点,15,16,17,18,19,3. 直线回归的假设检验 即推断总体回归系数 ()是否为零,即:SS总=SS回归+SS残余,剩余或残差(residual),(1)方差分析,20,查附表3,F0.01(1,18)=8.28 P 0.01 (2)检验 = (b 0)/ b =n-2,21,(-0.4585 - 0)/0.0699 = - 6.56 = 18,t0.01(18) = 2.878 P 0.01 F = t2=(-6.56)2 = 43.03,22,23,4. 直线回归中的区间估计,(1)总体回归系数的区间估计:,例:上例中,b=-0.4585,Sb=0.0699,t0.05,18=2.101 的95%可信区间:,24,25,26,(2) 的估计:,即总体中当X为某定值X0的条件下Y的均数。,27,即:11.9182.1010.3396= ( 11.08, 12.76 ),例:用 例1所求直线回归方程,试计算当X0= 15 mU/L时, 的95%可信区间。,28,的(1)可信区间图,29,(3)个体Y值的预测区间(容许区间):,即总体中当X为某定值X0时,个体Y值的波动范围。,注意:SY并非是样本观察值Y的标准差,30,个体Y值的(1)容许区间图,31,例: 例1中,当X=15,求个体Y值的预测区间(=0.05)。,32,5. 直线回归方程的应用 (1)预测: 即把预报因子(自变量X)代入回归方程对预报量(应变量Y)进行估计。 1)点预测: 2)区间预测:,33,区间预测: 当X是已知时,按一定概率估计应变量所在范围。 可按求个体Y值预测区间方法计算。,34,例:例1资料中,当胰岛素浓度X=15mU/L时,试估计血糖浓度(=0.05)。,35,(2)控制: 指当要求应变量Y在一定范围内波动时,如何控制自变量X的取值。 例 :已知血糖正常范围为(4.446.66 mmol/L),在前例资料的基础上,问欲将血糖水平控制在正常范围内时,血中胰岛素应维持在什么范围内(=0.05) ?,36,解得:X( 33.95, 38.79)mU/L,37,38,39,40,1. 相关系数(, r) 表示两变量直线相关的密切程度和方向。 相关系数波动范围: -1 r 1 (1)密切程度: |r| 1,相关越密切; |r| 0,相关越弱。 r=1或 -1,称完全相关; r=0, 称零相关,表示不存在直线相关关系,但不排除存在某种曲线关系的可能性。 (2)方向: r 0, 正相关; r 0, 负相关。,二、直线相关(linear correlation),41,42,2. 相关分析的步骤 (1)绘制散点图观察两变量间是否呈直线趋势,20名糖尿病人的血糖水平与胰岛素水平的散点,43,(2)计算相关系数,计算例1资料的相关系数,Pearson 相关系数 积差法相关系数,44,3. 相关系数的假设检验,例1 资料: H0: = 0 ; H1: 0;=0.05,查表得:P 0.01 (结果同回归系数检验),c,t 检验,查表法:P.719 r界值表。,45,三、应用直线回归时注意事项 1)应有实际意义; 2)分析前应绘制散点图; 3)用残差图考察数据是否符合模型假设条件 4)应在实际回归范围内绘制回归直线; 5)结果的解释及正确应用,46,47,残差分析模型诊断,通常以标准化残差(standardized residual)为纵坐标,以 为横坐标,作残差图。,48,49,A,B,C,D,E,F,残差呈随机分布,残差不满足方差齐性条件,存在非线性关系,有异常点,50,四、等级相关 (秩相关 rank correlation ),1. 适用于下列资料: (1)不服从双变量正态分布的资料(如二项分布); (2)总体分布型未知; (3)原始数据是用等级表示。 2. 等级相关系数(rs)意义 不用原始数据计算,而是根据数值大小的秩次进行计算。其意义同直线相关系数。,51,3. 等级相关系数的计算 (1)按直线相关系数公式计算,只是用秩次代替原始观察值。,(2)Spearman公式法:,52,例 为研究饮水中氟含量与氟中毒患病率之间的关系,测定了9个居民点井水中的氟含量X(mg/L),并同时通过体检得到这些居民点中常住居民的氟中毒患病率Y(%),资料如下表:,53,54,4. 等级相关系数的假设检验,H0: s = 0 ; H1: s 0;=0.05,(1)查表法:n 50时,查rs界值表(P.721)进行假设检验。 查表得:rs 0.001(9) = 0.933, P0.001,55,(2) 计算法:,以=9-2=7查t界值表,得P0.001,SPSS,56,双变量资料的相关分析方法选择,直线相关(Pearson相关)双变量正态 等级相关(Spearman相关)非双变量正态或等级资料。 X2检验分类资料或等级资料,57,讨 论 题,1. 某地防疫站用碘剂局部注射治疗219例地方性甲状腺肿,结果如下表,问患者年龄与疗效有无关联?,地方性甲状腺肿患者各年龄组疗效观察结果,58,两变量之间不呈直线而是呈曲线关系时,要用适当的曲线方程来描述两变量间的关系。 1. 曲线的类型 如指数曲线、幂曲线、多项式曲线、生长曲线等。,五、曲线配合(曲线拟合),59,60,61,2. 曲线配
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年方剂学考试试题及答案
- 设备安装后的运行调试与维护方案
- 招聘笔试客观题库及答案
- 集体土地租赁合同范本
- 碳陶复合半导体材料生产线建设项目节能评估报告
- 草剂柔性生产项目施工方案
- 离职员工离职后原公司项目交接及责任划分协议
- 南京市仓库租赁合同样本(含仓储管理条款)
- 夫妻离异后共同人寿保险合同修订协议
- 离婚财产分割及子女抚养责任、监护权转让合同
- 2025年南京市事业单位招聘考试卫生类预防医学专业知识试题
- GB/T 3836.1-2021爆炸性环境第1部分:设备通用要求
- 2021年全国质量奖现场汇报材料课件
- 《组织学与胚胎学》课件02细胞
- 教师资格证-综合素质-学生观
- 名词性从句公开课
- 最新北师大版100以内加减法口算和竖式计算
- 《窗边的小豆豆》阅读分享
- WOWTCG 艾泽拉斯群英传 官方规则手册
- 零件提交保证书(样本)PPAP
- 铝单板幕墙工程设计计算书
评论
0/150
提交评论