![[医学]卫生统计学 第六版第12章简单回归分析ppt课件_第1页](http://file2.renrendoc.com/fileroot_temp3/2021-9/7/b4c0133f-b66e-4732-abde-07a6390b8343/b4c0133f-b66e-4732-abde-07a6390b83431.gif)
![[医学]卫生统计学 第六版第12章简单回归分析ppt课件_第2页](http://file2.renrendoc.com/fileroot_temp3/2021-9/7/b4c0133f-b66e-4732-abde-07a6390b8343/b4c0133f-b66e-4732-abde-07a6390b83432.gif)
![[医学]卫生统计学 第六版第12章简单回归分析ppt课件_第3页](http://file2.renrendoc.com/fileroot_temp3/2021-9/7/b4c0133f-b66e-4732-abde-07a6390b8343/b4c0133f-b66e-4732-abde-07a6390b83433.gif)
![[医学]卫生统计学 第六版第12章简单回归分析ppt课件_第4页](http://file2.renrendoc.com/fileroot_temp3/2021-9/7/b4c0133f-b66e-4732-abde-07a6390b8343/b4c0133f-b66e-4732-abde-07a6390b83434.gif)
![[医学]卫生统计学 第六版第12章简单回归分析ppt课件_第5页](http://file2.renrendoc.com/fileroot_temp3/2021-9/7/b4c0133f-b66e-4732-abde-07a6390b8343/b4c0133f-b66e-4732-abde-07a6390b83435.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、问题提出问题提出 第十一章我们学习了两变量的关联性分析,要求对每第十一章我们学习了两变量的关联性分析,要求对每一个研讨对象同时观测两个目的,数据是成对出现的,两一个研讨对象同时观测两个目的,数据是成对出现的,两个目的之间是平等的,不存在因变量和自变量的关系,关个目的之间是平等的,不存在因变量和自变量的关系,关联性分析讨论的是两变量之间的互依关系。联性分析讨论的是两变量之间的互依关系。 假设要讨论变量之间的依存关系,一个变量随另一个假设要讨论变量之间的依存关系,一个变量随另一个变量的数量变化而变化,这时就存在因变量和自变量的关变量的数量变化而变化,这时就存在因变量和自变量的关系,该当用什么方法进
2、展分析?系,该当用什么方法进展分析?两变量的简单回归分析直线回归分析两变量的简单回归分析直线回归分析Chapter 12 Simple Linear Regression Analysis 1 1掌握直线回归的根本概念。掌握直线回归的根本概念。 2 2熟习直线回归方程的建立。熟习直线回归方程的建立。 3 3掌握回归系数的假设检验。掌握回归系数的假设检验。 4 4了解直线回归方程的运用。了解直线回归方程的运用。 5 5掌握直线相关和直线回归的联络与区别。掌握直线相关和直线回归的联络与区别。主要内容主要内容回归回归(regression)的由来的由来=33.73+0.516XGoltonPears
3、on统计的根本问题在于“由过去的数据来推断未来会发生什么事。 例例11-1 在某地一项膳食调查中,随机抽取在某地一项膳食调查中,随机抽取14名名40-60岁的安康妇女,测得每人的根底代谢岁的安康妇女,测得每人的根底代谢(kj/d)与体重的与体重的数据,见表数据,见表11-1。据此数据如何判别这两项目的间有无。据此数据如何判别这两项目的间有无相关?相关?=1106.7864+61.4229X1414名中年安康妇女根底代谢与体重丈量值的关系名中年安康妇女根底代谢与体重丈量值的关系300030003500350040004000450045005000500055005500600060003535
4、40404545505055556060656570707575体重体重kgkg根底代谢根底代谢(Kj/d 一、线性回归的根本概念一、线性回归的根本概念X:自变量:自变量(independent variable)Y:因变量:因变量(dependent variable):实测:实测Y值的估计值值的估计值(the estimation of Y)a:截距:截距(intercept)b:回归系数:回归系数(regression coefficient)1.1.直线回归方程中的符号及其含义:直线回归方程中的符号及其含义:2.2.直线回归的根本概念:直线回归的根本概念:(1)(1)直线回归:当一个变
5、量随另一个变量有规律地线性依存直线回归:当一个变量随另一个变量有规律地线性依存变动时,称这种数量上的线性依存变动关系为直线回归。变动时,称这种数量上的线性依存变动关系为直线回归。(2)(2)直线回归分析:根据实测值建立回归方程,绘制回归图直线回归分析:根据实测值建立回归方程,绘制回归图形,描画两变量之间数量上的线性变化关系的方法过程。形,描画两变量之间数量上的线性变化关系的方法过程。二、线性回归模型的适用条件二、线性回归模型的适用条件1. 线性线性(linear):X与与Y的存在线性关系。的存在线性关系。(散点图散点图)2. 独立独立(independent):恣意两个察看值相互独立。:恣意两
6、个察看值相互独立。(专业知识专业知识)3. 正态正态(normal):在一定范围内,恣意给定:在一定范围内,恣意给定X值,对应值,对应Y都服都服从正态分布。从正态分布。(专业知识、正态性检验专业知识、正态性检验)。4. 等方差等方差(equal variance):X的取值范围内,不论的取值范围内,不论X取什么取什么值,值,Y都具有一样的方差。都具有一样的方差。(散点图、残差散点图散点图、残差散点图)三、回归参数的估计三、回归参数的估计简单线性回归模型:简单线性回归模型: iiiXY 1. 回归模型:回归模型:Yi 是实测是实测Y值。值。 是模型的截距。是模型的截距。 是的模型总体回归系数是的
7、模型总体回归系数(斜率斜率)。Xi是是X的实测值。的实测值。 是残差是残差(residual),ei=Yi-i。样本线性回归方程:样本线性回归方程:bXaY 通常情况下研讨者只能获取一定数量的样本数据,通常情况下研讨者只能获取一定数量的样本数据,用该样本数据建立的有关用该样本数据建立的有关X与与Y变化的线性表达式为变化的线性表达式为回归方程。回归方程。iiiXY 总体线性回归模型:总体线性回归模型:估计估计iiiYYe =a+bX14名中年安康妇女根底代谢与体重丈量值的关系名中年安康妇女根底代谢与体重丈量值的关系30003000350035004000400045004500500050005
8、500550060006000353540404545505055556060656570707575体重体重kgkg根底代谢根底代谢 (Kj/d 2ii)Y(Ymin1414名中年安康妇女的根底代谢与体重丈量值的关系名中年安康妇女的根底代谢与体重丈量值的关系30003000350035004000400045004500500050005500550060006000353540404545505055556060656570707575体重体重kgkg根底代谢根底代谢 Kj/d2. 回归参数估计的最小二乘回归参数估计的最小二乘(LSE)原那么:原那么:iiiXY bXaY 参数参数和和统计
9、量统计量a和和biiibXaYX YYi 估计均值估计均值 2ii)Y(Y适宜统计量适宜统计量a和和b3. 回归参数的估计步骤:回归参数的估计步骤: 例例11-1 在某地一项膳食调查中,随机抽取在某地一项膳食调查中,随机抽取14名名40-60岁的安康妇女,测得每人的根底代谢岁的安康妇女,测得每人的根底代谢(kj/d)与体重的与体重的数据,见表数据,见表11-1。据此数据如何判别这两项目的间有无。据此数据如何判别这两项目的间有无相关?相关?(1) 由样本数据绘制散点图:由样本数据绘制散点图: 1414名中年安康妇女根底代谢与体重丈量值的散点图名中年安康妇女根底代谢与体重丈量值的散点图300030
10、00350035004000400045004500500050005500550060006000353540404545505055556060656570707575体重体重kgkg根底代谢根底代谢 (Kj/d(2) 回归分析的根本计算公式:回归分析的根本计算公式: NX)(XN)Y)(X(-XY)X(X)YY)(XX(llb222XXXY XbYa bXaY (3) 由样本数据计算根本统计量:由样本数据计算根本统计量: 64.516414/9 .32326Y 51.5514/2 .777X47.290245421Y 51.5806323XY 9 .32326Y28.44290X 2 .
11、777X 41n22 (4) 带入公式计算回归系数带入公式计算回归系数b: NX)(XN)Y)(X(-XY)X(X)YY)(XX(llb222XXYX 4229.6114)2 .777(28.44290149 .323262 .77751.3580632b2 回归系数回归系数b b的意义:当自变量的意义:当自变量X X每变动一个单位时,因变量每变动一个单位时,因变量Y Y相应平均变动的单位数。相应平均变动的单位数。(5) 带入公式计算回归方程的截距带入公式计算回归方程的截距a: XbYa 7864.110614777.261.42291463232.9a (6) 最小二乘原那么下的回归方程:最
12、小二乘原那么下的回归方程: X2294 .617864.1106Y (7) 绘制回归图形:绘制回归图形: 此直线必然经过点此直线必然经过点( , )( , )且与纵坐标轴相交于截距且与纵坐标轴相交于截距a a。假设散点图没有从坐标系原点开场,可在自变量实测范围内假设散点图没有从坐标系原点开场,可在自变量实测范围内远端取易于读取的值代入回归方程得到一个点的坐标,衔接远端取易于读取的值代入回归方程得到一个点的坐标,衔接此点与点此点与点( , )( , )也可绘出回归直线。也可绘出回归直线。 XX YY1414名中年安康妇女根底代谢与体重丈量值的散点图名中年安康妇女根底代谢与体重丈量值的散点图300
13、03000350035004000400045004500500050005500550060006000353540404545505055556060656570707575体重体重kgkg根底代谢根底代谢 Kj/d(XY )=1106.7864+61.4229X四、总体回归系数四、总体回归系数的统计推断的统计推断 建立样本直线回归方程,只是完成了统计分析中两建立样本直线回归方程,只是完成了统计分析中两变量关系的统计描画,研讨者还须回答它所来自的总体变量关系的统计描画,研讨者还须回答它所来自的总体的直线回归关系能否确实存在,即能否对总体有的直线回归关系能否确实存在,即能否对总体有0? At
14、tention: 由样本信息得出的结论一定要经过假设检验!由样本信息得出的结论一定要经过假设检验!1. 总体回归系数总体回归系数的假设检验:的假设检验: (t检验法检验法)bbSbt 122-412n 回归系数回归系数b的规的规范误范误(1) 回归系数回归系数b的规范误:的规范误: niixybXXss12.)(21.()2niiiy xYYsn的规范误的规范误(standard error of estimate)1311.1652142962.3272192-n. 残残SSSXY8810. 45771.11441311.165. XXXYblSS2) 计算检验统计量计算检验统计量t值:值:
15、 1) 建立假设,确定检验水准建立假设,确定检验水准: H0: =0, H1: 0 =0.05584.128810. 44229.61Sbtbb 122-142n 05. 0p179. 2t584.12t1205. 0 ,3) 确定确定P值,下结论:值,下结论: P0.05,回绝,回绝H0,以为有统计学意义,总体回归系数,以为有统计学意义,总体回归系数 0 。可以。可以以为安康妇女的根底代谢与体重有直线关系。以为安康妇女的根底代谢与体重有直线关系。(2) 假设检验的根本步骤:假设检验的根本步骤: 2. 总体回归系数总体回归系数的假设检验:的假设检验: (F检验法检验法) 方差分析的根本思想:方
16、差分析的根本思想: 根据变异的来源将总变异分解,同时相应的将自在度进根据变异的来源将总变异分解,同时相应的将自在度进行分解,计算各部分的均方行分解,计算各部分的均方(方差方差),计算,计算F值,判别有无统值,判别有无统计学意义。计学意义。2n1 MSMS/SS/SSF 残残回回残残回回残残残残回回回回, (X,Y)(2) 总变异的分解:总变异的分解:总变异总变异残差残差回归的变异回归的变异 222)YY()YY()YY(SSSSSS总回残总回残1n总1回2n残 假设两变量间总体回归关系确实存在,回归的奉献就要假设两变量间总体回归关系确实存在,回归的奉献就要大于随机误差残差,大到何种程度时可以以
17、为具有统计大于随机误差残差,大到何种程度时可以以为具有统计意义?意义?2n1 MSMS/SS/SSF 残残回回残残回回残残残残回回回回, XX2XX2XYXYlbl/lblSS 回回n/)Y(Y)YY(SS222 总总(3) 可计算统计量可计算统计量F:查查 F界值表,得界值表,得 ,P0.05。按。按 =0.05水准回绝水准回绝 ,回绝,回绝H0 ,可以以为安康妇女的根底代谢与体重有直线关,可以以为安康妇女的根底代谢与体重有直线关系。系。75. 4F36.581F)12, 1(05. 0 ,(4) 确定确定P值,下结论:值,下结论:4. 总体回归系数总体回归系数的置信区间估计:的置信区间估计
18、:总体回归系数总体回归系数 的的(1(1)双侧可信区间为:双侧可信区间为:)059.72787.50(881. 4791 . 24229.61Stbb2n,, b2n,Stb 总体回归系数总体回归系数 的的95%双侧可信区间为:双侧可信区间为:五、决议系数五、决议系数(Coefficient of Determination) 决议系数决议系数R2:回归平方和与总平方和之比,表示回归引:回归平方和与总平方和之比,表示回归引起的变异在总变异中所占比重的大小,反映了回归的相对奉起的变异在总变异中所占比重的大小,反映了回归的相对奉献。取值在献。取值在0到到1之间且无单位,取值越大,在之间且无单位,取
19、值越大,在Y的总变异中的总变异中回归关系所能解释的百分比越大,回归的效果越好。其计算回归关系所能解释的百分比越大,回归的效果越好。其计算公式为:公式为:222XYXXXYYYXX YYSSlllRSSlll回总YY2YY2YYlrl )r1(lSS 总总YY2l)YY(SS 总总 YY22l )r1()YY(SS残残 YY22lr)YY(SS回回决议系数决议系数R2与变异度之间的关系:与变异度之间的关系:XX2XX2XYXYlbl/lblSS 回回六、线性回归的运用六、线性回归的运用统计预测统计预测统计控制统计控制1. Y的总体均数的置信区间:的总体均数的置信区间: 给定给定X=Xp,由样本回
20、归方程算出的,由样本回归方程算出的p,只是,只是Y的总体的总体均数的一个点估计均数的一个点估计p=a+b Xp。p会因样本而异,存在抽会因样本而异,存在抽样误差,其规范误为:样误差,其规范误为:2-nY)(YS )XX()XX(n1SS2X.Y22pX.YYp Y总体均数总体均数95%置信区间为:置信区间为: pY2npStY , 例例12-1 X1=1.1时,时,Y的总体均数的总体均数95%的置信区间为:的置信区间为:4994. 0SX.Y 4040. 0)XX(2 9800. 0X 1599. 04040. 0)9800. 01 . 1(1510.4994 )XX()XX(n1SS2221
21、X.YY1 )4412.147502.13(1599.016.20957.14StY1Y2n1, 依此类推可以计算一切依此类推可以计算一切X取值时取值时Y的总体均数的置信区间。的总体均数的置信区间。NO.实测实测值值 X实测实测值值 Y预测值预测值均值均值均值的均值的标准误标准误Y均值的均值的95%CIY值的值的95%预测区间预测区间残差残差下限下限上限上限下限下限上限上限11.11414.09570.159913.750214.441212.961815.2297-0.095721.21313.39770.215912.931313.864112.221214.5741-0.397731.0
22、1514.79370.130014.512815.074713.677715.9097 0.206340.91515.49170.143615.181515.802014.368016.6155-0.491751.21313.39770.215912.931313.864112.221214.5741-0.397761.11414.09570.159913.750214.441212.961815.2297-0.095770.91615.49170.143615.181515.802014.368016.6155 0.508380.61717.58580.325616.882518.28921
23、6.296918.8747-0.585891.01414.79370.130014.512815.074713.677715.9097-0.7937100.91615.49170.143615.181515.802014.368016.6155 0.5083111.11514.09570.159913.750214.441212.961815.2297 0.9043120.91615.49170.143615.181515.802014.368016.6155 0.5083131.11414.09570.159913.750214.441212.961815.2297-0.0957141.01
24、514.79370.130014.512815.074713.677715.9097 0.2063150.71716.88780.255316.336317.439315.675118.1005 0.1122表表12-2 血凝数据的预测值、残差、置信区间与预测区间血凝数据的预测值、残差、置信区间与预测区间图图12-4 总体回归线的总体回归线的95%置信带表示图置信带表示图(XY )2. 个体个体Y预测值的区间估计:预测值的区间估计: 所谓预测就是把预告因子自变量所谓预测就是把预告因子自变量X代入回归方程对总代入回归方程对总体中预告量应变量体中预告量应变量Y的个体值进展估计。给定的个体值进展估计
25、。给定X=Xp ,对,对应的个体应的个体Y值也存在一个动摇范围。其规范差的计算公式为:值也存在一个动摇范围。其规范差的计算公式为: 22pY.XX|Y)XX()X(Xn11SSp个体个体Y预测值的区间预测值的区间(Prediction Interval,PI): PX|Y2nPStY , 例例12-1中中X1=1.1时,时,Y的预测值的规范差为:的预测值的规范差为:5249. 04040. 0)98. 0(1.115114994. 0S21X|Y 例例12-1中中X1=1.1时,时,Y的预测值的预测区间为:的预测值的预测区间为:14.09572.16 0.5249=12.961815.2297 当同时思索当同时思索X的一切能够取值时,个体的一切能够取值时,个体Y值的值的95%预测
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 零跑电动汽车购车协议
- 河北省尚义县2025年上半年事业单位公开遴选试题含答案分析
- 河北省临西县2025年上半年公开招聘村务工作者试题含答案分析
- 2025地下室小平方房屋使用权转让合同
- 2025年城市综合体项目房地产合作开发合同范本
- 2025版水电安装工程分包与工程验收标准合同
- 2025年生物制药企业间技术合作合同示范
- 2025包材国际采购合同范本
- 2025版人力资源和社会保障厅社会保障业务培训与研讨合同
- 2025版事业单位教学楼物业出租合作协议
- 2025至2030年中国视频监控系统行业市场运行态势及投资战略研究报告
- GB/T 45953-2025供应链安全管理体系规范
- 速冻机在果蔬加工中的应用考核试卷
- 2025年初级律师助理面试必-备题库及解析
- 增值税留抵退税培训课件
- 2025年秋季开学第一课《翻越你的浪浪山》课件
- 人教版(2024)八年级上册英语Unit 1 Happy Holiday教案
- 2025年疾控实验室生物安全及保密相关知识理论培训考试试题(含答案)
- 大模型概念、技术与应用实践 课件 第6章 智能体
- 2025年岗前安全培训试题及答案
- 民用航空飞机电子系统技术
评论
0/150
提交评论