![医学]医学统计学第十一章 第一节 直线回归.ppt_第1页](http://file.renrendoc.com/FileRoot1/2018-12/30/08b8ee1d-6151-447c-9cec-3c7824e53002/08b8ee1d-6151-447c-9cec-3c7824e530021.gif)
![医学]医学统计学第十一章 第一节 直线回归.ppt_第2页](http://file.renrendoc.com/FileRoot1/2018-12/30/08b8ee1d-6151-447c-9cec-3c7824e53002/08b8ee1d-6151-447c-9cec-3c7824e530022.gif)
![医学]医学统计学第十一章 第一节 直线回归.ppt_第3页](http://file.renrendoc.com/FileRoot1/2018-12/30/08b8ee1d-6151-447c-9cec-3c7824e53002/08b8ee1d-6151-447c-9cec-3c7824e530023.gif)
![医学]医学统计学第十一章 第一节 直线回归.ppt_第4页](http://file.renrendoc.com/FileRoot1/2018-12/30/08b8ee1d-6151-447c-9cec-3c7824e53002/08b8ee1d-6151-447c-9cec-3c7824e530024.gif)
![医学]医学统计学第十一章 第一节 直线回归.ppt_第5页](http://file.renrendoc.com/FileRoot1/2018-12/30/08b8ee1d-6151-447c-9cec-3c7824e53002/08b8ee1d-6151-447c-9cec-3c7824e530025.gif)
已阅读5页,还剩48页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Linear regression 直线回归 第十一章 第一节 内容 概述 直线回归方程的建立 回归系数和回归方程的意义及性质 回归系数的假设检验 应变量总变异的分解 回归问题的方差分析 直线回归的区间估计 两个斜率的比较 两条回归直线的合并 过定点的直线回归 直线回归与直线相关的区别及联系 回归分析的正确应用 11.1 概述 Y 因变量,响应变量 (dependent variable, response variable) X 自变量,解释变量 (independent variable, explanatory variable) 直线回归的形式: Regression 释义 n=1078单位:英寸 x= 68 y=69 x1=72 y1=71 x2=64 y2=67 11.1 直线回归方程的建立 最小二乘法(least square estimation) 例:某医院欲研究儿童的体重与体表面积的关系,测 量了10名3岁男童体重与体表面积,数据见下表 编号X (X,kg)Y (Y,103cm2) 111.05.283 211.85.299 312.05.358 412.35.292 513.15.602 613.76.014 714.45.830 814.96.102 915.26.075 1016.06.411 合计133.457.266 111213141516 5.0 5.5 6.0 6.5 10名3岁男童体重与体表面积的直线回归 体重与体表面积的回归 回归直线的绘制 计算不太接近的两点的Y值: X=12kg时 Y=2.5212+0.238512=5.3832(103cm2) X=15kg时 Y=2.5212+0.238515=6.0987(103cm2) 10名3岁男童体重与体表面积回归图 111213141516 5.0 5.5 6.0 6.5 体重(kg),X 体 表 面 积 Y (103cm2) 11.3 回归系数和回归方程的意义及性质 b 的意义 a 的意义 的意义 的意义 的意义 b 的意义 斜率(slope) 2.5212 + 0.2385 X 体重每增加 1 kg, 则体表面积平均增加 0.2385(103cm2) b 的单位为 (Y的单位/X的单位) a 的意义 a 截距(intercept, constant) X=0 时,Y的估计值 a的单位与Y值相同 当X可能取0时,a才有实际意义。 估计值 的意义 X=11时, =5.145, 即体重为 11 kg 的三岁女童, 其平均体表面积之 估计为 5.145 (103cm2); X=15时, =6.099, 即体重为 15 kg 的三岁女童, 其平均体表面积之 估计为 6.099 (103cm2). 给定X时,Y的估计值。 当 时, 由体重(kg)估计体表面积(103cm2 ) X Y Y 的估计值 (体重,kg) (体表面积) 11.0 5.2835.145 11.8 5.2995.336 12.0 5.3585.383 12.3 5.2925.455 13.1 5.6025.646 13.76.0145.789 14.4 5.8305.956 14.9 6.1026.075 15.2 6.0756.146 16.0 6.4116.337 的意义 为残差:点到直线的纵向距离。 111213141516 5.0 5.5 6.0 6.5 残差平方和 (residual sum of squares). 综合表示点距直线的距离。 在所有的直线中,回归直线的残差平方和是最小的。( 最小二乘) 的意义 回归直线的有关性质 (1) 直线通过均点 (2) 直线上方各点到直线的纵向距离之和 = 直线下方各点到直线的纵向距离之和 即: (3) 各点到该回归线纵向距离平方和较到其 它任何直线者为小。 11.4 回归系数的假设检验 回归系数为0,则回归关系不存在。 H0:总体回归系数为0, =0; H1:总体回归系数不为0,0; =0.05。 回归系数的 t 检验 体重与体表面积回归系数的假设检验 H 0:总体回归系数 0,即体重与体表面积无回归关系; H 1:总体回归系数 0,即体重与体表面积有回归关系。 =0.05。 体重与体表面积间存在回归关系。 回归系数与相关系数的假设检验 结果等价。 11.5 因变量总变异的分解 X P (X,Y) Y Y的总变异分解 未引进回归时的总变异: (sum of squares about the mean of Y) 引进回归以后的变异(剩余): (sum of squares about regression) 回归的贡献,回归平方和: (sum of squares due to regression) Y的总变异分解 剩余标准差 (1) 扣除了X的影响后Y方面的变异; (2) 引进 回归方程后, Y方面的变异。 11.6 回归问题的方差分析 前面应变量总变异的分解与方差分析中 方差的分解原理相同,因而,X对Y的影 响是否有统计学意义,或X与Y的回归关 系是否成立,可以进行方差分析 例11.2 对例11.1所建方程进行方差分析。 H0:体重与体表面积间无直线回归关系; H1:体重与体表面积间有直线回归关系。 =0.05。 lXX=24.9040,lYY=1.5439,lXY=5.9396,SS总= lYY=1.5439, 根据式(11.6) SS剩 = 1.5439-5.93962/24.9040=0.1273 根据(11.12): SS回 = SS总-SS剩=1.5439-0.1273=1.4166 变异来源SSMSF 回 归1.416611.416689.01 剩 余0.127380.0159 总变异1.543990.1715 表11.2 方差分析表 得F=89.01,今1=1,2=8,查附表4 F界值表,得P0.01, 按 =0.05水准拒绝H0,接受H1,故可认为3岁男童的体重与 体表面积之间有线性回归关系 11.7 回归问题的区间估计 回归系数的可信区间估计 估计值 的可信区间估计 个体Y值的容许区间估计 复习 均数的可信区间: 均数界值标准误 (4.3,4.4) 个体的容许区间(参考值范围): 均数界值标准差 (2.37) 11.7.1 总体回归系数 的可信区间估计 根据 t 分布原理估计: 0.2385+/-2.3060.02528 0.18020.2968(103cm2/kg) 11.7.2 的可信区间估计 样本 总体 Y的总平均 给定X时Y的平均 (Y的条件均数) 根据 t 分布原理根据: X=12时,求 的95%可信区间 =13.44, lXX=24.9040, =0.1262。 当X=12时, =5.3832, 11.7.3 的容许区间估计 给定 X 时 Y 的估计值是 Y 的均数的一个估计。 给定X 时 Y 值的容许区间是 Y 值的可能范围。 的100(1- )%容许限: 的可信区间与Y的容许区间 可信区间是针对条件均数的,而容许区间是针对Y的取值 范围的。 X=12时, 的可信区间为:5.25785.5077(103cm2), 表示:体重为12kg的3岁男童,估计其平均体表面积为 5.3832,95可信区间为(5.2587,5.5077) (103cm2)。 X=12时,Y的容许区间为:5.06665.6998(103cm2), 表示:体重为12kg的3岁男童, 估计有95的人其体表 面积在5.06665.6998 (103cm2)之间。 结论: 体重为12kg的3岁男童,估计有95%的人其体 表面积在5.06665.6998(103cm2)之间,平均 体表面积为5.3832(103cm2),95可信区间 为(5.2587,5.5077) (103cm2)。 可信区间与容许区间示意 (confidence band & tolerance band) 111213141516 4.5 5.0 5.5 6.0 6.5 7.0 11.8 两条回归直线的比较 有时需要对两条回归方程进行比较,以推断相应 的两总体回归直线是否平行,是否重叠。 决定直线回归方程的参数是回归系数b和截距a 两回归直线平行,等价于1=2; 两回归直线重叠,等价于1=2且1=2。 11.8.1 两回归系数的比较 检验假设为: H0:12; H1:12。 =0.05。 t= 11.9 过定点的直线回归 例11.4 在用荧光光度法测定全血硒的研究中,分别取 不同硒含量的标准液,消化后测定其荧光强度,试作 标准直线。 含硒量(g)X 荧光强度Y 0.000 0.00 0.025 4.36 0.050 9.31 0.100 17.13 0.150 25.03 0.200 33.22 过定点(X0,Y0)的直线回归方程 一般的直线回归方程(过X的均数和Y的均数): 过定点(X0,Y0)的直线方程估计 不同硒含量所得荧光强度的过定点的回归 荧 光 强 度 Y 0 0.025 0.05 0.075 0.1 0.125 0.15 0.175 0.2 0 5 10 15 20 25 30 35 硒含量X (g) 11.10 直线回归与直线相关的区别与联系 区别 r 没有单位,b有单位;所以,相关系数与单位 无关,回归系数与单位有关; 相关表示相互关系,没有依存关系;而回归有依 存关系; 对资料的要求不同: 当X和Y都是随机的,可以进行相关和回归 分析; 当Y是随机的(X是控制的),理论上只能作 回归而不能作相关分析; I型回归:X是精确控制的; II型回归:X是随机的。 由X推算Y: 由Y推算X: 11.10 直线回归与直线相关的区别与联系 联系 均表示线性关系; 符号相同:共变方向一致; 假设检验结果相同:是否存在共变关系 ; 11.11 回归分析的正确应用 要有实际意义; 充分利用散点图,判断: (1) 线性趋势 (2) 离群值 当样本含量较大时,统计学检验的作用减弱; 回归关系可以内插,不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 应急与防汛管理制度
- 强酸强碱室管理制度
- 影像科岗位管理制度
- 微商城商家管理制度
- 德师风建设管理制度
- 快递员区域管理制度
- 忽必烈行政管理制度
- 总公司行政管理制度
- 患者风险点管理制度
- 感染科感染管理制度
- 农机维修专业技能考试题及答案
- 浪潮集团ERP实施岗在线测评题
- 低温水电解制氢系统 稳动态及电能质量性能测试方法(征求意见稿)
- 气象行业天气预报技能竞赛理论试题库资料(含答案)
- 城市轨道交通车辆检修工(中级)技能鉴定考试题库资料(含答案)
- 一把手讲安全课件:提升全员安全意识
- 校园环保之星事迹材料(7篇)
- 四川省成都市金牛区2023-2024学年七年级下学期期末数学试题
- 人教版初中政治名言总结
- 植物学基础智慧树知到期末考试答案章节答案2024年哈尔滨师范大学
- 白豆蔻提取物的药理药效学研究
评论
0/150
提交评论