双变量回归与相关医学统计教学课件_第1页
双变量回归与相关医学统计教学课件_第2页
双变量回归与相关医学统计教学课件_第3页
双变量回归与相关医学统计教学课件_第4页
双变量回归与相关医学统计教学课件_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

双变量回归与相关双变量回归与相关 Bivariate Regression 引进回归方程后, Y方面的变异。 31 (2)计算检验统计量 t 值 (1)建立检验假设并确定检验水准 (3)确定P值下结论 32 (二)总体回归系数的可信区间 此区间不包括=0,结论为b有统计学意义。 33 SPSS结果 34 (三)利用回归方程进行估计与预测 1.总体均数 的可信区间 : 给定X后对应Y的总体均数 给定X后对应Y的样本均数 35 2.个体Y值的容许区间 给定X后对应个体Y值波动范围 36 X Y (体重,kg) (体表面积,103cm2 ) 11.0 5.283 11.8 5.299 12.0 5.358 12.3 5.292 13.15.602 13.7 6.014 14.4 5.830 14.9 6.102 15.2 6.075 16.0 6.411 例 某地10名三岁儿童体重与体表面积 37 111213141516 4.5 5.0 5.5 6.0 6.5 7.0 可信区间与容许区间示意 (confidence band & tolerance band) X 体重 Y 体 表 面 积 38 第二节第二节 直线相关直线相关 Linear Correlation 39 p生物遗传学上的“相关” 在回归分析中,有理由认为父亲身高决定儿 子身高,故把父亲身高作为自变量X,儿子身 高作为应变量Y。 Pearson K(英,18571936)在对同一家庭中兄 弟与姐妹身高间关系进行分析时,发现两者 难以象父亲与儿子身高间关系那样区别自变 量X与应变量Y,也不必计算回归方程。 Galton F(英,18221911)将这种现象称之为 “ 相关”。 40 u 当一个变量增大,另一个也随之增大( 或减少),我们称这种现象为共变,或相 关。两个变量有共变现象,称为有相关 关系。 u 相关关系不一定是因果关系。 一、直线相关的概念 41 r = 0 (h) r 0 (f) r-1 (d) r1 (b) 0r1 (a) -1r0 (c) r 0 (e) r 0 (g) 零相关正相关负相关 完全正相关完全负相关零相关零相关 零相关 相互关系示意图 42 相关系数的性质 u两变量间的线性关系密切程度与相关 方 向用直线相关系数r表示。 u1 r 1 ur0为正相关 ur0为负相关 ur0为零相关或无相关 43 二、相关系数的意义与计算 Pearson 相关系数 标准化后的协方差 44 45 SPSS结果 46 三、相关系数的统计推断 (一)相关系数的假设检验 尿肌酐含量与年龄之间无直线相关关系 47 附表2 附表13 48 (二)总体相关系数的可信区间 相关系数的抽样分布在0时呈偏态分布 Z的1-可信区间: 变换后r的1- 可信区间: Z变换后服从正态分布 49 相关系数的抽样分布相关系数的抽样分布 (| (| | | = 0.8 = 0.8,n=100n=100,10001000次抽样次抽样) ) -0.8 -0.6 -0.4 -0.2 0.0 0 100 200 300 -1.0 00.20.40.60.81.0 0 100 200 300 = - 0.8 = 0.8 50 R.A. Fisher(1921) 的 z 变换 z 近似服从均数为 , 标准差为 的正态分布。 51 相关系数的z变换值的抽样分布( = - 0.8) 00.51.01.52.0 0 50 100 150 200 -0.8 -0.6 -0.4 -0.2 0.0 0 100 200 300 -1.0 变换前变换后 52 01234 0 50 100 150 200 00.20.40.60.81.0 0 100 200 300 相关系数的z变换值的抽样分布( =0.8) 变换前变换后 53 相关系数的可信区间估计 1. 将 r 变换为 z 。 2. 根据 z 服从正态分布,估计 z 的可信区间。 3. 再将 z 变换回 r。 54 p求得8名健康成人血清总胆固醇与低密度脂 蛋白胆固醇含量间的 r=0.974,试求总体相关 系数 的95%可信区间。 z的95%可信区间: 总体相关系数的95%可信区间 : (0.8587 0.9954)55 四、决定系数 0 R2 1 Y的总变异中回归关系所能解释的百分比 年龄可解释尿肌酐含量变异性的77.75% 56 五、直线回归与直线相关的区别与联系 p 区别 ur没有单位,b有单位; u相关表示相互关系,没有依存关系; 回归有依存关系; u对资料的要求不同: 当X和Y都是随机的,可以进行相关和回 归分析; 当Y是随机变量,X是控制变量时,理论 上只能作回归而不能作相关分析; 57 p 区别 uI型回归: Y是随机变量,X是控制变量; II型回归: Y与X均是随机变量。 u同一资料中由X推算Y与由Y推算X的回归 方程不同: 58 p 联系 u均表示线性关系 u符号相同:共变方向一致 u假设检验结果相同:tr=tb u 可以互相换算 : 59 六、直线回归与相关应用的注意事项 u相关:X与Y没有主次,为双向。 u回归:Y依X变化而变化,为单向 。 u自变量的选择: 原因、容易测量、变异小 u要有实际意义。 1.根据分析目的选择变量及统计方法 60 孩子的身高与小树 的高度间显示出显 著的相关性 61 u有无异常点,谨慎剔除。 2.进行相关、回归分析前要绘制散点图, 进行判断 62 离群值对相关的影响 63 样本的间杂性对相关性的误导 64 3.用残差图考察数据是否符合模型假设条件 Y与X为线形关系 误差服从均数为0的正态分布 方差相等 各观察单位独立 u回归模型应用前提条件: 65 e 0 66 00 00 e e e e 67 uP值越小越有理由认为变量间直线关系 存在,不能说关系越密切。 u直线回归关系可以内插,不宜外延。 u当样本含量较大时,统计学检验的作用 减弱。r0.05/2,100=0.195 4.结果的解释及正确应用 68 第三节第三节 秩相关秩相关 Rank Correlation 一、一、Spearman Spearman 秩相关秩相关 69 p应用条件: 1.不服从双变量正态分布而不宜作积差 相关分析; 2.总体分布类型未知; 3.原始数据用等级表示。 70 work years of potential life lost 71 72 或用秩Pi、Qi直接计算积差相关系数r 附表14(n50) 73 SPSS结果 74 第六节第六节 两条回归直线的比较两条回归直线的比较 一、两个回归系数的比较一、两个回归系数的比较 二、两个截距的比较二、两个截距的比较 75 76 Y X bc b2 b1 bc 0 77 第七节第七节 曲线拟合曲线拟合 78 一、曲线拟合的一般步骤 1.依据分析目的确定X与Y,根据两变量 散点图、结合专业知识选择曲线类型。 2.求回归方程:曲线直线化。 3.拟合优度:R2。 79 CRF:促肾上腺皮质激素释放因子 ACTH:肾上腺皮质激素 例9-13 80 例9-13数据散点图 CRF(nmol/L) X Y ACTH(pmol/L ) 81 82 例9-13数据对X作对数变换散点图 Y ACTH(pmol/L) lg CRF(nmol/L) X 83 例9-14 84 例9-14数据散点图 病人住院天数(天) X Y 预后指数 85 lnY 预 后 指 数 例9-14数据对Y作对数变换散点图 病人住院天数(天) X 86 用最小二乘估计只能保证 最小 不能保证将变换值方程 回代 后得到的 最小。 87 二、曲线拟合的用途 1.定量刻画X与Y的关系。 2.用决定系数R2反应两变量曲线关系的密 切程度。 88 Y X 0 三、常见的几种曲线 对数曲线 89 Y X0 指数曲线90 Y X 0 Y = b0 + b1 X + b2 X2 抛物线 91 Y X Y = b0 + b1 X + b2 X2 + b3 X3 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论