相关与回归分析错误辨析.ppt_第1页
相关与回归分析错误辨析.ppt_第2页
相关与回归分析错误辨析.ppt_第3页
相关与回归分析错误辨析.ppt_第4页
相关与回归分析错误辨析.ppt_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

直线相关与回归分析 作者 胡良平单位 军事医学科学院生物医学统计咨询中心 实例导引 下面是直线回归与直线相关方面的错误实例 请辨析其错误所在 例1 树高与子高 例2 狗按直线规律咬人 某人在北京郊区调查居民被狗咬伤的情况 结果显示 各年龄组中被狗咬伤的百分率是不同的 即 年龄由小到大 被狗咬伤的百分率依次为 很小 较小 较大 很大 较大 较小 很小 较大 狗按直线规律咬人吗 原作者的一个惊人的发现是 年龄与百分率之间的相关系数r 0 9956 P 0 0001 因此拟合的直线回归方程也是有非常显著性意义的 狗按直线规律咬人吗 故可以认为在所调查的市郊 被狗咬者年龄与被狗咬伤的百分率之间有很好的线性关系 可用此回归方程来预测该地任何一位居民被狗咬伤的概率 以便提醒人们外出时携带必要的防身器械 要倍加小心 尽可能减少被狗咬的机会 例3 直线两端 闹地震 某地进行核试验 在一定条件下 离爆心的距离x km 与冲击伤发生率y 有如下试验数据 x km 4 14 46 88 710 311 913 515 317 319 523 430 0y 100999080706050403020101 若采用直线相关与回归分析 相关系数r 0 9754 回归方程y 4 2960 x 113 3081 对相关系数及回归方程的假设检验均有 P 0 0001 结论为 在离爆心4 30km范围内 离爆心的距离与冲击伤发生率间有良好的线性关系 将X 1和X 30分别代入上面的直线回归方程 计算得 冲击伤发生率Y 109 0 与Y 15 6 这是为什么 此资料的散布图 y 100 50 0 0102030图6 1离爆心的距离与冲击伤发生率间的散点图 例4 错在哪 1954年上海市曹杨村卫生调查资料显示 儿童的年龄 x 岁 与儿童麻疹曾患率 y 之间有一定的关系 专业知识也认为这种联系确实是存在的 某人对资料作了直线回归分析 感觉效果的确不错 得到的直线回归方程为 0 361867 0 109086x 对截距和斜率检验的结果分别为ta 4 052 P 0 0152 tb 4 757 P 0 0089 资料和y的预测值如下 错在哪 编号年龄 x 岁 麻疹曾患率 y 预测的麻疹曾患率 1134 347 12265 556 03376 868 94485 279 85590 390 76694 1101 6 例5 错在哪 把一批活钉螺同时按同样条件埋入土中 每隔1月取出一部分 检测其存活率 直至12个月 资料见表12 其中x 埋螺月数 y 钉螺存活率 错在哪 有人用SAS软件拟合出y倚x变化的直线回归方程为 Y 107 591209 9 843407x用此方程推算出y的估计值和残差都列在表12中 试根据下面SAS计算的结果以及表中13个值 结合专业知识和统计学知识 对所选用的分析方法作出有说服力的评价 错在哪 例6 用直线相关回答一致性问题 人们常需考察两种检测方法检测同一批样品的结果是否一致 当测定结果是定量资料时 人们常用配对t检验或计算相关系数 并检验之 当配对t检验的结果为P 0 05或对相关系数r检验的结果为P 0 05时 都得出两种测定方法的测定结果是一致的结论 这样做科学吗 有无改进方法 分析与释疑 这样做并不科学 进行配对t检验时 某些样品上表现出来的差异经过求其平均值可能会被掩盖掉 而进行直线相关分析时 某检测方法存在系统误差时 不能被发现 分析与释疑 最好的做法是 求直线回归方程 检验回归系数b与1之间的差别有无统计学意义 因为若两种检测方法检测的结果始终一致时 其观测点必然落在与X轴成45度角的直线上 其斜率b 1 例7 下面的分析结果可信吗 患者编号1234567胰岛素含量 u ml 241718121512110血糖含量 mg 142170194213214238249某研究者对7例糖尿病患者给某种药物后 测量其血中胰岛素和血糖的含量 该研究者采用的是直线相关分析 得 r 0 3140 P 0 05 结论为胰岛素含量和血糖的含量之间无直线相关关系 表6 4不同喷雾压力 kg cm 下MMD观测结果 MMD m 实验次序 压力 0 30 50 70 91 11 31 52 0 110 28 68 48 98 17 19 06 4211 09 78 67 28 47 58 16 0311 613 18 26 97 96 58 56 1412 18 010 16 67 28 18 65 8511 59 78 56 78 07 17 85 9 Y11 289 828 767 267 927 268 406 04s0 7191 9740 7640 9450 4440 5900 4640 230 下面的做法错在哪 某作者欲分析年龄与淋巴细胞转化率的关系 n 252 r 0 20 回归方程y 76 0 0 4x P 0 01 结论是淋巴细胞转化率与年龄密切相关 例8 用年龄预测淋巴细胞转化率有价值吗 分析与释疑 关于样本相关系数的假设检验结果 若得到P 0 05 仅说明两定量变量在总体中有直线相关关系 并没有说明关系密切到何种程度 可否由X的值去预测因变量Y的值 应看决定系数 即相关系数r的平方之值的大小 此值至少应大于0 5才有价值 它反映了X对Y的贡献率 分析与释疑 本例中 r 0 20 其决定系数为0 04 说明在淋巴细胞转化率的变化中 只有4 的量可由年龄来预测 可见 没有任何实用价值 实例分析 例1 献血者人数 仪器台数 献血量与采血者人数之间的多元回归分析 例2 全国各县年平均气温 湿度 风速等因素与疟疾发病率之间的多元回归分析 例9 错在哪 某研究者收集到200名献血者的下列资料 年龄 性别 献血次数和骨矿

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论