人民卫生统计学第8版第二章-数据关联的探索.ppt_第1页
人民卫生统计学第8版第二章-数据关联的探索.ppt_第2页
人民卫生统计学第8版第二章-数据关联的探索.ppt_第3页
人民卫生统计学第8版第二章-数据关联的探索.ppt_第4页
人民卫生统计学第8版第二章-数据关联的探索.ppt_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卫生统计学,第二章数据关联的探索,目录,第一节:数据的关联,第二节:散点图,第三节:相关,第四节:回归现象,第五节:相关与回归的陷阱,01,02,03,04,05,06,07,第六节:分类变量的相关,第七节:关联与因果,重点难点,散点图的应用正确描述不同类型数据的相关关系直线回归的正确应用回归方程的建立、解释与评价关联和因果的判断,第一节数据的关联,1.在研究学习努力程度与学习成绩的关联时,这里涉及的两个变量分别为学习努力程度和学习成绩,我们需要考虑几个问题:(1)学习努力程度与学习成绩是否存在关联,是什么关联方向,关联强度多大。(2)努力学习能在多大程度上提高学习成绩。(3)两者的关联可能受到其他一些因素的影响或干扰,比如学校的教学质量。,第一节数据的关联,2.统计学上定量描述两变量的关联时需考虑:(1)两变量是否真的存在关联。(2)两变量的关联方向和关联强度。(3)两变量间的数量依存关系。(4)两变量的关联关系中是否受到其他因素的影响和干扰。,第一节数据的关联,第二节散点图,1.制作散点图利用平面坐标显示两个定量变量之间的关系,其中一个变量对应横轴,另一个变量对应纵轴,根据每个观测单位的两个变量值可确定该点的坐标。例1脱氧雪腐镰刀菌烯醇(deoxynivalenol,DON)是粮食中常见的一类污染性真菌毒素。为了探索粮食中DON含量与患者骨关节炎得分(osteoarthritispoints,OAP)的关系,在主食面粉和大米的地区测量患者骨关节炎得分,并测量主食样品中DON含量(g/g),数据见下表,绘制散点图。,(一)图的解释,第二节散点图,(一)图的解释,第二节散点图,38名大骨节病患者OAP(分)与粮食中DON含量(g/g),(一)图的解释,第二节散点图,患者OAP和粮食中DON含量的散点图,2.评价散点图(1)观察图的总体趋势和明显偏离该趋势的观测单位。(2)通过散点图的总体趋势来呈现关联的形式、方向和密切程度。,(一)图的解释,第二节散点图,第二节散点图,(一)图的解释,3.散点图解释(1)散点呈现线性趋势。(2)两变量同时增大或减小,即呈正相关。,患者OAP和粮食中DON含量带直线的散点图,第三节相关,(一)直线相关系数,第三节相关,。,大骨节病中OAP和DON含量的相关系数的计算如下:,(一)直线相关系数,第三节相关,(一)直线相关系数,第三节相关,(一)直线相关系数,第三节相关,不同r值的线性关系示意图,(一)直线相关系数,第三节相关,(二)秩相关系数,第三节相关,例2缺铁性贫血是儿童常见营养性疾病之一,其高发在6个月至2岁。现研究农村地区贫血状况,关注某村21例6个月1.5岁患儿的血红蛋白含量与贫血体征的关系,其中贫血体征分为:阴性(-)、出现(+)、中度(+)、重度(+),具体数据见下表,现对二者做相关分析。,(二)秩相关系数,第三节相关,贫血患儿的血红蛋白含量(g/L)和贫血体征,(二)秩相关系数,第三节相关,最后,需要特别注意的是,相关不区分解释变量和反应变量。,第四节回归现象,(一)回归直线的拟合,第四节回归现象,(一)回归直线的拟合,第四节回归现象,(一)回归直线的拟合,第四节回归现象,例2续已知例2数据中38个对象骨关节炎得分OAP(y)和粮食中DON含量(x)的均数和标准差及两变量之间的相关系数,通过最小二乘法得到的回归直线的斜率为,(一)回归直线的拟合,第四节回归现象,截距,最后得到回归直线的方程为,3.注意事项(1)理清相关系数和斜率之间的关系,从计算公式、数量关系和实际意义等方面。(2)回归中需要明确区分反应变量和解释变量。,(一)回归直线的拟合,第四节回归现象,(二)回归方程的解释和残差,第四节回归现象,(二)回归方程的解释和残差,第四节回归现象,图所示是书中例2-1和例2-4数据回归分析后的散点图,可见左图数据点无规律散布于0水平线周围,说明拟合效果尚可,而右图散点呈现U型散布,说明拟合效果不佳。,(二)回归方程的解释和残差,第四节回归现象,例2-1和例2-4散点图,3.注意事项(1)最小二乘法回归直线的斜率和截距取决于测量值的单位,不能仅凭它们的大小判断其影响大小。(2)用回归直线进行预测时,需注意回归直线概括了整体趋势,给出的预测值也是对整体趋势的一个预测,并不一定完全准确。,(二)回归方程的解释和残差,第四节回归现象,(三)决定系数与相关,第四节回归现象,第五节相关与回归的陷阱,(一)离群点与强影响点,第五节相关与回归的陷阱,(二)观测值范围,第五节相关与回归的陷阱,有些时候通过散点图,我们发现两变量间存在某种趋势,但是这种趋势不是线性的。这时可以采用数据转换将非线性数据转换后得到线性关联。,(三)非线性关联,第五节相关与回归的陷阱,例3某环境检测部门测得某地距污染源的距离和中心线上大气中氰化物平均浓度(在不同时点测量各点的氰化物浓度并计算各点平均值),数据如表所示。排放源下风向中心线上的平均浓度随距离的增大而减小,最高值在中心线50米附近。用恰当的回归方程反映中心线上氰化物平均浓度随距污染源的距离变化而变化的关系。,(三)非线性关联,第五节相关与回归的陷阱,某地距污染源的距离(m)和中心线上大气氰化物平均浓度(mg/m3)数据,(三)非线性关联,第五节相关与回归的陷阱,中心线上大气氰化物平均浓度与距污染源距离的散点图(A)和残差图(B),(三)非线性关联,第五节相关与回归的陷阱,在图(A)中我们可以观察到随距污染源距离增加,中心线上的大气氰化物平均浓度的改变速度越来越小,图(B)为相应的残差图,其结构所描述的是简单直线关系的残差形态,图(B)整体上呈曲线并表现出一定的规律,所以判断直线回归不适合此据。这里将原始值进行对数转换(logtransformation)后,替代原始值进行分析,如下图。,中心线上大气氰化物平均浓度与距污染源距离对数值的关系,探索两变量间的关联性时,单独分析发现存在关联或无关联,但以变量的某种属性进行分层分析即引入第三变量分层时,再分析原来两个变量的关系,原有的关联会在某些层内发生某些变化甚至方向相反,这个第三变量就是潜在影响变量。,(四)潜在影响变量,第五节相关与回归的陷阱,例2续根据大骨节病发生情况将地区分为:东部(开始监测时病情很平稳,在17年的监测过程中没有大的变化),中部(开始监测时病情较严重而活跃,但在监测过程中持续下降,其间无明显反弹)和西部病区(甘肃、陕西、青海和西藏地区,其特征为病情严重而活跃),进一步可探讨东中西三个地区的粮食中DON含量的关系(数据见下表),增加区域信息后的数据如下:,(四)潜在影响变量,第五节相关与回归的陷阱,(四)潜在影响变量,第五节相关与回归的陷阱,38名大骨节病患者OAP(分)与粮食中DON含量(g/g),由图看出中部地区和西部地区总趋势为上升趋势,但是东部地区的关联则不明显,且观察点集中在OAP和粮食中DON含量都较低的区域。,(四)潜在影响变量,第五节相关与回归的陷阱,不同地区患者OAP和粮食中DON含量的散点图,平均数的相关潜在影响变量基于大量个体平均值的相关强度通常要高于基于相同变量的个体数据之间的相关强度。因此,在进行分析时应谨慎对待,以免导致结果偏差。,(五)平均数的相关,第五节相关与回归的陷阱,第六节分类变量的相关,例4为了解某市2岁6岁儿童维生素D的营养状况,对该市3582名2岁6岁儿童血清25(OH)-D水平进行检测,具体数据见交叉表。适用于两变量均为分类变量时。,(一)交叉表的制作,第六节分类变量的相关,某市不同性别26岁儿童维生素D的营养状况,1.条件分布在设定一个变量取值的条件下,计算另一个变量取值的分布,所得到的分布就是条件分布(conditionaldistribution)。,(二)条件分布与关联,第六节分类变量的相关,男童中维生素D缺乏情况的条件分布,2.关联(1)下表为例4中女童维生素D缺乏情况的条件分布。(2)比较前表和下表可以得到性别和维生素D缺乏情况的关系,即女童的维生素D缺乏比例高于男童(0.29680.1986)。,(二)条件分布与关联,第六节分类变量的相关,女童中维生素D缺乏情况的条件分布,1.数据整理将所得数据整理为交叉表,并计算相应的联合分布和边缘分布,如下表。,(三)Pearson列联系数,第六节分类变量的相关,22交叉表的一般形式及分布,(三)Pearson列联系数,第六节分类变量的相关,例4续利用例4儿童维生素D缺乏的例子计算不同性别和是否缺乏维生素D的列联系数。首先,男性缺乏维生素D的理论频数的计算如下:然后依次计算,(三)Pearson列联系数,第六节分类变量的相关,列联系数,与定量变量一样,分类变量进行相关性分析时要注意潜在的影响变量,单独分析两变量和按潜在影响变量分层后再分析两变量,原有的关联会在某些层内发生变化,有时甚至方向发生反转,例如辛普森悖论(Simpsonsparadox)。,(四)分类变量相关分析的陷阱,第六节分类变量的相关,第七节关联与因果,下图描述了几种常见的关联。虚线双箭头表示存在关联,实线箭头表示有因果关系。,(一)关联中因果、共

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论