预防医学刘明清_第1页
预防医学刘明清_第2页
预防医学刘明清_第3页
预防医学刘明清_第4页
预防医学刘明清_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

预防医学,第十章人健康研究的统计学方法,目录,第一节统计学的概要,统计学的意义,统计学的一些基本概念,统计资料的类型,统计工作的基本步骤第二节统计表,统计表,统计表,目录第三节数值变量资料的统计分析1,数值变量资料的统计记述2, 数值变量资料的统计推断第四节分类变量资料的统计分析1、分类变量资料的统计记述2、分类变量资料的统计推断、学习目标、1 .掌握整体、样本等统计学基本概念的统计类型统计表和统计图的制作数值变量数据和分类变量数据的统计记述的指标、计算和适用条件数值变量数据和分类变量数据的区间推断的方法、常用的假设检查方法和2 .熟悉:医学统计工作的基本阶梯度数表的制作方法在正态分布曲线中的面积分布规律和参考值范围的制定。 3 .理解t分布特征的统计上两种类型是错误的。 重点和难点,重点:总体和样本概念统计类型统计表和统计图的编制要求数值变量数据和分类变量数据的统计描述指标,计算和适用条件采样误差和基准误差数值变量数据和分类变量数据的区间估计方法常用的假设检验方法和应用条件。 难点:取样误差和基准错误t分布和t界限值假设检验的基本思想p值语义检验中假设2种错误的分布和检验。 第十章第一节,丁可南阳医学高等专科学校,第一节统计学概述,统计学(statistics )是研究数据收集、整理、分析的科学,是了解社会和自然现象客观规律数量特征的重要工具。 统计学方法是人们通过偶然现象认识其内在规律,阐明疾病、现象的发生、发展规律,为预防疾病、促进健康提供客观依据。 第十章第一节,(一)同质和变异同质(homogeneity )是研究指标的影响因素相同的变异(variable )是基于同质的各观察单位(也称为个体)之间的差异,第十章第一节(2)总体和样本总体, 根据研究目的决定的同质观察单位的样本全体是从总体中随机抽出的部分观察单位,其测定值(或变量值)的集合,第10章第1节(3)变量和变量值的总体(population )是根据研究目的决定的同质观察单位的总体(sample ) 是从总体中随机抽出的部分观察单位,其测定值(或变量值)的集合,第10章第1节,(4)参数和统计量参数(parameter )是总体的统计指标。 习惯上用希腊字母表示的整体参数统计(statistic )是样本的统计指标。 习惯性地用字母表示统计量的话,在第10章第1节中,(5)误差1 .系统误差(systematicerror ) :测定结果还有倾向性。 究明原因就可以避免。 2 .随机测量误差(randomerrorofmeasurement ) :测量结果没有倾向性。 不可避免。 3 .采样误差(samplingerror ) :随机采样引起的采样统计量和整体参数的差异以及采样统计量的差异称为采样误差。 变异是绝对的,采样误差是不可避免的。 此外,第10章第1节,(6)概率(probability )是描述某个随机事件的发生可能性大小的模,常用的符号用p表示。 随机事件的概率在0到1之间,即0P1。 概率事件: P0.05或P0.01的事件。 统计学上认为小的概率事件在1次取样中几乎不会发生。第10章第1节(1)数值变量数据数值变量数据(measurementdata )为定量数据(quantitativedata )或计量数据(numericalvariabledata)(2)分类变量数据分类变量数据(categoricalvariata ) 1 .无序分类(unorderedcategories)2.有序分类(orderedcategories ),第10章第1节,资料类型的分类由研究目的决定,统计分析方法的选择与资料类型密切相关在资料分析过程中,可以根据相关专业理论和实际需求,在各种资料之间相互转换,满足不同统计分析方法的要求。第十章第一节、(一)统计设计:第一阶段、最重要环节(二)收集资料:经常资料和暂时性资料(三)整理资料:泄漏补充、系统化、条理化学(四)分析资料1 .统计描述2 .统计推断、第十章第一节、第十章第二节、丁可南阳医学高等专科学校、(一)统计表的结构和表格要求1 .统计表主要找到、目标(包括横向目标、纵向目标)、线、数字2 .编制统计表的主要要求是通过强调表的中心内容,一张表表现出中心问题。第十章第二节、第十章第二节、(一)统计表的种类1 .简单表、第十章第二节、(一)统计表的种类2 .复合表、第十章第二节、(一)统计表的种类和选择1 .资料是连续的,其目的是通过线段升降来表现事物的动态变化趋势,选择普通线图2 .表示变量分布的度数表资料是, 以直方面的面积来表现各组段的度数或频度分布状况为目的,应该选择直方图3 .资料相互独立,其目的是用直线条的长度比较数值的大小,选择直线条图,第十章第二节,(一) 统计表的类型和选择4 .事物内部各部分的构成比例资料,以用面积的大小来表现各部分所占比重的大小为目的,因此必须选择圆形图5 .二变量连续性资料,以点的密度和倾向来表现两个变量的相互关系,以选择散布图为目的6 .资料是连续的、第十章第二节、(二)制图通则1 .根据资料性质和分析目的正确选择适当的统计图。 2 .需要标题,简要说明统计图资料的时间、地点和主要内容,一般放在图下。 3 .绘制有坐标轴的图形时,在纵横两轴设定目标,明确记载单位。 通常,将两轴的交点即原点初始设定为0。 纵横轴比率通常优选为5:7或7:5。 4 .在同一附图内比较不同的东西时,必须用不同的线或颜色来表现,用附图例来说明。 第十章第二节,(三)常用统计图及其绘制方法1 .条形图(bargraph )条形图以等宽条(柱)的长度表示各指标值的大小。 指标适用于各自独立的分类资料。 第十章第二节、第十章第二节、第十章第二节、(三)常用统计图及其描绘方法2 .构成图(constituentratiochart )以图形面积的大小表示事物内部各构成部分所占的比重和比率。 适用于按性质分类、可计算构成比的资料。 构图分为圆形图和百分图。 比较第十章第二节、第十章第二节、图10-3复方猪胆囊治疗单纯型老年支气管炎的最近疗效,比较第十章第二节、图10-4复方猪胆囊治疗老年性支气管炎的最近疗效,(三)常用统计图及其描绘方法3 .线图(线图) :为线段升降适用于持续的数据。第十章第二节、第十章第二节、(三)常用统计图及其绘制方法4 .直方图也称为度数分布图,适用于以各矩形的面积表示各组的度数,以各矩形的面积的总和为总度数,表示连续性资料的度数分布。第10章第2节,第10章第2节,图10-6某市某年150名3岁女童的身高度数分布,(3)常用统计图及其绘制方法5 .散点图(scatterdiagram )散点图以点的密集度和变化趋势表示两个现象间的相关关系。 应用于双变量数据,具有连续变化的特点。第十章第二节、第十章第二节、图10-715名8岁男子身高和座位高散布图,(三)常用统计图及其绘制方法boxplot用于比较两组或多组资料的集中趋势和离散趋势,箱图中横线表示中值,箱长表示四分之一间隔,两端分别为P25和P25,箱图最外面的、第十章第二节、第十章第二节、图10-8肿瘤抑制剂剂量与对照组给药后小鼠肿瘤重量的比较、第三节数值变量资料的统计分析、刘琥珀济宁医学院、1 .度数表的制作、度数表顺序流程图的制作、(1)度数分布、2 .度数分布表的用途(1)数值变量的度数分布的类型和特征(2) (3)易于发现特大或极小可疑值作为陈述资料的形式;(4)易于进一步统计分析,3 .数值变量频数分布的类型和特征;44,1 .算术平均值(mean )样本平均值:整体平均值: (1)应用:对称分布资料,特别是正态分布资料。 (2)计算直接法加权法;(2)集中倾向指标,45,2 .几何平均数(geometricmean):(1)应用:等比数列资料对数正态分布数据;(2)计算:直接法加权法(2)应用:偏差分布的一端或两端无确定数据的资料分布不明确。 (3)计算:直接法度数表法,离散倾向,即个体值间的变异程度,数据越分散变异程度越高。 极差四分位间隔离散标准偏差变动系数,47,(三)离散倾向指标,48,1 .全距离(r )全距离也称为极差,是观测值的最大值和最小值的差。 反映个体变异的范围。 说明全距离大,离散度大,相反,说明离散度小。 缺点: (1)除最大值和最小值外,不能反映组内其他数据的离散度。 (2)样品含量极大时,不得比较其全距离。 (3)样品含量不变,全距离取样误差大,不稳定。 另外,49,2 .四分之一点间隔(q )上四分之一点(P75 )与下四分之一点(P25 )之间的差Q=P75-P25四分之一点间隔可以看作是中间半变量值的总距离。 这与全距离相似,数值越大表示变异程度越大,相反,变异度越小表示变异程度越大。 将四分位间距作为说明个体差异的指标,比全距离稳定,但没有考虑每个观察值的偏差程度。 应用:结合中值描述偏差分布数据的特点。50、3 .方差全面考虑各变量值的方差程度。 距离平均差:总和零距离平均差平方和:除了变异度之外,还与变量值的个数有关。 取其平均值,则为方差。 取、51、4 .标准偏差(standarddeviation )总体的方差平方,是总体的标准偏差。 标准偏差越大,表示个体的变异越大,则平均的代表性越差。 计算:直接法:加权法:52,标准偏差的应用(1)描述正态分布数值变量数据的离散度。 (2)根据平均数描述正态分布的特征,估计参考值范围。 (3)用以计算变异系数。 (4)用于计算基准错误。 53,5 .变异系数(coefficientofvariation )以百分比表示标准偏差和平均数之比。 变异系数是相对数,没有单位。 变异系数越小,表示变量值集合的变异程度越小;相反,变异系数越大,表示变异程度越大。 应用: (1)比较度量衡单位不同的多组资料的变异度。 (2)比较平均数大不相同的几组资料的变异度。 变异指标总结,54,1 .极端差粗,适合任何分布。2 .标准偏差与平均单位相同,最常用,适于近似正态分布。 3 .变异系数主要用于单位差异和平均数差异较大的资料。 平均指标和变异指标分别反映了资料的不同特征,正态分布:平均数,标准偏差分布:中值,四分位数间隔,55,1 .正态分布的特征(1)正态曲线在横轴上平均数最高。 (2)正态分布以平均数为中心左右对称。 (3)正态分布有平均数和标准差两个参数。 平均数是位置参数,标准差是变异度参数。 (4)正态曲线下的面积分布有一定的规律。 (4)正态分布和医学参考值范围、曲线下面积分布规律、2 .参考值范围的估算、医学参考值:很多健康人的某些指标的变动范围。 所谓“正常人”,是指不是完全健康的人,没有影响研究指标的疾病或相关因素的同质的人。 57、制定基准值范围的顺序如下: (1)明确研究整体,从“健康人”整体采样测量方法,(2)控制测量误差。 (3)判断是否需要分组(性别、年龄等)。 (4)根据专业知识决定是单侧还是双侧。 (五)确定适当的百分比范围; (6)根据资料的分布类型选择适当的方法进行范围推定。 58、59,两种方法计算95%的参考值范围,(一)平均采样误差和标准误差,概念:采样统计量的标准偏差称为标准误差。 意义:描述平均抽样误差大小的统计指标。 样本平均数的标准偏差,反映了含量相同的样本平均数的离散倾向和变异程度。 对于类似性质的资料,由于平均数的标准误差越大,样本平均数的变异程度越大,样本平均数围绕整体平均数的分布越分散,样本平均数与整体平均数分离,因此由样本平均数推断的整体平均数的可靠性越小,样本误差越大。 二、数值变量资料的统计估计、采样误差、数值变量资料、标准误差、平均数标准误差的用途1 .测定采样平均数的可靠性,反映采样误差的大小。 标准误差越小,表示样本平均数之间的偏差越小,用样本平均数估计总体平均数越可靠,反之亦然。 2 .可用来估计总体平均数的信任区间。 3 .可用于平均数的假设检验。 (二)t分布、t分布特征:1.单峰分布,以0为中心左右对称。 2.t分布是一系列曲线,其形状受自由度的影响。 t边界值、统计学家在t边界值表中制作了与各种自由度相对应的t分布曲线中的尾部面积(概率)的百边界值。 因为t分布是以0为中心的对称分布,所以表中只记载了正值,所以在调查表时,与t的值无关,正负只是绝对值。 表右上图中的阴影部分表示t/2、v以外的尾部面积占总面积的百分比,即概率p。 当自由度增加时,t边界值逐渐减小,并且当自由度变为无穷大时,两侧t0.05=1.96,一侧t0.05和=1.645是u分布的边界值。64、(3)全体平均数推定、点推定数值变量数据:区间推定、参数推定的方法(数值变量数据)、全体平均数95%可靠区间已知未知、样本量小未知、样本量大、(4)假设检验的意义和基本步骤, 基本步骤1 .建立假设:一侧还是两侧2 .决定检定水平3 .选定检定方法,计算统计量4 .决定概率p值的推定结论,对资料性质的要求(数值变量资料),各自独立的随机样本从正态分布中分散出总体。 1 .样本平均数与总体平均数的比较,(1)小样本平均数与总体平均数的比较,(2)大样本平均数与总体平均数的比较,(3)在已知总体标准偏差的情况下,2 .对数变量数据的比较,3 .两个样本平均数的比较,(1)两个小样本的平均数的比较, (2)两大样本平均数的比较,72,假设检验中应注意的问题1 .资料必须符合随机化取样的原则2 .选择的假设检验方法必须符合其应用条

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论