医学统计学(预防医学)PPT演示课件.ppt_第1页
医学统计学(预防医学)PPT演示课件.ppt_第2页
医学统计学(预防医学)PPT演示课件.ppt_第3页
医学统计学(预防医学)PPT演示课件.ppt_第4页
医学统计学(预防医学)PPT演示课件.ppt_第5页
已阅读5页,还剩255页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学,1,主要内容,前言,医学研究资料的统计处理,统计表与统计图,医学统计资料的统计描述,统计是什么?WhatisStatistics?,若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。FlorenceNightingale1820一1910,一、前言,FlorenceNightingale,在她的时代,各医院的统计资料非常不准确。但是南丁格尔却有先知灼见,她认为医学上的统计资料,有助于改进医疗与护理的方法与措施,而最后可促进医学的进步。1858年影响英国军队健康、效率以及医院行政的笔记。这本书被称为“有史以来写得最好的一本统计图表书籍”。,FlorenceNigh

2、tingale,在书中,有一个章节是她所做的统计图表;她是以图表陈述统计数据的先驱者,也是首位发明圆饼图(Polar-areaCharts,或称为PieCharts),用来呈现统计数据比率的人。1858年,她获选为英国统计学会的第一位女性会员,不久又成为美国统计学会的荣誉会员。,6,统计学是收集、分析、解释与呈现数据资料的一门科学。医学统计学-是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门科学。,什么是统计学?,天气预报,生活中的统计数据,数据处理的工具和技能,同质与变异变量与变量值参数与统计量总体和样本概率误差,二、医学研究资料的统计处理

3、,(一)常用基本概念,(一)常用基本概念,同质与变异同质:被研究指标的影响因素相同。e.g.比较两种不同药物的降压效果。在医学研究中,对被观测指标有影响的可控制的非实验因素达到相同或基本相同就可认为是同质。同质性是构成研究总体的必备条件;研究内容不同,对同质性的要求不同;,制定血红蛋白参考值范围时:,制定白细胞参考值范围时:,同质与变异变异(variation)是指在同质的基础上各观察单位(或个体)之间的差异。e.g.同为20岁健康男大学生,身高有高有矮、体重有重有轻,这种差异就是变异。,不可控因素作用下所产生的一种综合表现。结果是随机的。个体变异是普遍存在的。个体变异是有规律的。没有个体变异

4、,就没有统计学!,(一)常用基本概念,变量及变量值变量是指观察单位的某项特征或指标。e.g.人的年龄、性别、身高、体重等。变量值是变量的观察结果。e.g.定性结果:男、女;已婚、未婚定量结果:厘米、千克,(一)常用基本概念,(一)常用基本概念,总体和样本总体是根据研究目的确定的同质观察单位某种变量值的集合。有限总体:调查某地成年女性红细胞数。无限总体:调查A厂30岁成年女性红细胞数。样本是指在研究总体中随机抽出一部分个体进行观察或测量,这些个体的测量值构成的集合。挪威统计学家凯尔(A.N.Kiaer),1895年提出抽样调查。,参数与统计量描述总体特征的有关指标,称为参数。未知的,固有的,不变

5、的!反映样本特性的有关指标,称为统计量。已知的,变化的,有误差的!,(一)常用基本概念,平均身高,总体,样本,平均身高,总体参数,样本统计量,概率又称机率。是描述事件发生可能性大小的一个度量,常用P来表示,取值范围为0P1。,(一)常用基本概念,1.不可能事件:P=02.必然事件:P=13.随机事件:0P1,随机机会均等随机抽样有相同的机会被抽到随机分组有相同的机会被分到不同的组中实验顺序随机先后接受处理的机会相同,(一)常用基本概念,抛硬币试验在概率的统计学定义上的诠释,(一)常用基本概念,当观察次数n越来越大,频率f的随机波动幅度越来越小,并最终趋向于一个常数:随机事件A发生的概率。频率:

6、用随机事件A发生表示观察到某个可能的结果,则在n次观察中,其中有m次随机事件A发生了,则称A发生的比例为频率。显然有。,(一)常用基本概念,小概率原理当某事件发生的概率P0.05或P0.01时,统计学上称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生,此即为小概率原理。小概率原理是进行统计推断的依据。,(一)常用基本概念,小概率原理,小概率事件在一次试验中认为是不会发生的。,误差指实际测量值与真实什之差。,(一)常用基本概念,1.系统误差:P=0可避免2.随机测量误差:P=1不可避免,可控3.抽样误差:0P1不可避免,不可控,1.系统误差:P=0可避免2.

7、随机测量误差:P=1不可避免,可控3.抽样误差:0P1不可避免,不可控,(一)常用基本概念,抽样误差指由抽样引起的样本统计量与总体参数间的差别。原因:个体差异抽样表现:样本统计量与总体参数间的差别不同样本统计量间的差别抽样误差是有规律的!,数值变量资料分类变量资料,(二)医学统计资料的类型,无序多分类有序多分类(等级资料),二分类多分类,二分类多分类,无序多分类有序多分类(等级资料),无序多分类有序多分类(等级资料),二分类多分类,无序多分类有序多分类(等级资料),数值变量资料以定量方法表达每个观察单位的某项观察指标,又称定量资料或计量资料。变量值是固定的,有度量衡单位:cm、kg、kPa特征

8、数据间有连续性:体重55kg60kg统计描述指标有统计推断方法:t检验、u检验、方差分析、相关回归,(二)医学统计资料的类型,集中趋势:平均数离散趋势:标准差,分类变量资料将观察单位按某种属性来分类计数的资料,亦称定性或计数资料。数据为整数,无度量衡单位特征统计描述指标常用相对数:率、构成比、相对比统计推断方法:u检验、X2检验分类,(二)医学统计资料的类型,二分类:有效、无效;阴性、阳性多分类:血型:A、B、O、AB,无序多分类有序多分类:(等级资料),治愈、好转、无效、死亡;、,观察单位observations个体individuals,变量variables,Quantitativeda

9、ta计量资料,Qualitativedata计数资料,Units;elements,三类资料间关系,例:一组2040岁成年人的血压,以12kPa为界分为正常与异常两组,统计每组例数,60,60平均存活天数?(一)中位数(median)是将每个变量值从小到大排列,位置居于中间的那个变量值。,计算,公式:n为奇数时n为偶数时,例2-39名中学生甲型肝炎的潜伏期分别为12,13,14,14,15,15,15,17,19天,求其中位数。,频数表资料的中位数,下限值L,上限值U,i;fm,中位数M,例21频数表中位数的计算,Nf,中位数71+3x(130 x50%59)/2671.69,应用,1、各种分

10、布类型的资料2、特别适合大样本偏态分布资料或者一端或两端无确切数值的资料。,百分位数示意图,(二)百分位数(percentile),1直接计算法,设有n个原始数据从小到大排列,第X百分位数的计算公式为:当为带有小数位时:当为整数时:,Trunc()取整函数,例对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大排列如下,试求第5百分位数和第99百分位数。,患者:住院天数:(1)n=120,为整数:,(2),带有小数,故取整trunc(118.8)=118,患者:住院天数:,2频数表法,公式:,当时,公式(2-9)即为中位数的计算公式,例2-9试分别求例21频数表的第25、第7

11、5百分位数。,P2565+3x(130 x25%19)/1565.90P7574+3x(130 x75%85)/1974.66,众数(mode),众数是一组观察值中出现频率最高的那个观察值;若为分组资料,众数则是出现频率最高的那个组段的组中值。适用于大样本;较粗糙。例2-7有16例高血压病人的发病年龄(岁)为:42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,试求众数。,众数(mode),众数是一组观察值中出现频率最高的那个观察值;若为分组资料,众数则是出现频率最高的那个组段的组中值。适用于大样本;较粗糙。例2-7有16例高血压病人的发病年龄(岁)为:42,45,48,51,52,54,55,55,58,58,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论