医学统计学基本概念_第1页
医学统计学基本概念_第2页
医学统计学基本概念_第3页
医学统计学基本概念_第4页
医学统计学基本概念_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、卫 生 统 计 学 health statistics 数学教研室 XX学院公共卫生系 卫生统计学卫生统计学 人民卫生出版社 第6版 “ 统计是20世纪对人类社会贡献最大 的四大学科之一”。 引 言 为什么? ?当今社会(时代)被称为信息社会. ?信息社会的主要特征: 信息在各个领域的重要性; 信息数量庞大; 信息处理和传输迅速 ?统计在信息社会中的重要作用: 提供搜集信息的理论方法; 提供加工处理信息的理论方法; 提供分析信息的理论方法. 引 言 某杂志中一篇文章报导,用某种中草药治疗玫瑰糠疹,有效率为7878,平均疗程为三周左右。问此药治疗玫瑰糠疹的确有效吗? 由于玫瑰糠疹具有自然治愈的情

2、况,一般不服药,多喝水,到三周左右有些患者也会自愈。所以,此药的 78疗效有待探讨。这就要求设立具有可比性的对照组。 某医生用两种降血脂药物治疗高血脂患者,用A药治疗20人,其中15人(75%)有效,用B药治疗20人,其中17人(85%)有效,能否根据这个结果推断B药优于A药?如果各治疗 100个患者,B药的有效人数是否仍高于 A药的有效人数?若治疗更多的人,结果是否会改变吗?改变的可能性有多大?对于这些问题的推断需用统计学的方法进行统计分析才能得出相应结论。 样本含量的估计 假设检验 统计学是一门以 社会现象总体数量方面为对象的方法论科学。是运用概率论和数理统计的 原理和方法研究如何有效地收

3、集、整理和分析受随机影响的数据,并对所考察的问题作出 推断或预测,直至为采取决策和行动提供 依据和建议的一门学科。 用数量反映质量: 体格检查(量血压、脉搏) 个体健康质量; 考试分数个体学习质量; 期望寿命反映人群健康状况的指标; 婴儿死亡率反映卫生服务质量的指标。 统计学是一门关于数据的科学,只要研究和分析数据,就要用到统计学;统计又是一种重要的分类手段,只要有分类的问题,就要用到统计学。 几乎所有学科都要研究和分析数据,也几乎所有学科都要进行分类,因而统计学与几乎所有学科都有或多或少的联系。 各种事物所具有的内在数量规律性都可以借助统计方法加以探索。但统计方法只是帮助其他学科探索内在的数

4、量规律性,而这种数量规律性的解释只能由各学科的研究完成。 理论统计 应用统计 统计学的类型 1.是关于数据的搜集、整理和分析的最基本的原理、原则和方法。 2.适用于各种现象数量特征的分析研究。它是应用统计学共同的理论基础。 运用于某一特定领域的统计理论和方法。 应用 统计学 经济学经济学 管理学管理学 医学医学 工程学 社会学 工商管理、会计审计 金融学 医学统计学 卫生统计学 生物统计学生物统计学 什么是 卫生统计学? 卫生统计学(health statistics) 就是运用概率 论和数理统计的原理和方法并结合医学实践来研究医 学资料的搜集、整理、分析与推断的一门学科。 卫生统计学主要包括

5、三方面的内容: 1)卫生统计学的基本原理和方法; 2)健康统计; 3)卫生服务统计。 医学人 口统计、疾 病统计、生 长发育统计 卫生资源利用、 医疗卫生服务的需 求、医疗保健体制改 革等方面的统计学问 题 一、卫生统计学的定义和内容 第一章 绪 论 ?理论基础:概率论与数理统计的原理和方法。 ?研究对象:生命科学领域中 随机现象。 ?研究方法:科学设计、资料搜集、整理、综合归纳、表达及分析发现随机现象背后隐藏的 统计学规律。 统计学概念的含义统计学概念的含义 统计学:处理数据中 变异性的科学与艺术。 目的:求得可靠的结果。 统计学的现实地位:科研合作、审稿、基金申请、 药物开发与申报、卫生决

6、策。 数理统计数理统计 : :是以概率论为基础的描述偶然性现是以概率论为基础的描述偶然性现象内部隐藏着的数量关系的一种分析方法。 数理统计和概率论是研究 随机现象的统计规律性。 概率:是随机事件发生的可能性大小。 在每次试验或观测之前不能确切预料将出现什么结果,这样的现象叫做 随机现象。 随机现象有没有规律性呢?从表面上看,随机现象似乎是一种没有规律性的现象,其实不然。对随机现象作大量的观测时,就发现它有某种明显的规律性。 随机现象有两个主要特征: 随机性:即它的发生是随机的; 规律性:即它每次发生可能性的大小是可以度量。 出现正面和反面的概率各为 1/2 。 抛掷一枚硬币发生正面朝上的试验记

7、录 医学研究医学研究对象对象主要是人体以及影响人相关的主要是人体以及影响人相关的各种因素。由于生物体普遍存在着变异性,加之各种影响因素又错综复杂,只有掌握好医学统计方法,紧密结合本专业的特点,运用医学统计方法这个“工具”,收集、整理呈数量关系的各种“现象”,消除或把误差控制在最低限度才能透过偶然现象寻求其规律性,才能分析推断出新的论点或新的学说。论点或新的学说。 如对同一种药物或同一种疗法,在一组或一群病人(生物体)可以产生不同的反应,甚至同一个体在不同时间重复做同一实验,每次反应也不尽相同。只有借助于医学统计方法,合理的安排试验,正确处理分析数据,就能得出比较可靠的科学结论;如果盲目试验和主

8、观分析,就得不出正确的结论,或者是对一些实际有效的药物或疗效做出无效的结论。 *二、统计学基本概二、统计学基本概念念 1. 总体与样本 2. 同质与变异 3. 参数与统计量 4. 误差 5. 概率 1. 总体与样本总体与样本 population and sample 总体:根据研究目的确定的同质研究对象的全体(集合)。分有限总体与无限总体 随机抽样 从总体中抽取一部分个体时,若每一个体都有同等的机会被抽中,则称之为随机抽样,如抽签法,随机数字表法等。 1. 总体与样本总体与样本 population and sample 样本:用随机抽样的方法从总体中抽出的、 有代表性的一部分个体称为样本,

9、 总体 银川市12岁健康 男生身高 样本 n=120 随机抽样 为了保证样本的可靠性和代表性,需要采用随机的抽样方法 推 断 在总体中随机抽取样本时要注意以下几点: 一是样本与总体的同质性,这是保证样本的可靠性。 二是抽取样本必须遵守随机化原则,即每个被抽取到的观察单位都有同等的机会被抽取。这是保证样本的代表性。 三是保证样本足够的含量,样本含量没有严格的规定,有的抽取几例就可以了,有的可能要几万例,这就要视研究问题的性质和研究者的要求而定。 四是控制误差 总体 样本 抽取部分观察单位 特 征 特 征 推断inference 实际工作中,经常是用掌握的总体中的一 部分资料(即一个样本),来推测

10、或说明总体。 如用一滴血代表一个人的血型,用若干部分水 样推测整个江河的水质,用若干样本的疗效 估计总体病人疗效等。 同质同质(homogeneity) 是针对被研究指标来讲,其影响因素相同。简单地理解同质就是指对研究指标影响较大的,可以控制的主要因素应尽可能相同。如研究方法相同,观察时间相等,以及民族、地区、年龄、性别等客观条件一致。 2. 同质与变异 统计学研究的任务:就是在同质分组的基础上,通过对个体变异的研究,透过偶然现象,反映同质事物的本质特征和规律。 同质同质基础上的个体差异称为变异(variation)。如一组同年龄、同性别、同民族、同地区儿童的身高值各不相同。 同质与变异的例子

11、 ?例 调查2003 年西安市7岁男童身高和体重 同质:2003 年、西安市、7岁男童 变异:身高和体重各不相同 ?例 研究某降压药的疗效 同质:高血压患者、用某药治疗 变异:疗效各不相同 例如:调查某地例如:调查某地2002年年1000人正常成年男子的红细 胞数的正常值范围。 总体:某地所有的正常成年男子的红细胞数总体:某地所有的正常成年男子的红细胞数 同质:同某地、同同质:同某地、同2002年、同成年男子、同正常。 变异:某地正常男子每个人的红细胞数值 变量:红细胞数 个体:某地正常男子每个人的红细胞数 样本:某地样本:某地1000人正常成年男子的红细胞数 总体、样本、个体、同质、变异、变

12、量? 3. 参数与统计量参数与统计量 parameter and statistic 参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为、。固定的常数 总体 样本 抽取部分观察单位 统计量 参 数 推断inference 统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为 。 参数附近波动的随机变量 。 SX、 总体参数是固定的常数,统计量是在总体参数 附近波动的随机变量。 4. 误差 error 误差:误差(error)指实际观察值与客 观真实值之差、样本指标与总体 指标之差。 (1)系统误差 (2)随机误差 误差可分为: 测量值=真值+随机误差+非随机误差 系统误

13、差与随机误差的区别系统误差与随机误差的区别 这是由于许多无法控制的内在和外在的偶然因素如试验的初始条件、培养条件、管理措施等尽管在试验中力求一致但不可能绝对一致所造成。随机误差带有偶然性质,在试验中,即使十分小心也难以消除。随机误差影响试验的精确性。统计上的试验误差指随机误差。这种误差愈小,试验的精确性愈高。 抽样误差是统计学中的重要概念。在抽样研究中 是不可避免的。产生抽样误差的根本原因是个体间存 在的变异性。 5. 概率 probability 确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫必然事件;肯定不发生某种结果的叫不可能事件。

14、随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件。 随机事件的特征:随机性;规律性:每次发生的可能性的大小是确定的。 概率:随机事件发生的可能性大小,用大写的P表示;取值0,1。 概率(probability)又称几率,是度量某一随机事件A 发 生可能性大小的一个数值,记为P(A)。0P(A)1。 必然事件 P = 1 不可能事件 P = 0 随机事件 0 P 1 P 0.05(5)或P 0.01(1) 称为小概率事件(习惯),统计学上认为不大可能发生。 小概率事件 样本的实际发生率称为 频率。设在相同条件 下,独立重复进行n次试验,事件

15、A出现m次,则事 件A出现的频率为m/ n。 频率 frequency frequency 频率与概率间的关系: ? 样本频率总是围绕概率上下波动 ? 样本含量n越大,波动幅度越小,频率越接近概率。当试验重复很多次时P(A)= = m/n。 *三、 医学统计资料类型及工作的步骤 (一)医学统计资料类型 1.变量 2.资料类型 (1)计量资料 (2)计数资料 (3)等级资料 3.三类资料间关系 观察单位(个体)的某项特征称为变量 (variable)。 变量的观察结果(测得值)称为变量值 (value of variable)亦称为资料资料。 1.1.变量变量 在医学研究中,绝大多数观察 (测量

16、)指标在观察前是无法知道结果的,即观察结果是随机的。这种观察(测量)指标称为随机变量(random variable),在医学统计书中经常简称为变量。随机变量可以分为 连续型变量(continuous variable) 和离散型变量(discrete variable) 。 1)连续型变量(continuous variable) :即连续变 化的变量,其取值是数轴上某一区间内的一切数值,理论上它们是无限可分的。如身高、体重 2) 离散型变量(discrete variable) :其取值是0, 1,2等不连续的量,是数轴上有限或无限的可数的 值,两个数之间没有小数。如 年新生儿数、月手术

17、病人数 变量可分为以下类型: 变量可分为以下类型: (1)定量变量(quantitative variable) 也称为 数值变量,其变量值是定量的,所获资料为 计量资料。 即对每一个观察对象用定量的方法测定某项指标量的 大小。有度量衡单位。 如:患者身高(cm)、体重(kg)、血压(mmHg)、 脉搏(次/分)、红细胞计数( 10/L) 1) 分类变量(categorical variable) : 也称为计数资料,将观察单位按某种属性或类别分组,然后清点数目所得各组的观察单位数。 多项分类:观察结果表现为互不相容的多个 属性或类别 。 (2)定性变量 无序分类 二项分类:两类观察结果互相对

18、立。 如性别,近视眼(X=1表示)、不是近视眼(X=0表示)。 如职业、血型(A、B、AB和O型)。 这种汇总后的资料又可称为计数资料, 有序分类(ordinal categories) 变量取值不仅表示互不相容的类别而且表示各类在研究背景意义下的等级顺序,因此具有“半定量”意义。所以观察有序分类变量所得资料又称为等级资料。例如,患者治疗的可能结果有治愈、好转、有效、无效或者死亡。从治疗效果评价的角度上考察,这些分类是优劣等级的区别,因此这样的资料是有序分类的。 2) 有序变量(ordinal variable): 也称为等级资料,将观察单位按某种属性的 不同程度不同程度分组,然后清点各组数目

19、,但所分各组之间有等级顺序。 (有序分类) 住院号 年龄 身高 体重 住院天数 职业 文化程度 分娩方式 妊娠结局 2025655 27 165 71.5 5 无 中学 顺产 足月 2025653 22 160 74.0 5 无 小学 助产 足月 2025830 25 158 68.0 6 管理员 大学 顺产 足月 2022543 23 161 69.0 5 无 中学 剖宫产 足月 2022466 25 159 62.0 11 商业 中学 剖宫产 足月 2024535 27 157 68.0 2 无 小学 顺产 早产 2025834 20 158 66.0 4 无 中学 助产 早产 20194

20、64 24 158 70.5 3 无 中学 助产 足月 2025783 29 154 57.0 7 干部 中学 剖宫产 足月 观察单位observations 个体individuals 变量variables Quantitative data 计量资料 Qualitative data 计数资料 (1)定量资料(计量资料) (2)定性资料(分类资料) 1)二项分类(无序分类) (计数资料) 2)多项分类 无序多分类 有序多分类 (等级资料) 无序分类:如性别、职业、血型等; 有序分类:如血清反应、疗效划分等。 2.资料的类型 等级是主观划分的,各级没有大小但有秩序, 必须从低到高或由高到低

21、;级和级之间界限模糊, 可能错判。 (1) 计量资料 特点:定量的,有单位的,表示为数值的大小。 如:患者身高(cm)、体重(kg)、血压(mmHg )、脉搏(次/分)、红细胞计数( 10/L) (2) 计数资料 特点:变量值是定性的,没有单位,表示为相互独立的类别。 如:肤色、血型、职业、性别 (3) 等级资料 癌症分期:早、中、晚。 药物疗效:治愈、好转、无效、死亡。 尿蛋白: ?,?,?,+,+及以上 特点:各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。 3.3.三类资料间区别三类资料间区别 等级资料与计数资料不同: 属性分组有程度差别,各组按大小顺序排列。 等级资

22、料与计量资料不同: 每个观察单位未确切定量,故亦称为半计量资料。 计数资料与计量资料不同: 定量的,有单位的,表示为数值的大小。 变量值是定性的,没有单位,表示为相互独立的类别。100名高血压患者治疗后的临床记录名高血压患者治疗后的临床记录 患者 编号 年龄 (岁) 性别 治疗 分组 收缩压 (kPa) 舒张压 (kPa) 心电图 疗效 评定 变量(名) 1 37 男 A药 18.67 11.47 正常 显效 2 45 女 对照 20.00 12.53 正常 有效 变量值 3 43 男 B药 17.33 10.93 正常 有效 (观察值) 4 59 女 对照 22.67 14.67 异常 无效

23、 100 54 女 B药 16.80 11.73 正常 有效 连续 离散 离散 连续 连续 离散 有序 变量类别 连续型变量与计量资料; ;离散型变量与计数资料; ;有序变量与等级资料. . 4. 三类资料间关系 例:一组20?40岁成年人的血压 以12kPa为界分为正常与异常两组,统计每组例数 8 低血压 8? 正常血压 12? 轻度高血压 15? 中度高血压 17? 重度高血压 计量资料 等级资料 计数资料 定量变量、分类变量和有序变量可以相互转换是否正确,为什么? 一种类型的变量转化为另一种类型,只能由高级向低级转化。 连续型 有 序 二 值 分 类 离散型变量常常通过适当的变换或连续性

24、校正后借用连续性变量和有序变量的方法来分析。 资料的类型 定量资料(计量资料) 定性资料 (分类资料) 计数资料(二项分类 、无序多分类)等级资料(有序多分类 ) 变量的类型 定量变量(数值变量) 连续型变量 离散型变量 定性变量 分类变量(二项分类 、无序多分类) 有序变量(有序多分类 ) 无序分类:如性别、职业、血型等; 有序分类:如血清反应、疗效划分等。计量资料: 变量值是定量的,有单位的,表示为数值的大小。 计数资料: 变量值是定性的,没有单位,表示为互不相容的类别。等级资料: 变量取值不仅表示互不相容的类别而且表示各类的不 同程度的等级顺序, 基本步骤 设计 搜集资料 整理资料 分析

25、资料 调查设计 实验设计 (二)(二)医学统计工作的步骤医学统计工作的步骤 统计工作是人们为了说明所研究对象的某种数量特征和数量规律性,而对该现象的数据进行收集、整理与分析的活动过程。 统计设计(design) 要对所作工作的全过程有一个全面的设想,明 确研究的目的,对研究的事物有一定的了解(可以确研究的目的,对研究的事物有一定的了解(可以 通过查阅文献资料或作预试验来实现)。如:要研通过查阅文献资料或作预试验来实现)。如:要研 究什么?收集什么资料?如何收集?人力财力条件究什么?收集什么资料?如何收集?人力财力条件 可否?观察对象和观察单位是什么?怎样汇总资可否?观察对象和观察单位是什么?怎

26、样汇总资 料?计算哪些统计指标?样本例数是多少?预期结 果怎样?果怎样? 是对整个研究过程的总设想或总按排,是最关 键的一步,也是最重要的一步。 统计工作的三个中心阶段统计工作的三个中心阶段 搜集资料 整理资料 分析资料 有组织、 有计划地 搜集资料。 要求:准确、 完整、及时 对调查资料 去伪存真、 去粗取精、 科学分类、 浓缩简化 描述性分析 推断分析、 决策分析。 要求:定性 定量结合 收集资料 任务:按研究设计的要求,及时取得准确、完整的原始数据。 3)专题调查:实验研究,调查研究等。 医学统计资料的来源主要有三个方面: 1)统计报表:如传染病报表、职业病报表、医 院工作年报表等,报表

27、应做到完整、准确、及时。 2)经常性工作记录 :如医院的病历,各种化验 单,检测单,出生、死亡登记卡。 统计数据的收集方法统计数据的收集方法 一、问卷调查 二、普查法 三、抽样调查 四、典型调查 五、观察法 六、实验法 七、集体访谈法 整理资料 主要任务 资料审核、分组、 汇总、制表、制图等。 分组 频数分布 统计表 统计图 3. 按照分组要求设计整理表,进行汇总 1)质量分组 :将观察单位按某种 属性或类别分组,适用于定性资料。 2)数量分组 :将观察单位按变量值 的大小分组,适用于定量资料。 2. 设计分组 任务:按研究设计的要求,使原始数据系统化、条理化,便 于进一步计算统计指标和进行统

28、计分析。 资料整理的过程: 1. 检查和核对搜集到的数据和资料 设计分组设计分组 质量分组 数量分组 计数资料、等级资料 计量资料 按事物的性质、特征或类型分组,如疾病分类、死因分类,病人按性别、职业、工种分类。疾病或病情按轻、中、重分组,疗效按治愈、好转、死亡分组等。特点是同质、组间界限划分明确。 按观察单位的数量大小来分组,如年龄、血压、脉搏、时间、身高、体重等。特点是从量的变化分析事物的差别和规律。数量分组的粗细及组数的多少,以能说明资料的规律性为准,还必须注意到习惯分组法。 整理资料的基本方法是根据资料的特性将其整理成统计表、绘制成统计图。通过统计表、图可以大致看到所得资料集中、离散的

29、情况。并利用所收集得来的数据计算出几个统计量,以表示该资料的数量特征。 统 计 描 述 任务任务:按研究设计的要求,计算有关指标,阐明事物按研究设计的要求,计算有关指标,阐明事物的内在关系和规律。的内在关系和规律。 分析资料 统计描述:指由统计指标、统计表、 统计图等方法,对资料的数量特征 及分布规律进行测定和描述,不涉 及由样本推论总体的问题。 统计推断:指如何抽样,以及如何由 样本信息推论总体特征。 分析资料(analysis of data) 分析资料 统计描述包括两个方面: 集中趋势的描述 和离散趋势的描述 科学研究的基本程序 ?提出一个欲待研究的问题 (发现问题或选题) ?科学研究设

30、计(专业设计和统计设计) ?获取试验与观察的资料 (搜集资料) ?数据审核与计算机录入 (整理资料) ?分析资料(描述性统计和统计推断 ) ?分析结果的合理解释 (专业结论) 上一页 下一页 四、统计学的主要内容四、统计学的主要内容 统 计 方 法 调查和实验设计 抽样设计与方法 描述统计 推断统计 医学统计软件应用 上一页 下一页 描述统计的主要方法描述统计的主要方法 描 述 统 计 方 法 集中量数: 描述集中趋势 差异量数: 描述离散程度 相关系数: 描述关系程度 偏态系数 峰态系数 特征值 统计表 统计图 次数分布图, 如直方图 发展趋势折线图 相关散点图 返回 上一页 下一页 推断统

31、计的主要内容推断统计的主要内容 推 断 统 计 返回 参数估计 假设检验 点估计 置信区间估计 均数差异显著性检验 率差异显著性检验 变量间关系显著性检验 医学统计学是医学生的必修课。根据不同专业的特点,相应的课时数可能有所增减。但无论是预防医学专业的学生、临床医学专业的学生或其他医学专业的学生都将会在今后从事医学研究和实际工作中遇到各种各样的医学统计问题,因此掌握必要的医学统计学知识是适应今后工作的一种基本要求。 为此,在学习本课程时,应注意: 五、学习医学统计学应注意的问题五、学习医学统计学应注意的问题 1、医学统计学研究的是 群体的数量特征 适当的统计指标 2、学会统计学的思维方法 抽样

32、研究抽样误差结论具有概率性 医学专业知识解释 3、正确选用统计学方法 (1)资料类型不同统计学方法不同 (2)设计类型不同统计学方法不同 (3)研究目的不同统计学方法不同 . ?4、不管公式来源、推导,只要求了解其意义、用途和应用条件。 举例:1)看电视,知道开、关就行。 2)牛吃的是草,挤出来的是牛奶。 ? ? 数据 结果 我们应当清醒地认识道,运用统计方法推导出来的结论是否可靠,关键取决于以下几个方面: 调查或试验设计是否周密完善、是否按设计要求进行实施; 所选用的指标是否特异性和客观性强、灵敏度和精确度高;数据是否真实可靠、样本含量是否足够大;所选用的统计方法是否妥当;结果的解释是否正确。因为在运用统计学的全过程中,稍有不慎,就有可能犯统计学上的错误,它们分别产生于试验设计、数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论