统计学绪论(初)课件_第1页
统计学绪论(初)课件_第2页
统计学绪论(初)课件_第3页
统计学绪论(初)课件_第4页
统计学绪论(初)课件_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学Medical Statistics2022/10/1第一章 绪论Introduction2022/10/1主要内容第一节 医学统计学的地位和作用第二节 统计学中几个基本概念第三节 计量资料的统计描述第四节 医学统计工作的基本步骤第一节 医学统计学的地位和作用当研发了一种治疗高血压病的新药,应该怎样评价该新药的疗效?患者 一组服用对照药一组服用新药观察疗效 然后分析该新药的有效性和安全性 统计学扮演什么角色? 在这个“临床试验”中有诸多问题需要回答:需要多少名患者参加试验?如何将患者分为两个组? 哪些措施可以保证两组患者除了接受不同药物治疗外,其他影响疗效的因素在两组的分布是一致的?

2、如果分布不一致,如何在诸多的影响因素中,分离出药物因素的效应? 据调查,柳叶刀(The Lancet)、新英格兰医学杂志(New England J. Medical)、美国医学杂志(JAMA) 、英国医学杂志(BritishJ.Medical)等著名医学杂志发表的文章中,有70%应用了统计学,而且杂志有统计学的常务编审。统计学能使数据变成信息“统计学是现代医学大厦的一个重要支柱”。 -美国医学会杂志(JAMA)主编数据 信息datainformation对统计学的一知半解常常造成不很必要的上当受骗对统计学的一概排斥往往造成不必要的愚昧无知-统计与真理 统计学是处理复杂问题的工具Francis

3、 Galton(1822.2.161911.1.17) “当人类科学探索者在问题的丛林中遇到难以逾越的障碍时,唯有统计工具可为其开辟一条前进的通道”。 -英国著名遗传学家Galton 变异(variation):由于个体结构和功能千差万别,机体反应受到各种自然和社会环境因素的影响和制约,对内外环境刺激的反应同样千差万别。个体差异是自然界普遍存在的现象。统计学将这种差异称为变异。 变异同样条件下对同一个体进行重复观测结果具有不确定性医学中充满了个体变异和不确定性。医学统计学:运用数理统计学的基本原理和方法来研究医学问题的一门学科,它包括了研究设计、数据收集、整理、分析以及分析结果的解释和表达。第

4、二节 统计学中几个基本概念(1)总体与样本(Population and sample)总体(population):所有同质观察单位某种观察值(即变量值)的全体。 样本(sample):总体中抽取部分观察单位的观测值的集合。 注意观察单位间的同质性是构成总体的必备条件,也是进行研究的基本前提。个体样本总体总体样本populationsampleindividual随机抽样样本中的个体总数称为样本量(sample size)。在抽样研究中,随机抽出一部分个体(每个个体都有同等的机会被抽取)进行观察或测量的过程称为随机抽样(random sampling)。总体随机随便(2)资料的类型(Type

5、 of data)根据是否定量化分为三种:(1)定量资料(quantitative data) 由定量变量组成的资料,如体重、身高。(2) 定性资料(qualitative data) 由分类变量组成的资料,如血型、职业。(3) 等级资料(ranked data) 由等级变量组成的资料,如疗效、心功能分级。1.计量资料(或定量变量) measurment data ,quantitative data,定义:测定每个观察单位的某项指标量的大小,所得的资料称为计量资料。其变量值是定量的,一般带有度量衡或其它单位。 特点:每个观察单位的观察值之间有量的区别。 某市110名健康男性工人的血红蛋白量(

6、g/L)11814815816313815613414015213214916516011917413715215414012213814813916816012015112114613515614913514813813315013215314014813514615813715314215511414713312713215513413813913114213514513414312814713714211913913114514115015212514714413116213814612114313014115012814215010712314314014014713014112615

7、1149140139140125147129149142154151 定义:将观察单位按某种属性或类别分组计数,分组汇总得到各组观察单位数称为计数资料。特点:计数排列是无序分组,同组各观察单位之间没有量的差别,但各组间有质的不同,各组互不相容。 二项分类和多项分类2.计数资料(或无序分类变量) enumeration data, unordered category data战期死亡人数存活人数合计第一战期281442第二战期71623第三战期121022合计474087各战期战士破伤风病死率比较 3.等级资料(或有序分类变量) ranked data, ordinal category da

8、ta 定义:将观察单位按某个指标量的大小分成等级或某种属性的不同程度分成等级后分组计数,分类汇总各组的观察单位数称为等级资料。 特点:等级是有序分组。同计数资料的区别是:属性的分组有程度的差别,各组按一定顺序排列;与计量资料的区别是:每个观察单位未确切定量,所以又称为半定量资料。资料的转化 根据分析的需要,计量资料、计数资料、等级资料可以进行转化。 血红蛋白(g/dl) 贫血程度 血红蛋白 6 重度贫血 异常 6 中度贫血 异常 9 轻度贫血 异常 1216 血红蛋白正常 正常 16 血红蛋白增高 异常 计量资料等级资料计数资料 但必须明确,凡能计量的,应尽可能采用计量资料;因为计量资料可以得

9、到较多的信息。计量计量计量计数计数计数等级等级某市110名健康男性工人的血红蛋白量(g/L)11814815816313815613414015213214916516011917413715215414012213814813916816012015112114613515614913514813813315013215314014813514615813715314215511414713312713215513413813913114213514513414312814713714211913913114514115015212514714413116213814612114313014

10、1150128142150107123143140140147130141126151149140139140125147129149142154151图2-1 110例健康男性工人血红蛋白量分布图2-2 某地192名健康人血铅值分布平均数指标平均数(average) 是描述一群同质变量值集中位置的特征值,用以说明同类现象或事物数量的中等水平(集中趋势)。常用指标:算术均数、中位数、众数等。 1. 定义:简称均数,符号为 (相应的总体均数记为)。定义公式为(一)算术均数(mean)算术均数适合于对称分布的资料,如分布均匀的小样本数据或近似正态分布的大样本数据;算术均数容易受极端值的影响。 2.

11、均数的应用与特点众数是指在一群观察值中,出现频率最高(即次数最多)的数据,用符号 Mo 表示。(二)众数(mode) 众数主要应用在对小样本的探索性数据进行分析将一组变量值按大小顺序排列,位次居中的变量值即为中位数。中位数将变量值一分为二,一半比它小,一半比它大。符号为M、Md。1. 中位数的计算(三)中位数(median) 2. 中位数的应用与特点中位数将频数等分为二,所以中位数适合各种类型的资料,尤其适合于大样本偏态分布的资料。由于中位数总处在居中的位置上,因而它不受特大或特小值的影响。 正 态 分 布 时:均数中位数众数正偏态分布时:均数 中位数 众数负偏态分布时:均数 中位数 众数百分

12、位数是一种位置指标, 它将一组变量值排列后划分为若干相等部分的分割点数值。符号为Px,常用的有四分位数。 分割点1 分割点2 分割点3四分位值1(Q1)四分位值2(Q2)四分位值3(Q3)(四)百分位数(percentile)例如:含量为n的样本,取第5百分位数P5,理论上有n5%的观察值比P5小,有n (100-5)%个观察值比P5大,由此可知百分位数是一个界值。2. 百分位数的应用与特点 百分位数不论资料分布类型均可计算,在实际工作中常用于确定医学参考值范围;在假设检验中用作拒绝或不拒绝检验假设的界值。 百分位数并非由全部观察值综合计算得来,因此,它不如均数和标准差精确;然而中间部分的百分

13、位数因不受资料中个别极端数据的影响,具有较好的稳定性。 同质事物或现象才能求平均数;要根据数据分布类型正确选用平均数; 在计算和应用平均数指标时的注意事项 变异指标又称离散指标,用以描述一组计量资料各观察值之间参差不齐的程度。变异指标越大,观察值之间差异愈大,说明平均数的代表性就越差;反之亦然。 变异指标 三组同性别、同年龄儿童体重甲组2628303234 乙组2427303336丙组2629303124丙组乙组甲组三组均数均为30一.极差极差(Range)是一批数据中最大值与最小值之差,反映了数据散布范围。二.四分位数间距 四分位数间距(Q)包括了全部变量值中居于中间水平的一半数据的分布范围

14、。 Q = P75 P25 缺点:比较稳定,但不能反映其余数据的变异情况,没有充分利用每个变量值的信息。 四分位数间距仅用来描述大样本偏态资料的变异情况。 Q三.方差与标准差方差(Variance)分为样本方差和总体方差。样本方差符号为 ,相应的总体方差符号为 。(一)方差的定义(二)标准差的定义标准差即为方差的平方根,样本标准差符号为s,相应的总体标准差符号为。 丙组乙组甲组 三组同性别、同年龄儿童体重甲组2628303234 乙组2427303336丙组2629303124 方差或标准差属同类变异指标,它们多用来描述均匀分布或近似正态分布的资料,大、小样本均可,其中以标准差的应用最广,通常与均数结合使用。比如在许多医学研究报告中常用 的形式表达资料。(三)方差与标准差的应用四. 平均数指标与变异指标的联系 与区别以及使用范围 均数与标准差:适用是均匀分布的小样本数据或近似正态分布数据,对样本含量没有要求。中位数与四分位数间距:适用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论