医学统计中的基本概念.ppt_第1页
医学统计中的基本概念.ppt_第2页
医学统计中的基本概念.ppt_第3页
医学统计中的基本概念.ppt_第4页
医学统计中的基本概念.ppt_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,医 学 统 计 学,Medical Statistics,授课教师:林莉萍,2,第一章 医学统计中的基本概念,3,一、统计学 (statistics),统计学是研究数据的搜集、整理与分析的科学,面对不确定性数据作出科学推断。,第一节 绪论,4,二、医学统计学,医学统计学是研究数据的搜集、整理、分析与推断的科学。是把统计理论方法应用于居民健康状况研究、医疗卫生实践和医学科研的一门应用性学科。 医学统计学广泛地应用于基础医学、临床医学、预防医学和卫生事业管理等领域。,5,第二节 医学统计工作中的基本概念,6,举例: 比较两种不同的治疗方法(如西药与中药)对高血压的控制情况。 药物是实验因素,性别、年龄等为非试验因素,血压是观测指标。,一、 同质和变异(homogeneity and variation ),7,观察单位(observation unit):亦称个体(individual) 是统计研究中最基本的单位,它可以是一个人、一个家庭、一个地区、一个样品等。 严格地讲,除了实验因素外,影响被研究指标的非实验因素(容易控制的)相同被称为同质。 在同质的基础上被观察个体(或单位)之间的差异被称作变异(variation) ,亦称为个体差异。 变异是由众多的、偶然的、次要的因素造成的。,8,变量:被观察对象的特征或指标称为变量。 (习惯上称指标) 变量值: 也称观察值 (observed value, measurements) 是变量的观察结果 可以是定量的如:身高、体重血压等; 亦可以是定性的如性别、血型、疗效等),变量及变量值(variable and value of variable ),被观察对象的 年龄、体重、血压 性别、种族 文化程度等,9,1、总体(Population) 是指根据研究目的所确定的同质研究对象的全体。更确切地说是同质的所有观察单位某种观察值(变量值)的集合。分有限总体与无限总体。,二、总体与样本,有限总体(finite population): 研究对象的个体数目是有限的总体。 无限总体(infinite population): 研究对象的个体数目不确定或无限多。,10,2、样本(Sample) 是指从总体中随机抽取的一部分观察单位。 样本含量(Sample size)医学上称为样本例数 是指样本包含的个体的数目,用“n”表示。 而总体中包含的个体的数目,用“N”表示。,11,三、抽样(Sampling),从总体中抽取部分个体的过程,即为抽样。 随机抽样(random sampling) 是指在抽样的过程中,遵循随机化原则。 随机化原则: 要求总体中每一个个体都有相等的被选机会进入样本。 随机抽样的优点: 避免抽样过程中人为因素(如:主观意愿或客观无意识)的影响,保证样本的代表性。,12, 样本的特性,1.随机性(randomization): 遵循随机化原则。(随机随意随便) 2.代表性(representative): 样本中的每个个体来自同一总体。 3.可靠性(reliability): 所作的结论可信度较高,样本含量“足够” 。 4.可比性(comparable): 遵循齐同对比的原则。,13,各 种 抽 样 方 法 的 特 点,简单随机抽样(simple random sampling): 最基本的抽样方法。 系统抽样(systematic sampling) : 又称等距抽样。 分层抽样(stratified sampling ): 层(strata)间差异大,层内差异小。 整群抽样(cluster sampling ): 群间差异小,群内差异大。,抽样误差的大小: 分层抽样系统抽样简单随机抽样整群抽样,14,四、实验设计,1.完全随机设计(completely random design): 是将受试对象随机分配到各个处理组或对照组中。可以是两样本比较,也可以是多样本比较;各样本含量可以相等,也可以不等,但不宜差别太大。 2.配对设计(matching design): 是将受试对象按一定条件配成对子,将他们随机分到两个组中,分别给予不同的处理。配对条件是指有可能影响实验效应的非主要因素。 3.随机区组设计(random blockdesign ): 亦称为配伍组设计,它是配对设计的扩展。每个配伍组包含多个受试对象,将它们分别随机分到各处理组。,15,五、误差(error),统计上所说的误差泛指实测值与真值之差, 以及样本指标与总体指标之差。 抽样误差是指由抽样引起的某指标的样本统计量(如样本均数)与该指标的总体参数(如总体均数)的差异。,16,(1)系统误差 ( system error ) 是由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因使测量结果呈倾向性偏大或偏小。 特点: 有倾向性 可避免,(2)随机测量误差 (random measurement error) 由于偶然因素(如操作技术不稳定、不同操作员之间的操作差异、电压不稳、环境温度差异等)的影响所 致的误差。 特点:无倾向性 不可避免,(3)抽样误差(sampling error) 由于抽样所致的样本统计量与总体 参数的差异。 原因:总体中的个体之间存在变异 (个体差异)。 特点: 无倾向性 不可避免,17,六、概率与频率,频数(frequency):是指在试验中某事件发生的次数。 事件实际发生次数( ) 频率 = 可能发生(试验)总次数(N ),1、频率,18,2、概率(probability): 是指某事件发生的可能性大小。用“P ”表示。 P的取值范围:0P1 P=0 不可能事件(事件必不发生) P=1 必然事件(事件必发生) 小概率事件: P 0.05(5)或P 0.01(1)称为小概率事件(习惯),统计学上认为不大可能发生。 随着实验次数增至足够大,频率逐渐稳定于某一常数附近,则该常数称之为概率。,19,第三节 医学统计工作的内容和资料类型,20,一、资料的类型(变量类别),1、计量资料 (数值变量 numerical variable ) 2、计数资料 (无序分类变量 unordered categories variable ) 3、等级资料 (有序分类变量 ordinal categories variable ),21,1、计量资料(measurement data) 定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。 特点: 取值是定量的 表现为数值大小 有度量衡单位(计量单位) 变量值是连续的 如:身高、红细胞计数、血压等,22,2、计数资料(enumeration data) 定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。 特点: 取值是定性的(无度量衡单位计量单位) 多为间断性资料 数据分类互相排斥(互不相容) 数据分类无逻辑顺序 可分二项分类和多项分类 如:性别、血型等,23,3、等级资料(ordinal data) 定义:是介于计量资料和计数资料之间的一种资料,通 过半定量方法测量得到。 特点: 取值是定性的(无度量衡单位计量单位) 数据分类互相排斥 分类等级有定量含义 (又称为半定量资料) 数据分类有程度上的差别 (等级顺序关系) 多为间断性资料 如:疗效(痊愈、好转、无效、死亡) 尿蛋白(-、+、+、+、+)等,24, 资料间的转化 在实际应用中,根据分析的需要,各类变量间可以互相转化。例如: 血红蛋白 正常 重度贫血 (16.0g% ) 计量资料计数资料等级资料,25,二、医学统计工作的内容,26,1、 统计设计 设计 (design) 是根据研究的目的,对研究工作的全过程作一个全面的规划,制定总的研究方案,是统计工作中最关键的一步。,设计,实验设计,调查设计,27,2、收集资料(collection data): 是根据研究目的及实验设计的要求,收集准确的、完整的、充满信息的原始资料(raw data )。 收集资料是统计工作的前题和基础。,任务:取得准确可靠的原始数据,28, 医疗卫生 工作记录和报告, 专题调查 或试验研究, 统计报表(报告卡),经常性资料,一时性资料,(1)资料的来源,29,(2)资料的要求,必须完整、及时、正确 要有足够的数量 注意资料的 代表性和可比性,30,3、整理资料(sorting data): 把搜集到的原始资料有目的地进行科学加工, 使资料条理化、系统化,便于进一步的统计分析。,首要工作: 进行数据审核(资料清理data cleaning ) 完整性检查:要求无缺项和漏项。 准确性检查:要求无逻辑错误, 无区间错误。,31,整理资料的步骤,(1)检查核对资料,(2)设 计 分 组,(3)资料列表划记归组,按质分组 (用于计数资料和等级资料),按量分组 ( 用于计量资料 ),32,4、分析资料(analysis data): 把经过统计整理的资料作一系列的描述性分析和推断性分析,从而阐明事物的规律性。 不同类型的资料使用的统计分析的方法不一样。,分析的关键: 依据资料的类型和特征,正确选择统计分析方法。,33,统计描述 descriptive statistics,统计推断 inferential statistics,分析资料 analysis of data,统计描述:是指用一些统计指标、统计图表等方法描述数据的分布特征和变化趋势。 统计推断:是指用调查、实验取得的样本信息估计总体特征。,34,基本概念和基本步骤测试题,35,1、计量资料、计数资料和等级资料的关系是:,A、计量资料兼有计数资料和等级资料的一些性质。 B、计数资料兼有计量资料和等级资料的一些性质。 C、等级资料兼有计量资料和计数资料的一些性质。 D、计数资料兼有计量资料的一些性质。 E、三者差别不大。,A型题,36,2、统计学中的系统误差、随机测量误差和抽样误差,在实际工作中是:,A、三种误差都不可避免 B、系统误差和测量误差不可避免 C、系统误差和抽样误差不可避免 D、随机测量误差和抽样误差不可避免 E、三种误差都可避免,A型题,37,3、抽样误差是指:,A、个体值和总体参数之差 B、个体值和样本统计量之差 C、样本统计量和总体参数之差 D、样本统计量和总体测量值之差 E、总体测量值和总体参数之差,A型题,38,4、在统计工作中,整理资料时首要工作是:,A、设计分组 B、拟整理表 C、检查资料 D、资料归组 E、计算全距,A型题,39,5、搞好统计工作,达到预期目的,最重要的是:,A、原始资料要多 B、原始资料要正确 C、整理资料要详细 D、分析资料要先进 E、统计计算精度要高,A型题,40,6、关于随机抽样,下列说法哪一项是正确的:,A、随机抽样即随意抽取个体 B、研究者在抽样时应精心挑选个体,以使样本更能代表总体 C、抽样时应使得总体中的所有个体有同等机会被抽取到 D、为确保样本具有更好的代表性,样本量应越大越好 E、随机抽样即随便抽样,A型题,41,7、统计学中所说的总体是指:,A、根据目的划分的研究对象的全体 B、根据地区划分的研究对象的全体 C、根据人群划分的研究对象的全体 D、根据研究目的确定的同质研究对象的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论