医学统计学概述 1_第1页
医学统计学概述 1_第2页
医学统计学概述 1_第3页
医学统计学概述 1_第4页
医学统计学概述 1_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二篇人群健康的研究方法第四章医学统计方法,杨永坚yyj580719,为什么要学习卫生统计学?,便于发现事物的规律从样本推断总体必须借助医学统计学方法医学科研设计离不开统计设计,卫生统计学学习方法,重点掌握统计学基本原理与方法理论联系实际多看医学专业文献,消化理论课的内容加强对统计公式的理解,不要死记重视实验课的学习,第一节概述一、医学统计学的研究对象和定义在概率论中,我们把观察到的所有的事物或现象称为事件。可以分为三类:必然事件:指在一定条件下结果一定会发生;不可能事件:即结果一定不会发生;随机事件:其结果可能发生也可能不发生。前两类事件的结果是一定的,而随机事件结果为不确定性的,如何对其不确定性结果进行科学判断,属于统计学的研究范畴,所以统计学的研究对象就是不确定性事物或现象。例如:同年龄同性别的人身高各不相同,如果不进行统计处理我们就很难对年龄与身高的关系进行描述。,统计学(statistics):是一门处理数据中变异性的科学与艺术,内容包括数据的收集、分析、解释和表达,目的是求得可靠的结果。医学统计学(medicalstatistics):就是运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。,二、医学统计学的内容主要内容包括医学研究中的统计设计和统计分析方法。1统计设计:医学研究设计包括专业设计和统计设计,统计设计贯穿于专业设计全过程的各个环节,统计设计是医学科研工作的先导和依据,是研究结果准确可靠的保证。2统计分析常用的基本统计分析方法:包括统计描述和统计推断。统计描述如平均数和标准差、相对数等,统计推断如参数估计、t检验、u检验、方差分析、2检验、秩和检验等。其它统计分析方法:包括多因素分析和生存分析等。,三、统计工作的步骤一般分为四步,(一)设计(design)指制定周密的研究计划,内容包括搜集资料、整理资料和分析资料全过程总的设想和安排。是统计工作中最关键的一环,是研究能否成功的前提。包括:调查设计和实验设计:1.调查设计:针对调查研究的设计,(调查研究指目的在于了解某一事物的实际情况,而不施加任何干预措施的研究),调查设计中包括专业设计和统计设计,统计学主要涉及后者,内容主要是资料的搜集、整理和分析计划。可概括为以下几个方面:明确调查目的和确定研究指标;确定研究对象和观察单位;选择调查方法;决定采取的调查方式;设计调查项目和调查表;估计样本含量;收集、整理、分析资料的计划。,2.实验设计即针对实验研究的设计,实验设计应严格遵循四个基本原则,即对照、随机、均衡和重复原则。(1)对照原则(control):实验效应除了受实验因素的影响外还常常会受到一些其他因素的影响,例如药物疗效,除药物本身外,还与诸如年龄、性别、服用其他药物、服用方法等因素有关;另外,个体敏感性差异也会对结果产生影响。1)设立对照的目的:就是控制这类因素;这样才能减少非实验因素的干扰。2)对照的基本要求:除处理因素外,其他因素在两组间要尽可能相同。,3)对照的形式:要根据研究目的和内容加以选择,常见的形式有空白对照:即对照组不加任何处理因素。如接种疫苗和不接种疫苗(空白对照)儿童的血清学和流行病学指标比较。实验对照:指对照组不施加处理因素,但施加某种实验因素,如“动物雌激素水平与骨质疏松症关系研究”,实验组动物手术摘卵巢,对照组不摘卵巢但要手术。标准对照:不专设对照组,而是以现有的标准值或正常值作为对照。采用此对照要注意实验条件应一致,否则会影响比较效果。临床研究常以某种“金标准”作为标准对照。自身对照:即实验与对照在同一受试者身上进行。如施加实验因素前后比较、身体的左右侧比较、先用A药再用B药的比较。相互对照:指不设单独的对照,而是几个实验组之间相互对照比较。如几种药物治疗同一种疾病的疗效比较。历史对照:以本人过去的研究或他人的研究结果作对照,与本次研究结果比较。要特别注意资料的可比性,一般不用。,(2)均衡原则:也称齐同原则。即实验中要求实验对象除了要观察的实验因素外,其它一切条件应尽可能相同;分组实验的话就要求各组非实验因素的条件均衡一致,这样就可以消除非实验因素对实验的影响。(3)随机原则:随机化(randomization)指从总体中抽取观察对象时,每一个对象都有同等的机会被抽到。其主要作用是保证均衡性和避免选择偏性。实验中一切凡涉及分组、影响结果的顺序因素都必须加以随机化,否则研究结果可能会毫无意义。随机化方法:有很多,最简单的就是抽签,但不适用于大样本或多组分配;常用的是应用随机数字表和随机排列表,前者可用于抽样和分组,而后者只用于分组(4)重复原则(replication):是消除非处理因素影响的又一个重要手段,重复程度表现为实验例数(样本含量)和重复次数的多少。实验例数(样本含量)和重复次数应合适,过小则结果不一定能反映真实情况,会出现偏差;过大则不仅浪费,且会增加控制实验条件的难度。估计样本含量可通过公式计算或查表。,(二)搜集资料(datacollection)任务:即指按研究设计的要求,选择得到资料的最佳途径和取得完整、准确、可靠的原始数据的过程。1.资料的类型和来源:经常性资料:指可随时获得的资料。包括统计报表、报告卡、日常工作记录如病历等;一时性资料:需通过专题调查或实验获得。专题调查:实验研究,调查研究等2.资料的搜集首先要制定计划,内容主要包括:选择收集资料的地点、人员和时间;人员培训方案;预调查(实验)方案;资料记录方式;调查表的拟定;仪器设备的准备;调查资料的抽样复核比例和方法;经费准备,等。资料搜集三原则:准确、完整、及时。资料搜集方式:有直接观察、采访、填表和通信4种。前两种有调查员完成,质量较高,后两种由被调查着自填,相对误差较大。,(三)整理资料(datasorting)任务:按研究设计的要求,使原始数据系统化、条理化,便于进一步计算统计指标和进行统计分析。资料整理的过程:1.检查和核对搜集到的数据和资料2.设计分组1)质量分组:将观察单位按某种属性或类别分组,适用于定性资料,如按性别、职业、病种分组。2)数量分组:将观察单位按变量值的大小分组,适用于定量资料,如按年龄、身高等。两种分组方法可结合使用。3.按照分组要求设计整理表,进行汇总,(四)分析资料(dataanlysis)任务:按研究设计的要求,计算有关指标,阐明事物的内在关系和规律。统计分析包括:1统计描述:用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行描述,如平均值、发病率等。不涉及由样本推论总体的问题。2统计推断抽样研究的目的就是了解总体,所以统计推断就是由样本推论总体特征,如推断总体均数、总体率及其可信区间、总体指标的比较等。,四、统计资料的类型变量和变量值变量(variable):指观察单位的某项特征。例如,若观察单位是人,则性别、年龄文化水平、身高等;变量值(valueofvariable):指变量的观察结果(测得值)。变量可分为以下类型:(一)定量变量(quantitativevariable):也称为数值变量。其变量值是定量的,即对每一个观察对象用定量的方法测定某项指标量的大小,有度量衡单位。所获资料为定(计)量资料。,定量变量又分为:1.连续型变量(continuousvariable):即连续变化的变量,其取值是数轴上某一区间内的一切数值,理论上它们是无限可分的。如身高、体重2.离散型变量(discretevariable):其取值是0,1,2等不连续的量,是数轴上有限或无限的可数的值,两个数之间没有小数。如年新生儿数、月手术病人数等。,(二)定性变量1.分类变量(categoricalvariable):将观察单位按某种属性或类别分组,然后清点各组的数目,得到各组的观察单位数,所获得的资料称为计数资料。又可分为:,2.有序变量(ordinalvariable):也称为等级变量,将观察单位按某种属性的不同程度分组,然后清点各组数目,但所分各组之间有等级顺序。所获得的资料称等级资料或半定量资料。,二项分类:两类观察结果互相对立。多项分类:观察结果表现为互不相容的多个属性或类别。,血红蛋白量(计量资料),变量间的转化:,五、统计学几个常用概念(一)同质与变异同质(homogeneity):是针对被研究指标来讲,其影响因素相同。简单地理解同质就是指对研究指标影响较大的,可以控制的主要因素应尽可能相同。如研究方法相同,观察时间相等,以及民族、地区、年龄、性别等客观条件一致。,变异(variation):是同质基础上的个体差异。如一组同年龄、同性别、同民族、同地区儿童的身高值各不相同。统计学研究的任务:就是在同质分组的基础上,通过对个体变异的研究,透过偶然现象,反映同质事物的本质特征和规律。,(二)总体与样本总体(population):就是根据研究目的确定的同质的所有观察单位某种变量值的集合。有限总体:指个体总数已知(有限)的总体称为;无限总体:指无确切范围的总体(即总体中的个体数因总体的时间、空间未加以限制,因而可无限增加),如糖尿病人的血压测定值。样本(sample):就是按随机化原则从总体中抽取的有代表性的一部分个体(某种变量实测值)的集合。,(三)误差统计上的误差泛指实测值与实际值(真值)之差。包括:1系统误差由于各种人为原因,如仪器未校正、方法未统一、操作不一致等所产生的误差叫系统误差。这种误差呈倾向性的偏大或偏小,在实际工作中应尽可能避免,而且是可以避免的。2随机测量误差由于非人为的原因,如控制了系统误差后结果仍然有偏差,这种误差称为随机测量误差,如在光电比色分析中同一份样品其光密度值也不可能完全相同,这就是随机测量误差。其特点是不可避免且误差无倾向性,但应控制在一定容许范围内。3随机抽样误差在抽样调查研究中,尽管控制了系统误差和随机测量误差,但样本指标和总体指标仍不相同,这是由于抽样造成的称为抽样误差。随机抽样误差也是不可避免的,但其有一定的规律性,可以用统计学方法处理,即根据抽样误差的分布规律,利用样本信息对总体进行统计推断。2、3条总称随机误差)4过失误差:指用于工作不认真仔细造成的判断错误或记录错误所致的误差。解决的办法是选高素质的观察者、培训、制定和实施质量控制措施等。,(四)概率概率(probability):是描述随机事件发生的可能性大小的数值(或度量),用P表示。由于必然事件的发生概率为1,不可能事件的概率为0,所以随机事件的概率介于0和1之间。统计学上将P0.05的随机事件称为“小概率事件”。统计学上认为,小概率事件在一次试验中不可能发生(或发生的可能性极小),这称为小概率原理,是一条公理。,(五)参数与统计量参数(parameter):是根据总体分布的特征而计算的总体统计指标(用希腊字母代表),如总体均数,总体率,总体标准差等。统计量(statistic):由总体中随机抽取样本而计算的相应样本统计指标(用拉丁字母代表),如样本均数,样本率p,样本标准S等。统计学研究的目的就是要用样本统计量来估计总体参数-统计推断。,同一总体的个体彼此之间的差异有一定的规律性。通常用变量取值的分布来全面反映这种规律性。为了便于处理实际问题,统计学中常用若干典型的分布模式来近似的描写实际资料,如正态分布、二项分布和泊松分布等,常称为统计模型。利用统计模型进行统计分析可以简化运算。,(六)无效假设统计推断的前提必须建立假设,无效假设(H0)是假设总体相同或差别由抽样误差引起,然后运用统计学原理和方法作出接受H0或拒绝H0的判断。(七)随机化随机化指在科研中把每个受试对象按照机会均等的原则进行安排,如对象的抽取、实验分组、实验先后顺序等影响实验结果的因素均应加以随机化处理,以保证结果科学可比。注意随机不等于随便。常用随机化方法有抽签法和随机数字法。,1.下面的变量中,属于分类变量的是()脉搏B.血型C.肺活量D.红细胞计数E.身高2.下面的变量中,属于定量变量的是()A.性别B.体重C.血型D.职业E.患病与否3.某人记录了50名病人体重的测定结果:小于50Kg的13人,介于50Kg和70Kg间的20人,大于70Kg的17人,此时资料属于()定量资料B.分类资料C.有序资料D.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论