




已阅读5页,还剩63页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,1,医学统计学(medicalstatistics),卫生统计学教研室马修强副教授2011-9-13,.,2,名人名言,学者不能离开统计学而研学;政治家不能离开统计学而施政;事业家不能离开统计学而执业;军事家不能离开统计学而谋略。马寅初,.,3,统计学的定义,Asciencedealingwiththecollection,analysis,interpretationandpre-sentationofmessesofnumericaldata.(关于数据的收集、分析、解释和表达的学科)-WebstersInternationalDictionary,.,4,统计学的定义,Thescienceandartofdealingwithvariationthroughcollection,classifi-cation,andanalysisinsuchawayastoobtainreliableresult.(通过数据的收集、分类和分析来处理变异以获得可靠结果的一门学科和艺术)-JohnM.Last,ADictionaryofEpidemiology,.,5,统计学与医学,统计学在医学方面应用的分支名称:生物统计学(biostatistics)医学统计学(medicalstatistics)卫生统计学(healthstatistics)医学统计学运用统计学原理和方法研究医学科研中有关数据的收集、整理和分析的应用学科。,.,6,1.学会驾驭变异性(variation)变异性是社会和生物医学中的普遍现象。WHO报告中国期望寿命:平均71(岁)实际上每个人的实际寿命是不确定,有些用现有的知识可以解释,有些不能解释。统计试图为不能解释的问题(困惑费解的问题)提供线索和依据。统计学就是处理数据中变异的科学。,为什么要学习医学统计学?,.,7,Theoddsoffindingtwoidenticalfingerprintswere1in64billion.FrancisGalton,两个随机个体具有相同DNA图形的概率为310-11;如果同时用两种探针进行比较,两个个体完全相同的概率小于510-19。,每支枪的枪管都有独一无二的特征,这种特征影响了它所发射的每一发子弹。司法弹道学,.,8,120名正常成年男子红细胞计数值(1012/L),.,9,.,10,2.设计你的研究,随机对照试验,RandomizedControlledTrial(RCT)不一定是最好的医学研究方法,但是最好的试验方法。,.,11,国际生物医学杂志编辑协会一般要求(包含了统计学要求):UniformRequirementsforManuscriptsSubmittedtoBiomedicalJournals,国际医学杂志编辑委员会对随机对照试验论文报告要求:CONSORT(ConsolidatedStandardsofReportingTrials)/Statement/revisedstatement.htm#ref5,3.论文的统计学审查,.,12,.,13,在全世界报告的122个关于SelectiveSero-toninReuptakeInhibitors(SSRI)抗抑郁作用的RCT研究报告中,仅有一个(0.8%)报告符合CONSORT的描述规范。,.,14,“良好愿望的医学”(well-meaningmedicine)转入“基于证据的医学”(evidence-basedmedicine,EBM)。所有临床试验的结果都是先有统计学结论(统计指标比较、P值),再给出专业结论。,4.统计学结论是重要的科学证据之一,.,15,统计学与数值计算,统计学的结论是建立在正确的数值计算的基础上;数值计算可以由多种途径完成,如心算、手工计算、计算器、电脑(统计软件);使用统计软件仅仅是解决复杂统计计算的快速实现问题,其真正的精髓并不在于如何操作软件,而在于你是否具有足够的统计学知识选择合适的统计方法,并对结果作出合理的解释。,.,16,产生的问题:数据的可靠性:数据造假问题统计方法的选择:误用非常严重,.,17,舍恩(Schon)事件,维克托尼努夫化学元素发现造假事件,黄禹锡事件,数据造假,.,18,2005年6月9日,自然杂志公布了一份令人震惊的调查结果。,美国调查人员对3247名科学家的问卷调查结果显示:约5%的科学家承认,由于得到的信息与他们正在进行的研究相抵触,他们曾丢弃某些数据;10%的科学家承认,他们在发表研究报告时,曾不适当地将自己或他人的名字列为作者;超过15%的科学家承认,他们曾改变原来的设计或结果,或忽略一些观测以便使赞助商满意。,.,19,统计方法的误用,70%左右的文章有统计学错误;其中,70%的错误出在初等的、基本的统计学方法,30%的错误出在高等的、复杂的统计学方法。,1966年,据对美国医师协会杂志(JAMA)等医学杂志的来稿的统计显示,149篇投稿论文中,仅有28%可以接受,67%有统计缺陷但尚可以纠正,5%不可救药。,.,20,“生物统计学者是我们的可贵盟友。生物统计学不是远离我们的数学,而是现代医学的一门基本学科,就像大厦中的一个支柱”。,美国医师协会杂志编辑,“非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究工作面临着被葬送的危险”。,Yates和Healy,.,21,Howtoliewithstatistics-DarrellHuff如何用统计学说谎或统计数字会撒谎,统计这种神秘的语言,在一个用事实说话的社会里是如此吸引人,但有时它却被利用并成为恶意夸大或迷惑他人的工具。统计方法和统计术语是必不可少的。但如果不能准确理解和恰当使用这些统计语言,不能正确了解其含义,统计结果只能是一堆废话。统计不仅是一门科学,更是一门艺术(加工、处理、升华)。,.,22,统计学的几个基本概念,同质与变异总体与样本参数与统计量变量与资料误差频率与概率,.,23,同质:指事物的性质、影响条件或背景相同或非常相近。,同质与变异(homogeneityandvariation),例:调查2010年上海市7岁男童的身高和体重同质:2010年、上海市、7岁男童,变异:同质个体间测量结果的差异。,变异:上海市7岁男童的身高和体重各不相同,.,24,我的红细胞数比其他同事都低,该去医院看看了,个体变异是普遍存在的。一种或多种不可控因素(已知的或未知的)作用下所产生的综合表现。变异是不可避免的。个体变异是有规律的。没有变异,就没有统计学!,同质与变异(homogeneityandvariation),.,25,总体(population),定义:根据研究目的确定的、同质的全部研究对象的观测值的全体。如研究18岁男青年的生长发育情况,指标为身高、体重,则所有18岁男青年的身高测量值为一个总体,体重测量值为另一个总体。有限总体(finitepopulation)如2011年上海市在校大学生无限总体(infinitepopulation)如高血压病人,.,26,样本(sample),来自总体的部分研究对象的观测值。抽样(sampling):总体中的每个研究单位被抽取作为样本的过程。样本量(samplesize):样本包含的研究对象的个数。,.,27,参数:反映总体特征的统计指标,如总体均数、标准差,采用希腊字母分别记为、。固定的常数。,推断,统计量:反映样本特征的统计指标,如样本均数、标准差,采用拉丁字母分别记为。参数附近波动的随机变量。,参数与统计量(parameterandstatistic),.,28,误差(error),误差的定义:实测值与真实值之间的差异误差的分类:随机误差(randomerror)非随机误差(nonrandomerror)系统误差(systematicerror)非系统误差(nonsystematicerror),.,29,随机误差,由多种尚无法控制的因素引起的误差。无法消除或不可避免,但有规律可循。抽样误差(samplingerror)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。,.,30,系统误差,由可知的或可掌握的因素引起的误差。其值恒定不变或遵循一定变化规律,产生原因往往是已知或可能掌握的理论上可以通过周密的研究设计和严格的技术措施消除,实际操作上要看具体情况。实验者感觉或操作上的差异;仪器设备的测量精度;抽样不均匀,分配不随机等。,.,31,举例:用动脉血压计测量某人血压(实际值为80mmHg),各次测量的均值为100mmHg。下图为系统误差和随机误差的示意图。,.,32,非系统误差,又称过失误差(grosserror)由研究者偶然失误造成的误差。可通过研究者的认真检查核对避免此类误差。仪器失灵记录错误(点错小数点、指标弄错等),.,33,确定性现象和不确定现象,确定性现象:在一定条件下,必定会发生的现象。必然事件(P1)和不可能事件(P0)。随机现象:在同样条件下会出现两种或多种结果,事先不能确定可能发生何种结果的现象。在一定条件下可能发生的事件为随机事件(0P1)。,.,34,频率与概率,频率(relativefrequency):在相同条件下,独立地重复n次试验,随机事件A出现f次,则称f/n为随机事件A出现的频率。,.,35,频率与概率,概率(probability):随机事件发生可能性大小的度量指标。当n趋近无穷大时,频率f/n始终在一个常数左右微小摆动,称该常数为随机事件A的概率用P表示,0P1。随着样本量的增加,频率越来越接近概率。只要观察单位数足够多,可将频率作为概率的估计值。,.,36,Probability=Frequency?,Patient:WillIsurvivethisriskyoperation?Surgeon:Yes,Imabsolutelysurethatyouwillsurvivetheoperation.Patient:Howcanyoubesosure?Surgeon:Well,9outof10patientsdieinthisoperation,andyesterdaymyninthpatientdied.,Surelynot,.,37,在一次实验或观察中该事件发生的可能性很小。,P0.05:小概率事件(rareevent),小概率事件在一次实验或抽样中不可能发生,如果发生就怀疑前提假说(检验假设)的正确性。,小概率反证法思想(统计推断的基础),.,38,变量(variable),研究者对每个观察单位的某项特征进行观察或测量,该特征称为变量。观察或测量的结果称为变量值或观察值。变量值可以是数值,也可以是某种属性。变量值构成资料(data)。,.,39,医学研究中常见的资料类型,计量资料(measurementdata)计数资料(enumerationdata)等级资料(rankeddata),.,40,计量资料,又称定量资料(quantitativedata),即观测每个观察对象某项指标的大小而得到的资料;必须通过“量”才能获得;带有度量衡单位;每个个体拥有一个数值;可以转换为等级资料和计数资料。,.,41,计量资料的类型,离散型:在一定范围内取值的个数为有限。如:出生婴儿数、死亡人数等。连续型:在一定范围内取值的个数为无限。如:身高、体重等。,.,42,计数资料,又称定性资料(qualitativedata),或称无序分类变量(unorderedcategoricalvariable),即将观察单位按某种属性或类别分组计算各组的例数,分组汇总各组观察单位数后得到的资料。必须通过“数”才能获得;不带有度量衡单位,每个个体拥有一个属性。,.,43,计数资料的类型,两分类:阳性或阴性;存活或死亡;有效或无效;男性或女性多分类:如血型中的A、B、O、AB四种,.,44,等级资料的特点,又称有序分类资料(ordinalcategoricaldata),即将观察单位按某种属性的大小程度分成等级后分组计算各组的例数,分组汇总各组观察单位数后得到的资料。必须先“量”后“数”才能获得;不带有度量衡单位,每个个体拥有一个属性;如治疗效果分为痊愈、有效、无效、恶化等,.,45,练习:资料类型的判断,.,46,资料类型的转化,计量资料可以转化为等级资料和计数资料如血压中收缩压为计量资料;按照90160mmHg为界值,可分为低血压、正常血压、高血压(等级资料);也可以分为正常和不正常(计数资料)。计量资料的信息最丰富,研究中尽可能收集计量资料。,.,47,医学统计学的基本步骤,设计(design),收集资料(collectionofdata),整理资料(sortingdata),分析资料(analysisofdata),.,48,一、设计(design),统计设计:对资料收集、整理和分析全过程总的设想和安排。是后续步骤的依据,是最关键的一环。是提高观察或实验质量的重要保证。,科研设计,专业设计,统计设计,成果:先进性、创新性科学性和可行性,.,49,研究者在统计设计过程中的几个关键问题:(1)如何进行抽样,如何安排设计所规定的干预措施?(2)要达到研究目的应抽取多少个观察单位?(3)如何在诸多的影响因素中,分离出研究因素对结果的效应?,.,50,二、收集资料(collectionofdata)根据设计方案,取得准确可靠的原始数据,是统计分析的基础。,来源,统计报表资料,经常性工作记录,专题调查或实验研究,统计年鉴和统计数据专辑,.,51,三、整理资料(sortingdata)将原始数据净化、系统化、条理化,以便为进一步计算和统计分析。净化是指对原始数据的清理、检查、核对和纠正错误等;系统化和条理化是指根据研究目的,将原始数据合理分组并归纳汇总等。,.,52,资料整理包括:,1、首先对原始数据进行核对和检查2、设计分组质量分组:将观察单位按其属性或类别归类分组。如性别、职业分类等。数量分组:将观察单位按数值大小进行分组。如年龄大小、血压高低等。3、按分组要求设计整理表,汇总资料。,.,53,数据的预处理:把原始数据转化为能被统计软件识别的数据集。,例:性别:男、女sex:=1(男)=2(女),数据录入工具:EpiData、Ecxel等,.,54,四、分析资料(analysisofdata)计算有关统计指标,反映数据的综合特征,阐明事物的内在联系和规律。,统计分析分为:(1)统计描述(2)统计推断,.,55,统计学发展简史,统计学的发展史可分为三个时期:17世纪70年代18世纪末:古典统计学18世纪末19世纪末:近代统计学20世纪初现在:现代统计学,.,56,Statisticiansareverycareful!,Asabiologist,aphysicist,andastatisticianareridingonatrainthroughWisconsin,theypassaherdofcows,oneofwhichiscompletelywhite.“Ohlook,therearewhitecowsinWisconsin,”saysthebiologist.“Youmean,”saysthephysicistwithanairofsuperiority,“thereisatleastonewhitecowinWisconsin.”“No,”saysthestatistician,“thereisatleastonecowinWisconsinthatswhiteonatleastoneside!”,.,57,现代统计学的开端,FrancisGalton(1822-1911),维多利亚女王时代最博学的人,创用和发展了“相关”与“回归”。平生著书15种,撰写各种学术论文220篇,涉猎范围包括地理、天文、气象、物理、机械、人类学、社会学、统计学、教育学、医学、生理学、心理学、遗传学、优生学、指纹学、音乐、美术等,是一位百科全书式的学者。,生物统计学派创始人,.,58,KarlPearson是Galton的学生开创了统计方法学,把这门学科由描述性统计改变为推断性统计。创造“标准差”术语,提出2检验、线性相关与回归。1911年,在伦敦大学创立了世界首个综合大学统计系。,现代统计学的开端,现代统计学之父,.,59,KarlPearson对相对论的贡献,爱因斯坦23岁时设立Olympia专业研究组,向成员推荐的第一本书,Pearson认为自然的法则与观察者的理解能力有关。自然进程的不可逆纯粹是相对的概念。一个能以光速前进的观察者将看到永恒的现在。他推测如果研究者的速度超过了光速将会看到时光倒流,就像电影回放一样。该书介绍的某些主题后来成为爱因斯坦理论的部分内容。,.,60,Biometrikashallserveasameansnotonlyofcollectingorpublishingunderonetitlebiologicaldataofakindnotsystematicallycollectedorpublishedelsewhereinanyotherperiodical,butalsoofspreadingaknowledgeofsuchstatisticaltheoryasmayberequisitefortheirscientifictreatment.19061936KarlPearson19361966EgonPearson,创办世界上最权威的生物统计学专业期刊,IF1.446(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 渠道开发承包协议书
- 摘除护栏安全协议书
- 擂台比赛生死协议书
- 机械租赁合租协议书
- 校舍维修安全协议书
- 朋友财产赠与协议书
- 生物遗传学解题技巧指导课件
- 中医诊断学课件-望闻问切
- 智能制造数字化设计与仿真
- 机械创意设计
- 贵州省贵阳市重点中学2024-2025学年高一年级下册开学考试语文试卷(含答案)
- 2025年山东省淄博市高新区中考一模历史试题(原卷版+解析版)
- 2025年高考数学压轴题分层练习:概率与统计(40题)
- 医院抹布拖把标识管理
- 2025年4月版安全法律法规标准文件清单
- 四川成都历年中考作文题与审题指导(2005-2024)
- 2025春季学期国开电大专科《管理学基础》一平台在线形考(形考任务一至四)试题及答案
- 公安规范化执法
- 2025年人工智能初创企业的组织架构与流程
- 2025届高三湖北省十一校第二次联考地理试卷(含答案解析)
- 2025年全国中小学生科普知识竞赛题库附答案(共630题)
评论
0/150
提交评论