医学统计学基本概念(马修强)课件_第1页
医学统计学基本概念(马修强)课件_第2页
医学统计学基本概念(马修强)课件_第3页
医学统计学基本概念(马修强)课件_第4页
医学统计学基本概念(马修强)课件_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学(medicalstatistics)卫生统计学教研室马修强副教授2011-9-13医学统计学(medicalstatistics)卫生统计学1名人名言学者不能离开统计学而研学;政治家不能离开统计学而施政;事业家不能离开统计学而执业;军事家不能离开统计学而谋略。——马寅初名人名言学者不能离开统计学而研学;2统计学的定义Asciencedealingwiththecollection,analysis,interpretationandpre-sentationofmessesofnumericaldata.(关于数据的收集、分析、解释和表达的学科)----Webster’sInternationalDictionary统计学的定义Asciencedealingwitht3统计学的定义Thescienceandartofdealingwithvariationthroughcollection,classifi-cation,andanalysisinsuchawayastoobtainreliableresult.(通过数据的收集、分类和分析来处理变异以获得可靠结果的一门学科和艺术)----JohnM.Last,ADictionaryofEpidemiology统计学的定义Thescienceandartofd4统计学与医学统计学在医学方面应用的分支名称:生物统计学(biostatistics)医学统计学(medicalstatistics)卫生统计学(healthstatistics)医学统计学运用统计学原理和方法研究医学科研中有关数据的收集、整理和分析的应用学科。统计学与医学统计学在医学方面应用的分支名称:51.学会驾驭变异性(variation)变异性是社会和生物医学中的普遍现象。

WHO报告中国期望寿命:平均71(岁)

实际上每个人的实际寿命是不确定,有些用现有的知识可以解释,有些不能解释。统计试图为不能解释的问题(困惑费解的问题)提供线索和依据。

统计学就是处理数据中变异的科学。为什么要学习医学统计学?1.学会驾驭变异性(variation)为什么要学习医学统计6Theoddsoffindingtwoidenticalfingerprintswere1in64billion.—FrancisGalton两个随机个体具有相同DNA图形的概率为3×10-11;如果同时用两种探针进行比较,两个个体完全相同的概率小于5×10-19。每支枪的枪管都有独一无二的特征,这种特征影响了它所发射的每一发子弹。—司法弹道学Theoddsoffindingtwoidenti7120名正常成年男子红细胞计数值(×1012/L)

5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.645.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69120名正常成年男子红细胞计数值(×1012/L)5.18医学统计学基本概念(马修强)ppt课件92.设计你的研究随机对照试验,RandomizedControlledTrial(RCT)

不一定是最好的医学研究方法,但是最好的试验方法。2.设计你的研究随机对照试验,Randomized10国际生物医学杂志编辑协会一般要求(包含了统计学要求):UniformRequirementsforManuscriptsSubmittedtoBiomedicalJournals国际医学杂志编辑委员会对随机对照试验论文报告要求:CONSORT(ConsolidatedStandardsofReportingTrials)

/Statement/revisedstatement.htm#ref53.论文的统计学审查国际生物医学杂志编辑协会一般要求(包含了统计学要求):国际医11论文段(主题)序号论文段(主题)序号题目与摘要1统计学方法12序言2结果13方法与参与方3招募受试者14受试者4基线数据15干预措施5纳入分析的例数16结局指标6结局和估计值17样本量7辅助分析18随机数的产生8不良事件19随机分组(密封的方案)9局限性20随机的实施10可推广性21盲法11解释22论文段(主题)序号论文段(主题)序号题目与摘要1统计学方法112在全世界报告的122个关于SelectiveSero-toninReuptakeInhibitors(SSRI)抗抑郁作用的RCT研究报告中,仅有一个(0.8%)报告符合CONSORT的描述规范。在全世界报告的122个关于SelectiveSero-to13“良好愿望的医学”(well-meaningmedicine)转入“基于证据的医学”(evidence-basedmedicine,EBM)。所有临床试验的结果都是先有统计学结论(统计指标比较、P值),再给出专业结论。

4.统计学结论是重要的科学证据之一“良好愿望的医学”(well-meaningmedicin14统计学与数值计算统计学的结论是建立在正确的数值计算的基础上;数值计算可以由多种途径完成,如心算、手工计算、计算器、电脑(统计软件);使用统计软件仅仅是解决复杂统计计算的快速实现问题,其真正的精髓并不在于如何操作软件,而在于你是否具有足够的统计学知识选择合适的统计方法,并对结果作出合理的解释。统计学与数值计算统计学的结论是建立在正确的数值计算的基础上;15产生的问题:数据的可靠性:数据造假问题统计方法的选择:误用非常严重产生的问题:16舍恩(Schon)事件维克托·尼努夫化学元素发现造假事件黄禹锡事件数据造假舍恩(Schon)事件维克托·尼努夫化学元素发现造假事件黄禹172005年6月9日,《自然》杂志公布了一份令人震惊的调查结果。美国调查人员对3247名科学家的问卷调查结果显示:约5%的科学家承认,由于得到的信息与他们正在进行的研究相抵触,他们曾丢弃某些数据;10%%的科学家承认,他们在发表研究报告时,曾不适当地将自己或他人的名字列为作者;超过15%的科学家承认,他们曾改变原来的设计或结果,或忽略一些观测以便使赞助商满意。2005年6月9日,《自然》杂志公布了一份令人震惊的调查结果18统计方法的误用70%左右的文章有统计学错误;其中,70%的错误出在初等的、基本的统计学方法,30%的错误出在高等的、复杂的统计学方法。1966年,据对美国医师协会杂志(JAMA)等医学杂志的来稿的统计显示,149篇投稿论文中,仅有28%可以接受,67%有统计缺陷但尚可以纠正,5%不可救药。统计方法的误用70%左右的文章有统计学错误;其中,70%的错19“生物统计学者是我们的可贵盟友。生物统计学不是远离我们的数学,而是现代医学的一门基本学科,就像大厦中的一个支柱”。--美国医师协会杂志编辑“非常痛心地看到,因为数据分析的缺陷和错误,那么多好的生物研究工作面临着被葬送的危险”。--Yates和Healy“生物统计学者是我们的可贵盟友。生物统计学不是远离我们的数学20Howtoliewithstatistics--DarrellHuff

如何用统计学说谎或统计数字会撒谎统计这种神秘的语言,在一个用事实说话的社会里是如此吸引人,但有时它却被利用并成为恶意夸大或迷惑他人的工具。统计方法和统计术语是必不可少的。但如果不能准确理解和恰当使用这些统计语言,不能正确了解其含义,统计结果只能是一堆废话。统计不仅是一门科学,更是一门艺术(加工、处理、升华)。Howtoliewithstatistics--Da21统计学的几个基本概念同质与变异总体与样本参数与统计量变量与资料误差频率与概率统计学的几个基本概念同质与变异22同质:指事物的性质、影响条件或背景相同或非常相近。同质与变异(homogeneityandvariation)例:调查2010年上海市7岁男童的身高和体重同质:2010年、上海市、7岁男童变异:同质个体间测量结果的差异。变异:上海市7岁男童的身高和体重各不相同同质:指事物的性质、影响条件或背景相同或非常相近。同质与变异23我的红细胞数比其他同事都低,该去医院看看了个体变异是普遍存在的。一种或多种不可控因素(已知的或未知的)作用下所产生的综合表现。变异是不可避免的。个体变异是有规律的。没有变异,就没有统计学!红细胞数(1012/L)150名正常成年男子红细胞数分布图人数同质与变异(homogeneityandvariation)我的红细胞数比其他同事都低,该去医院看看了个体变异是普遍存在24总体(population)定义:根据研究目的确定的、同质的全部研究对象的观测值的全体。如研究18岁男青年的生长发育情况,指标为身高、体重,则所有18岁男青年的身高测量值为一个总体,体重测量值为另一个总体。有限总体(finitepopulation)如2011年上海市在校大学生无限总体(infinitepopulation)如高血压病人总体(population)定义:根据研究目的确定的、同质的25样本(sample)来自总体的部分研究对象的观测值。抽样(sampling):总体中的每个研究单位被抽取作为样本的过程。样本量(samplesize):样本包含的研究对象的个数。样本(sample)来自总体的部分研究对象的观测值。26参数:反映总体特征的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数。总体样本抽取部分观察单位

统计量

参数

推断统计量:反映样本特征的统计指标,如样本均数、标准差,采用拉丁字母分别记为。参数附近波动的随机变量。参数与统计量(parameterandstatistic)参数:反映总体特征的统计指标,如总体均数、标准差,采用希腊字27误差(error)误差的定义:实测值与真实值之间的差异误差的分类:随机误差(randomerror)非随机误差(nonrandomerror)系统误差(systematicerror)非系统误差(nonsystematicerror)误差(error)误差的定义:实测值与真实值之间的差异28随机误差由多种尚无法控制的因素引起的误差。无法消除或不可避免,但有规律可循。抽样误差(samplingerror)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。随机误差由多种尚无法控制的因素引起的误差。29系统误差由可知的或可掌握的因素引起的误差。其值恒定不变或遵循一定变化规律,产生原因往往是已知或可能掌握的理论上可以通过周密的研究设计和严格的技术措施消除,实际操作上要看具体情况。实验者感觉或操作上的差异;仪器设备的测量精度;抽样不均匀,分配不随机等。系统误差由可知的或可掌握的因素引起的误差。30举例:用动脉血压计测量某人血压(实际值为80mmHg),各次测量的均值为100mmHg。下图为系统误差和随机误差的示意图。随机误差80100舒张压(mmHg)系统误差发生频次血压计法测量舒张压值的分布举例:用动脉血压计测量某人血压(实际值为80mmHg),各次31非系统误差又称过失误差(grosserror)由研究者偶然失误造成的误差。可通过研究者的认真检查核对避免此类误差。仪器失灵记录错误(点错小数点、指标弄错等)非系统误差又称过失误差(grosserror)32确定性现象和不确定现象确定性现象:在一定条件下,必定会发生的现象。必然事件(P=1)和不可能事件(P=0)。随机现象:在同样条件下会出现两种或多种结果,事先不能确定可能发生何种结果的现象。在一定条件下可能发生的事件为随机事件(0<P<1)。确定性现象和不确定现象确定性现象:在一定条件下,必定会发生的33频率与概率频率(relativefrequency):在相同条件下,独立地重复n次试验,随机事件A出现f次,则称f/n为随机事件A出现的频率。实验者Buffon(法)k.pearson(英)k.pearson(英)投掷次数40401200024000“正面”次数2048601912012

频率0.50690.50160.5005频率与概率频率(relativefrequency):在相34频率与概率概率(probability):随机事件发生可能性大小的度量指标。当n趋近无穷大时,频率f/n始终在一个常数左右微小摆动,称该常数为随机事件A的概率用P表示,0<P<1。随着样本量的增加,频率越来越接近概率。只要观察单位数足够多,可将频率作为概率的估计值。频率与概率概率(probability):随机事件发生可能性35Probability=Frequency?

Patient:WillIsurvivethisriskyoperation?Surgeon:Yes,I'mabsolutelysurethatyouwillsurvivetheoperation.Patient:Howcanyoubesosure?Surgeon:Well,9outof10patientsdieinthisoperation,andyesterdaymyninthpatientdied.Surelynot…Probability=Frequency?

Patie36在一次实验或观察中该事件发生的可能性很小。

P0.05:小概率事件(rareevent)小概率事件在一次实验或抽样中不可能发生,如果发生就怀疑前提假说(检验假设)的正确性。小概率反证法思想(统计推断的基础)在一次实验或观察中该事件发生的可能性很小。P37变量(variable)研究者对每个观察单位的某项特征进行观察或测量,该特征称为变量。观察或测量的结果称为变量值或观察值。变量值可以是数值,也可以是某种属性。变量值构成资料(data)。变量(variable)研究者对每个观察单位的某项特征进行观38医学研究中常见的资料类型计量资料(measurementdata)计数资料(enumerationdata)等级资料(rankeddata)医学研究中常见的资料类型计量资料(measurementd39计量资料又称定量资料(quantitativedata),即观测每个观察对象某项指标的大小而得到的资料;必须通过“量”才能获得;带有度量衡单位;每个个体拥有一个数值;可以转换为等级资料和计数资料。计量资料又称定量资料(quantitativedata),40计量资料的类型离散型:在一定范围内取值的个数为有限。如:出生婴儿数、死亡人数等。连续型:在一定范围内取值的个数为无限。如:身高、体重等。计量资料的类型离散型:在一定范围内取值的个数为有限。41计数资料又称定性资料(qualitativedata),或称无序分类变量(unorderedcategoricalvariable),即将观察单位按某种属性或类别分组计算各组的例数,分组汇总各组观察单位数后得到的资料。必须通过“数”才能获得;不带有度量衡单位,每个个体拥有一个属性。计数资料又称定性资料(qualitativedata),或42计数资料的类型两分类:阳性或阴性;存活或死亡;有效或无效;男性或女性多分类:如血型中的A、B、O、AB四种计数资料的类型两分类:阳性或阴性;存活或死亡;43等级资料的特点又称有序分类资料(ordinalcategoricaldata),即将观察单位按某种属性的大小程度分成等级后分组计算各组的例数,分组汇总各组观察单位数后得到的资料。必须先“量”后“数”才能获得;不带有度量衡单位,每个个体拥有一个属性;如治疗效果分为痊愈、有效、无效、恶化等等级资料的特点又称有序分类资料(ordinalcatego44练习:资料类型的判断病例号年龄(岁)性别身高(cm)血型心电图尿WBC职业血RBC(1012/L)135女1.65A正常-教师4.67244男1.74B正常-工人5.21326男1.80O正常+职员4.10425女1.61AB正常+农民3.92541男1.71A异常++工人3.49645女1.58B正常++工人5.48750女1.60O异常++干部6.78828男1.76AB正常+++干部7.10931女1.62O正常+军人5.24练习:资料类型的判断病例号年龄性别身高血型心电图尿WBC职业45资料类型的转化计量资料可以转化为等级资料和计数资料如血压中收缩压为计量资料;按照90~160mmHg为界值,可分为低血压、正常血压、高血压(等级资料);也可以分为正常和不正常(计数资料)。计量资料的信息最丰富,研究中尽可能收集计量资料。资料类型的转化计量资料可以转化为等级资料和计数资料46医学统计学的基本步骤设计(design)收集资料(collectionofdata)

整理资料(sortingdata)

分析资料(analysisofdata)

医学统计学的基本步骤设计(design)收集资料(coll47一、设计(design)统计设计:对资料收集、整理和分析全过程总的设想和安排。是后续步骤的依据,是最关键的一环。是提高观察或实验质量的重要保证。科研设计专业设计统计设计成果:先进性、创新性科学性和可行性

一、设计(design)统计设计:对资料收集、整理和分析全过48研究者在统计设计过程中的几个关键问题:(1)如何进行抽样,如何安排设计所规定的干预措施?(2)要达到研究目的应抽取多少个观察单位?(3)如何在诸多的影响因素中,分离出研究因素对结果的效应?

研究者在统计设计过程中的几个关键问题:49二、收集资料(collectionofdata)

根据设计方案,取得准确可靠的原始数据,是统计分析的基础。

来源统计报表资料经常性工作记录专题调查或实验研究统计年鉴和统计数据专辑

二、收集资料(collectionofdata)来源统50三、整理资料(sortingdata)

将原始数据净化、系统化、条理化,以便为进一步计算和统计分析。

净化是指对原始数据的清理、检查、核对和纠正错误等;系统化和条理化是指根据研究目的,将原始数据合理分组并归纳汇总等。

三、整理资料(sortingdata)51资料整理包括:1、首先对原始数据进行核对和检查2、设计分组

①质量分组:将观察单位按其属性或类别归类分组。如性别、职业分类等。②数量分组:将观察单位按数值大小进行分组。如年龄大小、血压高低等。3、按分组要求设计整理表,汇总资料。

资料整理包括:1、首先对原始数据进行核对和检查52数据的预处理:把原始数据转化为能被统计软件识别的数据集。例:性别:男、女sex:=1(男)=2(女)数据录入工具:EpiData、Ecxel等

数据的预处理:例:性别:男、女sex:=53四、分析资料(analysisofdata)

计算有关统计指标,反映数据的综合特征,阐明事物的内在联系和规律。统计分析分为:

(1)统计描述(2)统计推断

四、分析资料(analysisofdata)统计分析分54统计学发展简史统计学的发展史可分为三个时期:17世纪70年代—18世纪末:古典统计学18世纪末—19世纪末:近代统计学20世纪初—现在:现代统计学统计学发展简史统计学的发展史可分为三个时期:55Statisticiansareverycareful!

Asabiologist,aphysicist,andastatisticianareridingonatrainthroughWisconsin,theypassaherdofcows,oneofwhichiscompletelywhite.“Ohlook,therearewhitecowsinWisconsin,”saysthebiologist.“Youmean,”saysthephysicistwithanairofsuperiority,“thereisatleastonewhitecowinWisconsin.”“No,”saysthestatistician,“thereisatleastonecowinWisconsinthat’swhiteonatleastoneside!”Statisticiansareverycareful56现代统计学的开端FrancisGalton(1822-1911),维多利亚女王时代最博学的人,创用和发展了“相关”与“回归”。平生著书15种,撰写各种学术论文220篇,涉猎范围包括地理、天文、气象、物理、机械、人类学、社会学、统计学、教育学、医学、生理学、心理学、遗传学、优生学、指纹学、音乐、美术等,是一位百科全书式的学者。生物统计学派创始人现代统计学的开端FrancisGalton(1822-1957KarlPearson是Galton的学生开创了统计方法学,把这门学科由描述性统计改变为推断性统计。创造“标准差”术语,提出2检验、线性相关与回归。1911年,在伦敦大学创立了世界首个综合大学统计系。现代统计学的开端现代统计学之父KarlPearson是Galton的学生现代统计学的开端58KarlPearson对相对论的贡献爱因斯坦23岁时设立Olympia专业研究组,向成员推荐的第一本书Pearson认为自然的法则与观察者的理解能力有关。自然进程的不可逆纯粹是相对的概念。一个能以光速前进的观察者将看到永恒的现在。他推测如果研究者的速度超过了光速将会看到时光倒流,就像电影回放一样。该书介绍的某些主题后来成为爱因斯坦理论的部分内容。KarlPearson对相对论的贡献爱因斯坦23岁时设立59Biometrikashallserveasameansnotonlyofcollectingorpublishingunderonetitlebiologicaldataofakindnotsystematicallycollectedorpublishedelsewhereinanyotherperiodical,butalsoofspreadingaknowledgeofsuchstatisticaltheoryasmayberequisitefortheirscientifictreatment.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论