统计在临床的应用_第1页
统计在临床的应用_第2页
统计在临床的应用_第3页
统计在临床的应用_第4页
统计在临床的应用_第5页
已阅读5页,还剩126页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学在临床医学中的应用,医学统计学的地位和作用,第一节 医学统计学的地位和作用,当研发了一种治疗高血压病的新药,应该怎样评价该新药的疗效?患者,一组服用对照药,一组服用新药,观察疗效,然后分析该新药的有效性和安全性,统计学扮演什么角色? 在这个“临床试验”中有诸多问题需要回答:需要多少名患者参加试验?如何将患者分为两个组? 哪些措施可以保证两组患者除了接受不同药物治疗外,其他影响疗效的因素在两组的分布是一致的?如果分布不一致,如何在诸多的影响因素中,分离出药物因素的效应?,第一节 医学统计学的地位和作用,第一节 医学统计学的地位和作用,应采用什么样的指标来反映新药的有效性和安全性?怎样测量这些指标以保证数据的准确性和可靠性?如何控制试验的误差?如果两组疗效存在一定差别,怎样比较两个药物的疗效到底是否存在差别? 统计学将回答上述问题!,第一节 医学统计学的地位和作用,另一种情形: 为了解一个城市居民高血压病的患病现状,通常的做法是在这个城市调查一部分个体,利用这一部分个体的高血压病患病状况来反映整个城市的患病状况。 如何在这个城市选取这一部分个体? 需要选取多少人进行调查? 如何保证收集到的资料是准确和可靠的?如何评价这种准确性和可靠性?,第一节 医学统计学的地位和作用,如何描述这部分人高血压病的患病状况?如何从这部分人推论到整个城市人群?对于这种推论的正确性抱有多大的信心? 统计学将回答上述问题!,一个常见和普遍的误解: “统计”就是分析数据,第二节 医学统计学基本内容和统计工作基本步骤,第二节 医学统计学基本内容和统计工作基本步骤,“做完实验后才找统计学家无异于请他作尸体解剖,他能做的全部事情就是告诉你这实验死于什么原因”。,现代统计学奠基人之一、世界著名统计学家Fisher曾精辟指出,第二节 医学统计学基本内容和统计工作基本步骤,医学科研的统计设计和统计分析是统计学不可分割的两个重要组成部分。,没有科学严谨的统计设计,数据的收集以及分析常常是没有价值的。对于不准确或不可靠的数据,统计分析所得出的结论常常是站不住脚的,甚至是误导的。,第二节 医学统计学基本内容和统计工作基本步骤,第一节 医学统计学的地位和作用,医学统计学在医学科学研究中的地位和作用举足轻重 由于研究设计、数据收集、统计分析、结果解释及结果报告任何一个环节的缺陷或错误,已经断送了许多先进的甚至非常前沿的医学研究成果,即使已经发表的研究成果也存在着大量的统计学缺陷或错误。 现在,人们已逐步认识到统计学在医学和公共卫生科学研究中的极端重要性。医学统计学正日益彰显其蓬勃的生命力和广阔的应用空间。,统计研究设计,调查研究,实验研究,临床试验,动物实验,实验研究设计,根据研究对象不同又可分为 动物实验研究(animal experiment design) 以实验动物和实验样品为对象临床试验(clinical trial design) 以患者为对象现场试验(field trial) 以自然人群为对象,实验设计的三项原则,贯彻以下三原则是控制误差和偏倚的重要措施:随机化原则 设立对照 足够的样本含量(重复原则),随机化原则,是指采用随机的方式,使每个受试对象均有同等的机会被抽取或分配到实验组和对照组,随机化(Randomization),随机抽样随机分配实验顺序随机,二者区别与联系,设立对照,是控制实验中其它非实验影响因素和偏倚不可缺少的重要手段。根据研究目的设立恰当的对照,如:安慰剂对照空白对照实验对照标准对照自身对照,例 某医生欲观察某中药对慢性支气管炎的预防效果,设计时在城市某工厂选择工人100名服用该中草药,在农村选择某乡农民100名作对照,不服用此药。结果是城市慢性支气管炎患者明显较少,而农村慢性支气管炎患者增加,由此得出该中草药有防治慢性支气管炎的作用。 该结论合理吗?为什么?,修改,将城市100名工人分成两组:50名服用中草药,50名不服用将农村100名农民分成两组:50名服用中草药,50名不服用,实例,1976年某单位报告果胶驱铅的疗效观察。30名铅中毒工人脱离现场后住院治疗,治疗前测得尿铅均数为0.116mg/L,血铅均数为1.81mg/L。服用果胶20天后再测,尿铅均数降为0.087mg/L,血铅均数降为0.73mg/L。说明果胶有较好的驱铅作用。,重复原则,指在相同实验条件下进行多次实验或观察主要包括以下两方面:对多个受试对象进行实验对同一受试对象进行重复观测,实验设计的基本内容,研究背景研究目的资料来源(研究地点、抽样方法、研究对象、纳入排除标准、研究因素、研究指标样本量、资料内容)研究方法(资料整理、误差和偏倚的控制、资料描述、资料推断)研究结果研究特色及问题技术路线图,统计方法的正确选择,数据特征,样本含量,研究目的,对比组数,设计类型,资料类型,综合判断,表1 单变量资料差异比较的分析方法小结,表2 双变量(多变量)资料的关联性分析方法小结,1. 研究目的一是通过比较,回答观测指标的差别是否归因于处理因素或分组因素,在本教材范围内所涉及的主要是单变量问题。二是分析变量之间是否存在某种联系,这主要涉及相关分析和回归分析,在本教材范围内所涉及的主要是双变量问题。,表1. 两种方法检测12名妇女最大呼气率(L/min)结果,表2. 甲、乙两药治疗小儿上消化道出血的效果,2. 设计类型 从实验研究设计来看,常见的设计类型为完全随机设计(成组设计)配对或配伍设计(随机区组设计),两样本(成组)t 检验单因素(完全随机设计)方差分析卡方检验(独立样本)两样本Wilcoxon秩和检验或多样本Kruskal-Wallis秩和检验,对完全随机设计的数据,应选择相应的方法:,配对t检验配伍组(随机区组)设计方差分析配对卡方检验配对(符号秩和检验)或配伍设计的秩和检验(Friedman秩和检验)等。,对于配对或配伍设计的数据,应选择相应的方法:,3. 资料类型对于定量变量,选择它所对应的统计方法?对于定性变量,选择它所对应的统计方法?,4. 数据特征 对于同一设计类型和同一资料类型,仍然有许多方法可以选择。,表3. 九个测定点用甲、乙两种方法的测定结果(g/m3),t检验和方差分析属参数检验方法,对数据要求较高,通常要求数据服从正态分布和方差齐性。如果服从该条件或经变量变换后服从条件,则采用参数检验方法,否则采用秩和检验这类非参数检验方法。,能否不考虑分布和方差齐性问题,直接采用非参数检验?,5. 对比组数单组问题(样本与与已知总体参数比较)两组问题多组(3组或以上)比较注意,多组比较在差别有统计学意义时,需再进行两两比较。,6. 样本含量在样本较小时:如果是一个样本率与总体率的比较,可采用直接计算概率的方法如基于二项分布的确切概率法。如果是四格表资料则采用Fisher确切概率法或校正卡方检验。对于均数比较问题,一般情况下采用t检验。在大样本时:可考虑Z检验作近似。,在实际工作中,遇到的实际问题可能并非如此简单,须结合专业问题和所要分析的具体内容加以综合考虑和仔细判断,有时需对各种统计方法加以综合运用。,此外:当分析目的是分析变量之间是否存在某种联系时,这就涉及到双变量的分析方法,即相关关系或回归关系的分析。需注意相关分析和回归分析的区别与联系,关联性分析:对于定量变量,需根据两个变量是否满足双变量正态分布,相应地采用Pearson积矩相关分析或Spearman秩相关分析。对于等级变量则直接采用Spearman秩相关分析。,对分类变量,常计算列联系数进行分析对于RC表资料,需注意区分是单向有序或者是双向有序对于一个二分类变量和一个等级变量之间的线性关联通常采用线性趋势卡方检验,表4. 某市不同年级中学生吸烟率,生存分析:是一类较为特殊的针对具有截尾数据的生存时间数据所进行的分析针对分组和未分组资料,方法有所不同,多变量的数据分析:多重线性回归是对反应变量为定量变量进行的多变量分析Logistic回归是对反应变量为分类变量所进行的多变量分析Cox比例风险回归是对反应变量为含有截尾数据的生存时间所进行的分析,混杂因素的控制非研究因素的“可比性”问题可比性好,各组观测指标之间的差异只能归因于研究因素而不是其它原因,如果各组在研究因素之外的某种或某些因素有所不同,那么这个或这些其它因素的效应就可能同研究因素的效应混淆在一起在这种情况下,通常的统计分析结论在进行因果推断时常常是不可靠的,对于非研究因素不具可比性的资料,应采用统计调整技术消除那些因素的影响对于具有多个变量的复杂情况,则需采用多变量分析技术加以调整,分析阶段控制混杂因素可采用:1) 分层分析2) 标准化法3) 协方差分析4) 多重回归,1) 分层分析Example:研究吸烟与健康的关系,吸烟者与不吸烟者死亡率的直接比较可能存在问题因为:吸烟者多为男性,而男性比女性更易患心脏病而发生死亡,吸烟者与未吸烟者之间死亡率的差异也许是因为性别的差异,为了排除这种可能性,可以性别因素分层,再比较吸烟与非吸烟者的死亡率:男性人群中,吸烟与不吸烟者进行比较女性人群中,吸烟与不吸烟者进行比较,年龄可能又是另外一个混杂因素,这就需要对年龄进行分层分析:,男 40岁 40岁女 40岁 40岁,以上是通常的分层分析思路,但这并不能保证这样分析的结论一定是正确的 尤其当:调查设计存在严重问题,样本对总体代表性很差,未能反映被调查总体的真实情况时,另需注意:当一个事件的影响因素较多时,由于不断分层的结果致使某些层中样本含量太少;采用这种简单的分层分析可能割裂多个因素之间的内在联系,难以真实揭示多个因素对观测结果的影响,从而导致错误的结论。,实战练习,1. 欲了解某地城乡婴儿营养状况有无差别,测量了其血红蛋白含量,见表1该资料属何种类型?该资料属何种设计?不同月龄婴儿的血红蛋白浓度有无差异?Any else?,表1. 某地婴儿血红蛋白浓度,该资料类型?属何种设计类型?可用何种统计方法分析上述资料?,2. 某检验员用两种方法测定了10名正常人的血红蛋白含量(g/dl),结果如下:,3. 选甲型流感病毒感染者24人,随机分成2组,每组12人。用甲型流感病毒活疫苗进行免疫,一组用鼻腔喷雾法(X1),另一组用气雾法(X2) ,免疫后一月采血,分别测定血凝抑制抗体滴度,结果如下。问两法免疫的效果是否不同?X1 :50 40 30 35 60 70 30 20 25 70 35 25X2 :40 20 30 25 10 15 25 30 40 10 15 30,4. 某医生用泼尼松、转移因子和胸腺肽治疗系统性红斑狼疮(SLE)患者14人。治疗前后血清Sil-2R(U/ml)数据见下表。他用成组设计两样本t检验,得t 0.3737,P0.7116。因此他得出治疗前后血清Sil-2R的差异没有统计学意义的结论,请问该结论是否正确?,表2. 治疗前后血清Sil-2R(U/ml)数据,4. 某医生用泼尼松、转移因子和胸腺肽治疗系统性红斑狼疮(SLE)患者14人。治疗前后血清Sil-2R(U/ml)数据见下表。他用成组设计两样本t检验,得t 0.3737,P0.7116。因此他得出治疗前后血清Sil-2R的差异没有统计学意义的结论,请问该结论是否正确?,有人提议用配对t检验,如果治疗前后的差异有统计学意义就可以说明治疗有效,你同意否?,5. 某地抽样调查了部分健康成人的红细胞数,其中男性360人,均数为4.6601012/L,标准差为0.5751012/L;女性255人,均数为4.1781012/L,标准差为0.2911012/L,试问该地男、女平均红细胞数有无差别?,6. 某社区随机抽取了30名糖尿病患者、IGT异常和正常人进行载脂蛋白含量(mg/dL)测定,结果见下表,问三种人的载脂蛋白有无差别?,7. 在抗癌药筛选试验中,5个窝别,各4只,共20只小白鼠,按不同窝别分为5组。分别观察三种药物、一种对照物,对小白鼠肉瘤(S180)的抑瘤效果,表3. 三种药物抑瘤效果的比较(瘤重,g),new表3. 三种药物抑瘤效果的比较(瘤重,g),8. 用15只小白鼠,随机分为3组,比较小白鼠接种三种不同菌型伤寒杆菌9D、11C、DSC1后存活天数,实验数据见表6,问接种不同菌型伤寒杆菌的小白鼠存活天数间有无差别?,表4. 小白鼠接种三种不同菌型伤寒杆菌后存活天数,new表4. 小白鼠接种三种不同菌型伤寒杆菌后存活天数,9. 用配对设计观察两种方法治疗16名扁平足患者的效果记录如下,问两种方法的疗效有无差别? 病例号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A法 好 好 好 好 差 中 好 好 中 差 好 差 好 中 好 中 B法 差 好 差 中 中 差 中 差 中 差 好 差 中 差 中 差,差值 2 0 2 1 -1 1 1 2 0 0 0 0 1 1 1 1,10. 已知某地正常人尿氟含量的中位数为2.15mmol/L。今在该地某厂随机抽取12名工人,测得尿氟含量(mmol/L)如表3。问该厂工人的尿氟含量是否高于当地正常人?,11. 研究不同饲料对雌鼠体重增加的关系,资料如下表。试比较喂高蛋白的雌鼠与喂低蛋白的雌鼠增重是否不同?,表4. 不同饲料组雌鼠所增体重,表3. 鼻咽癌患者与眼科病人的血型分布,12. 某医院研究鼻咽癌患者与眼科病人的血型构成情况有无不同,资料如表3,问其血型构成有无差别?,13. 在某项治疗牙科术后疼痛控制的双盲临床研究中,将178例患者随机分为两组,A药组90人,有效人数为68人;B药组88人,有效人数为58人。资料经整理成下表形式。问两种药有效率有无差别?,表1. 两种药物治疗牙科术后疼痛有效率的比较,表2. 某省三个地区花生的黄曲霉毒素B1污染率比较,14. 某省观察三个地区的花生污染黄曲霉毒素B1的情况,见下表,问三个地区花生污染黄曲霉毒素B1污染率有无差别?,15. 某研究室用甲、乙两种血清学方法检查410例确诊的鼻咽癌患者,得结果如下,问两种方法检出率有无差别?,两种检验结果之间有无关联?,16. 某矿工医院探讨矽肺不同期次患者的胸部平片密度变化,492例患者资料整理如下表,问矽肺患者肺门密度的增加与期次有无关系?,表7. 不同期次矽肺患者肺门密度级别分布,17. 某研究者欲评价普通儿童和患某种心理疾病儿童的智力水平有无差异,调查了189名儿童,结果见下表,问两组儿童的智力水平有无不同?,表5. 两组儿童的智力水平情况,表5.两组儿童的智力水平情况,17. 某研究者欲评价普通儿童和患某种心理疾病儿童的智力水平有无差异,调查了189名儿童,结果见下表,问两组儿童的智力构成分布有无不同?,18. 以下资料为 20名糖尿病人血糖水平(mmol/L)与胰岛素水平(mU/L)的测定值,研究两变量之间的相互关系及其密切程度。,表5. 20名糖尿病人血糖(mmol/L)与胰岛素(mU/L)测定值,19. 某医师采用手术疗法治疗12例宫颈癌患者,随访时间(月)记录如下:1,2,4,5,7,8+,11,15,18,33+,36,38+。试估计各时点生存率及其标准误、各时点总体生存率的95%可信区间、中位生存时间,并绘制生存曲线。,20. 20名糖尿病人的血糖(Y,mmol/L)、胰岛素(X1,mU/L)及生长素(X2,g/L)的测定值列于下表中,试分析血糖与胰岛素及生长素之间的线性关系。,98,Meta-Analysis,99,Meta analysis,Meta analysis是在系统性综述时为了合并多个独立的研究结果,所使用的统计方法。可以将针对同一问题的多个独立的研究结果进行定量分析。,100,Meta分析也不再局限为一种统计学方法,而成为一个完整的科学研究过程,具有严格的设计来保证研究结果的科学性、可行性和再现性。,101,目前经常交叉使用的名词,1) Systematic review 系统评价 (日趋规范的用法) 2) Meta-分析(荟萃分析、汇总分析) 3) Overview 4) Systematic overview 5) Pooling project,102,主要内容,Meta分析的概念Meta分析的基本原理Meta分析的效应尺度固定效应的Meta分析方法随机效应的Meta分析方法,103,Meta分析与传统的文献综述有何区别?,104,Meta分析与传统的文献综述不同,传统医学文献综合研究特点主要依靠权威人士,根据其对某领域基础理论的认识和相关学科的了解来总结和评价。资料和数据的采集取决于研究者的经验和主观意愿,不同综述者对同一领域的研究结果常常会得出完全不同的结论。,105,Meta分析与传统的文献综述不同,传统医学文献综合研究存在的问题缺乏客观性不能定量地综合出总的研究效应,106,Meta分析在中国,最先在教育学和心理学领域应用,从80年代后期起,Meta分析文献大量涌现,并逐步引入中国。近年来,随着循证医学的兴起和发展,在医学领域尤其是临床医学和公共卫生领域的应用日益广泛。,107,Systematic reviews/meta-analyses indexed in PubMed 10 years,108,Step 1:明确研究目的,要求:简明扼要例:研究孕妇服用Bendectin是否与胎儿畸形有关联,对多个独立的药物流行病学研究结果进行Meta分析研究目的:孕妇在怀孕期间服用Bendectin是否与胎儿畸形有关联,109,Step 2:确定文献收集的标准,目的:保证进入Meta分析的各个独立研究具有较好的同质性 包括:研究对象、设计类型、处理因素、结局效应、样本大小、观察年限、文献发表时间、语种等,110,Step 2:确定文献收集的标准,纳入标准:所有以英文发表的、以研究孕期前三个月服用Bendectin与胎儿畸形为目的的论著文献,包括病例对照研究和队列研究,单独研究的个体必须为1840岁怀孕妇女,且研究中包含有母亲年龄、经产情况、饮食、吸烟饮酒习惯及Bendectin的用量。剔除标准:曾服用Bendectin以外的可疑致畸药物者,111,Step 3:收集文献,文献检索的完整性直接影响Meta分析研究结果的可靠性。文献检索时最好是能找到所有有关的文献(包括没发表的),以减少发表偏倚对研究结果的影响,112,Step 3:收集文献,确定检索主题词确定检索数据库确定检索年限非发表文献的搜集方法 会议 网站 同行了解,113,Step 4:选择文献、评价文献质量,根据纳入标准和排除标准筛选收集的原始文献确定原始文献质量的评价标准,114,选择文献、评价文献质量 确定原始文献质量的评价标准,主要考察各个研究是否存在偏倚(失访偏倚、选择偏倚、发表偏倚等)及其影响程度。质量高低可用权重来表示,也可用量表或评分系统来评价。,115,选择文献、评价文献质量 确定原始文献质量的评价标准,系统性综述和meta分析随机对照双盲实验队列研究病例对照试验系列病例分析病例报告观点、评论、意见动物研究离体研究,质量高低递减,116,文献作者、年代、来源研究设计特征研究对象特征干预特征评价指标质量,Step 5:提取纳入文献的信息,117,归纳:进行Meta分析前需要准备的技术文件,计划书 检索策略 入选、排除标准 原始文献评价标准数据提取表格与作者联系的信件,118,选择文献的基本步骤,119,Step 6:分析资料和报告结果,计算各研究的效应值、方差和权重 对各研究结果的效应值进行齐性检验 计算合并的效应值 固定效应模型的合并效应值 随机效应模型合并的效应值绘制各研究的效应值和置信区间 森林图 (Forest Plot),120,分析资料和报告结果齐性检验,齐性检验是Meta分析过程中必须进行的工作。齐性检验的结果若齐性检验P0.05若齐性检验P0.05,121,分析资料和报告结果齐性检验,若齐性检验P0.05,应先分析导致各研究结果不一致的原因,如各研究的观察对象选择标准是否有差异,剔除不合格的资料后,再进行齐性检验,如齐,选择固定效应模型。分析导致各研究结果不一致的原因,如各研究的观察对象选择标准无差异,考虑选择随机效应模型,122,分析资料和报告结果偏性评价,偏性 所谓偏性是指在资料收集、分析、解释、发表和综述时任何可能导致结论系统地偏离真实结果的情况。Meta分析中最突出的问题是发表偏性。 偏性的估计漏斗图 漏斗图(Funnel Plot)是以每个研究的效应尺度为横坐标,以每个研究的样本量为纵坐标做成的散点图。,123,漏斗图的解释,每个纳入研究的效应值的精度随该研究样本含量的增加而增加。漏斗图不对称,则存在偏性,124,从均数为1.5,标准差为0.7的正态总体的1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论