统计方法抉择_第1页
统计方法抉择_第2页
统计方法抉择_第3页
统计方法抉择_第4页
统计方法抉择_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

临床研究中统计方法的抉择与应用,四川大学华西医院,康德英,第一讲,一、统计在临床研究中的意义,临床研究中需要测试PICOT指标,以描述临床与健康状态;反映研究/干预结果的形式;临床研究需要定量测试系列指标,必然有各种数据;数据处理、真实性的科学判断,均需要有关统计学方法。,临床统计是:,处理临床研究资料中变异性科学与艺术。临床研究的结果表达与评价:真实性、适用性、重要性,均需要借助统计学知识。统计学要贯穿于临床研究中的资料搜集、整理、分析与结果解释等全过程。,设计阶段(根据研究目的与资料特点,预设统计分析方法,确定临床指标;同时进行样本含量估算)实施、资料收集与整理阶段:用相应统计分析方法,评估质量控制效果;检查数据资料的完整性、失访与原因统计检查极端值与异常值,分析原因与正确处理分析资料阶段:检查资料是否满足预设统计方法的应用条件,选用统计学方法。,二、临床研究中相关数据采集,(一)、临床研究指标及时点的确定,1、观察测试指标的主要类别临床/生物学指标:病死、复发率、残疾、生化等生存质量及其相关指标:HRQL、QALYs、DALYs,QALYs-质量调整寿命年,1,0,12345,0.6,0.8,0.5,0.4,0.3,QALYs=2.6,0.2,QALYs=1.0,生存时间,生存质量,经济学指标:直接成本、间接成本等用于疾病负担以及成本效果分析(CEA)、成本效益分析(CBA)、成本效用分析(CUA)等。,2、临床研究指标设置应全面和重点兼顾,1)临床试验常设指标候选范围:疗效指标不良反应(副作用)指标费用(临床经济学)指标,2)临床终点观察指标的数量设置应选择重点、有代表性指标:不能过多(对于大规模研究,指标过多往往不能保证质量)。,3、选择测定次数与时点,临床研究中指标测量时间与次数确定:效应量变化特征曲线。,质控应体现在数据收集、整理、数据分析等不同阶段。如常用手段:盲法测量临床软指标多个实验室标准样品平行试验/标准校验曲线培训记录员与调查员,提高依从性双输法录入数据,4、数据收集过程中的质量控制,5、影响数据收集质量的因素,与项目指标本身的设置有关(临床硬指标、临床软指标)客观性、易量化灵敏度高精确性强与指标数目及测量的难易程度有关:应避免指标过多。与收集方式有关:实验室标准测试面对面访谈法电话访谈信访,如何判断与评估数据质量?,数据质量的评价可通过统计描述和图表法(散点图)加以初步判断:异常值与极端值的识别与处理。计量资料计数资料缺失值及其类别与所占的比例,评判是否会对最终结果产生影响。失访比例?,三、统计分析的基本内容,统计描述:反映样本结果的基本特征统计图表:各类表格或图示基本指标:均数/标准差;率、构成比统计推断:样本推断总体参数参数估计:点估计及其95%可信区间假设检验:差别(均数、率)推断;相关性推断。,资料基本分型与分析,数值变量资料:计量资料统计描述统计推断分类变量资料:计数资料统计描述统计推断,(一)、计量资料的统计描述及结果表达,统计描述大样本随机对照试验资料中对于服从正态分布的可以用均数标准差;服从对数正态分布的资料:可以用几何均数标准差对于其它不服从正态分布的资料:只能采用中位数和四分位间距(IQR)表达。统计图表:各类图表(频数表、直方图),正态性判断,判断资料是否服从正态分布,可用正态性检验的方法。其它:统计图表:eyeball均数与中位数差均数与标准差(均数1S或2S中样本例数)医学专业知识对资料的正态性进行估计。,实例两组患者头孢唑啉钠药物动力学参数比较(xs)组别(h-1)k10(h-1)老年组(n=7)0.62130.11770.28560.042760岁以下组(n=5)3.55053.55530.82573.5329,(二)、计数资料的描述:常用率与比,分析时不能以构成比代率如某产院拟分析畸形儿与母亲分娩年龄的关系,检查新生儿4470例,畸形儿116例。母亲年龄(岁)2123242526272829303133畸形儿数:12141924181913311%0.861.71216211616112.60.860.86结论:母亲年龄在24-29岁时,畸形儿最多,占总数的92.2%,符合一般规律。,计算率时要求分母不宜过小,病死率与死亡率不同,(三)临床效应量及其统计描述,临床效应量(effectsize)常被定义为有临床意义或实际价值的干预效应或差值。,1、计量资料类型的效应量表达,效应量(effectsize)是指临床上有意义的均数差值(均数差值是指试验组与对照组的均数之差)。必须结合专业知识、指标特点综合判定差值的实际意义。,0.57-0.48=0.09mmol/L,2、计数资料效应量的测量指标,疗效测量指标(两组疗效率的差值)绝对危险降低率(absoluteriskreduction,ARR):对照组与试验组事件发生率之间的绝对差值%表示。此值意味着试验组临床事件发生率比对照组相同事件率的绝对差值,其值越大,临床效果的意义自然会越大。公式:ARR=P-A(%)P=对照组的事件率,如病死率A=试验组的事件率,治疗多少病例数才使一例患者受益(numberneededtotreat,NNT)公式:NNT=1/ARRNNT=5vsNNT=500意义,相对危险降低率(relativeriskreduction,RRR):此值的大小表示试验组比对照组治疗后有关临床事件发生的相对危险度下降的水平。公式:相对危险降低率(RRR)=(P-A)/P)100P=对照组的事件率,如病死率A=试验组的事件率,效应量临床意义的判定,结合疾病与病人特点医院内感染率降低1%与病死率减少1%考虑相对值:如复发率20%-10%降低绝对值为10%,相对值50%50%-40%降低绝对值为10%,相对值20%与观察时间有关:NNT,高血压患者药物预防心梗或死亡,观察期NNT轻度高血压5.5y10重度高血压1.5y10时间矫正(假设其每年发生率是一致的)NNT矫正=NNT观察时间X(观察时间/矫正时间)NNT1.5=10X(5.5/1.5)=37,四、统计推断的方法抉择,统计推断内容假设检验参数估计(可信区间),五、统计方法正确抉择基本要素,统计方法的正确抉择至关重要。,五、统计方法正确抉择基本要素,资料类型设计方案样本含量数据结构特定条件,(一)、计量资料统计推断方法选择,假设检验t检验、u检验、方差分析、秩和检验等效应量可信区间(95%可信区间):准确度:95%、99%、90%精度:为可信区间的宽度*影响精度因素:准确度、标准差、样本量,(二)、计数资料的统计推断方法,2检验、logistic回归分析,率差值的可信区间估计说明两个率间的差别程度以及有无临床价值。,五、统计方法正确抉择基本要素,资料类型设计方案样本含量数据结构特定条件,五、统计方法正确抉择基本要素,资料类型设计方案样本含量数据结构特定条件,五、统计方法正确抉择基本要素,资料类型设计方案样本含量数据结构特定条件,五、统计方法正确抉择基本要素,资料类型设计方案样本含量数据结构特定条件,六、结果解释与注意事项,(一)、如何正确的表达统计结果,假设检验目的是根据P值与检验水准的比较,并得到两组总体均数是否有差异的推断结论。P值:两组总体均数间差异无统计学意义;(P值在附近时,下结论应慎重)。不能表明“显著性”差别的程度以及有无实际意义(临床意义),“显著意义”定义,英语表达为“significant”,它的正确意义应当是“有意义的、有重要性的”。俄语为日语“有意”国内只有极个别的英汉词典把“significant”误译为“显著的”。正确的说法应是“差异有统计意义”或“差异有高度统计意义”。,“显著意义”举例,“丙酸倍氯米松组患者吸入糖皮质激素后,其气道反应性有显著降低(P0.05);对照组治疗前后气道反应性无明显变化(P0.05)。,可信区间:按照设计类型及相应的公式分别计算出组间均数差值95%可信区间。可信区间能提供更多的信息:能表明差别有无统计学意义,同时能显示差别的程度及临床意义,但CI不能提供确切概率。因此,统计结果的表达:P值与可信区间相结合,同时报告。,(二)、正确解释结果,真实性重要性适用性,1、真实性解释与评价,统计推断的结论具有概率性;只能有两种结果,有统计学意义,无统计学意义。但两类结果同样重要。特别是当出现阴性结果时,更应该注意,因为可能有II型错误的存在,阴性结果可能又包括两类:确实无统计学意义;或者出现假阴性。应重点考察样本含量及检验效能。,检测项目患者组(32)健康组(10)P值检验效能LAT-EF57.213.359.69.20.050.10INF-EF76.815.282.014.30.050.17SEPTAL-EF37.412.646.913.40.050.52ESV29.38.527.37.30.05EDV62.116.063.69.60.05,预防出现假阴性结果:正确估算样本含量,样本含量应该足够,不能过大或过小,否则两者均可造成资源上的浪费。样本含量的估算需要得到以下信息:以病死率为例:I型错误率:0.05II型错误率:0.10.2新方法达到的最小效应量:1%,5%传统基线病死率:,根据课题设计方案和研究的主要内容,实际上可简化为两组:传统手术组与微创手术组,因此选用公式:其中:为I型错误率为II型错误率p1为传统手术的病死率=25%;p2为微创手术病死率=20%,=0.05,=0.20每组n=1152=0.05,=0.10每组n=1530=0.05,=0.05每组n=1884失访率5%-10%,校正样本含量每组校正n=12131280每组校正n=16111700每组校正n=19842094,2、重要性评价:综合临床意义与统计学意义,临床意义,统计学意义,abcd,3、评价统计结果的适用性,统计分析结果实际上是基于个体的平均水平。将平均水平结果应用到个体水平,忌生搬硬套。,七、临床研究中常见统计问题,公开发表论文中常见的统计学问题:,需做而未做统计分析统计分析方法不清,或未标明应用条件不满足错误选用统计方法:结果解释不合理:论文写作方面:结果表达不完整、不清楚。,(一)、统计方法选择应符合分析目的,表甲乙两种疗法的疗效比较(例)疗效甲法乙法痊愈1020显效3020有效1030无效2010合计7080资料特点:单向有序的计数资料分析目的:疗效差别比较采用方法:首选秩和检验?卡方检验?,(二)、分析方法应恰当,根据分析目的、资料的类型(计量亦或计数资料)选择合适的统计分析方法。,脑梗塞两种治疗方案比较研究,选择病人,随机分配,方案A,方案B,未实施A或实施B,实施A,实施B,未实施B或实施A,1,2,3,4,脑梗塞(卒中)两种治疗方案随访2年后其疗效的比较,见表,表疗效比较结果分配内科治疗分配外科治疗外科治疗1内科治疗2外科治疗3内科治疗4存活2年4829635420死亡227156合计5032336926,对该情况有三种分析方法,意向性治疗分析:1+2与3+4比较功效分析(EfficacyAnalysis):只是2与3比较实效分析(TreatmentReceivedAnalysis):1+3与2+4比较,上述资料的三种分析结果,表三种分析方法的结果比较分析方法内科治疗外科治疗2P意向性治疗分析29/373(7.8%)21/395(5.3%)1.90.17功效分析27/323(8.4%)15/369(4.1%)5.60.018实效分析33/349(9.5%)17/419(4.1%)9.10.003,在发生率90%时,下结论时应慎重。,(三)、考虑混杂/偏倚对结果的影响,混杂与偏倚也将直接影响统计结果的真实性,即可造成真实效应低估及假阴性结果。,真实效应量,混杂与偏倚,大,中,小,中等混杂或偏倚中等抽样误差,结论,有效,无效,1、如何控制与减少中等混杂或偏

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论