




已阅读5页,还剩67页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
科研设计中的误差分析,1,第一节流行病学研究基本思维方法,2,一、研究的外部真实性与内部真实性1外部真实性:指研究样本的结果和结论可以外推到研究的总体人群。遵循随机抽样原则和避免产生严重的选择偏倚是保证样本代表性的重要措施。2内部真实性:指研究样本的结果真实可靠。严格控制和减少测量偏倚和混杂偏倚对结果的影响,保证研究结果真实性的关键。,3,二、误差与偏倚医学研究中,从研究设计、指标测量、数据分析到结果推论均可因设计和处理不当而产生各种各样的误差(error),其中因人为因素造成的观察结果偏离真实值则被称为偏倚(bias)。,4,2.观察偏倚(observationalbiasorinformationbias)3.混杂偏倚(confoundingbias)当研究某个暴露因素与某疾病的关联时,由于研究中存在某些既与疾病有关联,又与所研究暴露因素有联系的外部因素影响,使暴露因素与疾病真实关联性被人为歪曲,这种导致研究结果存在误差的现象叫混杂。这些外部因素称混杂因素,由它们产生的偏倚称混杂偏倚。,5,口服避孕药(OC)与心机梗死(MI)病例对照研究(未分层的分析结果)-服未服合计-对照-合计-cOR=(39/114)/(24/154)=.20,6,口服避孕药(OC)与心机梗死(MI)病例对照研究(按年龄分层后的结果)-=40岁-(+)(-)合计(+)(-)合计-2126471888106对照175976795102-合计388512325183208-OR12.80OR22.78对照:76/178=0.43;MI:47/153=0.31;40岁:25/208=0.12,7,三、比较与对照试验组和对照组间的良好可比性是分析性比较研究的基础,是保证研究结果内部真实性的关键。1可比性:指比较的各组间在下述方面的一致(1)影响结局产生的非研究(外部混杂)因素在比较组间分布应相同。研究(暴露)因素-结局外部混杂因素,8,对于观察性研究:病例对照研究病例组和对照组间,或定群研究暴露组和非暴露组间的外部因素分布频率应该完全相同;对于实验研究:临床试验(或人群干预试验)中的治疗(或干预)组与对照组间外部因素的分布频率应该完全相同。,9,(2)研究指标定义在任何研究时点、任何研究参加单位或研究者均应该采用相同的指标定义,如病例诊断标准等。(3)组间采用的实验室检测方法应该相同。(4)组间资料收集方法应该相同。2统计学推断:以拒绝无效假设和接受备择假设作为判断比较组间有无差异的根据。此外,比较两组95%可信限区间也是精确估计真实差异的重要方法。,10,四、因果推论现场观察研究和临床试验或现场实验研究所获得的因素与结局之间的关联,究竟是表面上的虚假联系还是本质上的因果关系,必须经过因果推论的论证。1.首先确定研究结果有无偏倚的影响:存在严重偏倚的研究资料不宜用来进行统计学检验,不能用来确立因果关系。,11,2.确定因素与结局是否存在统计学上的关联:关联性研究获得的结果可做三种解释:(1)真实的效应;(2)机遇(随机误差)所致;(3)由偏倚所致。,12,统计学检验:帮助研究者了解该OR、RR或RD值由机遇所致的概率(P值)P0.05或P0.01:所获样本的OR、RR或RD值是因机遇而非暴露因素所致的可能性5%或1%;P0.05:无论是观察性研究还是实验性研究所获的结果,如经统计学检验无显着意义时,不能由此便下结论认为因素和结局之间没有本质的关联或药物无疗效,可能还有样本数量是否足够大的问题需要考虑。,13,3.按判断因果关系的原则确定研究结果的因果性质:任何一项观察性研究或实验性研究所获结果,若要下因果关系的结论,除要保证研究结果不存在任何偏倚的影响和经统计学检验证实存在统计学显著意义外,还必须按严格的判断因果关系的下述法则进行逻辑关系的检验:,14,原因和结局的时间顺续(temporality)剂量反应关系(doseresponserelationship)联系的强度(strength)一致性(consistency)合理性(plausibility)实验证据(experimentevidence),15,在有了严格的临床设计并实施后,会得到许多研究所需要的信息,如何运用概率论和数理统计的原理和方法来分析医学信息就是医学统计学的任务了。统计学是描述、归纳、探索数据分布规律、解释数据的科学和艺术,也是研究人员合理地、灵活地运用统计学原理和方法,充分提取试验信息,深入揭示研究事物客观规律的一种手段。,16,二、统计学的内容,1统计研究设计2统计资料的收集、整理、描述和表达3统计分析方法的选择4统计结果的解释,17,统计研究设计,实验性研究(有干预):优点:能够较好地控制非处理因素(即混杂因素)的影响,避免人为造成的偏倚,使要比较的组之间具有均衡性和可比性。缺点:如果样本量小时,不能保证非处理因素(即混杂因素)在组间有较好的均衡性和可比性。,18,对实验因素作有计划安排:以人为受试对象的称谓临床试验设计以动物为实验对象的称谓实验设计观察性研究(无干预)属于调查设计。,19,实验设计的三要素:实验因素实验单位实验效应,20,实验设计的四个基本原则:随机对照重复盲法,21,实验设计类型:随机对照试验(randomizedcontroltrail,RCT)交叉试验(cross-overdesign)队列研究(cohortstudy)病例对照研究(casecontrolstudy),22,三、统计学方法,实验设计资料收集整理统计分析,参数估计(点估计、区间估计),假设检验:样本均数差数间的显著性检验样本率的差数间的显著性检验变量间的回归和相关问题,23,四、应用中的错误-1.实验设计,1、随机化概念不清某文报道“120例肩周炎不同疗法的对比研究”中明确交代病人的分组方法,即“根据病情和就诊先后顺序分组,每组40人”。,24,对差错的分析:这里显然忽视了受试对象的分组应遵守“随机化原则”的要求。因为随机化是削弱或消除非试验因素对试验结果干扰和影响的重要措施之一。病人就诊的先后顺序,往往暗示其病情不同,尤其是当病人的病情轻重难以判断时,若将先来就诊者分为一组,后来就诊的分为另一组,则不可避免地引入顺序误差,从而得出错误的结论。,25,2、假对照某人在研究某药物的治疗铅中毒的驱铅效果时,涉及如下试验,30名铅中毒工人脱离现场后住院治疗的结果观测指标治疗前治疗后血铅(mg/L)0.1810.0290.0730.019*尿铅(mg/L)0.1160.0090.0870.010*与治疗前比p0.01结论:此药有明显的驱铅作用。,26,对错误地分析:本研究试图利用前后对照来说明此药的驱铅效果,统计分析的结果清楚的显示两组之间的差别具有非常显著性。但不能说明此药具有驱铅作用,因为脱离现场后即使不治疗亦有尿铅排出,实际上此研究成了具有“假对照”的研究。,27,正确的设计:如果仅有一种治疗方法需要考察其疗效,就必须有不给于任何治疗的空白对照组。如果患者都必须接受某种治疗,就必须具有两种或两种以上的不同治疗方法。,28,3、对照不全研究者为研究ADI药物预防肠道传染病的效果,设计如下试验:在甲幼儿园随机抽取大、中、小班儿童各50名组成试验组,服用ADI药物(剂量按年龄、体重严格计算);在乙幼儿园随机抽取大、中、小班儿童各50名组成对照组,不服用ADI药物。但两个幼儿园参加此项试验的儿童的饮食、作息时间和体育活动情况是完全相同的。结果发现:甲幼儿园150名儿童肠道传染病的发病率明显低于乙幼儿园150名儿童肠道传染病的发病率(P0.001)。于是,研究者得出结论:ADI药物有预防肠道传染病的作用。,29,对错误地分析:本研究试图利用两个幼儿园并随机设立对照来说明ADI药物有预防肠道传染病的作用。但设计出现了问题,即使两个幼儿园参加此项试验的儿童的饮食、作息时间和体育活动情况是完全相同的,但还有一些目前不了解的影响因素,因此,目前的设计不能得出作者的结论。,30,正确的设计:在甲、乙幼儿园分别随机抽取大、中、小班儿童各50名,然后按随机的原则,每个儿童均有相同的机会被分配到对照组或实验组,这样在每个幼儿园的每个班,均有对照组和实验组,已达到均衡可比。,31,4、组间均衡性差在研究耐力训练与提高战士体质的关系时,设计了如下的实验:以血乳酸为主要观察指标,用20名连队的战士按训练方案进行耐力训练,以机关同龄的20名战士为对照,对照组进行日常活动,观察经4周训练后,两组战士进行一定量的运动时血乳酸的变化。两组战士训练前后血乳酸(mg/L)的观测结果组别训练前训练后训练组38.23.533.13.1*对照组40.04.038.93.5*与训练前比p0.05,47,标准差大于均数资料不符合正态分布3.方差不满足齐性要求,48,2、错误使用t检验胃癌或巨型胃溃疡13人,在实行全胃切除术前后的体重(kg)如下:试比较手术前后体重有无变化?术前42.548.039.046.058.547.539.058.051.043.038.050.057.5术后52.051.545.052.549.055.052.052.050.550.041.051.572.2本题目经t检验,得到t=1.536p=0.138,于是得到手术前后体重无显著性变化的结论。,49,对错误的分析:本项目本身用的设计是自身治疗前后的两次测定,用选用配对t检验的方法。GroupStatisticsNMeanS.DS.E术前1347.53857.25852.0131术后1351.86157.08751.9657而错误的选用独立样本检验时加大了误差,计算t=1.536p=0.138,使本来差异有显著性的变为无显著性。,50,按配对设计进行的检验结果PairedSamplesStatisticsNMeanStd.DeviationStd.ErrorMeanPair1疗前1347.53857.25852.0131疗后1351.86157.08751.9657PairedDifferencesMeanStd.DeviationStd.ErrorMeantSig.(2-tailed)-4.32316.86711.904-2.270.042统计结果:p0.05手术前后体重有显著性变化,术后体重增加。,51,3、t检验代替方差分析测量三组人的舒张压(mmHg),数据如下:A组B组C组,52,NMeanStd.DeviationStd.Error10135.34.371.3810138.24.181.32139.62.63.83,53,组别tp1-21.5150.1471-32.6640.0162-30.8950.382,54,55,t检验与方差分析的比较,比较的内容t检验方差分析加q检验资料的利用率低:每次仅用两组高:每次要用全部数据对原试验设计的影响残:割裂了整体设计全:与原试验设计呼应犯假阳性错误的概率大:1-(1-0.05)n小:=0.05结论的可靠性低:统计量的自由度小高:统计量的自由度大df=n1+n2-2组内误差的自由度,56,4、重复测定数据的处理重复测量资料系指同一受试对象的某项观测指标进行多次测量所得的数据。这类数据间往往有相关性存在,违背了方差分析要求数据满足独立性的基本条件。此时若用一般方差分析方法,将会增大犯I类错误的概率。单因素重复测量资料的方差分析1、方差分析方法同随机区组资料的方差分析。2、两两比较时可进行两组资料之间的配对t检验,但检验水准需进行转换,=/k,k是进行两两比较的次数,57,两种不同剂型在血中的浓度(g/ml)剂型受试者服药后测定时间(j)(i)K1h2h4h6h8h1胶2囊3组.I=18片1剂2组3I=2.8,58,方差分析表变异来源离均差平方和自由度Fp组间(剂型)2635.8114.030.0645组内(时间)41880.79450.770.0001剂型时间951.1941.150.3413(剂型)对象9163.5514误差11548.6456合计66179.9879经过调整系数统计学推断:不同剂型药物的血液浓度间的差别无统计学意义,不同时间的血药浓度间的差别有统计学意义,剂量与时间之间无明显的交互作用。,59,应用中的错误4.相关和回归的应用,研究在专业上有一定联系的两个定量变量之间呈直线关系的密切程度和方向的统计分析方法称为直线相关分析。相关分析:1、计算相关系数r2、对相关系数进行检验3、结合专业知识,评价此相关方法是否有临床实用价值4、计数资料用Spearman秩相关,60,研究在专业上有一定联系的两个定量变量中一个变量随另一个变量变化的依赖关系的统计分析方法称为直线回归分析。依据自变量的个数回归分类为:自变量仅有一个时为一元回归分析自变量有多个时为多元回归分析若自变量个数相同,但同时考察有联系的多个应变量时,称为多重回归分析。,61,为研究小鼠S78-3肉瘤体积Y(cm3)随时间X(日)增长规律,将以下数据回归分析,所得结果如下:时间(日)0691113151719212325272931肉瘤体积0.00420.03080.06140.07440.10280.15160.2101(cm3)0.33900.52010.76231.10201.56902.02142.7661Y=-0.7178+0.00803xt=-2.527p=0.027r=0.849,62,63,若按因变量的性质分类为:因变量为连续性变量时为非时间的连续性变量(如:身高、体重、血压、胆固醇含量等),可用一元、多元回归分析,可直线化的曲线回归分析等。为时间变量(如:患者治疗后的生存时间、复发时间等等),需要运用生存分析中的回归分析方法,如COX半参数回归分析或特定的参数回归模型进行分析。为随时间变化的连续型随机变量(如:某种流行病的发病率等),则通常运用时间序列分析。,64,因变量为离散性变量时为二值变量(如:患者经过治疗后在规定的一段时间内存活情况,常分为“生存”、“死亡”两种情况,患者经过治疗后在规定的一段时间内复发情况,常分为“复发”、“未复发”两种情况,等等)此时,若自变量多为连续性变量,可考虑选用多元逐步Logistic回归分析;若自变量多为定性变量,可考虑选用有序变量的多元逐步Logistic回归分析。为多值有序变量(如:患者经过治疗后的疗效,分为治愈、显效、好转、无效、死亡;糖尿病患者经过一段时间治疗后血糖的测定结果可分为、,等等)此时可用有序变量的多元逐步Logistic回归分析。,65,多变量分析logistic回归已成为现代流行病学危险因素研究的首选方法。在病因和发病因素的研究中,危险因素和疾病的关系是非常复杂的,各种危险因素之间可以相互影响,它们对结果的影响大小也不同。logistic回归能在复杂关系中平衡多种混杂因素的作用,进一步筛选出主要的危险因素,及其在决定病因和发病因素中的相对比重。,66,为多值名义变量(如研究者关心的结果变量为血型,分为O、A、B、AB型,等等)此时若自变量为定
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学信息培训总
- 前端技术模拟面试题及答案
- 患者搬运约束技术培训试题及答案
- 辅警法律知识培训提纲课件
- 农业银行2025兴安盟秋招笔试性格测试题专练及答案
- 邮储银行2025鄂尔多斯市秋招笔试创新题型专练及答案
- 农业银行2025凉山彝族自治州秋招笔试创新题型专练及答案
- 农业银行2025鹰潭市小语种岗笔试题及答案
- 2025年3D打印的食品制造工艺
- 2025行业数字化转型成功案例分析
- 山东大学核心期刊目录(文科)
- 年产62万吨甲醇制烯烃(MTO)项目初步设计说明书
- 中医基础理论-脏象学说
- ICU患者的早期活动
- GB/T 8566-2007信息技术软件生存周期过程
- TSZUAVIA 009.11-2019 多旋翼无人机系统实验室环境试验方法 第11部分:淋雨试验
- GB/T 13452.2-2008色漆和清漆漆膜厚度的测定
- GB/T 12730-2008一般传动用窄V带
- ps6000自动化系统用户操作及问题处理培训
- 手机拍照技巧大全课件
- 基层医院如何做好临床科研课件
评论
0/150
提交评论