临床医学科研设计方法及论文的严格评价.ppt

上传人：优*** IP属地：广东上传时间：2020-03-17 格式：PPT 页数：132 大小：2.74MB 积分：88 举报 版权申诉

已阅读5页，还剩127页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

临床医学科研设计方法及论文的严格评价中华医学会姜永茂一临床医学科研设计方法的分类描述性研究 DescriptiveStudy 病例报告 CaseReport 系列病例分析 CaseSeriesAnalysis 横断面调查 Cross sectionalSurvey 分析性研究 AnalyticalStudy 病例对照研究 Case Controlstudy 队列研究 CohortStudy 干预性研究 InterventionalStudy 随机对照临床试验 RCT 非随机同期对照临床实验 CCT 历史对照临床试验自身前后对照实验 Before AfterStudy 交叉试验 Cross OverStudy 病例报告是有关单个病例或10例以下病例的详尽临床报告系对罕见病进行临床研究的主要形式对新发生的疾病或临床事件的首例报告具有重要的价值许多疾病首次认识都是通过病例报告形式如AIDS 莱姆病等病例报告由于详细描写病例的临床表现和治疗经过有时可以提示实验室尚不能证实的发病机制如血小板减少性紫癜海豹肢畸形高度选择容易出现偏倚不能估计疾病或临床事件的发生频率据Fletcher统计国外主要的医学期刊发表的原始研究中大约20 30 为10例以下的病例报告如BMJ的 LessonoftheWeek 病例报告实例 1980 1981年6个月的时间内洛杉矶三家医院先后发现5例以前健康的男性同性恋青年患卡氏肺囊虫肺炎这种情况引起了人们的注意因为这种类型的肺炎以前几乎毫无例外地发生于老年男性或女性因为他们的免疫系统受到了抑制这种不常见的情况提示医生他们可能患了一种以前不知道的疾病后来证实他们患的是获得性免疫缺陷综合征即艾滋病HymesKB GreeneJB MarcusA etal Kaposi ssarcomainhomosexualmen areportofeightcases Lancet 1981 2 598 系列病例分析是对一组病例资料进行的分析一般 10例可以是前瞻性的但多数是回顾性的病例资料不全对病例有一定的选择性容易导致偏倚缺少对照难以比较效果评价 1 样本量 2 前瞻性还是回顾性 3 连续样本抽样样本选择样本 4 诊断标准系列病例分析实例 1997年新英格兰医学杂志报道了24例既往健康且相对年轻的妇女患有瓣膜性心脏病通过分析发现这些妇女在患病前的1年时间里均服用了一种通过抑制食欲而达到减肥目的的减肥药 fenfluramine phentermine 作者推论这种减肥药可能导致严重的瓣膜性心脏病后经病例对照研究证实 ConnollyHM Valvularheartdiseaseassociatedwithfenfluamine phentermine NEnglJMed 1997 337 581 588 描述性研究的评价病例报告和病例分析都是描述性研究缺乏严格的科研设计和规范的对照分析科学性差论证强度低只能为进一步进行分析性和试验性研究提供线索本身并不能验证假设但描述性研究容易进行临床医生面临大量临床资料和病史记录随时可以总结分析所需时间短不需很多的人力物力因此至今仍是临床医生应用的最主要的科研设计方案横断面研究是在某一时点或相当短的时间内如1天一周或一个月对某一人群中有关疾病或临床事件的患病或发生状况及影响因素进行调查分析因此又称为现况研究或患病率研究现况研究的目的是了解某一疾病或临床事件的发生状况及其影响因素根据不同的研究目的可获得不同的结果如患病率抗体阳性率实验室指标的阳性率疾病的伤残率和死亡率等诊断试验评价的科研设计可以视为特殊形式的横断面研究横断面研究实例我国糖尿病研究协作组进行的我国14省市30万人口糖尿病调查报告是我国首次在全国范围内进行的糖尿病患病率调查获得我国糖尿病的实际患病率为0 609 对研究我国糖尿病的分布及制定防治规划都有十分重大意义评价这项研究要注意所抽取的30万人口作为研究对象代表性如何所应用的筛选试验本身敏感性和特异性如何糖尿病的诊断标准如何确定可同时进行危险因素调查如年龄性别吸烟饮酒等横断面研究的评价横断面研究基本上属于描述性研究但与病例报告及病例分析相比其研究设计较为严密需要计算样本大小在选择研究对象抽样方法影响因素的调查及结果的分析等方面均较为规范对患者和非患者的特征及影响因素又可以进行某些比较性研究和分析现况研究主要是通过普查和抽样调查方式进行普查是对选定的目标人群的所有对象都进行调查抽样调查则随机抽取目标人群的样本人群作为研究对象代表性最好的抽样方法是随机抽样横断面研究的评价横断面研究论证强度较低用于病因或预后研究时因为是同时调查疾病和影响因素没有时间因果关系因此横断面研究主要功能是普查或抽样调查获得疾病的患病率及用于诊断试验的评价而对防治病因预后研究只能是提供线索为进一步作分析性研究或试验性研究打下基础病例对照研究病例对照研究是一种用于分析暴露和疾病或临床事件之间因果关系的分析性研究设计方案选择具有所研究疾病或临床事件的一组病人组成病例组无此病或临床事件的一组为对照组比较两组的暴露率或暴露水平的差异以研究该疾病或临床事件与暴露的关系如果病例组的暴露率或暴露水平高于对照组则认为该暴露因素与疾病或事件有联系这里暴露指暴露于某些危险因素具有某种预后因素或接受某种诊疗措施等病例对照研究的设计模式病例对照研究的结果病例组对照组有暴露因素ab无暴露因素cdOddsRatio OR a b c d ad bc进行卡方检验计算P值和可信区间 95 CI 病例对照研究实例瑞典进行了一项大规模病例对照研究来探讨胃食管反流和食管腺癌的关系研究者收集了189例食管腺癌患者和820例经年龄性别配对的对照组以同样方式调查了两组烧心等症状的情况食管腺癌组对照组烧心反胃或都有113135 至少每周一次无上述症状76685OR 7 5 95 CI 5 3 11 4 严重者OR 43 5 18 3 103 5 Symptomaticgastroesophagealrefluxasariskfactorforesophagealadenocarcinoma NewEnglJMed 1999 340 825 831 病例对照研究的特点研究对象分成病例组和对照组并不是随机化分组因此按有无被研究的疾病或临床事件来分组因此病例组和对照组不是研究者能控制的所调查的研究因素是由研究者从现在对过去的回顾而获得因此是回顾性研究从因果关系的角度来看是先有了疾病再去调查暴露情况分析疾病和暴露的关系因此是由果推因的研究病例对照研究的优点所需样本量较少适合于罕少见疾病的研究调查暴露情况采用回顾性方法适用于对长潜伏期疾病的研究如化学因素致癌作用常需10 20年允许同时调查许多因素与研究疾病的联系可以使用病史记录作为数据来源省人省时省钱科研周期短容易出成果病例对照研究的缺点选择合适对照组非常困难对照组系由研究者自行选择难免产生选择偏倚暴露率和暴露水平的测量是在患病之后回顾而获得因此特别容易受到回忆性偏倚的影响不能计算发病率只能计算相对危险度用优势比 oddsratio OR 来估计论证强度不及队列研究和试验性研究因此当病例对照研究得出的结论有争议时应进一步设计队列研究加以证实队列研究队列研究也是一种用于分析暴露和疾病或临床事件之间因果关系的分析性研究设计它把一群研究对象按是否暴露于某种因素分成暴露组与非暴露组随访适当长的时间比较两组之间所研究疾病或临床事件的发生率发病率或死亡率的差异以研究疾病与暴露之间的因果关系队列研究的设计模式队列研究的结果患病无病危险性暴露aba a b 非暴露cdc c d RelativeRisk RR a a b c c d AttributableRisk a a b c c d 队列研究的实例世界上最著名的队列研究是由AustinBradfordHill爵士 RichardDoll爵士及后来的RichardPeto进行的这项研究为最初的两位作者赢得了爵位他们通过问卷随访了34440名英国医生将他们分为四个队列非吸烟者轻度吸烟者中度吸烟者重度吸烟者应用全病因死亡率和特异病因死亡率作为观察结果在1964年发表的10年初步报告中显示吸烟者无论肺癌死亡率还是全病因死亡率都大幅度升高并且有剂量效应关系吸烟越多患肺癌的几率越大这项重要研究的20年和40年的结果对1951年收集并且没有死亡的研究对象的随访率达到惊人的94 不仅表明了吸烟的危害性也表明了从一个执行良好的队列研究中获得证据的重要作用队列研究的实例吸烟者和非吸烟者每年每100000人死于肺癌和缺血性心脏病的人数肺癌缺血性心脏病非吸烟者10413吸烟者1406691 14 d7860815 24 d127652 25 d251792吸烟者和非吸烟者肺癌RR 140 10 14 25 d者RR 25 1吸烟者和非吸烟者缺血性心脏病RR 669 413 1 6肺癌AR 140 10 130 100000 year缺血性心脏病AR 669 413 256 100000 year 队列研究的优点可设立前瞻性的同期对照除了暴露因素接触与否外各队列中纳入的观察对象诊断标准和纳入排除标准以及观察指标等都可作到标准化因此论证强度高可靠性强因为暴露在前疾病在后确定暴露没有偏倚由于是前瞻性观察没有回忆性偏倚临床应用广病因研究预后研究防治效果远期疗效的观察等都可以应用特别是在病因及危险因素的研究中有重要价值 RCT不能进行时队列研究是最好的设计方案队列研究的缺点在发病率很低的疾病需要很大的样本数并且有些暴露因素从接触到发病有很长的潜伏期因此不适用于少见疾病的研究队列研究属于观察性研究分组是自然形成的与试验性研究相比容易产生偏倚容易发生失访偏倚如失访率在10 以上就可能会影响研究结果由于随访时间较长在此过程中会发生许多事件或因素很难判定最后出现的结果只与所研究的暴露因素有关随机对照临床试验试验组和对照组的分组是采用真正随机化分配方法两组都被随访一个特定的时期然后按预先确定的终点指标死亡心脏病发作血清胆固醇水平等进行分析 RCT还可按是否实行盲法 blinding 分为单盲试验双盲试验和开放试验 open或openlabel 后者不实行盲法随机对照双盲试验 randomized controlled doubleblindedtrial 被认为是最佳的科研设计方法是科研设计的金标准目标人群研究样本随访时间未改善改善改善未改善试验组比较组随机对照临床试验实例 4S研究 ScandinavianSimvastatinSurvivalStudy 入选4444例患有冠心病且血清胆固醇为5 5 8 0mmol l的患者随机分为两组一组接受辛伐他汀治疗另一组接受安慰剂治疗该试验是双盲且结果评价人员也不了解分组情况一级终点是总死亡率二级终点是主要冠状动脉事件发生率两组随访条件一致平均随访5 4年结果辛伐他汀组总死亡率8 2 安慰剂组11 5 相对危险性减少 RRR 为29 绝对危险性减少 ARR 为3 3 需要治疗人数 NNT 为30 随机对照临床试验的优点前瞻性设计是检验一种假设的最有力的方法随机化分组试验组和对照组之间的均衡性好增加了可比性排除了很多非研究因素的混杂偏倚有严格的诊断纳入排除标准观察指标与判断标准统一在很大程度上减少了偏倚的发生双盲法减少了观察性偏倚允许作系统评价 systematicreview 和汇总分析 metaanalysis 随机对照临床试验的缺点昂贵且耗时因此许多RCT 或者从未作过或者研究对象太少或者研究的时间太短经常使用替代终点指标而非临床结果可导致潜在的偏倚随机化方法不正确或随机化不理想没有对所有合格的患者进行随机化分组排除了不典型合并症预后差禁忌症的病人需要病人知情同意实施困难医学伦理学问题系统评价和汇总分析 1973年一个小样本研究证实对早产妇女给予皮质类固醇激素可以降低婴儿死亡率随后10年又进行了6个研究因为样本量都很小所以其结果不一致假如在1983年进行汇总分析就会发现这些试验总的结果表明类固醇激素治疗具有有益的作用但又过了10年并又进行了另外7个研究才最终证实了类固醇治疗的作用临床实践才开始改变论文质量重要性原始性真实性可读性可重复性科学性实用性伦理性二医学论文的严格评价医学论文科学性的严格评价研究设计的因素研究对象的因素观测结果的因素资料收集与整理的因素统计分析的因素证据的等级我国临床研究的现状科研设计方法1985年1995年病例报告95 14 8 72 7 6 临床试验221 34 5 298 31 2 对照临床试验 CCT 36 5 6 108 11 3 随机对照临床试验 RCT 8 1 3 40 4 2 前瞻性研究25 3 9 57 6 0 回顾性研究160 25 0 133 13 9 横断面研究272 42 5 452 47 4 实验性研究52 8 1 132 13 8 合计640 100 954 100 对科研设计方法的正确评价科研设计方法的选择取决于不同的研究阶段循序渐进取决于不同的研究领域诊断性研究取决于不同的疾病罕少见疾病取决于医学伦理学的要求治疗性研究的恰当时机各种科研设计方案的应用范围研究对象的因素研究对象的纳入排除标准研究对象的代表性连续样本抽样样本选择样本 RealWorld 样本大小分组情况无对照对照随机对照干预措施的隐匿情况随访时间失访率观察结果的因素测量结果的质量控制方法是否采用盲法客观主观替代终点指标与临床终点指标诊断性研究的评价描述性研究横断面研究选择研究对象确立标准诊断将对象分为有病无病用研究的诊断方法检查对象结果与标准诊断比较计算评价指标前瞻性或回顾性 Sensitivity a a c Specificity d b d Efficacy Accuracy a c a b c d PositivepredictiveValue a a b NegativePredictiveValue d c d 诊断性试验的评价 1 是否与标准诊断方法进行盲法对比标准诊断方法指当前公认的诊断疾病最可靠的方法也称金标准常用的金标准有病理学诊断手术特殊的影象诊断冠造诊断冠心病也可用公认的综合诊断标准标准诊断的选择应结合临床具体情况标准诊断选择不妥将造成病例组对照组划分错误如评价B超对胆石症的诊断价值采用口服胆囊造影作为诊断胆石症的金标准实际上口服胆囊造影要比B超为差从而造成敏感性特异性评价结果的不正确诊断性试验的评价 2 研究对象能否代表试验检查对象总体病例组应包括该病的各种临床类型轻中重型早中晚期典型和不典型有和无并发症等使试验结果具有代表性对照组应选自确实无该病的其他病例应包括易与该病混淆的其他相关疾病这样才具有鉴别诊断价值研究对象应是同期进入研究的连续样本或随机抽样样本避免选择偏倚样本量应足够大样本偏倚 SpectrumBias 分期病例组对照组目的I小量典型病例观察实验的性能II小量典型病例健康人初步鉴别诊断III病例范围扩大健康人更进一步鉴别诊断IV包括伴发疾病包括易混淆的疾病具有临床鉴别诊断意义V广泛病例广泛的易混淆疾病验证临床价值AndrewA Nierenberg AlvanR Feinstein 癌胚抗原的评价 RansohoffDR和FeinsteinAR检索了1969 1973年英文杂志发表的有关CEA诊断结肠癌的文章发现17篇其中3篇早期进行的研究报告CEA有很高的敏感性 90 1篇报告有很高的特异性 90 但应用上述标准对这些研究进行评价却发现研究对象存在问题癌胚抗原的评价结肠癌病例组17个研究均没有按临床如疾病严重程度或合并疾病进行分类3个报告有高敏感性的研究没有进行病理分期即没有说明是否包括局限性病例其他14个研究中7个报告低敏感性病例均进行了病理分期包括了局限性病例CEA对广泛侵润病例的敏感性比局限性病例高对照病例应包括其他部位的癌症患者如乳腺癌肺癌及同一部位的其他疾病患者如结肠炎 17个研究中只有1个报告CEA有高特异性对照组包括其他癌症和结肠疾病但疾病的侵犯范围没有报道16个研究报告低特异性 6个指出了侵犯范围诊断性试验的评价 3 是否介绍了研究对象的来源三级医院的专科门诊和基层医院的普通门诊某些疾病的患病人数和病情有很大差别如报道肾动脉造影对青年高血压患者的诊断价值专科医院可查出10 的肾动脉狭窄对照组的来源也必须交待清楚如实验室工作人员医学生等诊断性试验的评价 4 精确性及测量偏倚是否作了描写必须描写试验的精确度和可靠度可重复性报告有否测量偏倚操作者水平和操作者间偏倚一致性 kappa值诊断性试验的评价 5 参考值的确定是否合理可靠正常值与参考值的区别正态分布的数据参考值为均数 2s 包括95 的正常范围双侧各2 5 为不正常非正态分布的数据参考值可用中位数和百分位数表示数据常有重叠临界点的确定取决于对敏感性和特异性的要求 ROC曲线可帮助确定临界点诊断性试验的评价 6 是否说明了在一组试验中的价值如诊断试验作为一组试验平行试验或系列试验之一用于临床除测定该组试验总的诊断价值外还应测定该试验在该组试验总的诊断价值中占多少价值诊断性试验的评价 7 是否介绍了具体方法和注意事项试验对象方法和结果的判断应加以叙述被检查者是否需要摄入量饮食或体力活动等方面的限制是否要禁用某种药物是否有不良反应诊断性试验的评价 8 是否作了效用分析四格表计算敏感性特异性预测值似然比介绍假阳性假阴性病人的最后结局如对诊断阳性的病人常进行特异的治疗对阴性的病人不治疗其中肯定包括假阳性的病人接受了治疗假阴性的病人未接受治疗会出现那些结果诊断性试验中常见的偏倚 1 病情检查偏倚对试验出现阳性结果的患者用金标准确诊而对阴性结果的患者则不再进一步检查造成缺乏假阴性的资料这种情况下会出现敏感性升高特异性降低的假象即病情检查偏倚据调查 1990 1993年世界主要期刊有关诊断性试验的文章中38 的研究中存在这种问题诊断性试验中常见的偏倚例如确定病史体检在冠心病诊断中的作用对1030例门诊怀疑冠心病患者通过病史体检有168例进一步作心导管确诊报告敏感性74 特异性84 而全部病例无偏倚的敏感性为53 特异性为93 诊断性试验中常见的偏倚 2 缺乏对照人群试验结果造成的偏倚实际上是一种描述性研究病例分析例如有腰背痛的患者做MRI检查发现许多人有椎间盘突出故常用此结论来解释原因并进行治疗另一篇文章对98例无腰背痛患者作MRI检查 2 3有椎间盘突出发生率略低但无统计学差异诊断性试验中常见的偏倚 3 由病例丢失引起的偏倚诊断试验常有结果不明确者在资料分析时作者常将他们剔除从而造成结论不真实1990 1993年的世界主要期刊中约62 的研究存在此种偏倚诊断性试验中常见的偏倚 4 审阅者偏倚审阅者事先已知道试验结果所造成的偏倚1990 1993年世界主要医学期刊中约53 的研究有此偏倚诊断性试验中常见的偏倚 5 测量偏倚试验操作不正规缺乏质量控制没有进行重复性测定没有对观察者仪器在不同时间测定的变化加以分析1990 1993年世界主要医学期刊中约68 的研究有这类问题诊断性试验中常见的偏倚 6 评价指标不全面许多文章没有关于敏感性特异性预测值似然比可信区间 ROC曲线等评价指标全面的描述约76 的研究有此问题诊断性试验中常见的偏倚 7 样本数太少样本量的大小取决于对敏感性特异性的要求和允许误差的大小诊断性试验中常见的偏倚 8 参考试验偏倚是指金标准选择不当所造成的偏倚如评价B超对胆石症的诊断价值采用口服胆囊造影作为诊断胆石症的金标准实际上口服胆囊造影要比B超为差从而造成敏感性特异性评价结果的不正确病因及发病因素研究的评价 1 是采用哪一种研究方法其论证强度如何描述性研究病例对照研究队列研究随机对照临床试验暴露组与非暴露组的可比性如何病因及发病因素研究的评价 2 因果关系相关性的强度如何在随机对照临床试验和队列研究中采用相对危险度 RR 作为表示因果关系相关性强度的指标即试验组该病发病率是对照组的多少倍在病例对照研究中采用优势比 OR 表示相关性强度即暴露于某种危险因素发生某病的危险性是对照组的多少倍 RR或OR越大表示因果关系相关性越强病因及发病因素研究的评价 3 结论的重复性如何如果结论能够重复也就是说在不同地区不同作者不同研究方法均能获得一致结论表明这种病因学的相关性是比较肯定的如吸烟和肺癌的关系美国作了前瞻性队列研究追踪85348名男性老年人吸烟者患肺癌的RR为10 我国天津曾作病例对照研究发现男性吸烟者患肺癌的OR为6 病因及发病因素研究的评价 4 因与果在时间上的先后关系是否正确某一病因侵袭人体而导致发病是有一定的效应时间的这种间隔时间还应呈现一定的规律先暴露于发病因素或危险因素然后发病符合暴露发病关系者才能明确其因果关系 2020 3 17 67 可编辑病因及发病因素研究的评价 5 是否有剂量效应梯度如口服雌激素避孕药发现使用1 4 9年者患子宫内膜癌的RR为5 6 使用5 6 9年者上升至7 2 使用7年以上者则为13 9 存在剂量效应关系也是论证因果关系的一个重要根据病因及发病因素研究的评价 6 因果关系是否有流行病学上的意义如乙型肝炎发病率高的地区肝癌的发病率也高评价有关病因学方面的文献还要看所论证的因果关系是否符合流行病学的规律病因及发病因素研究的评价 7 因果关系是否有生物学意义如在人体肝细胞癌的组织细胞内发现HBV DNA HBV DNA侵袭人体肝细胞时有可能诱发肝癌在肝癌发病率高的小鼠肝细胞内也发现有类似HBV DNA的物质因此肝癌发病的病毒病因存在生物学证据病因及发病因素研究的评价 8 因果关系是否有特异性如凝血因子VIII遗传性缺陷引起血友病这是特异的但绝大多数疾病是多因素致病要论证其因果关系比较复杂预防和治疗研究的评价 1 是否设有对照组分组是否随机化 2 随访是否完整是否按随机化分组进行分析 3 是否采用盲法预防和治疗研究的评价 4 基线资料是否具有可比性随机化并不总是很好地平衡两组样本小时机遇的作用更明显因此必须对基线资料进行比较以确定两组资料的可比性这里不是比较两组间在预后因素的分布上有没有统计学的显著性差异而是比较这些差异的大小因为随机分组后任何组间基线情况的差异都是由机遇产生的预防和治疗研究的评价 5 终点指标是否与临床直接相关是否报道了临床上所有有关的结果免疫增强剂提高免疫球蛋白水平但是否能够减少死亡率还需进一步研究替代终点安妥明降低血脂有预防心肌梗死发生的作用但安妥明治疗组的总死亡率却比安慰剂组高与安妥明引起心律失常的不良反应有关预防和治疗研究的评价 6 是否详细介绍了研究对象的情况纳入排除标准病情轻重研究地点三级专科医院还是基层医院有无并发症读者可根据上述情况应用研究结果预防和治疗研究的评价 7 是否同时考虑到临床意义和统计学意义 P值说明如果无效假设正确 1 2 时发现这种差异或更大差异的可能性如果P值很小一般0 05 则推翻无效假设 P值越小越有理由推翻无效假设推翻无效假设则接受备择假设即 1 2 但这只是说 1与 2不相等并不能得出两者相差有多大的结论当样本很大时尽管差异很小 P值也会很小因为此时抽样误差很小预防和治疗研究的评价 7 是否同时考虑到临床意义和统计学意义临床意义是指这种差异在临床上是否有价值几种情况有临床意义有统计学意义有临床意义无统计学意义评价样本量无临床意义有统计学意义无临床意义无统计学意义预防和治疗研究的评价 7 是否同时考虑到临床意义和统计学意义例有人对7674例男性和2896例女性进行了沙眼患病率的调查结果男性沙眼患病率为81 25 女性沙眼患病率为76 83 作者认为男性与女性患病率相差不多但某位统计学家对这一结果进行了差别的统计学检验发现P 0 001 得出了有极显著差别的结论正确表达差别有统计学意义有高度统计学意义临床意义不仅与差异的大小有关如肺癌5年生存率有50 提高到55 但肺癌死亡率很高很有意义预防和治疗研究的评价 8 是否介绍了防治措施的实用性治疗方法应详细描述不良反应情况在临床上和生物学上是合理的依从性成本效益分析预后研究的评价 1 是否都有统一的起始点是否都是从最早出现症状开始观察或是从确诊开始观察起点不统一常会造成偏倚例如研究心肌梗死的预后如收集心脏监护室的病人观察其病死率多少常得出预后较好的结论因为许多还来不及送到医院或死于急诊室的病例没有统计进去预防和治疗研究的评价 2 是否介绍了研究对象的情况和病例的来源如病例的年龄性别严重程度和有否并发症等都与预后有关三级医院和基层医院病人不同例如有关儿童高热惊厥一次发作后癫痫的发生率如何大医院儿童专科医院中的病例和在人群中统计有很大的差别预防和治疗研究的评价 3 是否所有的对象都进行了随访如没有失访率是多少如果失访率超过10 就会影响预后的估计如果失访率达20 以上结论就不可靠预防和治疗研究的评价 4 是否有客观的预后指标肿瘤的预后可用5年生存率表示预防和治疗研究的评价 5 预后估计是否采用了盲法三我国医学期刊发表的论文中存在的问题科研设计方面能够提供较强证据的论文很少缺少对照组或对照组不恰当样本量不足样本缺乏代表性没有采用随机化方法或随机化方法描述不充分我国医学期刊发表的论文存在的问题统计学分析方面没有采用统计学分析方法没有描述所采用的统计学方法所采用的统计学方法要求的前提条件不符合多重t检验代替方差分析将重复测量结果作为独立变量进行处理忽略配对特性很少采用可信区间很少采用多元分析或生存分析方法我国医学期刊发表的论文存在的问题结果解释方面错误理解P值含义过分相信小样本研究得出的阴性结果过分强调二级终点结果或亚组分析结果我国医学期刊发表的论文存在的问题资料描述方面缺少关键信息的描述尤其是在资料与方法部分我国医学期刊发表的论文存在的问题发表偏倚阳性结果的论文比阴性结果的论文有更大地被发表的机会我国医学期刊发表的诊断性研究的评价上海医科大学检查了5种中华系列杂志1985和1995年发表的112篇诊断性研究论文缺乏金标准18只有阳性率无敏感性特异性等指标40没有论文采用似然比和ROC曲线我国医学期刊发表的治疗性研究的评价年份杂志名称科研设计论文数无对照CCTRCT1963新英格兰医学杂志3554 0 37 0 9 0 1975新英格兰医学杂志4734 0 26 0 40 0 1976中华内科杂志5074 0 24 0 2 0 1985中华内科杂志2751 9 25 9 22 2 1997中华内科杂志3633 3 35 2 31 4 1997 8中华消化杂志3138 7 25 8 35 5 1998 9中华老年医学杂志277 5 1978 97中华结核呼吸杂志39476 7 12 8 10 5 1980 98上海中医杂志197181 9 9 9 9 2 我国医学期刊发表的治疗性研究的评价 1995 1996年35种中国医学杂志发表的164篇治疗性研究论文中随机化描述25 15 2 描述但错误9 5 5 未描述130 79 3 基线资料完整基线资料42 28 7 简单描述27 16 5 未描述90 54 8 样本量10 15000 均未说明样本量的确定方法我国医学期刊发表的病因性研究的评价史宗道检查了6本国内杂志1994 1997年发表的61篇有关病因研究的论文其中14篇为队列研究 15篇为病例对照研究 32篇为横断面研究14篇队列研究中 5篇考虑了混杂因素 6篇采用了RR来指示联系强度15篇病例对照研究中 10篇考虑了混杂因素 14篇采用了OR来指示联系强度32篇横断面研究中 8篇应用了OR或RR在29篇分析性研究中 14篇研究样本量不足结论大约一半的论文存在方法学缺陷我国医学期刊发表的预后性研究的评价评价3本杂志发表的12篇预后研究的情况5篇为回顾性研究8篇无对照组4篇样本量 30例部分论文不是一个一致的起始队列在7篇前瞻性研究中只有1篇失访率 10 很少有论文应用Cox模型或逻辑回归分析四出现问题的原因一作者的责任论文质量不高缺乏科研设计统计学论文写作方面的培训缺少与有关科研设计方面专家的沟通缺少简明实用的面向临床医生的科研设计和统计学方面的教科书晋升的压力医生只注重发表论文的数量忽视论文的质量大学和医院的科研管理机构审查把关不严格出现问题的原因二杂志的责任稿件审查不严审稿专家过于注重科研课题的重要性对科研设计和统计学方法的问题重视不够编辑人员过于依靠审稿专家在学术上把关只注意文字和规范方面的编辑加工忽视了对论文科学性方面的审查上述两方面能力加强许多问题资料不完整统计学缺陷或错误等可以在发表前改正出版政策篇幅限制发表偏倚等五问题的后果研究对象承受了一定的风险和痛苦但没有获得任何有益的结果造成资源的浪费包括时间资金医院床位和设备等因为错误的研究结果本身或因为错误的研究结果延误了更有效的治疗方法的研究患者可能因此而接受错误的治疗方法误导如果研究中存在的问题未经改正就发表研究者以后还会犯同样的错误其他研究人员也可能会模仿采用错误的科研设计方法问题的严重性医学期刊发表的论文中出现质量问题会造成非常严重的后果所以有专家指出错误应用科研设计方法和统计学方法不仅仅是科研水平问题更是科研道德问题作者编辑审稿人员应对这一问题应给予足够的重视六改进措施一长期措施加强对科研人员的培训普及科研设计和统计学方面的知识尤其是应尽快为非统计学专业的临床科研人员提供简明实用的教材加强统计学家和临床流行病学家的咨询作用科研人员主动征求上述专家的意见提高科研管理人员的素质强化科研管理部门的职能使其在对科研人员的培训科研方案的审批科研过程的监督科研论文的投寄等方面起到应有的作用改进措施二短期措施鉴于目前医学期刊发表的论文存在较严重质量问题的现状杂志应切实负起自己的责任通过杂志自身的努力和引导可以在较短的时间内提高所发表论文的学术质量杂志应在以下三个方面加强工作 1 普及科研设计和统计学方面的知识提高科研人员的科研水平以便生产出更多更好的米科研成果 2 普及医学论文写作方面的知识为作者提供详细的论文撰写指南和投稿须知以便作者做出最好的饭稿件 3 普及医学论文严格评价方面的知识教育读者如何批评性地吸收论文中研究结果以便对论文的内容更好地消化阅读杂志本身应采取的措施一提高编委和审稿人员对论文科研设计和统计学方面问题的认识为其提供内容详细的审稿单提出对论文每个部分应注意审查的问题二吸收更多的临床流行病学家和统计学家进入杂志编委会和审稿组尽可能将所有与统计学有关的论文送给他们审阅修改后的论文应再次送给他们审阅三加强对编辑人员的培训充分发挥编辑人员在学术内容方面的审查把关作用四建立和完善一系列的出版政策并大力宣传 1 优先发表科研设计严谨论证强度高的科研论文如RCT 队列研究病例对照研究等 2 拒绝发表低水平重复研究的论文 3 鼓励研究和发表有关新的科研方法和设计方法的论文 4 对阴性结果的论文给予与阳性结果的论文同样的发表机会 5 鼓励作者将研究设计方案送杂志编辑部审阅尤其是大规模临床试验研究 6 鼓励作者将原始资料送杂志编辑部供审稿使用 7 杂志不应硬性限制论文的字数论文的长短应根据论文的信息含量来确定编辑不应以篇幅限制为由随意删减论文中必要的内容七临床试验报告的强化标准只有在发表的论文中全面和准确地描述有关RCT设计实施和分析的情况才有可能对临床试验的质量进行严格的评价但是在发表的论文中对RCT的报告经常是不充分的远没有达到透明的要求再加上因为方法学拙劣而出现的问题增加了对RCT评价的难度临床试验报告的不完整性许多回顾性检查证明临床试验报告中存在着缺陷例如 1979 1980年在4种最主要的医学杂志发表的67篇临床试验报告中只有30 报告了对终点指标的评估是否采用了盲法同样在1985年发表的45篇报告中只有27 详细说明了一级终点 endpoint 在1990年发表的37篇得到阴性结果的临床试验中只有43 报告了样本量的计算方法临床试验报告不但经常不完整而且有时不准确在119篇声明是按研究对象预先分配情况对各组中包含的所有研究对象进行分析意向分析 intention to treatment analysis 的报告中 15篇 13 分析时把部分研究对象排除在外或未按预先分配情况对所有研究对象进行分析另外许多回顾性检查发现报告不充分更常见于专科杂志和非英语出版的杂志因为通过恰当的随机化 randomization 可以消除选择性偏倚 selectionbias 所以随机化是高质量RCT的一个至关重要的组成部分成功的随机化依赖于以下两个步骤 1 生成 generation 一个不可预测的分配顺序 2 对负责入选研究对象的研究人员隐匿该分配顺序遗憾的是发表的论文中对所采用的将研究对象分配到不同干预措施中的方法的介绍通常也是不完整的例如在妇产科杂志发表的206篇所谓的RCT报告中至少有5 描述的研究并非真正随机这个估计是比较保守的因为目前大多数研究没有充分提供有关研究对象分配方法的信息报告临床试验的强化标准 DerSimonian及其同事曾经提出如下建议即编辑人员通过向作者提供期望严格报告项目的一览表可以显著提高临床试验的报告水平早在20世纪90年代两组编辑临床试验专家和方法学专家就分别发表了有关报告临床试验的建议在随后的一篇评论中 Rennie极力主张这两个组互相接触并制定一套共同的建议其结果就是CONSORT声明报告临床试验的强化标准 CONSORT声明或简称CONSORT 包含一个核对表和一个流程图核对表中包含了应该在RCT报告中介绍的关键项目而流程图则用以说明研究对象在整个试验过程中的流动情况 CONSORT最初是为报告两组平行对照RCT而制定的但CONSORT中的大多数内容对于许多其他类型的试验设计也是适用的 CNGSORT声明核对表项目1 研究对象是如何被分配到不同的干预措施中如随机分配 randomallocation 随机化 randomized 随机指派 randomlyassigned 举例文题应用经口尼古丁吸入器减少吸烟量效果和安全性的双盲随机临床试验 62 Title Smokingreductionwithoralnicotineinhalers doubleblind randomizedclinicaltrialofefficacyandsafety 62 摘要设计随机双盲安慰剂对照临床实验 63 Abstract Design Randomized double blind placebo controlledtrial 63 在电子数据库中识别一篇相关报告的能力很大程度上取决于它是如何被标引的如果作者没有在论文中清楚地说明所进行的研究是RCT 美国国立医学图书馆MEDLINE数据库的标引员就有可能不会将该报告分类为RCT 为了保证一篇研究论文能够被正确地标引为RCT 作者应该在其论文的摘要中清楚地说明研究对象是被随机分配到进行比较的各个组中恰当的措词包括研究对象被随机分配到治疗是随机化的研究对象是通过随机分配的方法被分配到不同的干预措施中同时我们也强烈呼吁在论文的文题中使用随机化 randomized 这个术语以便论文在检索时立即被识别出来在20世纪90年代中期如果要查找与某一主题有关的全部RCT 通过MEDLINE电子检索仅仅能查找到一半左右该缺陷已通过Cochrane协作网的工作得到了部分弥补截至到1999年 Cochrane协作网已经识别出MEDLINE中未标引出来的近100000个RCT 这些报告被重新进行了标引遵守该建议可以提高未来标引的准确性当需要对报告进行总结时我们鼓励采用结构式摘要结构式摘要中包括了与试验设计实施和分析有关的一系列小标题每个小标题中包含了标准化的信息一些研究已经发现结构式摘要比传统的描述性摘要质量更高并且使读者更容易找到所需要的信息 CNGSORT声明核对表项目2 研究的背景和研究的理论基础举例腕管综合征是因为腕部正中神经受到压迫而引起的是臂痛的常见原因尤其对于妇女在建议的许多种治疗方法中皮质类固醇注射是其中之一这种注射的技术要求之一是注射位置必须最接近于腕管但又不能注射到腕管中选择该注射位置的理由是在邻近腕管的前臂掌面经常有水肿可能导致对正中神经的压迫另外在此部位注射对正中神经损害的危险性比在狭窄的腕管内注射要小联合应用利诺卡因和皮质类固醇有两方面的理由注射没有疼痛减少了注射后期的感觉使注射得以恰当的进行我们通过双盲随机临床试验首先研究了在最接近腕管处注射皮质类固醇后症状是否消失其次观察了在治疗后的随访过程中多少病人仍然保持没有症状典型的引言是由流畅的文字组成没有固定的格式在引言中作者需要说明研究的背景并解释进行该项试验的理论基础在引言的第一部分中作者应该描述究竟是因为什么问题必须进行这项试验通过对所研究问题的性质范围和严重程度的描述提供研究的背景说明研究的必要性 RCT报告中经常缺少这方面的信息另外作者还应该简要地描述大概的研究方法在引言中包含试验的目的也是恰当的 CNGSORT声明核对表项目3a 研究对象的入选标准举例凡是年龄20 44岁月经规律需要在Kenyatta国家医院家庭福利中心放置宫内避孕器的妇女均纳入本研究如果存在下列任何一项标准则不能进入本研究 1 宫外孕史 2 过去42天内妊娠 3 子宫肌瘤 4 活动性盆腔炎性疾病 5 子宫颈或子宫内膜恶性肿瘤 6 已知对四环素过敏 7 过去14天内使用过任何抗生素或既往注射过长效青霉素 8 对感染的反应受到损害 9 Nairobi市以外的居民随访地址不完整或不愿意回来随访任何RCT都只是阐述了与某些特定人群有关的问题临床试验专家通常通过采用入选标准和在一个或少数几个中心进行试验来限制所研究的人群典型的选择标准可能涉及到年龄性别临床诊断和伴发疾病排除标准经常被用来保证病人的安全入选标准应该清楚地加以说明如果与研究有关的话任何已知的病人诊断方面的不准确性都应该进行讨论因为这将影响到试验的效能作者需要对研究对象和研究环境进行详细的描述因为读者据此可以评价试验结果的外部真实性外延性可推广性尽管入选标准非常重要但研究报告中仍然经常描述得不够充分例如在364篇外科RCT报告中 25 没有详细说明入选标准 CNGSORT声明核对表项目3b 资料收集的环境和场所举例从位于伦敦的四家综合医疗机构和NorthwickPark医院耳鼻喉门诊病人中征募志愿者开药者熟悉顺势疗法的原则但并未经历过顺势疗法的免疫治疗资料收集的环境和场所影响试验的外部真实性卫生保健机构在组织经验医疗资源和所研究疾病的基线危险性方面有着很大的差异气候和其他的物理因素经济地理及社会和文化环境均可能影响试验的外部真实性作者应该报告所涉及的研究环境和保健提供者的数目和类型这样读者能够评价试验的外部真实性他们应该描述进行研究的环境和场所包括国家城市和直接环境如社区诊所医院门诊住院病房这方面的描述应该提供足够的信息从而使读者能够判断试验的结果是否适合于他们自身的医疗环境 CNGSORT声明核对表项目4 各组干预措施的精确细节及干预措施是何时怎样实施的举例牛皮癣性关节炎患者被随机分配到接受安慰剂治疗或接受etanercept Enbrel 治疗 etanercept25mg皮下注射每周2次共12周 etanercept为一种无菌的冻干粉末每个小瓶中含etanercept25mg 甘露醇40mg 蔗糖10mg 氨丁三醇1 2mg 安慰剂以同样的剂型提供配方中除不含有etanercept外其他成分均相同注射时每个小瓶用1ml制菌剂使etanercept恢复原状作者应该全面地描述每一种干预措施包括用作对照的干预措施安慰剂的特征及区分它的方法也应该报告全面描述给予对照组或干预组的常规治疗尤为重要因为事实上这是一种联合干预在某些情况下描述由谁来实施治疗是非常关键的因为这可能是干预措施的一个组成部分例如对于外科手术除了外科操作本身外描述外科医生的数量培训情况和经验可能是必需的必要时作者应该报告有关选择干预时间和干预持续时间的细节尤其是给予多个成分的干预措施时 CNGSORT声明核对表项目5 明确的目的和假设举例在本研究中我们检验了这样的假设即实行对未产妇分娩积极处理的政策将 1 降低剖腹产率 2 降低分娩时间延长的比率 3 不影响母亲对生育经历的满足感 CNGSORT声明核对表项目6a 明确定义一级和二级终点指标举例有关银屑病疗效的一级终点为通过PASI 银屑病范围和严重程度指数测定从基线到12周银屑病活性改善达到75 的病人所占的比例对PASI分数和银屑病靶病变的改善情况另外进行了分析所有RCT都是评价一些反应变量或终点在各个组之间比较这些终点大多数试验有几个终点但研究者对其中的一些终点比其他的终点更感兴趣一级终点指标是指提前确定的最重要的终点也是通常用于计算样本大小的终点一些试验有一个以上的一级终点但是同时具有一个或两个以上的终点将因为多重分析而导致结果解释上的困难因而并不推荐这种做法在RCT报告中应明确指出哪些终点是一级终点其他感兴趣的终点是二级终点所有的终点指标无论是一级还是二级都应该标明并且给出完整的定义许多疾病有很多可能的终点而这些终点可以用不同的计分方法和工具来测量在有关非类固醇抗炎药物治疗类风湿性关节炎的196篇RCT中共使用了70多个终点而在有关精神分裂症的2000个试验中共使用了640个不同的工

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

临床医学科研设计方法及论文的严格评价.ppt

文档简介

温馨提示

最新文档

评论

相关文档