26年EQ-5D量表应用核心要点_第1页
26年EQ-5D量表应用核心要点_第2页
26年EQ-5D量表应用核心要点_第3页
26年EQ-5D量表应用核心要点_第4页
26年EQ-5D量表应用核心要点_第5页
已阅读5页,还剩24页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

26年EQ-5D量表应用核心要点演讲人基础认知:EQ-5D量表的本质与当代应用定位总结常见应用误区与规避方案全流程视角下EQ-5D应用的核心要点22026年EQ-5D应用场景的新扩展目录我作为从事卫生技术评估与患者报告结局研究18年的研究者,亲眼看着EQ-5D从国内少数顶尖机构用于药物经济学探索的小众工具,变成如今覆盖医保谈判、慢病监测、医疗服务绩效评价等多个核心领域的通用标准工具。进入2026年,随着我国卫生健康领域对患者报告结局的重视程度不断提升,EQ-5D的应用频率较10年前增长了近10倍,但我在审稿、项目评审和日常同行交流中发现,不少研究者对不同场景下EQ-5D应用的核心要点把握不到位,常出现版本选择错误、数据分析不规范、结果解读偏差等问题,直接影响了研究结论的可靠性甚至政策决策的科学性。基于此,本文从基础认知到实践操作再到误区规避,系统梳理EQ-5D应用的核心要点,供同行参考。01基础认知:EQ-5D量表的本质与当代应用定位1EQ-5D量表的核心属性EQ-5D是欧洲生命质量学会开发的普适性健康效用测量量表,核心分为两个模块:一是健康描述系统,涵盖行动能力、自我照顾、日常活动、疼痛/不适、焦虑/抑郁五个维度,这也是“5D”名称的来源;二是视觉模拟评分(EQVAS),由受访者给自己的总体健康状态打分,范围为0(最差健康)到100(最好健康)。其核心不可替代的优势,是可以将不同的健康状态转化为0(对应死亡)到1(对应完全健康)之间的效用值,进而计算卫生经济学评价核心指标——质量调整生命年(QALY),这是绝大多数疾病特异性生活质量量表无法实现的。我当年第一次用EQ-5D做慢性乙肝药物经济学评价的时候,国内还没有本土化的效用积分体系,只能参考日本的研究数据,现在国内研究体系已经非常成熟,发展速度远超我当年的预期。0222026年EQ-5D应用场景的新扩展22026年EQ-5D应用场景的新扩展国内EQ-5D的应用场景在近5年发生了巨大变化,已经从传统的临床试验探索性终点、学术研究用药物经济学评价,拓展为四类刚需应用场景:一是医保准入与卫生技术评估(HTA)的法定要求,当前我国医保谈判对创新药、创新医疗器械、数字医疗的HTA,都明确要求提供基于EQ-5D的QALY数据;二是国家基本公共卫生服务的慢病患者健康监测,高血压、糖尿病等常见慢病的年度健康管理,已经将EQ-5D作为患者生活质量监测的首选推荐工具;三是医疗机构DRG/DIP绩效评价,医疗服务效果评价从单纯关注治愈率、住院日,转向关注患者术后长期生存质量,EQ-5D已经成为多个省份的核心评价指标;四是公共卫生政策效果评价,环境健康干预、食品安全政策、人群健康促进项目,都需要用EQ-5D测量干预带来的健康获益。应用场景的不断扩展,对应用的规范性提出了远高于以往的要求,这也是我们系统梳理核心要点的核心初衷。22026年EQ-5D应用场景的新扩展梳理完基础认知与当代应用定位后,接下来我们从研究全流程出发,逐层拆解各个环节的核心应用要点。03全流程视角下EQ-5D应用的核心要点1研究设计阶段:版本选择与前置准备要点1.1基于研究人群与场景选择合适的EQ-5D版本目前主流的EQ-5D版本包括EQ-5D-3L(每个维度分3个水平:无问题/中等问题/极端问题)、EQ-5D-5L(每个维度分5个水平:无问题/轻微问题/中等问题/严重问题/极端问题)、EQ-5D-Y(适配儿童青少年的专用版本)三类,不同版本的适用场景存在明确差异:第一,针对一般人群健康监测、10000例以上的大样本流行病学调查,优先选择EQ-5D-3L。该版本维度区分简单,受访者应答负担低,经过数十年全球应用验证,信效度完全满足研究需求,而EQ-5D-5L虽然区分度更高,但维度划分偏细,低文化、高龄人群很容易区分不开“严重问题”和“极端问题”,反而增加测量误差。我前年参与一项12万人群的慢阻肺筛查研究,项目组一开始盲目追新想用5L,预调查发现16%的65岁以上老年人无法准确区分两个最严重的水平,最后换成3L,应答率提升了11%,数据质量反而更好。1研究设计阶段:版本选择与前置准备要点1.1基于研究人群与场景选择合适的EQ-5D版本第二,针对临床试验、中小样本干预效果评价,优先选择EQ-5D-5L。该版本的天花板效应远低于3L,对轻度健康问题的区分度更好。我曾经碰到一个年轻研究者做膝关节炎微创干预研究,一开始用了3L,结果62%的患者在行动维度都选了“轻度问题”,整体天花板效应接近50%,根本看不出干预效果,最后重新用5L开展预调查,才得到了显著的干预效果差异。第三,针对18岁以下的儿童青少年人群,必须使用EQ-5D-Y,不能直接套用成人版本。EQ-5D-Y的维度描述适配了儿童的日常场景,比如将成人版本的“日常工作”调整为“上学、和朋友玩耍”,信效度远高于成人版本,这是很多初学者最容易犯的错误。1研究设计阶段:版本选择与前置准备要点1.2遵守版权规范与本土化调适要求EQ-5D的版权归欧洲生命质量学会所有,不同用途的授权要求明确:非商业学术研究可以免费申请授权,商业用途比如企业发起的注册临床试验、产品上市评价研究需要购买官方授权。我近两年碰到不下5篇已经接收的待发文章,因为无法提供授权证明,被期刊推迟发表,甚至有1篇直接被撤稿,这个前置准备工作一定要在研究启动前完成,不要等到投稿的时候才补。另外,我国已经完成了所有主流版本的中文本土化调适,维度描述符合中文表达习惯和人群认知,任何研究者都不要自行修改维度描述,自行修改会破坏量表已经验证的信效度,导致研究结果不被学术界和决策部门认可。1研究设计阶段:版本选择与前置准备要点1.3合理搭配特异性研究指标EQ-5D是普适性量表,优势是通用性强,可以跨疾病、跨人群比较健康获益,但劣势是对特定疾病的特异性健康问题覆盖不足。因此我一直建议,任何针对特定疾病的研究,都要在EQ-5D之外搭配对应的疾病特异性量表:比如做糖尿病研究搭配糖尿病生活质量量表(DQoL),做类风湿关节炎研究搭配类风湿关节炎特异性量表,做骨关节炎研究搭配WOMAC骨关节炎指数。我之前参与一项SGLT2抑制剂的卫生经济学研究,仅EQ-5D的结果显示新药和老药的效用差异只有0.01,看起来没有临床意义,但结合糖尿病特异性量表发现,新药在周围神经病变相关的健康问题上改善明显,最终调整了研究结论,这个案例让我印象非常深,也证明合理搭配指标才能得到全面准确的结论。2调查实施阶段:质量控制核心要点2.1根据人群特征选择合适的调查方式目前常见的调查方式包括面对面辅助调查、线上自测、电话调查三类,不同方式的适用人群不同:第一,针对高龄(≥75岁)、低文化程度、活动障碍的人群,优先选择面对面辅助调查。我去年做长三角社区老年糖尿病健康监测项目,发现线上自测的缺失率是14.7%,而面对面调查的缺失率只有2.1%,而且线上自测的平均效用值比面对面调查高0.04,存在明显的应答偏倚——健康状况越差的老人越难完成线上调查,更容易退出,导致结果偏高。第二,针对年轻人群、慢病自我管理人群,可以选择官方验证的线上版本,其信效度和纸质版没有差异,还能降低调查成本。2调查实施阶段:质量控制核心要点2.2调查员培训与预调查控制偏差很多研究的系统偏差都来自调查员的不规范操作,我见过最常见的问题就是调查员替受访者填答:比如看到受访者卧床,就直接在行动维度选“极端问题”,但实际上很多卧床患者依然可以完成自我照顾、和家人交流,对自身健康状态的自评和调查员的主观判断差异非常大。因此我在培训调查员的时候,一定会明确要求:所有问题都必须由受访者自评,调查员只能解释问题表述,不能替代受访者判断,更不能修改答案。另外,正式调查前一定要做预调查,预调查样本量不低于总样本的5%,通过预调查可以提前识别目标人群对维度描述的理解偏差,调整调查流程,避免正式调查出现大面积偏差。2调查实施阶段:质量控制核心要点2.3特殊人群的调查调整规则针对儿童人群,7-17岁儿童优先采用自我报告,只有不满7岁的儿童才采用代理报告;代理报告优先选择父母代理,不要选择医生代理,国内外大量研究已经验证,父母代理和儿童自我报告的一致性达到81%,而医生代理的一致性只有58%,因为医生对儿童的心理状态、日常活动体验的感知远低于父母。针对轻中度认知障碍人群,优先采用主要照料者代理报告,同时一定要在研究报告中明确标注代理方式,方便读者判断结果的可靠性。3数据分析阶段:效用计算与结果解读要点3.1正确选择本土效用值积分体系效用值是基于人群健康偏好测算得到的,不同国家和地区人群的健康偏好不同,因此必须选择对应研究人群的积分体系。我国2019年就发布了中国人群的EQ-5D-5L效用值积分体系,2022年发布了EQ-5D-3L的本土积分体系,当前做中国人群的研究,必须用本土体系,不能直接套用英国、日本或者其他国家的体系。我作为多个核心期刊的审稿人,每年都会碰到至少10篇用境外积分体系的来稿,基本上都直接退修,因为不同积分体系对同一个健康状态的效用值计算差异最大可以达到0.1,这个差异足以改变成本效用分析的结论,对医保决策的影响是决定性的。3数据分析阶段:效用计算与结果解读要点3.2识别并报告天花板效应与地板效应天花板效应是指大部分受访者都选择最好的健康水平,地板效应是指大部分受访者都选择最差的健康水平,两种效应都会降低量表的区分度,导致结果偏差。我一般建议,当任何一个维度的天花板效应超过30%,或者研究整体的天花板效应超过20%,就必须在研究报告中明确披露,同时补充特异性量表的结果,不能直接忽略这个问题。如果不披露,很容易导致结论偏倚,甚至误导决策。3数据分析阶段:效用计算与结果解读要点3.3结果解读要兼顾总效用与维度分布很多研究者只报告平均效用值,不报告五个维度的分布,这是非常不完整的。比如两个干预方案,平均效用值都是0.75,但是方案A主要改善疼痛不适维度,方案B主要改善行动能力维度,针对不同的目标人群,临床意义完全不同:针对膝关节炎患者,改善疼痛的价值更高,针对脑卒中后遗症患者,改善行动能力的价值更高。因此必须分维度报告不同严重程度健康问题的发生率,不能只报告总效用值。另外,解读差异的时候要注意区分统计显著性和临床意义,EQ-5D的最小临床重要差异(MCID)一般在0.03-0.05之间,只有差异超过这个范围,才有实际的临床意义,不能因为大样本得到了统计显著性,就宣称微小差异有临床价值。4不同主流应用场景的特定核心要点4.1药物经济学评价与医保谈判中的应用要点第一,必须严格按照我国医保局HTA指南要求,采用中国本土效用积分体系,这是硬性要求;第二,随访时间要覆盖干预的全周期,不能只测基线和治疗后3个月,比如抗肿瘤药的随访至少要覆盖12个月,才能得到准确的QALY计算数据,我去年参与一个PD-1抑制剂的HTA评估,申办方只提供了6个月的EQ-5D数据,外推的不确定性非常大,最后被要求补充12个月的随访数据,耽误了近半年的时间,这个教训一定要记;第三,必须按病种分期、年龄层开展亚组分析,不同亚组的效用差异很大,亚组分析才能给决策提供更准确的信息。4不同主流应用场景的特定核心要点4.2慢病人群健康监测中的应用要点第一,连续监测的调查方式必须保持一致,不能第一年用面对面调查,第二年换成线上调查,调查方式的差异会导致虚假的健康变化,我在国家慢病监测项目中就碰到过三个省份第二年换成了线上调查,结果平均效用值比第一年高0.05,其实不是人群健康变好,而是健康差的患者退出了调查,这个偏倚直接导致这三个省份的数据没法纳入全国汇总分析;第二,要结合人口死亡率数据计算健康期望寿命,这才是慢病监测对公共卫生政策的核心价值,不要只停留在单个患者效用值的统计层面。4不同主流应用场景的特定核心要点4.3数字医疗干预效果评价中的应用要点这是近年来快速增长的新场景,核心要点一是采用官方验证的线上适配版EQ-5D,不要自行修改维度,保证信效度;二是要控制选择偏倚,愿意参与数字医疗干预的人群本来健康素养就更高,基线效用值也更高,因此要做分层匹配,排除基线差异带来的偏倚。讲完全流程的核心操作要点,我们再梳理一下当前EQ-5D应用中最常见的误区,以及对应的规避方案。04常见应用误区与规避方案1误区一:版本选择越新越好很多研究者觉得EQ-5D-5L比3L新,性能更好,不管什么场景都用5L,实际上并非如此,大样本人群监测中,3L的应答率更高,数据质量更稳定,5L的区分度优势无法体现,反而增加应答负担,因此核心是适配场景,不是越新越好。2误区二:发SCI必须用境外效用积分体系很多研究者觉得发国际期刊要用欧美国家的积分体系才够权威,实际上现在国际期刊都已经形成共识:针对本国人群的研究必须用本土的效用积分体系,我们团队近几年发的多篇SCI,编辑都要求我们换用中国本土积分体系,不存在用本土体系发不了SCI的问题。3误区三:把统计显著性等同于临床意义很多大样本研究中,0.01甚至更小的效用差异也能得到统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论