版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
肿瘤学预测模型研究的设计策略2026预测模型指为了辅助临床决策,估计个体当下患有某种疾病(或亚型)或未来出现某医学结局概率或风险的数学公式。从疾病类型来看,肿瘤领域的预测模型研究数量居于首位,可能与精准医疗理念的不断推进、电子健康数据及多组学数据的日益普及相关。在技术层面,数据获取、软件工具、分析流程的不断进步,使得构建预测模型在操作上变得日益便捷。研究者能够基于不同规模的数据,应用多种建模方法,借助高度集成的工具快速完成模型构建。然而,部分研究在选题阶段即存在临床逻辑不清或研究问题不明确的问题,所构建的模型缺乏严谨的设计与验证,难以体现实际的临床应用价值。本文概述预测模型类研究的常见类型及全流程框架,重点聚焦于肿瘤领域中预测模型研究的选题思路和研究设计内容,为肿瘤学预测模型研究的开展提供参考。一、预测模型研究的常见类型预测模型研究可分为6类,分别为:(1)寻找预后与诊断因子的研究;(2)仅开发预测模型的研究;(3)模型开发与内部验证研究;(4)模型开发与外部验证研究;(5)预测模型的验证研究;(6)预测模型的影响研究(图1)。其中,第1类研究主要目的是识别与结局相关的潜在因子,为后续预测模型开发提供基础;第3类研究中采用非随机划分数据集(如按时间段或中心划分)进行验证的策略,部分研究将其视为外部验证,但也有学者认为这种情况属于“内部-外部验证”的中间形式。当前预测模型研究大多重开发、轻验证,且对模型在临床实践中实际影响的研究不足,导致大量研究停留在模型构建阶段,真正具备推广价值的模型数量有限。例如,有研究对606个已发表的新型冠状病毒感染相关预后模型进行评价发现,近90%的研究存在较高的偏倚风险,16%的预后模型缺乏验证。因此,开展高质量的模型验证研究(第5类)与模型影响研究(第6类)已成为提高预测模型临床转化价值的关键方向。二、预测模型研究的全流程框架以上6类研究并非孤立存在,而是构成一个相互关联的研究体系。许多研究者误将预测模型研究等同于开发模型,忽视了模型开发仅是完整研究流程中的一个环节。预测模型作为一种临床辅助决策工具,其研究流程应与药物或器械一样,遵循完整的全流程研究框架,涵盖从临床问题的选择、模型构建与评估,到模型部署后再评价与持续监测的全过程(图2)。其中,最后一个环节通过系统收集模型在实际应用过程中的使用反馈,可进一步识别尚未满足的临床需求,并据此提出新的研究问题。尽管当前针对预测模型开发的具体流程步骤存在不同侧重,相关总结也各有差异,但普遍共识认为,预测模型的构建应遵循系统化、规范化的开发流程。根据针对个体预后或诊断的多因素预测模型报告规范以及相关方法学建议,表1以检查清单形式梳理归纳了模型开发对应的18个步骤以及对应的提示性问题,并以2024年发表在NatureCancer的免疫检查点阻断疗法应答率预测模型作为示例进行说明,便于研究者在实践中逐步推进工作。三肿瘤学预测模型研究选题1.
预测模型的种类:预测模型可分为诊断模型和预后模型两类。诊断模型的目的是基于个体当下采集的信息,判断其当下是否患病、处于何种亚型或分期等状态。预后模型则是利用个体当下采集的信息,判断其未来是否发生某一结局事件,如发病、死亡、复发或治疗效果等。此处预后模型中“预后”贴近“预测后来”的含义,与临床中“预后”的含义有所不同。举例而言,有研究基于个体血浆的循环肿瘤DNA甲基化信息、细胞游离DNA样本数据、肝癌特异性甲基化标志物,构建了识别个体是否罹患肝癌的预测模型,属于诊断模型。利用初潮年龄、首次足月生育年龄、既往活检次数、一级亲属患乳腺癌人数等指标,构建了预测个体未来乳腺癌发病概率的模型,属于预后模型。表1中免疫检查点阻断疗法的免疫应答预测模型也属于预后模型。大部分诊断模型和预后模型具有明确的区分标准,但有一类诊断模型很容易和预后模型混淆,尤其在肿瘤领域。例如,某些诊断模型开发时,在判断时点无法利用金标准明确研究结局,如对于影像学检查阴性的个体通常不会进一步活检(金标准),从而导致真实结局状态无法确定。在此类情境下,研究者只能利用个体后续随访的结局状态替代个体在当初模型开发时刻的结局状态,但该类模型仍属于诊断模型。这一替代策略需要建立在临床合理性的基础上,对随访间隔也有一定要求,实际操作中需要依情况具体分析。
研究问题的选择:预测模型研究的价值主要取决于研究问题的临床意义。例如,有研究使用肿瘤分期、分级、前列腺特异性抗原水平和所选治疗措施预测前列腺癌患者的诊断年龄是否超过70岁,模型表现良好,曲线下面积(areaunderthecurve,AUC)达到0.78,但由于患者的诊断年龄在就诊时即可获得,该模型缺乏实际临床意义。因此,研究问题的提出应紧紧围绕具体的临床决策场景。以表1示例中的免疫检查点阻断疗法为例,该治疗措施价格高昂,但并非所有患者均能从中获益,因此医师与患者亟需工具来评估个体是否会产生免疫应答,以便做出临床决策。研究者在确定研究问题时,可关注临床指南、专家共识的空白。例如,《中国抗癌协会乳腺癌诊治指南与规范(2024年版)》提出,在乳腺癌治疗开始前应使用HFA-ICOS等风险评估工具评估患者抗肿瘤治疗相关的心血管不良反应风险。基于此,研究者可进一步探索该预测模型是否适用于所有临床场景(如不同级别的医院、不同医疗条件的地区等)、满足不同患者群体(如具有合并症的患者)的需求,从而聚焦值得进一步探索的临床问题。表2梳理了肿瘤领域常见的研究问题及相应预测模型类型。确定了临床问题后,可利用PICOTS研究框架来协助明确研究方案,其中,P(population)为研究对象,I(intervention)/C(comparison)为预测因子,O(outcome)为预测结局(预后模型需要明确预测多长时间内的结局),T(timing)为使用预测模型的时刻及预后模型预测结果发生的时间范围,S(setting)为临床应用场景。在确定预测模型研究问题是否具备临床价值时,可重点考虑以下几个方面:(1)预测模型应具备明确的临床获益。例如,识别出需治疗的肿瘤患者、减少不必要的穿刺活检等。此外,如果拟开发罕见肿瘤的筛查模型,或拟纳入的预测因子涉及高成本的多组学数据,还需从患者、社会经济等视角评估其成本-效益。(2)模型开发应有明确的下游临床决策路径(如干预措施、临床路径等)作支撑。例如,开发肿瘤的精准诊断模型时,需要明确临床实践中针对模型所预测的不同诊断亚型的差异化处理策略,若针对不同预测结果均使用同样的临床路径,预测模型将缺乏实际意义。(3)预测模型的结局事件应有已知的、足够数量的候选预测因子或影响因素为基础。例如,若某种罕见肿瘤病因机制及影响因素尚不清晰,应优先开展机制研究或生物标志物、影响因素的研究,而非直接进行预测模型研究。3.
研究对象的选取:明确研究对象是预测模型研究的前提。临床预测模型的目标人群包括所有符合模型使用条件的个体,因此,为构建对预期目标人群具有良好预测性能的模型,选取能“充分代表”目标人群的研究对象至关重要。研究对象的选取通常体现为研究制定的纳入排除标准,注意事项包括以下几点:(1)纳入标准的设定应结合模型类型与临床应用场景。例如,用于临床诊断的诊断模型应纳入存在某些特定的症状、体征或是筛查阳性者,用于筛查的诊断模型应纳入表面健康的个体,预后模型应纳入具有发生预测结局风险的个体;需要排除在基线时已发生了预测结局或者不可能发生预测结局(如预测胃癌发病风险要剔除全胃切除者)的个体。在临床实践中,该步骤需要综合考虑成本-效益问题。(2)排除标准不宜过于严苛。设置过多的排除标准会限制模型应用的范围,降低模型的可推广性。(3)排除标准应避免使用含糊或主观的描述。(4)纳入与排除标准要在研究启动前统一制定,并统一应用于所有个体,且研究对象的招募和选取应限制在一定的时间窗口内。四、肿瘤学预测模型研究设计
研究设计类型:预测模型的研究设计因模型类型而异,且不同研究设计各有优劣(表3)。在诊断模型的开发中,评估不同设计适用性的关键在于纳入对象是否能代表未来模型的真实应用人群。例如,以医院为基础的传统病例-对照研究将确诊的肿瘤患者与健康个体进行比较,虽能构建出表现较好的模型(如纳入明确诊断的肝癌患者(n=1098)和随机抽取的参与常规体检的健康对照人群(n=835),得到肝癌诊断模型AUC为0.944、灵敏度为83.3%、特异度为90.5%),但仍需注意以下问题:(1)在临床实践中,模型应用的对象不仅包含确诊的肿瘤患者和健康个体,还包含大量鉴别诊断、疑似或非典型患者,针对这些人群的区分是体现模型临床意义的关键。(2)即使仅针对确诊的肿瘤患者和健康个体,肿瘤患者群体的分期、分型构成也可能影响模型表现。通常,晚期或高级别肿瘤更易被预测,导致所纳入肿瘤患者的类型构成直接决定了模型表现。(3)病例组和对照组在模型开发中的比例往往难以与未来临床应用场景匹配,直接影响模型的校准度。相比之下,横断面研究因可在某一时间段连续纳入全部对象,应用于诊断模型时更贴近临床实践中的“真实效果”,推荐程度高于传统病例-对照研究。巢式病例-对照研究中病例和对照均来自同一源人群,可通过加权策略反推,实现对“未来模型所应用的目标人群”的代表性,推荐程度较高。在预后模型的开发中,研究设计不仅需满足研究对象的代表性要求,还应合理界定预测时间点,即研究者确定的预测模型应用的时间点,以确保预测因子和结局之间具有明确的时间跨度。例如患者入院时预测其死亡风险的模型,入院时刻即为预测时间点。传统的病例-对照研究以结局为出发点,难以保证预测因子信息采集与预测时间点一致,容易产生回忆偏倚,且结局多为二分类变量,缺少时间信息,因此在预后模型研究中存在局限。相比之下,队列研究在构建时即确定预测时间点(一般为患者进入队列的时间),可以确保预测因子在结局发生之前被采集并计算时间跨度。随着医疗大数据的发展,当个体全部的健康信息都能实时捕捉记录时,回顾性数据同样具备前瞻性数据的应用潜力。在肿瘤领域中,因疾病发生率相对较低,且研究常涉及较复杂的组学指标,病例队列研究、巢式病例-对照研究等队列研究的衍生设计也是肿瘤领域预测模型研究中的常用方法。在利用随机对照试验数据建立预测模型时,需要考虑干预措施的处理策略。具体而言,直接忽略干预可能导致预测模型表现不佳,得到错误的预测概率;仅使用对照组进行建模虽可避免干预的影响,但会减少样本量,并且仅适用于空白对照,若对照组为标准治疗则无法采用。此外,仅在随机对照试验中开发的模型可以用于支持干预措施与结局之间的因果推断,但由于干预仅适用于该随机对照试验中经过严格筛选的人群,因此对结果的解释需谨慎。2.
预测结局:选择恰当的预测结局及其测量方式需要综合考虑临床和统计两个角度。从临床角度看,预测结局可分为3类:(1)致死事件:如全因死亡、死因别死亡;(2)客观非致死事件:如肿瘤发病、肿瘤复发;(3)主观非致死事件:如患者自报症状。综合临床意义和测量准确性,推荐顺序通常为致死事件、客观非致死事件、主观非致死事件。从统计学角度看,预测结局可分为连续变量、二分类变量、无序多分类变量、有序多分类变量以及时间-事件变量。在肿瘤研究领域,常见的预测结局如死亡或复发,往往不仅关注事件是否发生,更关注其具体发生时间,因此更适用于使用时间-事件变量。在选择预测结局时,需注意以下几点:(1)考虑结局的发生率。结局发生率越低,所需样本量越大,随访时间越长。因此,对于罕见肿瘤、罕见不良事件的预测难度相对较大。(2)考虑是否有相应判定的金标准。若无金标准,可参考当前指南或已发表文献中的替代判定标准,以确保结局的可测量性和一致性。(3)考虑竞争风险事件。若预测结局(时间-事件变量)存在竞争风险事件(例如死亡)时,可同步收集竞争风险事件的信息,考虑竞争风险事件的生存分析。(4)复合结局的设定。若选择复合结局,其包含的子结局的严重程度应相似,且具有临床相似性的结局可合并。此外,肿瘤研究中有一个常见的特殊误区,即将“肿瘤特异性生存率”作为预测结局,尤其在美国国家癌症研究所建立的监测、流行病与最终结果数据库的相关研究中使用广泛。然而,肿瘤特异性生存率假设个体仅可能因该肿瘤死亡,而忽略了其他死因的影响,这在真实世界中并不成立,其所得预测概率缺乏实际意义。3.
预测因子:预测因子的筛选流程包括3个阶段。首先基于文献回顾、临床经验、专家咨询以及数据库信息确定潜在预测因子。然后综合考虑每个潜在预测因子的预测能力、测量的可靠性、可行性和经济性,形成精简子集,即候选预测因子。最后通过统计建模与变量选择方法确定纳入模型的最终预测因子。在选择预测因子时,尽量避免纳入本身用于判断预测结局的信息。例如,肿瘤患者心肌梗死的诊断需要考虑缺血性胸痛症状、心电图特征和血清心肌酶谱变化,此时不宜再将血清心肌酶等级水平作为预测因子之一。在肿瘤患者生活质量的预测模型研究中,若使用SF-36量表评估生活质量,则量表内条目不应再作为预测因子。4.
样本量计算:样本量的计算不仅有助于确保预测模型研究的假设检验或模型拟合满足统计学上的基本要求,提升研究的可行性与科学性,同时还能有效避免资源浪费,符合伦理规范的基本要求。在构建预测模型时,基于统计模拟进行经验估计(如每变量事件数策略、每候选参数事件数策略)因简单易操作被广泛使用。然而,该方法主要关注模型系数估计的偏差、精度和显著性,未考虑模型在风险预测时的准确性,且不适用于机器学习模型的样本量计算,在目前的研究中存在一定争议。相比之下,基于效应指标进行理论估计的计算策略更能准确地进行样本量估计,具体操作可以使用Riley团队开发的R工具包pmsampsize。在验证预测模型时,基于统计模拟进行经验估计(如至少需要100例阳性事件和100例非阳性事件,理想情况下需要200例阳性事件)也存在诸多局限。例如,该方法并不总能为模型预测性能指标提供精确估计。模型性能估计的精确性除了阳性事件和非阳性事件的数量,还取决于验证人群中模型线性预测值的方差、验证模型的预期性能以及任何校准误差的预期程度等因素。因此,目前更推荐基于效应指标的样本量估计方法,具体操作参见R工具包pmvalsampsize。例如,一项验证首次发作双相情感障碍患者的2年内死亡风险的预测模型研究中,对其样本量计算进行了详细描述:预估目标人群2年死亡率为1.7%,C统计量为0.7,线性预测值的分布为(1.13,64.82),C统计量置信区间宽度为0.25,观察与预期事件比以及校准斜率的置信区间宽度均为0.65,最终计算得出模型验证所需最小样本量为3589,代码如下。pmvalsampsize(type="b",prevalence=0.017,cstatistic=0.7,lpbeta=c(1.13,64.82),csciwidth=0.65,cstatciwidth=0.25,oeciwidth=0.65)其他开发和验证模型计算样本量的代码示例见表4。五肿瘤学预测模型研究的实施1.
研究对象的招募:在开发预测模型时,为确保研究对象能够充分代表目标人群,并尽可能减少选择偏倚,首选连续纳入的设计,即使用预先确定的纳入排除标准在特定时间范围内纳入所有符合条件的个体,并逐一记录研究对象纳入或排除的理由。若目标人群数量较大,概率抽样方法可能更具可行性。此外,在研究对象的招募过程中,仍需考虑以下几点:(1)避免因失访、缺失或异常值而排除研究对象。直接排除此类研究对象易造成选择偏倚,且比例越高,影响越大。(2)对无金标准确诊的个体(如疑似肿瘤但未接受穿刺活检者),不应直接排除。可尝试采用替代参考标准(如使用肝脏超声检查或MRI检查结果替代肝脏穿刺活检诊断肝癌)、临床专家评估或通过随访确证结局。(3)多中心研究要加强前期培训和协调,确保各中心在纳入排除标准的理解和实施上保持一致。2.
研究指标的测量:研究指标(预测结局、候选预测因子)的质量直接关系到预测模型的准确性、可靠性和实用性。因此,在测量过程中,需确保指标的定义明确、收集方法标准化以及数据质量可控,以最大限度地减少信息偏倚,从而为模型的开发、验证和应用提供高质量的数据支持。在肿瘤领域,为尽可能减少预测模型
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电线电缆镀制工岗前冲突解决考核试卷含答案
- 白酒贮酒工风险识别强化考核试卷含答案
- 2026年新科教版初中九年级语文上册第一单元中考语文基础满分训练卷含答案
- 2026年新科教版初中九年级美术下册第二单元美术学业水平测试卷含解析
- 有机氟生产工操作模拟考核试卷含答案
- 锅炉设备装配工安全知识竞赛模拟考核试卷含答案
- 装表接电工常识模拟考核试卷含答案
- 野生植物监测工改进模拟考核试卷含答案
- 汽车饰件制造工安全生产基础知识考核试卷含答案
- 新生儿喂养困难多学科干预
- 博物馆陈列展览工程造价指南
- HG20202-2014 脱脂工程施工及验收规范
- ecmo中文操作手册maquet本适用于序列号为之后ROTAFLOW控制台
- 2023年中考英语一轮复习重点知识课件第17讲 语篇填空 (含详解)
- 卫生管理制度打印 卫生管理制度美发店(8篇)
- 城市地理学城市空间分布体系
- 省体育网后台发布信息教学
- 2023年长沙市望城人民医院招聘医学类专业人才考试历年高频考点试题含答案解析
- GB/T 4668-1995机织物密度的测定
- 数码电子雷管简介及案例(课堂PPT)
- 苹果栽培技术完整版课件
评论
0/150
提交评论