26年随访数据质控核查要点手册_第1页
26年随访数据质控核查要点手册_第2页
26年随访数据质控核查要点手册_第3页
26年随访数据质控核查要点手册_第4页
26年随访数据质控核查要点手册_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

26年随访数据质控核查要点手册演讲人质控核查前期准备要点01随访全周期各环节质控核查核心要点02核查后质控闭环管理要点03目录作为本前瞻性长期队列研究从启动阶段就参与随访管理与质控工作的一线人员,我见证了整个队列从基线入组到26年连续随访的全流程,也亲历了多次跨周期数据汇总核查中因为质控疏漏导致的各类问题。长期队列随访数据是开展病因学研究、疾病风险预测、公共卫生决策的核心基础,26年跨周期的时间跨度下,人员更迭、技术升级、标准调整都可能给数据带来各类偏倚,系统规范的质控核查是保障数据可用性、研究结论可靠性的核心前提。本手册结合我团队26年的实际工作经验,梳理质控核查全流程的核心要点,供相关工作参考。接下来我将按照工作推进顺序,从三个大方面逐一展开说明。01质控核查前期准备要点质控核查前期准备要点正式开展质控核查前,充分的前置准备是避免后续工作混乱、统一判定标准的核心基础,我团队将准备工作分为基线资料校准与核查团队校准两个部分。1基线原始资料的溯源与校准基线资料是所有随访数据的起点,基线资料的错误会传导至整个随访周期,必须优先完成核查校准。1基线原始资料的溯源与校准1.1知情同意文件完整性核查所有纳入26年随访分析的对象,第一步必须回溯知情同意文件的有效性。我刚参加工作时,最早一批入组的对象纸质知情同意书因库房搬迁遗失了17份,当时我们花了3个月逐一重新联系补签,才保留了这批对象的随访资格,因此这个环节绝不能省略。核查要点包括:一是文件签署日期是否在基线调查开展之前;二是签名是否为随访对象本人或法定授权委托人,不符合要求的代签文件视为无效;三是知情同意书版本是否符合当时伦理审查的要求,版本不符的需补充符合要求的知情文件。1基线原始资料的溯源与校准1.2基线核心变量的一致性复核核心变量指人口学特征、主要研究暴露因素、基线疾病状态三类对研究结论有核心影响的变量。需要将纸质原始记录与最早录入的电子数据进行交叉比对,我在2018年开展20周年随访核查时,就发现12名对象的基线日吸烟量,纸质原始记录为“20支/日”,电子录入误写为“2支/日”,该错误如果未被纠正,最终得到的吸烟与疾病关联结论会完全偏离真实情况。核查要求为:核心变量抽取不低于10%的样本做交叉复核,若错误率超过5%,则将核查比例扩大至100%。1基线原始资料的溯源与校准1.3失访判定标准的前置统一26年随访周期内,不同阶段的随访人员对失访的判定标准存在差异:部分人员将连续2次联系不上判定为失访,部分人员要求连续5次无应答,还有人员将对象迁出本区域直接判定为失访。标准不统一会直接导致失访率计算偏差,干扰后续对偏倚的评估,因此核查开始前必须统一标准:本队列统一明确,连续3次随访(间隔1年)未获得有效应答,且通过死因监测、医保系统也无法获取任何结局信息,方可判定为失访,所有对象均需按照该标准重新梳理随访状态。2核查团队的准备与校准质控核查的质量高度依赖核查人员的判断,提前完成团队同质化校准是必不可少的环节。2核查团队的准备与校准2.1核查人员的同质化培训所有参与核查的人员必须提前接受统一培训,熟悉26年不同阶段的随访方案、变量定义、不同载体资料的存储位置,培训完成后需开展考核,我团队要求所有人员完成50份样本的独立预判定,与标准判定的一致率达到95%以上方可上岗。2核查团队的准备与校准2.2核查分工的权责划分按照随访年度划分责任模块,每名核查人员负责连续3-5个年度的随访数据,每个核心模块设置一名负责人,比如专人负责知情同意与基线资料核查、专人负责终点事件判定,避免交叉混乱。所有核查过的资料都需要签署核查人员姓名与核查日期,做到任何问题都可以溯源到人。2核查团队的准备与校准2.3预核查的试运转正式核查开始前,抽取总样本量的5%开展预核查,提前发现标准模糊、流程遗漏的问题,及时调整统一。在25周年本次核查的预运转阶段,我们就发现不同人员对“新发糖尿病”的判定标准不统一:部分人员沿用早年“空腹血糖≥7.8mmol/L”的标准,部分人员使用当前“≥7.0mmol/L”的标准,提前统一标准后才避免了正式核查中出现大规模错误。完成前期准备工作,统一所有标准与流程后,我们进入本次质控核查最核心的部分——26年随访全周期各环节的质控核查要点,我将按照不同随访场景、不同工作节点的要求逐一展开说明。02随访全周期各环节质控核查核心要点随访全周期各环节质控核查核心要点26年随访数据包含现场面对面随访、被动监测随访、跨年度数据衔接三类不同场景,每个场景的质控要点各有侧重。1现场随访环节质控核查现场随访是每5年开展一次的面对面随访,是获取暴露因素动态变化信息的核心渠道,质控要点如下。1现场随访环节质控核查1.1随访对象身份的双重核验现场随访首先要确认到访人员为入组对象本人,除非对象完全丧失行为能力,否则不认可家属代做。我早年工作时就遇到过对象身体不适,让孪生弟弟代做随访,当时未核对身份,后续核查时发现血压测量值偏差超过30mmHg,重新约见本人才纠正了错误。因此我团队要求,必须通过“身份证+入组留存生物标识(指纹/面部信息)”双重核对身份,不符合要求的随访信息视为无效,对应对象标记为未应答。1现场随访环节质控核查1.2问卷采集过程的标准化核查核查问卷问题的询问是否符合标准化要求,是否存在诱导提示、遗漏问题的情况,比如针对饮酒量的问题,必须询问清楚“酒的种类、单次饮用剂量、每周饮用频率”,不能简化为“你是否经常饮酒”。我团队要求每10份完成的现场问卷抽取1份回看采集过程的录音录像,早年未留存音视频的则复核纸质记录的完整性,发现不规范的需要重新安排随访采集。1现场随访环节质控核查1.3生物样本采集转运的链码核查每次现场随访都会采集生物样本,每份样本都有唯一识别码,从采集、离心、分装、冻存到转运的全流程都需要留存记录。核查时需要逐一核对样本链码信息,确认每个节点的处理时间、储存温度都符合要求,比如静脉血样本必须在采集后2小时内完成离心,脱离-80℃环境的时间不能超过10分钟,不符合要求的样本需要明确标注,供后续研究人员参考。1现场随访环节质控核查1.4信息录入的即时复核核查针对早年纸质录入后转电子的数据,需要抽查纸质记录与电子数据的一致性;针对当前现场电子录入的数据,需要核查录入完成后是否当场完成缺项、逻辑错误校验,比如年龄填为120岁、收缩压低于舒张压这类明显的逻辑错误,是否及时修正。2被动随访环节质控核查26年随访周期内,大部分非现场随访年度的信息都是通过死因监测系统、医保报销系统、协作医院病案系统获得的被动随访信息,这部分最容易出现错误,也最容易被忽略。2被动随访环节质控核查2.1身份匹配的准确性核查不同系统的身份信息存在错误风险:同音字错误、身份证号15位升18位的转换错误、重名重出生日期的情况都很常见,仅依靠单一信息匹配很容易出错。我在2020年终点事件核查中,就遇到两名同姓名、同出生日期的对象,一名发生了冠心病,一名未发病,仅靠姓名和身份证号前15位差点匹配错误,最终核对户籍地信息才纠正。因此要求必须通过“姓名+出生日期+户籍地”三个字段交叉匹配,确保身份对应正确,身份匹配错误会直接导致终点错分,对研究结论的影响是致命的。2被动随访环节质控核查2.2终点事件的归因判定核查所有终点事件不能仅依靠医保系统的诊断结论直接判定,必须回溯原始病案,核对影像学、病理学或实验室检查结果,比如脑卒中必须有头颅CT或MRI的阳性检查结果,肿瘤必须有病理学诊断结果,不能仅依靠临床诊断就判定终点。如果对象发生多个终点事件,需要明确判定首发事件的时间与类型,不能漏报也不能错分,我经手的数千例终点事件中,大约每100例就有5-8例存在归因错误,因此这个环节绝不能省略。2被动随访环节质控核查2.3被动信息与既往信息的交叉核验获得被动采集的信息后,必须与既往随访信息交叉核对,比如对象基线已经明确诊断高血压,本次医保系统新增“高血压”诊断,需要核对是既往漏报还是系统错误登记,不能直接将高血压的发病时间更改为本次登记时间,避免发病时间计算错误。3跨年度数据衔接质控核查这是26年长期随访独有的核心质控要点,时间跨度带来的存储技术升级、标准调整,很容易导致跨年度数据衔接出现问题。3跨年度数据衔接质控核查3.1数据存储格式的兼容性核查26年间,我们的数据存储从最早的dBase文件,到Excel文件,再到当前的结构化数据库格式,多次格式转换很容易出现信息丢失。我之前就遇到过Excel转换SPSS格式时,日期字段发生错误,把1999年转换为2099年,差点把1例死亡病例错误标记为存活。因此要求所有格式转换完成后,抽取不低于10%的样本做一致性核对,确认没有乱码、字段错误、信息丢失后再合并数据。3跨年度数据衔接质控核查3.2核心变量定义跨周期的一致性核查随着学科发展,很多核心变量的定义会发生调整,比如糖尿病空腹血糖诊断切点从7.8mmol/L调整为7.0mmol/L,高血压诊断标准从160/95mmHg调整为140/90mmHg,绝对不能混用新旧标准:原入组对象用老标准、新随访对象用新标准,否则会直接导致组间偏差。我在2012年开展15周年汇总核查时,就因为忽略了这个问题,整个团队返工半个月才纠正所有数据,因此对我来说这个要点的印象尤为深刻,要求所有核心变量必须统一使用同一标准重新判定,确保跨周期数据可比。3跨年度数据衔接质控核查3.3随访状态变更的溯源核查随访过程中,对象状态从“随访中”变更为“失访”“终点事件”,每一次变更都需要有明确的原始记录。26年间研究团队人员更迭多次,部分早年的状态变更没有留下交接记录,因此核查时需要追溯每一次状态变更的依据:比如状态变更为死亡,必须要有死亡证明和死因报告,没有依据的状态变更视为存疑,需要想尽办法溯源,无法溯源的标记为缺失。完成全环节的质控核查后,工作并没有结束,还需要对核查发现的问题进行系统处理,形成完整的质控闭环,才能最终保障数据的可靠性,接下来我说明核查后的闭环管理要点。03核查后质控闭环管理要点1问题数据的分级标注与溯源修正1.1错误数据的分级分类我们将问题数据分为三个等级:一级错误为核心变量错误,包括身份错误、终点错分、核心暴露因素错误,这类错误会严重影响研究结论,必须优先修正;二级错误为非核心变量错误,比如对象的职业信息填写错误,不影响核心研究结论,标注后保留即可;三级错误为无法溯源的缺失信息,直接标记缺失状态即可。1问题数据的分级标注与溯源修正1.2可修正数据的溯源修正所有一级错误都需要回溯原始档案,或者重新联系对象核实,能够修正的必须修正。要求所有修正操作都要记录修正前内容、修正后内容、修正依据、修正人员信息,原始错误数据不能删除,全程保留修改痕迹,做到所有修改都可追溯。1问题数据的分级标注与溯源修正1.3不可修正数据的剔除标准只有无法溯源修正的一级错误、或者本身不符合入组标准的对象,才可以从分析数据中剔除,剔除操作必须记录剔除原因,不得随意删除原始数据。2质控结果的量化评估2.1核心质控指标的计算完成所有核查修正后,需要计算核心质控指标,明确本次质控的整体质量:包括知情同意完整率(要求不低于98%)、核心变量一致性符合率(要求不低于99%)、终点事件判定符合率(要求不低于95%)、总失访率(26年总失访率要求控制在20%以内),所有指标都需要纳入最终质控报告。2质控结果的量化评估2.2偏倚风险评估根据质控结果,评估本次数据可能存在的偏倚:比如失访是否集中在某个年龄组或暴露组,是否存在失访偏倚;核心变量错误是否集中在早年数据,是否存在差异测量偏倚,所有评估结果都需要明确写入质控报告,供后续研究人员参考。3质控档案的规范化归档所有核查过程资料,包括原始核查记录、问题数据清单、修正记录、最终质控报告,都需要统一归档,纸质档案存入专用恒温库房,电子数据做三地异机备份,避免数据丢失。我团队早年就经历过硬盘损坏丢失部分2000年随访数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论