《医学队列平台数据技术 队列数据管理 数据融合质控要求》_第1页
《医学队列平台数据技术 队列数据管理 数据融合质控要求》_第2页
《医学队列平台数据技术 队列数据管理 数据融合质控要求》_第3页
《医学队列平台数据技术 队列数据管理 数据融合质控要求》_第4页
《医学队列平台数据技术 队列数据管理 数据融合质控要求》_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS11.020

C07

团体标准

T/BRA-CDCHE/XXXXXXXX

医学队列平台数据技术

队列数据管理数据融合质控要求

MedicalCohortPlatformDataTechnology

CohortDataManagements------QualityControlRequirementsofDataIntegration

(草案)

20XX-XX-XX发布20XX-XX-XX实施

中国医院协会发布I

目次

前言..................................................................................IV

1.范围..................................................................................1

2.规范性引用文件.......................................................................1

3.术语和定义...........................................................................1

4.融合前................................................................................1

4.1融合的目的.............................................................................2

4.2队列数据集的基本信息..................................................................2

4.2.1来源及研究起止日期..............................................................2

4.2.2研究目的..........................................................................2

4.2.3研究设计..........................................................................2

4.2.4研究对象..........................................................................2

4.2.5变量..............................................................................2

4.2.6样本量.............................................................................2

4.3队列数据集的数据特征..................................................................2

4.3.1数据清单..........................................................................2

4.3.2缺失数据..........................................................................2

4.3.3核心变量和其他变量................................................................2

4.4获得队列数据的使用许可................................................................2

4.4.1联系数据负责人...................................................................2

4.4.2提供跨队列研究信息.............................................................2

4.4.3请求正式同意.....................................................................3

5.融合中..................................................................................3

5.1清理拟融合的原始队列数据.............................................................3

5.1.1识别并确认原始数据问题...........................................................3

5.1.2处理缺失数据.....................................................................3

5.1.3处理异常数据.....................................................................3

5.1.4处理重复数据.....................................................................3

5.1.5与研究目标的权衡.................................................................3

5.1.6记录数据清理过程.................................................................4

5.1.7数据质量验证.....................................................................4

5.2根据研究需求设定数据融合的规则.......................................................4

5.2.1选择需要融合的关键变量和次要变量.................................................4

5.2.2设定数据质量评估标准..............................................................4

5.2.3设定预期满足标准的数据变量的百分比.............................................4

5.3根据设定的数据融合标准评估所需的变量并进行定量评分..................................4

5.4验证融合结果.........................................................................4

6.融合后..................................................................................4

II

6.1使用文档记录过程......................................................................4

6.2确保过程的可追溯性和透明度...........................................................4

6.3定期评估和更新融合后的数据集.........................................................4

参考文献...................................................................................5

III

■yi-

刖百

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

本文件由北京大学第六医院提出。

本文件由北京慢性病防治与健康教育研究会归口。

本文件起草单位:北京大学第六医院、北京大学、中国医学科学院肿瘤医院、中国疾病预防控制研

究中心、山东大学齐鲁医院、北京大学第一医院、天津市安定医院、中国电子技术标准化研究院。

本文件主要起草人:刘肇瑞、黄雨、魏文强、孙可欣、丁若溪

本文件其它起草人:张婷婷、陈园生、吕明、张媛、李航、徐广明、李瑞琪、王悦、张同超、白情

倩、潘鹏、颜国利。

IV

队列数据管理数据融合质控要求

1范围

本文件规定了跨队列研究实施过程中数据融合的质控要求等内容。

本文件适用于指导拟开展跨队列研究的数据融合工作,包括但不限于社区人群队列、区域性人群队

列、针对某一疾病种类或基于特殊机构建立的人群队列。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注口期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

WS/T306卫生信息数据集元数据规范

WS363卫生信息数据元目录(系列标准)

WS364IJ生信息数据元值域代码(系列标准)

WS365城乡居民健康档案基本数据集

WS/T370卫生信息基本数据集编制规范

WS372-2012疾病管理基本数据集

WS375疾病控制基本数据集(系列标准)

GB/T41814信息技术生物特征识别校准、增强和融合数据(系列标准)

3术语和定义

下列术语和定义适用于本文件。

3.1

队列cohort

根据某个或某些共同特征而组建的一组特定人群。

注:特征包括但不限于:暴露因素、疾病或健康状态、出生时间或年代、地域、干预措施。

3.2

跨队列cross-cohort

队列(3.1)间进行特征数据比较、融合和分析。

注:跨队列形式包括:a)横向跨队列:在不同元数据的队列间进行比较、融合和分析:b)纵向跨队列:在相同元

数据的队列间进行比较、融合和分析。

3.3

数据融合datafusion

将来自不同来源和不同格式的数据进行整合和合并。

3.4

变量variable

数据集中最基本的元素,用于存储数据。

4融合前需明确的内容

1

4.1融合的目的

明确研究问题和目的,说明开展数据融合的原因和目标。

4.2队列数据集的基本信息

基于数据的可靠性、适用性和完整性,按照融合的H的确定拟进行数据融合的队列数据集。收集或

数据集中的相关信息,包括并不限于以下内容:

4.2.1来源及研究起止日期

包括开展队列数据收集的单位、负责人、经费资助,以及数据采集的起始FI期和完成三期。

4.2.2研究目的

明确队列数据的研究目的,了解研究内容及预期结果。

4.2.3研究设计

明确队列数据的研究设计类型,包括但不限于:现况调查、诊断试验、病例对照研究、队列研究、

纵向研究、实验性研究等。根据不同的研究设计类型,记录相应的设计要素,包括但不限于抽样方法、

随机方法、暴露因素、观测指标、干预措施、结局指标等内容。

4.2.4研究对象

明确研究对象的特征、纳入标准、排除标准以及观察的期限。

4.2.5变量

明确队列数据中的变量定义、数据类型、表示格式、数据单位以及取值范围。

4.2.6样本量

根据研究目的选择样本,计算样本量是否可满足统计学检验的要求。

4.3队列数据可用性

根据队列数据集的数据特征,评估拟进行数据融合的队列数据的可用性,评估内容包括但不限于以

下内容:

4.3.1数据清单

创建一个清单,列出所有拟进行融合数据的队列数据源,包括其来源、格式、结构和可用性,从而

对数据的整体情况进行全面了解。

4.3.2缺失数据

对每个数据源进行缺失数据的识别和分析。确定每个数据源中缺失数据的变量数量、比例以及缺失

原因。原因包括但不限于记录不完整、人为错误、技术问题或其他因素等。

4.3.3核心变量和其他变量

评估每个变量的重要性和对研究问题的贡献,分析变量是否为主要观测指标或直接影响研究的主要

结果。核心变量是对研究H的至关重要的变量,通常直接与研究假设或主要研究问题相关。确定哪些变

量对于研究目的至关重要的核心变量,哪些是次要的其他变量。明确核心变量和其他变量的缺失比例,

在决定如何处理缺失数据时根据变量的重要程度进行权衡。获得队列数据的使用许可

4.3.4联系数据负责人

与数据负责人建立联系,申请队列数据使用许可。可以通过电子邮件、正式书面函件或面对面会议

等适当的方式进行。

4.3.5提供跨队列研究信息

2

向数据负责人提供跨队列研究的详细信息,包括研究问题、研究目的、数据提取需求、数据融合统

计分析计划等。

4.3.6请求正式同意

请求数据负贵人提供正式的知情同意文件,明确他们同意跨队列研究使用、分享和融合他们的数据。

知情同意文件可以是书面协议、合同或许可证书,获取后按照有效期对知情同意文件进行档案保存,知

情同意文件包括但不限于以下内容:

a)数据使用目的和范围

b)数据分享和融合的具体条款和条件

c)数据的保护和隐私保护措施

d)同意的有效期限(如果适用)

e)同意的签署日期和签名

5融合中的规范

5.1清理拟融合的原始队列数据

5.1.1统一变量的赋值方式

对于因单位不一致,赋信编码不一致、调杳工具不一致导致的队列数据间相同评估变量的差异,可

以通过数据转化的方式进行统一。

5.1.2识别并确认原始数据问题

识别并确认原始数据的质量问题,如缺失值、异常值、重复值等。

5.1.3处理缺失数据

可根据研究需求决定在数据融合过程中是否对数据的缺失值进行处理,根据数据的重要性和可用性,

考虑以下不同的缺失数据处理方法,包括但不限于以下内容:

a)删除缺失数据行:如果缺失数据占比较小,且对研究问题的影响不大,可以考虑删除包含缺失

数据的行。

b)插补数据:使用统计方法或机器学习方法米估算缺失数据的值。

c)分析缺失数据:缺失数据本身可能包含信息,可以作为一个独立的变量进行分析。

d)加权分析:在某些情况下,可以使用加权分析来考虑缺失数据的影响,以降低偏差。

5.1.4处理异常数据

可根据研究需求决定在数据融合过程中是否对数据的异常值进行处理,根据异常值的特征和对•数据

的理解,选择适当的处理策略,包括但不限于以下内容:

e)删除异常值:对于极端异常值,可以考虑删除这些数据点,但需谨慎,以免丢失重要信息。

a)修复异常值:可以通过插值、取中位数、平均值等方式对异常值进行修复,使其更接近数据集

的整体趋势。

b)分组:将异常值分到适当的分组中,以降低其对分析的影响。

c)转换数据:应用适当的数学函数对异常值进行转换,以缓解其影响。

5.1.5处理重复数据

根据重复数据的特征和对数据的理解,选择适当的处理策略,包括但不限于以下内容:

a)删除重复数据:删除完全重复的记录,保留一条唯一的记录。

b)合并重复数据:对重复数据进行合并,将重复数据合并为一条记录,保留合并后的唯一记录。

c)分析重复数据原因:如果重复数据出现的原因不明确,可以分析其产生的原因,修复数据采集

或输入过程中的错误。

5.1.6与研究目标的权衡

3

在决定如何处理缺失数据时,需要权衡数据的可用性和对研究目标的影响。如果数据的缺失对研究

问题非常关键,那么需要采取更谨慎的方法来处理映失数据,如插补。如果数据的缺失对研究问题影响

较小,可以考虑简化的方法,如删除缺失数据行。

5.1.7记录数据清理过程

记录原始数据的质量问题,使用的数据清理工具、脚本或软件,并记录其参数和设置,缺失值、异

常值、重复值的处理方式,以及数据转换,变量的删除或保留及其原因。

5.1.8数据质量验证

对清理后的数据质量进行验证,确保数据质量满足要求。

5.2根据研究需求设定数据融合的规则

制定明确的融合规则和方法,包括数据匹配方式、变量匹配、合并方式等。

5.2.1选择需要融合的核心变量和次要变量

根据研究目的和问题,选择需要融合的关键变最,并评估这些变量的重要性及局限性.

5.2.2设定数据质量评估标准

评估标准应包括但不限于数据准确性、完整性、一致性和可靠性。

5.2.3设定预期满足标准的数据变量的百分比

设定预期满足标准的数据变量的百分比是为了确保在融合过程中,数据质最达到一定的标准。这个

百分比应基于评估数据质量的指标和方法来设定。

5.3根据设定的数据融合标准评估所需的变量并进行定量评分

根据设定的数据融合标准,对所需的变量进行评估,并根据预设标准进行定量评分。这些评分可以

帮助在融合过程中权衡不同变量的重要性和可靠性。

5.4验证融合结果

验证融合后数据集的准确性和一致性,确保融合结果符合预期。

6融合后的要求

6.1使用文档记录过程

记录数据融合的所有步骤、规则、参数以及处理过程,以便后续审杳和复制研究。

6.2确保过程的可追溯性和透明度

确保数据融合的过程具有可追溯性,能够清晰展示每个数据源如何被融合到最终结果中。

6.3定期评估和更新融合后的数据集

定期评估数据融合的效果,根据反馈和新的需求更新融合标准,以保持数据融合的质量和适应性。

4

参考文献

[1]Benchimo1,E.I.,L.Smeeth,A.Guttmann,K.Harron,1).Moher,1.Petersen,H.T.Sorensen,

E.vonElmandS.M.Langan(2015).“TheREportingofstudiesConductedusingObservational

Routinely-collectedhealthData(RECORD)statement.?,PLoSMed12(10):el001885.

[2]Bernardi,F.A.,D.Alves,N.Crepaldi,D.B.Yamaca,V.C.LimaandR.Rijo(2023).”Data

QualityinHealthResearch:IntegrativeLiteratureReview.,zJModInternetRes25:c41446.

[3]Carter,E.D.,H.H.Leslie,T.Marchant,A.AmouzouandM.K.Munos(2021)."'Methodological

considerationsforlinkinghouseholdandhealthcareproviderdataforestimatingeffective

coverage:asystematicreview.wBMJOpen11(8):e045704.

[4]deKraker,M.E.A.,M.Abbas,B.HuttnerandS.Harbarth(2017).^Goodepidemiological

practice:anarrativereviewofappropriatescientificmethodstoevaluatetheimpactof

antimicrobialstewardshipinterventions.ClinMicrooiolInfect23(11):819-825.

[5]deLusignan,S.,S.T.Liaw,P.Krause,V.Curein,M.T.Vicente,G.Michalakidis,L.Agreus,

P.Leysen,N.ShawandK.Wendis(2011).“Keyconceptstoassessthereadinessofdatafor

internationalresearch:dataquality,lineageandprovenance,extractionandprocessingerrors,

traceability,andcuration.Contributionofthe1M1APrimaryHealthCareInformaticsWorking

Group."YearbMedInform6:112-120.

[6]Duda,S.N.,B.E.Shepherd,C.S.Gadd,D.R.MasysandC.C.McGowan(2012).*Measuring

thequalityofobservationalstudydatainaninternationalHIVresearchnetwork.,zPLoSOne

7(4):e33908.

[7]Dusetzina,S.B.,S.Tyree,A.M.Moyer,A.Meyer.L.GreenandW.R.Carpenter(2014).

AHRQMethodsforEffectiveHealthCare.LinkingDataforHealthServicesResearch:AFramework

andInstructionalGuide.Rockville(MD),AgencyforHealthcareResearchandQuality(US).

[8]Field,K.,S.Kosmider,J.Johns,H.Farrugia,I.Hastie,M.Croxford,M.Chapman,M.Harold,

N.MuriguandP.Gibbs(2010).''Linkingdatafromhospitalandcancerregistrydatabases:should

thisbestandardpractice?*InternMedJ40(8):566-573.

[9]Gassman,J.J.,W.W.Owen,T.E.Kuntz,J.P.MartinandW.P.Amoroso(1995).“Dataquality

assurance,monitoring,andreporting.*ControlClinTrials16(2Suppl):104s-136s.

[10]Gilbert,R.,R.Lafferty,G.Hagger-Johnson,K.Harron,L.C.Zhang,P.Smith,C.Dibben

andH.Goldstein(2018)."CUILD:GuidanceforInformationaboutLinkingDatasets."JPublic

Health(Oxf)40(1):191-198.

[1l]Harron,K.,R.Gilbert,D.Cromwel1andJ.vantierMeulen(2016),"LinkingDataforMothers

andBabiesinDe-IdentifiedElectronicHealthData."PLoSOne11(10):e0164667.

[12]Hills,R.A.,D.Revere,R.Altamore,N.F.AbernethyandW.B.Lober(2012).*Timeliness

anddataelementcompletenessofimmunizationdatainWashingtonStatein2010:acomparison

ofdataexchangemethods."AMIAAnnuSympProc2012:340-349.

[13]Hoffmann,W.,U.Latza,S.E.Baumeister,M.Briinger,N.Buttmann-Schweiger.J.Hardt,

V.Hoffmann,A.Karch,A.Richter,C.0.Schmidt,I.Schmidtmann,E.SwartandN.vandenBerg

(2019).“GuidelinesandrecommendationsforensuringGoodEpidemiologicalPractice(GEP):a

guidelinedevelopedbytheGermanSocietyforEpidemiology.EurJEpidemiol34(3):301-317.

[14]Hosking,K.,G.Stewart,M.Mobsby,S.Skov,Y.zhao,J.Y.Su,S.Tong,P.Nihill,J.

Davis,C.ConnorsandJ.Davies(2020).“Datalinkageandcomputerisedalgorithmiccodingto

enhanceindividualclinicalcareforAboriginalpeoplelivingwithchronichepatitisBinthe

NorthernTerritoryofAustralia-Isitfeasible?”PLoSOne15(4):e0232207.

5

[15]Hosseinzadeh,A.,A.Karimpour,R.KlugerandR.Orthober(2022).z,Datalinkageforcrash

outcomeassessment:Linkingpolice-reportedcrashes,emergencyresponsedata,andtrauma

registryrecords.JSafetyRes81:21-35.

[16]Huang,Y.,Z.Liu,H.Uang,X.Guan,H.Chen,C.Ma,Q.Li,J.Yan,Y.Yu,C.Kou,X.Xu,

J.Lu,Z.Wang,L.Liu,Y.Xu,Y.He,T.Li,W.Guo,H.Tian,G.Xu,X.Xu,S.Lv,L.Wang,

L.Wang,Y.Yan,B.Wang,S.Xiao,L.Zhou,L.LiandL.Tan(2016).?,TheChinaMentalHealth

Survey(CMHS):I.background,aimsandmeasures.z,SocPsychiatryPsychiatrEpidemiol51(11):

1559-1569.

L17JKapsner,L.A.,J.M.Mang,S.Mate,S.A.Seuchter,A.Vengadeswaran,F.Bathe11,N.

Deppenwiese,D.Kadioglu,D.KraskaandH.U.Prokosch(2021).^LinkingaConsortium-WideData

QualityAssessmentToolwiththeMIRACUMMetadataRepository.*ApplClinInform12(4):826-835.

[18]Langseth,H.,T.Luostarinen,F.BrayandJ.Dillner(2010).*Ensuringqualityinstudies

linkingcancerregistriesandbiobanks."ActaOncol49(3):368-377.

[19]Liu,Z.,Y.Huang,P.Lv,T.Zhang,H.Wang,Q.Li,J.Yan,Y.Yu,C.Kou,X.Xu,J.Lu,

Z.Wang,H.Qiu,Y.Xu,Y.He,T.Li,W.Guo,H.Tian,G.Xu,X.Xu,Y.Ma,L.Wang,L.Wang,

Y.Yan,B.Wang,S.Xiao,L.Zhou,L.Li,L.Tan,H.ChenandC.Ma(2016).“TheChinaMental

HealthSurvey:II.Designandfieldprocedures.SocPsychiatryPsychiatrEpidemiol51(11):

1547-1557.

[20]Nind,T.,J.Galloway,G.McAl1ister,D.Scobbie,I.Bonney,C.Hall,L.Tramira,P.Reel,

M.Groves,P.Appleby,A.Doney,B.GuthrieandE.Jefferson(2018)."Theresearchdata

managementplatform(RDMP):Anovel,processdriven,open-sourcetoolforthemanagementof

longitudinalcohortsofclinicaldata."Gigascience7(7).

[21]Parsa,N.,M.J.Zibacenczhad,M.Trevisan,A.KarimiAkhormchandM.Sayadi(2020).

“MagnitudeoftheQualityAssurance,QualityControl,andTestingintheShirazCohortHeart

Study."BiomedResInt2020:8179795.

[22]Smith,M.andF.Flack(2021).z,DataLinkageinAustralia:TheFirst50Years.IntJEnviron

ResPublicHealth18(21).

[23]Stanfill,B.A.,E.S.Nakayasu,L.M.Bramer,A.M.Thompson,C.K.Ansong,T.R.Clauss,

M.A.Gritsenko,M.E.Monroe,R.J.Moore,D.J.Orton,P.I).Piehowski,A.A.Schepmoes,

R.D.Smith,B.M.Webb-RobertsonandT.0.Metz(2018).''QualityControlAnalysisinReal-time

(QJART):AToolforReal-timeQualityControlAssessmentofMassSpectrometry-based

ProteomicsData."MolCellProteomics17(9):1824-1836.

[24]Swart,E.,H.Gothe,S.Geyer,J.Jaunzemc,B.Maier,T.G.GrobeandP.Ihle(2015).”[Good

PracticeofSecondaryDataAnalysis(GPS):guide!inesandrecommendations]."Gesundheitswesen

77(2):120-126.

[25]Vandenbroucke,J.P.,E.vonElm,D.G.Altman,P.C.G0tzsche,C.D.Muirow,S.J.Pocock,

C.Poole,J.J.Schlesseimar.andM.Egger(2007).^StrengtheningtheReportingofObservational

StudiesinEpidemiology(STROBE):explanationandelaboration.AnnInternMed147(8):

W163-194.

[26]vonElm,E.,D.G.Altman,M.Egger,S.J.Pocock,P.C.G0tzscheandJ.P.Vandenbroucke

(2008)."TheStrengtheningtheReportingofObservationalStudiesinEpidemiology(STROBE)

statement:guidelinesforreportingobservationalstudies.,zJClinEpidemiol61(4):344-349.

[27]Weiskopf,N.G.andC.Weng(2013).“Methodsanddimensionsofelectronichealthrecord

dataqualityassessment:enablingreuseforclinicalresearch."JAmMedInformAssoc20(1):

144-151.

[28]Whitney,C.W.,B.K.LindandP.W.Wahl(1998).*Qualityassuranceandqualitycontrol

inlongitudinalstudies.EpidemiolRev20(1):71-80.

6

[29]Willey,B.,P.Waiswa,D.Kajjo,M.Munos,J.Akuze,E.AllenandT.Marchant(2018).

Z,Linkingdatasourcesformeasurementofeffectivecoverageinmaternalandnewbornhealth:

whatdowclearnfromindividual-vsecological-linkingmethods?”JGlobHealth8(1):010601.

[30]岳和欣,湛永乐,边峰,张一方,桂路婷,石英杰,孟耀涵,张娟江,江宇.(2021).“临床队列

研究的数据标准与共享中华流行病学杂志42(7).

[31]朱建平,付学敬(2023).〃融合数据标准管理和数据血缘建设的数据治理方法.〃上海质量(11):

49-55.

7

团体标准编制说明

《队列数据管理数据融合质控要求》

(阶段:征求意见稿)

一、团体标准任务来源、编制背景、目的和意义

(一)任务来源

本标准根据2024年10月12日北京慢性病防治与健康教育研究

会下达的《北京慢性病防治与健康教育研究会团体标准立项公告》,

严格按照《医学队列平台数据技术》要求,由北京大学第六医院负责

此项标准的起草制定工作。

(二)编制背景

《队列数据管理数据融合质控要求》的编制背景主要是由于国

内外在队列研究标准方面普遍缺乏适用于跨病种队列数据融合的质

量标准体系。目前的研究环境中,缺乏针对跨病种队列数据融合前各

单病种数据源的质量评价,也缺少对融合后形成的数据完整性以及应

用的科学性等方面的系统评价。这导致各类专病及自然人群队列间的

融合交叉研究在质量评价工作中面临困难。因此,编制这一标准旨在

建立一个科学、系统的质量标准体系,以提升跨病种队列研究的整体

质量和可信度。

(二)编制目的

《队列数据管理数据融合质控要求》的编写目的在于建立一套

系统化的标准,以确保不同队列数据在融合过程中的质量控制。这一

标准旨在解决当前跨队列研究中存在的数据质量不一致、缺乏标准化

评估和管理等问题c通过明确数据质控的要求和流程,确保在数据融

8

合过程中,各种数据源的准确性、完整性和一致性,从而提高研究结

果的可信度和科学性。此外,该标准还旨在促进数据共享与交流,为

研究人员提供清晰的指导,推动跨病种研究的协作与创新,最终提升

科学研究的整体质量和效率。

(三)编制意义

《队列数据管理数据融合质控要求》的编写意义在于为跨队列

数据融合提供系统化的质控标准,确保数据在整合过程中的准确性和

一致性,从而提升研究结果的可靠性和科学性。该标准促进数据共享

与合作,提高数据管理效率,减少错误与重复工作,增强研究的可重

复性和可比较性,满足法规与伦理要求。总体而言,这一标准对推动

科学研究的创新与发展、提升数据管理水平具有重要意义,为跨病种

研究提供坚实基础。

二、工作简况

(一)起草单位及主要起草人

本标准由北京大学第六医院主要负责起草,北京大学第六医院、

北京大学、中国医学科学院肿瘤医院、中国疾病预防控制研究中心、

山东大学齐鲁医院、北京大学第一医院、天津市安定医院、中国电子

技术标准化研究院,专家团队涵盖了精神、神经、肿瘤、消化、心血

管、疾病监测以及自然人群等领域。

姓名专业职称工作单位

精神障碍

刘肇瑞副研究员北京大学第六医院

流行病学

计算机软件与

黄雨研究员北京大学

理论

9

魏文强流行病学研究员中国医学科学院肿瘤医院

孙可欣流行病学副研究员中国医学科学院肿瘤医院

社会医学与卫

丁若溪副研究员北京大学第六医院

生事业管理

张婷婷社会精神病学主管技师北京大学第六医院

陈园生公共卫生研究员中国疾病预防控制中心

吕明流行病学教授山东大学齐鲁医院

流行病与卫生

张媛教授山东大学齐鲁医院

统计学

皮肤病与图像主任医师、教

李航北京大学第一医院

学授

徐广明社会精神病学主任医师天津市安定医院

控制科学与工

李瑞琪高级工程师中国电子技术标准化研究院

王悦公共卫生助理研究员中国疾病预防控制中心

张同超流行病学助理研究员山东大学齐鲁医院

皮肤病与性病

白倩倩主治医师北京大学第一医院

精神病与精神

潘鹏主治医师天津市安定医院

卫生学

精神病与精神

颜国利副主任医师天津市安定医院

卫生学

(二)主要编制过程

2024年6月,二匕京大学第六医院同天津市安定医院、北京大学、

中国医学科学院肿瘤医院、山东大学齐鲁医院、北京大学第一医院、

中国电子技术标准化研究院、中国疾病预防控制研究中心等有关起草

单位启动了标准前期研究项目“跨队列研究数据融合质量控制标准研

发“,对跨队列研究数据融合工作的流程和质控环节展开调研,并撰

写了调研报告,明确了跨队列研究数据融合工作的质量控制应基于工

10

作流程开展,包括原始队列数据采集、原始队列数据元定义、队列数

据融合三个步骤,同时对于各环节的质量控制报告应有统一要求。

2024年7月,北京大学第六医院会同其他起草单位开展准备团

体标准立项相关材料工作,一同针对制定《队列数据管理数据融合

质控要求》团体标准的具体工作进行了部署,确定了总体工作方案,

并组建了标准起草小组。

2023年8月-2024年9月,标准编写小组按照标准的修订程序进

行标准编制,形成标准初稿,并在起草单位内部多次讨论和修改,形

成了第一版的标准初稿,提交北京慢性病防治与健康教育研究会进行

立项审查。

2024年9月,根据北京慢性病防治与健康教育研究会发布的“北

京慢性病防治与健康教育研究会团体标准立项公告”,北京大学第六

医院同其他起草单位向北京慢性病防治与健康教育研究会提交申请,

明确了《队列数据管理数据融合质控要求》编写工作组的具体成员,

并确定了参编单位和参编人员排序。

2024年10月,北京慢性病防治与健康教育研究会同意该标准立

项。立项下达后,北京大学第六医院同其他起草单位进一步对第一版

《队列数据管理数据融合质控要求》标准初稿进行讨论和修改,同

时修订的还包括北京慢性病防治与健康教育研究会关于队列数据管

理中的其他两项标准。最终形成了标准初稿,并提交北京慢性病防治

与健康教育研究会进行初稿审核。

三、标准编制原则

11

(一)编制原则

1.科学规范。本标准按照GB/T1.1-2020《标准化工作导则第1

部分:标准化文件的结构和起草规则》中的规范性要求进行编写,对

本文件规定了跨队列研究实施过程中数据融合的质量控制要求等内

容,进行规范性阐述。

2.系统全面。对跨队列研究队列数据管理的数据融合质量控制的

全过程进行系统梳理,标准内容涵盖对数据融合前、融合中以及融合

后的质量控制流程和细则等。对跨队列研究队列数据管理的数据融合

质量控制进行全面规范,编制高水平的团体标准。

3.实用好用。尽可能从实用的角度出发,充分考虑标准的可实施

性和实施效果,吸引了各方工作人员参与,多方面征集标准相关部门

以及其他相关方的意见,完善标准内容。

4.协调一致。标准编制过程中,对相关的国家标准以及政策文件

进行了充分的分析和考虑,保证本标准与国家、行业标准及政策文件

的协调。

四、主要技术内容的论据

本文件规定了跨队列研究实施过程中数据融合的质控要求等内

容。本文件适用于指导拟开展跨队列研究的数据融合工作,包括但不

限于社区人群队列、区域性人群队列、针对某一疾病种类或基于特殊

机构建立的人群队列。本文件核心技术内容包括:融合前需明确的内

容、融合中的规范、融合后的要求等章节。

术语和定义:规定了队列、跨队列定义,结合实际经验,重点参

12

考了《ConnectingCohortstoDiminishAlzheimerJsDisease

(CONCORD-AD):AReportofanInternationalResearch

CollaborationNetwork》和《Usingacross-cohortcomparison

designtotesttheroleofmaternalsmokinginpregnancyin

childmentalhealthandlearning:evidencefromtwoUKcohorts

bornfour

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论