T-CESA《智能医疗 跨队列数据处理平台 数据表示要求》_第1页
T-CESA《智能医疗 跨队列数据处理平台 数据表示要求》_第2页
T-CESA《智能医疗 跨队列数据处理平台 数据表示要求》_第3页
T-CESA《智能医疗 跨队列数据处理平台 数据表示要求》_第4页
T-CESA《智能医疗 跨队列数据处理平台 数据表示要求》_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS35.240

L70

团体标准

T/CESAXXXX—2024

智能医疗跨队列数据处理平台数据表示

要求

Artificialintelligence-Medicalcross-queuedataprocessingplatform-Datadescriptionrequirements

征求意见稿

在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。

已授权的专利证明材料为专利证书复印件或扉页,已公开但尚未授权的专利申请

证明材料为专利公开通知书复印件或扉页,未公开的专利申请的证明材料为专利申请

号和申请日期。

2024-XX-XX发布2024-XX-XX实施

中国电子工业标准化技术协会发布

T/CESAXXXX-2022

目次

目次................................................................................II

前言................................................................................IV

引言.................................................................................V

1范围.................................................................................1

2规范性引用文件.......................................................................1

3术语、定义和缩略语...................................................................1

3.1术语和定义.......................................................................1

3.2缩略语...........................................................................2

4跨队列数据表示类型...................................................................2

5跨队列数据表示要求...................................................................3

6跨队列基础数据.......................................................................3

6.1分组数据.........................................................................3

6.2队列阶段.........................................................................4

6.3样本标识符.......................................................................4

6.4姓名.............................................................................4

6.5病例号...........................................................................4

6.6性别.............................................................................4

6.7民族.............................................................................4

6.8疾病种类.........................................................................4

6.9出生日期.........................................................................4

6.10联系方式........................................................................4

6.11现病史..........................................................................4

6.12现居住城市......................................................................4

6.13诊断结果........................................................................4

6.14行为习惯........................................................................4

6.15家族史..........................................................................4

6.16生育史..........................................................................5

6.17认知功能........................................................................5

6.18膳食............................................................................5

6.19环境暴露........................................................................5

6.20数据所属研究机构................................................................5

6.21数据状态........................................................................5

6.22入组时间........................................................................5

6.23基准时间........................................................................5

6.24采集时间........................................................................5

7病例报告表(CRF)数据...............................................................5

7.1CRF量表编号.....................................................................5

7.2CRF量表名称.....................................................................5

7.3量表类型.........................................................................5

II

T/CESAXXXX-2024

7.4量表创建机构.....................................................................6

7.5量表创建时间.....................................................................6

8跨队列临床数据.......................................................................6

8.1病程.............................................................................6

8.2处方.............................................................................6

8.3药物治疗史.......................................................................6

8.4疾病严重度.......................................................................6

8.5临床改善程度.....................................................................6

9跨队列影像数据.......................................................................6

9.1检查时间.........................................................................6

9.2检查机构.........................................................................6

9.3检查部位.........................................................................6

9.4病变形态.........................................................................6

9.5检查结果.........................................................................6

9.6影像图片.........................................................................7

10跨队列健康体征数据..................................................................7

III

T/CESAXXXX-2024

人工智能医疗跨队列数据处理平台数据表示

1范围

本标准规定了医疗跨队列数据处理平台中的跨队列数据类型、数据表示要求及各数据类型中的数

据描述。

本标准适用于跨队列数据处理平台的设计、开发及性能测试。

2规范性引用文件

下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。

凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。

WS364.1-2011卫生信息数据元值域代码第1部分:总则

WS365城乡居民健康档案基本数据集

3术语、定义和缩略语

3.1术语和定义

3.1.1队列数据category

来自特定疾病人群的一组患者个人的系列相关数据。

3.1.2类别category

具有某种共同属性(或特征)的事物(或概念)的集合。

[来源:GB/T101137]

3.1.3分类classification

按照选定的属性(或特征)区分分类对象,并将具有某种共同属性(或特征)的分类对象集合在一起的

过程。

3.1.4代码code

表示特定事物(或概念)的一个或一组宇符。这些宇符可以是阿拉伯数字、拉丁字母或便于电子计算

机和人识别与处理的其他符号。

[GB/T10113]

3.1.5编码coding

给事物(或概念)赋子代码的过程。

3.1.6关系relation

1

T/CESAXXXX-2022

实体或实体类型间的联系。

注:关系可描述实体类型和实体类型、实体类型和实体、实体和实体之间的关联方式。

3.2缩略语

下列缩略语适用于本文件。

CRF:病例记录表(CaseReportForm)

EMR:电子病历管理系统(ElectronicMedicalRecord)

HIS:医院信息系统(HospitalInformationSystem)

LIS:实验室信息管理系统(LaboratoryInformationManagementSystem)

PACS:影响归档和通信系统(PictureArchivingandCommunicationSystem)

4跨队列数据表示类型

在医疗领域中,跨队列数据是指各医疗机构之间依托跨队列数据处理平台关于已收集或建立的专

病队列数据交换和共享,结合EMR、HIS、LIS、PACS等系统中可供共享的部分疾病数据,可帮助医疗

机构更好地了解患者的医疗历史和疾病状况,辅助跨地区医疗、疾病预防和控制、大数据分析、移动医

疗等方面。尤其,慢性病的自身疾病特点及其复杂病因特点决定了其病因研究设计必须是大样本量且长

期随访,依赖于队列数据长时间多阶段的积累和采集,才可得到真实、可靠的病因学证据。跨队列数据

交换与共享框架如图1所示。

跨队列数据的类型可包括但不限于:

——跨队列基础数据;

——跨队列病例报告表(CRF)数据;

——跨队列临床数据;

——跨队列影像数据;

——跨队列生物与遗传信息;

——跨队列健康体征数据。

图1跨队列数据交换与共享框架

2

T/CESAXXXX-2024

5跨队列数据表示要求

在跨队列数据交换与共享条件下,不同所有方的队列数据可以通过表单、文本、影像、基因等格式

进行采集,需采用相同的数据属性表示结构。而且,相同的队列数据类型需采用统一的命名和相同的数

据分类子体系。跨队列数据的属性表示结构如表1所示,表示结构中的必选要素应包括但不限于:

——中文名称;

——定义;

——英文名称;

——数据类型;

——值域。

表示结构中的可选要素可包括但不限于:

——名称缩写;

——约束/条件;

——版本编号;

——最大出现次数;

——录入机构;

——失效时间。

表1跨队列数据的属性表示结构

属性描述

中文名称数据元素的中文名称

定义给出属性的解释和说明

英文名称数据元素的英文名称,一般用小写英文全称,英文单词之间用空格符分隔

英文名称中没有空格,如多个单词连写,其中每一个单词首字母为大写

数据类型说明数据元素的数据类型,如:复合型、数值型、布尔型、宇符串、日期型等

值域数据元素的有效取值范围

名称缩写数据元素或元数据实体的英文名称缩写称。名称缩写应遵守如下规则:

a)名称缩写在本部分范围内应唯一;

b)名称缩写不应包括空格、破折号、下划线或分隔符等;

c)名称缩写不应使用复数形式的英文单词,除非该单词本身就是复数形式;

d)元数据实体名称缩写每个英文单词的首字母均大写,其他字母均为小写,并把

这些单词组合起来;元数据元素名称缩写应采用除第一个单词外,每个单词的首

宇母大写,其他字母均为小写,并把这些单词组合起来;

e)对存在国际或本行业惯用英文名称缩写的采用惯用缩写

约束/条件说明一个数据元素取值的范围或存在条件

最大出现次数说明数据元素可出现的最大次数。

版本编号说明数据元素对应的版本次序

录入机构说明录入数据元素内容的对应机构

失效时间说明数据元素在法规、被采集对象要求等条件下失效的时间

6跨队列基础数据

6.1分组数据

3

T/CESAXXXX-2022

分组数据用于描述跨队列数据中样本所属的组别,如实验组、对照组、患者组等。

6.2队列阶段

队列阶段用于描述样本数据所属的获取阶段,如受试者自评、医生评估、医生核实等。

6.3样本标识符

样本标识符用于描述受试者在队列数据中的唯一编码。

6.4姓名

姓名用于描述受试者的名称信息。

6.5病例号

病例号用于描述受试者在医院或其他机构中的病例编号。

6.6性别

性别用于描述受试者的性别数据,如男、女。

6.7民族

民族用于描述受试者的所属民族。

6.8疾病种类

疾病种类用于描述面向受试者所采集的可能患有的疾病数据。

6.9出生日期

出生日期用于描述受试者的出生年、月、日等数据。

6.10联系方式

联系方式用于描述可联系到受试者的电话、邮箱等数据。

6.11现病史

现病史用于描述受试者已有或曾经患有的疾病数据,如糖尿病史、高血压病史、高血脂病史等。

6.12现居住城市

现居住城市用于描述受试者的居住地数据。

6.13诊断结果

诊断结果用于描述医生对受试者特定疾病的诊断结果数据。

6.14行为习惯

行为习惯用于描述受试者的长期固定行为活动,如吸烟、饮酒、饮茶、饮咖啡、使用染发剂等。

6.15家族史

家族史用于描述受试者的家族成员发病情况。

4

T/CESAXXXX-2024

6.16生育史

生育史用于描述女性受试者在怀孕以及生产的历史参数。

6.17认知功能

认知功能用于描述受试者大脑反映客观事物的特征、状态及其相互联系,并揭示事物对人的意义与

作用判断能力的情况。

6.18膳食

膳食用于描述受试者的日常饮食构成。

6.19环境暴露

环境暴露用于描述受试者接触外部环境因素和程度的情况。环境暴露行为模式可包括:

——受试者接触空气、水等环境介质中污染物的时间、频率、途径和方式;

——受试者居住或工作环境中污染源分布情况;

——受试者对暴露风险的防范行为;

——受试者在居住、工作环境中的危险因素,如噪声振动、粉尘、高温和生产性毒性等。

6.20数据所属研究机构

数据所属研究机构用于描述留存受试者数据的医院或研究机构数据。

6.21数据状态

数据状态用于描述受试者数据的留存状态,如正常、失效等。

6.22入组时间

入组时间用于描述受试者进入对应队列组别的时间。

6.23基准时间

基准时间用于描述队列数据采集的启动时间。

6.24采集时间

采集数据用于描述特定受试者的特定频次数据的采集时间。

7病例报告表(CRF)数据

7.1CRF量表编号

CRF编号用于描述队列数据采集所依赖的病例报告表量表编号。

7.2CRF量表名称

CRF量表名称用于描述队列数据采集所依赖的病例报告表量表名称,宜体现量表面向的疾病与度量

内容。

7.3量表类型

5

T/CESAXXXX-2022

量表类型用于描述量表所适用的人群、疾病等类型,如通用类量表、精神科量表、皮肤科量表等。

7.4量表创建机构

量表创建机构用于描述量表内容制定的机构名称。

7.5量表创建时间

量表创建机构用于描述量表内容制定的日期。

8跨队列临床数据

8.1病程

病程用于描述发病周期、发病频次、死亡时间等情况。

8.2处方

处方用于描述医生对患者所患疾病开具的处方内容。

8.3药物治疗史

药物治疗史用于描述被试者既往使用过的药物及其用量。

8.4疾病严重度

疾病严重度用于描述被试者的疾病诊断等级。

8.5临床改善程度

临床改善程度用于描述被试者在药物治疗后的病情改善程度。

9跨队列影像数据

9.1检查时间

检查时间用于描述影像数据获取的时间。

9.2检查机构

检查机构用于描述影像数据获取的检查机构。

9.3检查部位

病变部位用于描述影像数据获取的被测人员部位。

9.4病变形态

病变形态用于描述影像数据反映的形态,如无明显病变、空洞、结节、钙化、积液等。

9.5检查结果

检查结果用于描述医生对影像数据的评估结果,如基本正常、考虑特定疾病、诊断不明确等。

6

T/CESAXXXX-2024

9.6影像图片

影像图片用于展示或描述影像检查设备识别的检查图片。

10跨队列健康体征数据

跨队列健康体征数据可包括但不限于:

a)体格检查数据:

1)体重;

2)身高;

3)腰围;

4)臀围;

5)血压;

6)12导联心电图;

7)肺功能;

8)最大呼气流量;

9)手握力;

10)平衡力;

11)骨密度等。

b)生化检测数据:

1)血脂;

2)血糖;

3)肝功能;

4)肾功能;

5)心功能;

6)类风湿因子;

7)白细胞;

8)红细胞等。

c)留存样本类型:

1)唾液样本;

2)血液样本;

3)尿液样本;

4)粪便样本;

5)口腔黏膜样本等。

_________________________________

7

中国电子工业标准化技术协会

团体标准《智能医疗跨队列数据处理平台数据表示要求》

(征求意见稿)编制说明

一、工作简况

1、任务来源

根据中国电子工业标准化技术协会2024年第一批团体标准制修订通知(中电

标通〔2024〕001号),中国电子技术标准化研究院负责《智能医疗跨队列数据

处理平台数据表示要求》(团标计划号CESA-2024-010)的标准研制工作。

2、标准编制的主要成员单位

本项目由中国电子技术标准化研究院、北京大学、山东大学齐鲁医院、天津

大学、北京大学第六医院、东软集团股份有限公司等共同编制。

主要起草人包括:。

3、主要工作过程

1)2024年1月-2024年2月,成立编制组;

2)2024年3月,调研跨队列数据处理相关实践及工具、平台,形成研究报

告;

3)2024年4月-2024年7月,编制组多次召开标准草案编制会议,迭代形成

征求意见稿。

4)2024年7月29日,编制组组织组内征求意见会,根据建议进一步完善标

准征求意见稿。

二、标准编制原则和确定主要内容的论据及解决的主要问题

1、编制原则

本文件为自主制定标准,在起草过程中依据了GB/T1.1-2020《标准化工作

导则第1部分:标准化文件的结构和起草规则》的规定。

本文件对跨队列数据处理平台的数据类型进行了梳理,提出了数据表示要求

及各数据类型的数据描述,保证了本文件的通用性;同时,编制组由跨队列数据

处理相关单位构成,通过充分调研、分析与验证,在充分考虑医疗领域应用合理

性的前提下,编制技术条款,保证了其技术内容的先进性和指导性;最后,本文

中国电子工业标准化技术协会

件部分技术内容充分考虑并引用了部分已发布基础通用类标准,进而保证了本文

件的兼容性和可操作性。

2、确定主要内容的依据

标准制定的依据为:

a)标准格式按照GB/T1.1—2020标准要求编写。

b)本标准制定参考以下标准:

WS364.1-2011卫生信息数据元值域代码第1部分:总则

WS364.1-2011卫生信息数据元值域代码第1部分:总则

WS365城乡居民健康档案基本数据集

3、解决的主要问题

由于跨队列医疗数据处理平台相关系统主要由软件服务商开发并部署,大量

应用该系统的医院、医疗机构等用户方难以直观、明确、清晰地掌握队列数据存

储、构建、管理和交换等要求,造成了其在医疗队列构建前数据准备不足、构建

中专家知识输入不足、构建后使用困难等一系列问题。本标准针对上述问题,提

出了对应的标准条款,以支撑跨队列数据处理平台间的数据互联互通。

三、主要试验[或验证]情况分析

在医疗领域中,跨队列数据指的是各医疗机构之间的数据交换和共享,它可

以帮助医疗机构更好地了解患者的医疗历史和疾病状况,提供更加精准的医疗服

务。例如,在跨地区医疗方面,随着人们生活水平的提高和交通、通讯等技术的

发展,患者可以在不同地区的医疗机构接受诊治。跨队列数据共享可以帮助医疗

机构了解患者的医疗历史和病情,提供更为精准的医疗服务。随着相关研究的推

进及跨队列数据处理平台的建设,已逐步形成了各平台的数据表示形式和各数据

类型定义。本标准牵头单位同步关注了国

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论