CESA-2024《医疗云数据资源汇聚服务能力要求》_第1页
CESA-2024《医疗云数据资源汇聚服务能力要求》_第2页
CESA-2024《医疗云数据资源汇聚服务能力要求》_第3页
CESA-2024《医疗云数据资源汇聚服务能力要求》_第4页
CESA-2024《医疗云数据资源汇聚服务能力要求》_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS

团体标准

T/CESAXXXX—2024

医疗云数据资源汇聚服务能力要求

Capabilityrequirementsformedicalclouddataresourceaggregationservice

征求意见稿

在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。

已授权的专利证明材料为专利证书复印件或扉页,已公开但尚未授权的专利申请

证明材料为专利公开通知书复印件或扉页,未公开的专利申请的证明材料为专利申请

号和申请日期。

2024-XX-XX发布2024-XX-XX实施

中国电子工业标准化技术协会发布

T/CESAXXXX-2024

医疗云数据资源汇聚服务能力要求

1范围

本文件确立了医疗云数据资源汇聚服务能力框架,包括数据采集、数据装载、数据比对和服务管理。

本文件适用于:

a)为医疗行业用户选择医疗云数据资源汇聚服务提供参考;

b)为提供医疗云数据资源汇聚服务能力的厂商提供设计、实现依据;

c)为第三方测试机构开展医疗云数据资源汇聚服务测评提供依据。

2规范性引用文件

本文件没有规范性引用文件。

3术语和定义

本文件没有需要界定的术语和定义。

4缩略语

下列缩略语适用于本文件:

AES:高级加密标准(AdvancedEncryptionStandard)

CPU:中央处理器(CentralProcessingUnit)

CSV:逗号分隔值(Comma-SeparatedValues)

DDL:数据定义语言(DataDefinitionLanguage)

DES:数据加密标准(DataEncryptionStandard)

DML:数据操作语言(DataManipulationLanguage)

HA:高可用性(HighAvailability)

HTML:超文本标记语言(HyperTextMarkupLanguage)

MPP:大规模并行处理(MassivelyParallelProcessing)

SQL:结构化查询语言(StructuredQueryLanguage)

RSA:罗纳德-萨莫尔-阿德曼加密算法(Rivest-Shamir-Adleman)

SM2:商用密码算法2(CommercialCryptographicAlgorithm2)

SM4:商用密码算法4(CommercialCryptographicAlgorithm4)

5数据资源汇聚服务能力框架

数据资源汇聚服务将数据源端的结构化数据、半结构化数据、非结构化数据采集过来,经过处理,

存放到数据目标端,形成统一数据资源库。数据源端可以是国内外主流数据库、MPP数据库、消息队列

1

T/CESAXXXX-2024

数据库、NoSQL数据库等,数据源端存放的非结构化数据包括办公文档、文本、图片、HTML、报表、音

视频等。数据资源汇聚服务能力包括数据采集、数据装载、数据比对和服务管理,具体见图1。

a)数据采集是指采集数据源端的全量数据和增量数据。

1)数据源侵入要求是指在进行数据采集时,对源端数据库的操作侵入和对源端数据库所在服

务器的资源占用。

2)全量数据采集是指采集数据源端已存在的数据。

3)增量数据采集是指采集数据源端新增加的数据。

4)采集策略管理是指对源端数据采集策略的配置,例如按照库、模式、用户、对象等不同维

度进行数据采集。

5)性能调优是指数据采集过程中,通过参数配置等方式优化数据采集性能。

6)高可用性是指数据采集功能自身的高可用性,以保证数据采集的连续性。

7)安全性是指在数据采集过程中,所涉及到的文件存储和网络传输的安全性。

8)资源使用限制是指数据采集功能自身的资源使用限制,包括CPU、内存、网络带宽资源限

制。

b)数据装载是指采集到源端数据后,进行数据转换,将转换后的数据写入到数据目标端。

1)数据转换是指根据目标端数据库的要求将源端数据进行转换。

2)目标端写入是指将数据写入到目标端数据库,完成数据入库。

c)数据比对是指将源端数据写入到目标端后,对源端数据和目标端数据进行比对,确保数据的正

确性和一致性。

1)比对方式包括全量比对、增量比对、不停机比对等。

2)比对算法包括条数比对、详细比对、大表拆分比对等。

3)异常处理是指当数据比对存在数据差异时,对差异进行处理。

d)服务管理是指数据资源汇聚服务管理平台。包括服务监控、目标端写入统计、告警管理、服务

部署、集成接口和易用性。其中集成接口是指数据资源汇聚服务管理平台对外提供的集成接口,

用于第三方集成。

图1数据资源汇聚服务能力框架

6数据采集

6.1数据源侵入要求

2

T/CESAXXXX-2024

数据源侵入应:

a)支持数据库账号最小化权限进行数据采集,权限应仅包括:允许创建数据库连接、允许最大限

度使用表空间、允许从数据字典中执行部分过程和函数、允许查询数据库中部分数据字典、允

许查看部分系统参数的权限、允许查询待汇聚表的权限;

b)支持对源端资源使用不超过5%;

c)支持数据采集不会对源端数据库进行锁表操作;

d)支持数据采集只读取日志,在源端数据库中不创建任何表及其他数据库对象。

6.2全量数据采集

全量数据采集应:

a)保证全量数据采集的数据完整,无数据丢失和数据重复;

b)支持多线程并行的全量数据采集;

c)支持多种数据库对象的全量数据采集,包括表、视图、序列、函数、存储过程、包、自定义类

型、索引、约束等;

d)支持源端业务不停且无需备份还原到中间库的全量数据采集。

6.3增量数据采集

增量数据采集应:

a)保证增量数据采集的数据完整,无数据丢失和数据重复;

b)支持基于日志解析的增量数据采集,包括DDL语句、DML语句、序列变更语句的日志;

c)支持以事务为单位保证数据一致性的增量数据采集。

6.4采集策略管理

采集策略管理应:

a)支持设置排除或包含指定数据库对象的数据采集;

b)支持按库、模式、用户、对象等不同维度进行全量数据采集;

c)支持按操作类型、数据值等过滤条件进行数据采集。

6.5性能调优

性能调优:

a)应具备性能调优能力,通过参数优化等方式提升采集性能,采集性能延时可达到秒级;

b)宜支持数据压缩策略配置,降低对网络带宽的占用;

c)宜支持对数据源大表拆分进行全量数据采集,在千兆带宽的情况下,数据采集速率不能低于

20MB/s。

6.6高可用性

高可用性:

a)应支持数据采集重连重试;

b)应支持数据采集断点续传;

c)应支持服务器故障后的数据采集服务自动恢复,继续执行数据采集任务;

d)宜支持数据采集HA。

6.7安全性

3

T/CESAXXXX-2024

安全性应:

a)保证数据采集中间文件加密存储,包括支持DES、AES、RSA、SM2、SM4等多种加密算法;

b)保证数据采集中间文件加密传输,包括支持DES、AES、RSA、SM2、SM4等多种加密算法。

6.8资源使用限制

资源使用限制:

a)应支持数据采集内存使用限制;

b)宜支持数据采集CPU使用限制;

c)宜支持数据采集带宽使用限制。

7数据装载

7.1数据转换

数据转换应:

a)支持源数据到目标数据之间的数据类型转换等规则的制定、应用和维护;

b)支持数据库名转换、模式名转换、表名转换、列名转换,包括对数据库名、模式名、表名、列

名进行大小写转换;

c)支持对模式名增加前后缀;

d)支持对数据进行空格清理;

e)支持不同字符集编码之间的编码映射;

f)支持列增补,包括源端操作时间、目标端装载时间、操作类型(插入、删除、更新)、数据来源、

分布键等;

g)支持按库、模式、用户、表、列等维度进行数据筛选过滤;

h)支持DML过滤,包括根据DML操作类型过滤和值过滤等。

7.2目标端写入

目标端写入应:

a)支持数据多通道并行装载;

b)支持PBE(Prepare-Bind-Excute)装载数据;

c)支持根据数据值大小或时间顺序,配置不同数据冲突处理策略,策略包括跳过、重写、忽略;

d)支持不同DML操作(insert、update、delete)的冲突处理,处理方式包括:跳过、重写、忽

略;

e)支持双向同步相同表场景下的冲突处理,处理方式包括:跳过、重写、忽略。

8数据比对

8.1比对方式

比对方式应:

a)支持全量数据比对,即在全量数据写入目标端后将目标端全量数据和源端全量数据进行比对;

b)支持增量数据比对,即在增量数据同步过程中,将目标端的增量数据和源端的增量数据按照指

定条件进行比对,条件包括时间周期和增量事务数;

c)支持不停机比对,在源端有持续业务的情况下,基于快照进行数据比对;

4

T/CESAXXXX-2024

d)支持各种数据类型,如数值类型、字符串类型、二进制类型、大对象类型等的数据一致性比对;

e)支持数据库级、模式级、用户级、表级的不同级别的数据比对;

f)支持周期性的自动数据比对;

g)支持自定义数据比对线程数,加快数据一致性校验速度;

h)支持各种表结构的数据比对,比如:有主键表、无主键表等;

i)支持目标端转换后的数据与源端的数据进行比对。

8.2比对算法

比对算法应:

a)支持对数据库级、模式级、用户级、表级按数据条数比对;

b)支持对数据库级、模式级、用户级、表级逐行逐列按全量数据以值的粒度进行比对;

c)支持对表进行自定义分片,并对其进行数据值以值的粒度进行数据比对;

d)支持单独采集差异数据再次以值的粒度进行数据比对;

e)支持源端和目标端在不同字符集编码方式下,逐行逐列按全量数据以值的粒度进行比对。

8.3异常处理

异常处理:

a)应支持异常数据的手动和自动修复;

b)应支持差异数据基于多表、单表、多条数据、单条数据的修复方式;

c)宜支持不停机的差异数据修复,在源端有持续业务场景下,保证两边数据一致。

9服务管理

9.1服务监控

服务监控:

a)应提供平台审计日志,包括登录日志和操作日志等;

b)应提供数据采集、数据转换、数据加载、数据比对的运行日志;

c)应提供多种形式展示服务运行状态的能力,包括图形、列表、颜色区分等;

d)宜提供对汇聚平台各硬件节点健康度(包括CPU、内存、存储等)的监控能力。

9.2目标端写入统计

目标端写入统计应:

a)支持不同DML操作(增删改)数据量(条数及数据大小)的统计,包括成功和失败状态;

b)支持不同DDL操作(增删改)条数的统计,包括成功和失败状态;

c)支持库级的同步数据量(数据大小)的统计;

d)支持用户级、模式级按DML操作(增删改)条数的统计;

e)支持每日同步数据量(记录数及数据大小)变化趋势的统计;

f)支持自定义时间区间内同步数据量(记录数及数据大小)的统计。

9.3告警管理

告警管理:

a)应支持告警记录按内容进行搜索查看,包括告警类型、告警时间、告警状态;

5

T/CESAXXXX-2024

b)应支持不同告警类型的订阅,如系统故障信息、比对结果存在差异、实时同步延迟过大、高可

用故障;

c)应支持展示系统所有的告警记录;

d)应支持自定义设置期限自动清理历史告警记录;

e)宜提供告警方式的定制化配置能力,如邮件告警方式、微信告警方式等。

9.4服务部署

服务部署应:

a)支持多对一的增量数据采集链路的部署;

b)支持一对一的增量数据采集链路的部署;

c)支持模块化部署,服务按需部署在不同的设备上;

d)支持集中统一管控;

e)支持数据采集服务与源端数据库集中部署或分离部署。

9.5集成接口

集成接口:

a)应提供汇聚数据链路运行状态的查询接口,包括运行天数、同步速度、同步性能等信息状态;

b)宜支持数据汇聚链路的控制接口;

c)宜支持数据汇聚链路的删除接口。

9.6易用性

易用性:

a)应提供图形化界面;

b)应图形化展示数据比对的结果,不一致的数据应有明显的标识;

c)服务运行异常在图形化界面上应有明显的标识;

d)节点状态异常在图形化界面上应有明显的标识;

e)宜支持输出HTML、CSV等标准格式的数据比对结果。

6

中国电子工业标准化技术协会

团体标准《医疗云数据资源汇聚服务能力要求》(征求意见

稿)编制说明

一、工作简况

本制定任务来源于中国电子工业标准化技术协会于2024年9月10日下达的

《关于公布2024年第九批团体标准制修订项目的通知》(中电标通〔2024〕026

号),项目号是CESA-2024-148。本项目发起单位是中国人民解放军总医院,中

国电子技术标准化研究院作为联合发起单位,两个单位共同组织编制组开展标准

预研、标准立项、标准编制工作。

2024年1月至2024年3月,中国人民解放军总医院和中国电子技术标准化研究

院组织开展标准预研工作。对当前医疗云数据资源现状、数据汇聚需求进行实际

调研。经过需求分析,明确标准化对象是“医疗云数据资源汇聚服务”,并组织

了标准编制组,主要成员单位包括中电科金仓(北京)科技股份有限公司等。2024

年4月至2024年7月,编制组组织多次线上讨论会,讨论标准框架和标准内容,形

成标准草案,提交给中国电子工业标准化技术协会。2024年8月9日,中国电子技

术标准化研究院代表标准编制组参与了由中国电子工业标准化技术协会组织的

团体标准立项论证会,通过专家评审,同意标准立项。之后,编制组又组织了多

次线上讨论会,完善标准。2024年11月,中国电子技术标准化研究院、中国人民

解放军总医院、中电科金仓(北京)科技股份有限公司共同在解放军总医院进行

标准试点验证,进一步完善了标准内容。形成了当前的征求意见稿。

二、标准编制原则和确定主要内容的论据及解决的主要问题

(一)标准编制原则

开放性原则,本标准的制定过程是开放的,允许各相关方参与,包括医疗机

构、数据资源汇聚服务产品提供方等。公平性原则,标准制定过程中,各参与方

均可以表达意见和提出建议。透明性原则,标准制定过程是透明的,按照规范公

布决策依据、过程稿,以便于监督审查。协商一致原则,通过协商一致的原则,

解决各参与方的分歧,尽量达成共识。如果无法达成一致,通过投票等方式决策,

决策尽可能体现多数成员的意愿。技术先进性原则,标准反应当前的技术水平,

中国电子工业标准化技术协会

并鼓励采用新技术,以提高医疗云数据资源汇聚服务的能力和效率。可操作性原

则,标准内容具体、明确、易于理解和执行,避免模糊不清的条款。兼容性原则,

标准应和其他相关标准兼容,避免冲突和重复。可持续性原则,标准考虑长期的

发展和维护,能够适应未来技术的发展变化。安全性原则,考虑医疗数据的敏感

性,标准应强调数据安全,确保条款要求符合相关的法律法规。实用性原则,标

准基于实际应用需求,确保标准在医疗云数据资源汇聚服务中的实际应用价值。

科学性原则,标准的制定基于科学研究和实践经验,内容科学合理。

(二)确定主要内容的论据

本标准主要提出医疗云数据资源汇聚服务能力框架,包括数据采集能力、数

据装载能力、数据比对能力和服务管理能力。确定这四方面内容的论据包括:

医疗数据多样且复杂。医疗行业数据类型多样,包括结构化数据、半结构化

数据和非结构化数据。这些数据来源于不同的系统和平台,包括国内外主流数据

库、MPP数据库、消息队列数据库、NoSQL数据库等。因此,数据资源汇聚服务必

须能够处理和整合这些不同类型的数据,以形成统一的数据资源库。

医疗云数据资源汇聚服务需要考虑数据采集的全面性与效率。为了确保数

据的完整性和实效性,数据采集应包括全量数据和增量数据。同时,数据采集过

程应考虑对源端系统的最小侵入和资源占用,以保证源系统的正常运行。此外,

采集策略管理、性能调优、高可用性、安全性和资源使用限制等都是确保数据采

集高效、稳定和安全的重要因素。

医疗云数据资源汇聚服务需要确保数据转换与装载的准确性。数据转换是

将源端数据格式转换为目标端数据库可接受的格式的过程,这是确保数据准确写

入目标端的关键步骤。目标端写入则是将转换后的数据实际存储到目标数据库

中,完成数据的物理迁移。这一过程需要确保数据的准确性和一致性。

为了保证数据的一致正确,数据装载前一定要进行数据比对。数据比对是

验证数据迁移前后一致性的关键步骤。通过全量比对、增量比对和不停机比对等

方式,结合不同的比对算法,可以确保源端数据和目标端数据的一致性和正确性。

异常处理机制则用于解决比对过程中发现的数据差异,保证数据的可靠性。

为了提供健壮的医疗云数据资源汇聚服务,需要系统性考虑服务管理。服

务管理平台是数据资源汇聚服务的中枢,负责监控、统计、告警、部署和集成等

中国电子工业标准化技术协会

管理功能。服务监控和目标端写入统计有助于实时了解数据迁移的状态和性能;

告警管理可以及时发现并处理潜在问题;服务部署和集成接口则确保服务的可扩

展性和可集成性;易用性则保证用户能够方便地操作和管理数据资源汇聚服务。

(三)解决的主要问题

本标准旨在通过规范医疗云数据资源汇聚服务,提升数据的整合效率和质

量,为医疗行业的数字化转型和智能化升级提供坚实基础。具体包括:多源异

构数据上云,实现不同数据源的全量数据顺利迁移到云端,确保数据的完整性和

一致性。消除数据孤岛,打破数据间的壁垒,促进数据的共享和流通,提高数据

利用率。跨域数据融合,实现跨区域、跨系统、跨领域的数据实时汇聚和融合,

增强数据的整合能力和价值。支撑AI应用,为上层人工智能应用提供高质量、高

可用的数据资源、助力智能医疗的发展和创新。

三、主要试验[或验证]情况分析

为了确保标准条款内容设置合理,可以满足当前医疗行业的实际需求。编制

组于2024年11月组织了标准试点验证工作。对标准条款进行逐条验证,对比了

多款主流数据资源汇聚服务产品,这些产品都能满足标准中所列条款,标准中对

数据采集性能调优、数据采集资源使用限制、数据采集安全性、目标端写入统计、

集成接口、服务部署、服务易用性的条款具有技术引领性,可以促进医疗云数据

资源汇聚服务技术创新。

四、知识产权情况说明

本标准不涉及专利。

五、产业化情况、推广应用论证和预期达到的经济效果

(一)产业化情况

当前医疗云数据资源汇聚服务产品的产业化情况包括:产品和服务多样化,

市场上存在多种数据资源汇聚服务产品,包括开源和商业产品,功能丰富,也能

提供定制化服务。技术和功能先进,数据资源汇聚服务产品采用人工智能、大数

据等先进技术,支持数据校验、转换、实时同步等功能。市场竞争激烈,众多厂

商参与市场竞争,推动产品和服务的创新和优化。行业应用广泛,数据资源汇聚

服务在医疗行业应用广泛。未来,医疗云数据资源汇聚服务将朝着云服务集成、

智能化、安全、多云与混合云支持、边缘计算融合等方向发展。

中国电子工业标准化技术协会

(二)推广应用论证

标准宣贯与培训。为了确保标准的广泛理解和正确实施,首先需要对相关方

进行充分的宣贯和培训。这包括但不限于医疗机构、云服务提供商、医疗信息化

企业以及政府监管部门。通过线上研讨会、线下培训班等多种形式,详细介绍标

准的核心内容、实施意义、方法和预期效果,以提高各方的认识和执行力。

试点应用。选择具有代表性的医疗机构进行试点应用,制定详细的试点实施

方案,包括明确的时间表、责任分配和资源配置。同时,建立有效的监测评估机

制,定期收集试点数据和反馈,以评估标准的实际应用效果和可能存在的问题。

案例研究。收集和分析试点单位的成功案例,总结经验教训。通过案例研究,

提炼出最佳实践,为其他医疗机构提供可借鉴的实施路径。这些案例将通过会议、

出版物、网络平台等多种渠道进行分享和传播。

行业合作。建立广泛的行业合作关系,与行业协会、学会、研究机构等共同

推广标准,扩大标准的影响力和覆盖面。此外,通过与信息技术、云计算等相关

行业的企业进行跨界合作,共同开发符合标准的产品和服务,促进标准的落地实

施。

(三)预期达到的经济效果

本标准的制定和实施预计将对医疗行业产生一定的经济影响,推动医疗信息

化发展,提高医疗服务的质量和效率,降低医疗成本。主要包括:提高数据利用

效率,通过规范医疗云数据资源的汇聚服务,可以有效地整合和管理医疗数据,

提高数据的利用效率,从而降低数据管理和分析的成本。促进医疗数据资源共享,

标准的实施有助于打破数据孤岛,实现跨区域、跨系统、跨领域的数据共享,这

将有助于优化医疗资源配置,减少重复投资和浪费。支持精准医疗和个性化治疗,

高质量的数据资源是实现精准医疗和个性化治疗的基础。标准的实施将为上层

AI应用提供高质量的数据,从而提高医疗服务的质量和效率。推动医疗信息化

发展,标准的制定和实施将推动医疗信息化的进程,促进医疗行业与信息技术的

深度融合,为医疗行业带来新的经济增长点。提高医疗服务质量,通过提供高质

量的数据资源,医疗云数据资源汇聚服务标准的实施将有助于提高医疗服务的质

量,减少医疗错误,提高患者满意度。

六、转化国际标准和国外先进标准情况

中国电子工业标准化技术协会

目前尚无国际标准规范医疗云数据资源汇聚服务。

七、与现行相关法律、法规、规章及相关标准的协调性

国家卫生健康委、国家中医药管理局于2019年发布了《全国基层医疗卫生机

构信息化建设标准与规范(试行)》,明确了基层医疗卫生机构信息化建设的基

本内容和要求,包括基础设施、业务应用、数据管理、网络安全等方面。2023

年中共中央办公厅国务院办公厅印发《关于进一步完善医疗卫生服务体系的意

见》,提出到2025年和2035年的目标,以及优化资源配置、加强人才队伍建设、

推进能力现代化、加强分工合作、促进分级诊疗、推进体系整合化、提高服务质

量、改善服务体验、推进服务优质化、加强科学管理、压实责任、推进管理精细

化、深化体制机制改革、提升动力、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论