版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医院数据资产管理平台项目需求一、项目背景(1)“十四五”全民健康信息化规划建立健全健康医疗数据管理制度,培育健康医疗数据要素市场:以促进数据合规为方式,丰富数据供给,提高医疗数据质量,积极构建健康医疗大数据资源要素体系;采取“原始数据不出域、数据可用不可见”等方式,有序推动健康医疗大数据共享应用。(2)“数据要素×”三年行动计划医疗健康等行业和领域以推动数据要素高水平应用为主线,以推进数据要素协同优化、复用增效、融合创新为重点,通过强化场景需求牵引,带动数据要素高质量供给、合规高效流通,培育新业态、新模式,充分实现数据要素价值,为推动高质量发展提供有力支撑。(3)数据管理困境:分散存储、统计不准和数据缺乏深度挖掘随着医院数字化进程的加速,数据量呈爆发式增长,但目前全院数据存储和管理还存在部分分散状态,数据变化日志缺乏同步与记录,导致数据难以统一调配和高效利用,且数据质量参差不齐,无法准确分析数据问题,严重制约了医院数据资产的价值挖掘和整体运营决策的科学性。数据分散,难以统一利用:在医院的数据管理体系中,尽管已搭建起医疗数据中心,但其定位并非全院统一数据存储与管理的数据中台。诸多关键数据源,如体检数据、随访信息以及HRP系统数据等,尚未有效接入,致使数据散落在各类不同的数据库之中,涵盖Oracle、SQLServer、MySQL乃至文件数据库等。如此一来,每当面临数据分析、科研数据调用等实际需求时,不得不跨越多种数据库类型进行繁琐的查询与数据关联操作。如若涉及数据治理相关工作,其复杂程度更是直线上升,难以迅速推进,这无疑严重阻碍了数据的灵活高效运用,让数据的潜在价值大打折扣。数据质量参差不齐,治理机制缺失:数据生产环节(如映射、清洗、标准化)缺乏有效监控,易出现统计错误,且问题难以追溯;统计数据的准确性也存在不少问题。另外,即便发现了错误的统计结果,也存在难以精准锁定问题根源、无法及时察觉是哪一环节出现了差错的情况,这无疑给数据质量的保障以及基于数据的分析决策带来了极大的困扰,亟待一套行之有效的数据治理机制来破局。数据价值挖掘受限:由于数据孤岛和质量问题,医院难以高效利用数据进行运营决策、科研分析及患者服务优化,制约了数据资产的潜在价值。2.建设目标(1)智能数据字典标注:借助AI大模型的强大能力,自动为数据源的数据字典添加中文注释,随后由人工进行准确度校验。这一举措不仅有效解决了院方对未注释字段理解困难的问题,还显著提升了AI认知的精准度。(2)建立全流程数据治理体系,提升数据质量:部署数据血缘关系追踪与治理工具,精准识别数据准确性缺陷,支持数据质量问题的快速定位与修复;形成规范化数据治理机制,为全院数据资产化提供高可信度数据基础,支撑未来数据资产统一管理与价值挖掘。(3)通过技术工具与治理体系的双重建设,实现数据从“分散无序”到“统一可控”的转型,为医院数据驱动决策奠定基础。3.建设要求(1)数据治理与质量提升①数据质量问题分析与定位利用数据质量监控平台,对全院数据进行全面、深入的质量扫描和检测,生成多维度、详细的数据质量报告,报告中应准确反映数据的准确性、完整性、一致性、时效性等各项指标的分析结果,并对数据质量问题进行分类和分级,为后续的问题解决提供依据。借助数据血缘关系分析工具,追溯数据的产生源头和流转路径,从数据的起始点到最终应用点,全面梳理数据的加工、处理、转换等环节,深入分析数据质量问题产生的根源,如数据录入错误、数据处理逻辑漏洞、系统接口数据传输异常等,为精准定位问题提供技术支持。②数据质量问题解决与预防根据数据质量问题的分析结果,制定针对性强、切实可行的解决方案,如针对数据录入错误,制定严格的数据录入规范和审核机制;对于数据处理逻辑漏洞,及时优化数据处理流程和算法;针对系统接口数据传输异常,加强接口的稳定性和数据传输的校验机制等,确保数据质量问题得到及时、有效的解决。建立数据质量预警机制,通过对数据质量指标的监测和阈值设定,提前发现潜在的数据质量问题,并及时通知相关人员进行处理,避免数据质量问题的恶化和扩散,同时对已解决的数据质量问题进行跟踪和复盘,总结经验教训,不断完善数据质量管理体系,预防类似问题的再次发生。(2)数据安全要求总体符合等保2.0三级安全防护要求、实现数据分类分级管理,敏感数据处理、建立完善的数据访问审批流程。二、技术要求1.主要建设内容序号一级功能二级功能功能要求描述1数据字典管理数据源管理1、数据源的维护管理;2、数据源的连接测试;3、支持管理员对数据源进行元数据采集,支持以下数据源类型的元数据采集任务:PostgreSQL、MySQL、Oracle、SQLServer、Hive、HBase、GBase、DM达梦、OpenGauss等;4、支持查看元数据变更任务采集实例;元数据信息变化能够被感知,包括crud操作表字段的变化,可以将变更信息下载到本地。2元数据管理1、数据源模型表结构维护;2、字典版本管理;3、标准库版本管理;4、通用函数管理;3AI大模型自动注释(基于AI大模型)1、AI大模型自动完成标注解释;2、AI标注助手;3、支持AI全库标注;4AI数据治理数据库连接1、数据库连接配置;2、数据库测试链接;5数据治理规则管理1、数据治理工序和规则配置维护管理功能;2、ETLMapping;3、清洗脚本配置;4、脱敏配置;6数据治理过程管理1、数据导入;2、任务管理;3、T+N任务管理;4、T+N每日看板;7主数据管理1、本地标准;2、参考标准;3、系统管理;4、主数据管理;5、数据同步管理;6、审计管理;8数据结构化(基于AI大模型)1、系统管理;2、结构化管理;3、数据质量;9数据质控质控规则管理1、质控规则维护管理;2、质控规则配置;3、质控规则版本管理;10质控任务管理1、质控任务查询浏览;2、质控任务的维护管理;3、质控任务运行;4、任务工作流的日志记录查询;11质控结果分析1、质控任务执行情况;2、质控报告;3、质控报告导出;4、质控对比;12数据资产管理血缘关系1、针对数据资产整体模型结构之间的数据血缘关系,提供单表字段维度展示血缘关系图;2、支持同构层按照模块维度,展示数据表与同源层之间的血缘关系;13数据资产监控大屏大屏展示全院数据资产;14数据安全数据安全管理数据脱敏管理;2.项目技术要求医院数据资产管理平台项目详细技术要求如下:序号一级功能二级功能功能要求描述1数据字典管理功能概述数据字典管理工具作为医疗大数据治理的核心组件,承担着统一数据语义、破除信息孤岛的关键使命。它涵盖数据源管理,能记录数据来源、连接监控及评估质量,保障数据可追溯与可靠。其数据字典维护功能可灵活添加修改字典项,通过版本控制和历史记录便于审计排查,还能确保数据一致性,统一多系统数据定义。此外,借助AI大模型自动注释,可智能理解医疗文本语义,挖掘数据关系,为数据字典条目添注,且能自动更新优化,减少人工工作量与错误,提升管理效率和质量,为医疗大数据整合、共享、分析奠定坚实基础。2数据源管理1、针对接入数据源的维护管理,提供数据源定义的新增、编辑、启用或停用;2、支持对已有数据源的连接编辑(包含数据库类型、连接名称、IP、端口、用户名、密码、数据库和模式/用户);3、支持对数据源的连接进行测试,准确提示“成功”或“失败”;4、支持管理员对数据源进行元数据采集,支持以下数据源类型的元数据采集任务:PostgreSQL、MySQL、Oracle、SQLServer、Hive、HBase、GBase、DM达梦、OpenGauss等;5、支持查看元数据变更任务采集实例;元数据信息变化能够被感知,包括crud操作表字段的变化,可以将变更信息下载到本地。3元数据管理1、数据源模型表结构维护①支持数据库的模型表结构一键自动提取同步;②支持模型表结构查询浏览,并提供数据表与字段中文标注解释的编辑维护管理功能;③支持数据表字段的值域维护;④支持界面直观显示数据源数据表字段的注释率情况。2、字典版本管理针对数据字典,提供维护管理功能,并支持字典版本管理,包括版本号、版本说明和字典文件上传(支持Excel文件);提供模版下载功能;3、标准库版本管理针对模型标准库提供维护管理功能,并提供模型标准库版本管理,包括版本号、版本说明,字典版本设置、标准结构文件(支持Excel文件)和UTF-8编码格式;提供模版下载功能;4、通用函数管理针对数据治理工序所需处理函数,提供函数浏览与测试功能。4AI大模型自动注释1、支持通过AI大模型自动完成模型表结构的数据表与字段的AI标注解释,并提供人工核验修正功能;2、支持AI标注助手功能,展现AI标注分析过程,同时能够显示AI标注解释;3、支持AI全库标注和单个表标注两种模式。5AI数据治理功能概述数据治理工具作为医疗大数据资产管理平台的控制中枢,通过规则管理、过程执行与运营指标治理构建医疗数据的合规管控体系。其中,数据治理规则管理可制定统一规范,包括数据标准、质量要求等,确保数据的准确性与一致性,为后续治理工作提供准则。医院运营管理指标数据治理服务聚焦于医院核心运营指标相关数据,通过针对性治理,提升数据质量,为医院决策提供可靠依据,助力医院实现精细化管理,推动医疗大数据的有效利用和价值挖掘,全面提升医疗行业的数据治理水平和运营效率。6整体技术路线要求1、支持分层架构,各层职责清晰,便于管理和维护,实现模块间解耦和复用;2、支持分布式部署,可根据业务需求和数据量大小进行横向扩展,提高系统的并发处理能力和稳定性,满足企业未来业务发展和数据增长需求;3、支持元数据统一存储和管理,保障其安全性和可用性;4、支持对敏感数据进行脱敏处理;5、整体框架要求:采用微服务架构,支持容器化部署方式。7数据库连接1、支持数据库连接配置,包含新增数据库连接、编辑、手工配置、查看;2、编辑数据库连接,支持包含选择医院、数据库连接名称、数据库类型、数据库服务名、IP地址、端口号、用户名、密码、大小写敏感),同时支持测试链接;3、支持从数据库连接配置界面直接跳转至“跳转数据导入列表”。8数据治理规则管理1、针对手工/自动的数据治理任务所用的(如:清洗、去重、转换、归一、EMOI、EMPI、脱敏、结构化等)治理工序,提供工序规则配置维护管理功能。2、对于ETLMapping,支持手动和自动两种方式;支持选择按不同批次;支持对脚本的查看、编辑和生成任务并运行;3、对于清洗脚本编辑,支持编辑脚本和可视化配置两种模式;支持手动和自动两种方式;4、对于脱敏配置,根据脱敏规则,支持配置脱敏字段。9数据治理过程管理1、数据导入①通过数据导入配置,提供ODS库数据库模型表结构(数据库、数据表)自动创建,以及自动完成数据源原始历史数据的导入到ODS;②支持新增任务,包括任务名称、数据源、源库名、限速、目标库名、要导入的表和备注;③对于已有的任务,支持查看导入数据情况(可区分数据对比一致和数据对比不一致维度);可重新执行;查看日志和删除任务;④已有任务的列表,可按不同维度(全部、进行中、已完成、失败和已停止)进行区分查看。2、任务管理①针对数据治理按批进行,并提供数据批次任务管理功能;②针对数据治理批次任务,提供数据治理任务的新增、修改、删除等配置维护管理功能;③针对数据治理任务,提供手动执行功能,并支持多任务批量手工启动;④支持治理任务执行进度状态查询,提供执行结果日志浏览功能。3、T+N任务管理①提供T+N模式的数据治理任务的创建功能;②支持T+N数据治理任务的治理详情配置详情管理功能。4、T+N每日看板针对T+N数据治理任务的执行情况,提供每日看板功能。10主数据管理1、本地标准①数据元:支持对本地交互数据集的数据元维护管理,支持本地数据元的新增、编辑、删除、查询和导入等功能。主要用于本地交互数据集的组成部分。②数据集:支持对本地交互数据集的定义维护管理,支持本地数据集定义的新增、编辑、删除、查询等功能,以及对其数据集构成的数据元进行维护管理。主要用于参考标准之外的,本地自定义交互场景所需的数据集。③支持数据集生成JSON样例。2、参考标准①值域:内置国际、国家标准;支持新增、编辑、删除和查询标准;②数据元:内置WS363标准;③数据集:内置WS445标准。3、系统管理①提供业务系统管理模块,能够针对需要接入主数据管理系统的业务系统(如:HIS、EMR、LIS、PACS等系统),进行管理,提供注册、修改、禁用、启用等服务,并提供查询功能;②业务系统查询:输入查询条件,可查询出已在维护的业务系统名称列表;③业务系统属性编辑:支持新增业务系统属性,包括:名称(必填)、系统简称、负责人、邮箱、电话、URL,启用标记等;④业务系统记录删除/恢复:支持对某条业务系统记录信息打删除标记,该删除非物理删除;⑤业务系统记录禁用:支持对某条业务系统记录进行禁用;⑥业务系统记录启用:支持重新启用已经禁用的业务系统。4、主数据管理①分类管理:支持对主数据进行分类管理,包括主数据分类的新增、编辑、删除、查询等功能,对主数据进行分组管理,便于查找与维护;②主数据定义:定义主数据的实体和属性,包括新增、删除、启用标记等;支持跳转至主数据属性和主数据成员列表;③主数据属性:支持属性的新增、编辑、删除、发布和查询等;④主数据成员;支持对主数据的成员(内容)进行维护,系统须提供导入、新增、编辑、删除、查询等功能;⑤主数据查询:可根据查询条件如:主数据名称、启用标记、状态、拼音码(支持模糊检索)、删除标记等属性进行精确或模糊检索,并展示检索结果;⑥历史版本:展示对应历史版本主数据成员详情;支持通过选定历史版本进行恢复。5、数据同步管理①字典映射:针对“业务系统”需要做字典对照映射的“主数据”,可通过自动匹配和人工匹配两种方式进行映射维护。支持按编码/名称方式过滤筛选主数据及业务系统字典中未对照的字典成员,使用户能方便快捷的建立对照映射关系;②发布服务:支持针对主数据发布的同时,对每一主数据同步服务,提供配置管理功能;③发布关系定义:配置每个主数据与业务系统之间的发布关系;④发布服务启动用/关闭:支持对每个主数据对应的业务系统的发布服务提供启用/关闭开关,可灵活控制主数据的发布;⑤订阅服务:针对主数据的订阅的同步,对每一主数据同步服务,提供配置管理功能。⑥支持配置每个主数据与业务系统之间的订阅关系;⑦订阅服务启动用/关闭:支持对每个主数据对应的业务系统的订阅服务提供启用/关闭开关,可灵活控制主数据的订阅。6、审计管理①发布记录查询:支持按时间段过滤发布记录,主要包括发布版本、发布时间、发布人、发布类型、主数据相关信息等;②同步记录查询:支持按时间段过滤同步记录,主要包括消息流水号、主数据名称、系统名称、同步类型、同步状态等;支持查看同步记录详情。11数据结构化1、系统管理①机构管理:针对区域内的医疗机构或分院区,提供医疗机构的维护管理功能,主要包含新增、修改、删除、启用/禁用功能。②来源系统:针对结构化数据来源系统,提供来源系统的维护管理功能,主要包含新增、修改、删除、启用/禁用功能,方便结构化的数据溯源追踪。③数据类别:针对原始数据的数据类别(门诊病历、入院记录等),提供数据类别的维护管理功能,主要包含新增、修改、删除、启用/禁用功能。④数据用途:针对原始数据结构化后的数据用途,提供数据用途的维护管理功能,主要包含新增、修改、删除、启用/禁用功能。2、结构化管理①针对结构化的原始数据,提供原始数据查询浏览功能;支持按数据用途、数据类别、来源系统、筛选字段维度进行数据过滤;②针对模型定义,提供结构化模型定义维护管理功能,提供模型定义的新增、编辑、启用/禁用功能;③针对模型指标,提供模型指标的维护管理功能,主要包含新增、编辑、删除、启用/禁用功能;④针对模型指标的指标来源,提供指标来源的维护管理功能,主要包含新增、编辑、删除、启用/禁用功能;⑤针对模型指标,提供通过AI大模型对指定样例数据进行模型分析,辅助补充指标功能,提供人机交互界面查看AI调试与预览内容、结构化结果明细;⑥针对模型任务,提供模型任务的查询与维护管理功能,主要包含结构化抽样/发布任务进度查询以及发布任务启动/停止等功能;⑦针对模型任务的执行记录,提供任务执行记录执行情况以及执行状态查询功能;⑧针对结构化任务执行生成的结构化结果,提供结构化结果的浏览功能;⑨针对抽样任务的抽样数据,提供抽样核验功能,支持结构化指标结果数据在原文数据溯源高亮显示,并针对指标数据提取有误的模型指标,提供快捷编辑指标提取提示词功能,并提供重新抽取功能;⑩针对已发布的模型的模型数据,提供数据核验、质量评价功能;⑪针对已发布的模型的模型数据,提供模型已结构化的结果数据按照患者及就诊维度查询浏览,并支持结构化指标结果数据在原文数据溯源高亮显示功能。3、数据质量①关于抽样核验,针对结构化模型的抽样记录,提供抽样记录不同维度(如数据用途、模型、抽样状态和核验状态)的过滤功能;针对未核验结束的抽样记录的抽样数据,提供抽样数据的查询等功能;针对未核验的抽样记录的抽样数据,提供数据核验功能;针对核验结束,提供发布抽样核验报告功能,报告展示本批抽样结构化结果数据综合质量情况(展示:填充率、准确率、召回率),以及列表展示各结构化指标的质量情况(展示:填充率、准确率、召回率);②关于抽样报告,针对已提交核验报告的抽样记录,提供抽样记录的核验报告查询功能;支持报告详情查看;③关于模型评价,针对已发布的模型,提供模型数据的评价结果统计查询功能;针对已发布的模型,提供模型数据的查询等功能;针对已发布的模型的模型数据,提供数据核验、质量评价功能。12数据质控功能概述数据质控工具是医疗大数据治理的关键部分,通过质控报告与质控分析双模块驱动医疗数据质量持续提升。数据质控报告能全面呈现医疗数据质量状况,涵盖完整性、准确性、一致性等多方面检查结果,以直观清晰的方式展示数据存在的问题,为后续改进提供详细依据。数据质控分析则深入探究数据质量问题的根源,通过多维度分析,如对比不同数据源、不同时间段的数据,挖掘出潜在的规律和异常点,从而针对性地制定优化策略。13质控规则管理1、支持质控规则维护管理,包括规则的新增、编辑功能;2、针对不同类型的质控规则,支持向导、SQL模式;3、支持手动创建规则以及标准库新版本发布系统后台依据模型表结构自动生成对应版本质控规则,以及配置告警阈值发布告警信息给相关人员;14质控任务管理1、提供质控任务查询浏览功能,并且支持按照各种维度(模型版本、任务编号或名称、操作人)进行检索;2、支持质控任务的维护管理,支持质控任务的新增、编辑、删除等操作,并提供质控目标、规则选择、执行方式配置功能;3、提供质控任务的停止、重跑功能;4、提供任务多次运行的任务工作流的日志记录查询浏览功能。15质控结果分析1、以任务视角查看版本、批次、规则类型等不同维度质控任务执行情况;2、以质控报告的视角来查看规则数、告警数,基础的业务指标数据;3、将质控规则结果,按报告的形式进行统计展示,并支持报告导出excel;4、针对不同批次的质控异常占比,提供批次对比功能。16数据资产管理血缘关系1、针对数据资产整体模型结构之间的数据血缘关系,提供单表字段维度展示血缘关系图;2、支持同构层按照模块维度,展示数据表与同源层之间的血缘关系。17数据资产监控大屏大屏展示全院数据资产18数据安全数据脱敏管理1、数据源①提供需要脱敏的数据库数据源维护管理功能;②支持各数据源的新增、编辑、查询;③支持设置数据源所属系统、数据库类型、数据库服务及端口、用户名、密码
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 建立超链接专题知识讲座
- 中职就业指导课评估报告
- 便秘健康科普指南
- 妊娠期胆瘀护理
- 理工大学就业前景分析
- 桁架式展开结构:从设计构思到试验验证的深度剖析
- 根腐线虫鉴定方法探究与环境对小麦孢囊线虫影响解析
- 2026届江苏省宜兴市丁蜀区渎边联盟重点名校中考考前最后一卷生物试卷含解析
- 化工反应作业安全培训教育课件
- 2026届江苏省苏州市平江中学中考二模生物试题含解析
- 吸塑材料用料计算公式之一
- 互联网+护理服务规范
- (完整版)Conners-儿童行为问卷-常模和题目
- 连续刚构桥设计方法
- 压力管道安装质量保证体系文件
- 正比例(课件)六年级下册数学人教版
- 2023北京大兴区初一期中(下)英语试卷及答案
- 中药饮片生产管理和质量管理培训课件
- 教育教学理论试题与答案
- 陕西省普通高中学业水平考试 历史常考知识点总结课件
- 存量房交易纳税评估系统业务规程全套
评论
0/150
提交评论