版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1医院目前已构建基于全院主流业务场景的信息化系统体系。随着医院诊疗流程持续优化以及数据的积累沉淀,当前临床上产生的诊疗数据存在数据格式不统一、维度不够丰富、数据结构化程度不高等问题,这逐渐表明当前医院在科研数据集中应用能力方面仍有较大提升空间。因此,需要建设临床研究数据库建设(一期)项目,通过对临床既往及未来产生的诊疗数据进行数据采集、数据治理、数据利用、数据管理等操作,为科研人员提供专病数据快速检索、数据集创建及统计分析方法、患者全息视图等应用,实现对多模态医疗数据的人工智能智能化处理,使不同来源的信息得到充分利用,提高疾病预测模型的精度与泛化能力以及基于大数据技术的一站式智能分析能力,辅助临床研究开展,加速专科专病数据库建设,借助真实世界数据推动医院医疗、教学、科研的发展。1.为确保本项目采购系统能够长期、安全、稳定、可靠且高效地运行,本项目系统应满足以下技术需求:①系统应具备连续7×24小时不间断工作的能力;②系统能够接纳不少于5000名用户同时使用,并发用户数应达到3000以上;③单个业务查询响应时间应小于1秒;④系统需保障数据的一致性、完整性和准确性,要求达到99.99%以上;⑤所投软件产品均采用B/S架构设计,且符合信息技术应用创新要求;⑥系统实施范围涵盖XX医院(含各院区、门诊等区域);⑦对于所有采购的软件产品,在数据安全方面,必须采用国家密码管理局认定的自主可控国产密码算法进行加密传输和存储,以保证数据的机密性和完整性;⑧在软件正式部署上线之前,针对等保定级在三级及以上的软件系统,必须确保使用用户身份的真实性,同时需通过由采购人授权的第三方机构执行的信息安2全测评,包括渗透测试、漏洞扫描和合规性评估等环节,以全面验证系统的安全性和可靠性。功能清单:功能点1临床研究数据库建设(一期)数据采集服务-数据库对接自动采集2数据采集服务-接口数据集成服务3数据采集服务-文件数据迁移服务4数据采集服务-数据探查入库5数据采集服务-数据探查分析服务6数据采集服务-数据预处理服务7数据采集服务-数据采集验证服务8数据采集服务-统一建模设计9数据采集服务-数据索引构建服务数据采集服务-数据模型规划服务数据采集服务-实体关系映射服务数据采集服务-数据字典维护服务数据采集服务-数据模型版本控制服务数据治理服务-异常值检测服务数据治理服务-缺失值处理服务数据治理服务-数据去重服务数据治理服务-数据格式统一服务数据治理服务-数据抽取服务数据治理服务-数据格式标准化服务数据治理服务-数据编码标准化服务数据治理服务-病历后结构化3数据治理服务-病历后结构化数据验证服务数据治理服务-数据范围归一化数据治理服务-数据类型归一化数据治理服务-数据粒度归一化数据治理服务-数据维度归一化数据治理服务-数据标签化数据治理服务-数据标注服务数据治理服务-数据标签规则构建服务数据治理服务-标签验证测试服务数据治理服务-数据时序化数据治理服务-时间序列构建服务数据治理服务-时间数据对齐服务数据治理服务-时间数据存储服务数据治理服务-数据脱敏处理服务数据治理服务-数据加密算法选择服务数据治理服务-数据加密实施服务数据治理服务-数据安全审计服务数据质控服务-数据异常检测服务数据质控服务-数据完整性监控服务数据质控服务-数据一致性监控服务数据质控服务-数据准确性监控服务数据质控服务-数据时效性监控服务数据质控服务-数据合理性监控服务数据质控服务-制定质量完整性规则标准数据质控服务-制定质量一致性规则标准数据质控服务-制定质量时效性规则标准4数据质控服务-制定质量合理性规则标准数据质控服务-制定数据异常检测标准数据质控服务-开发数据质控任务服务数据质控服务-开发异常数据处理任务数据质控服务-开发数据检测服务数据质控服务-输出数据质量分析报告数据质控服务-输出数据质量问题报告数据质控服务-输出数据质量趋势报告数据质控服务-提供数据质量改进咨询服务数据质控服务-提供数据质量改进实施服务数据溯源管理-标识与索引数据溯源管理-操作与记录数据溯源管理-可视化展示智能化处理科研数据资源治理平台数据标准管理-平台数据标准统计总览数据标准管理-标准文档元数据管理-元数据采集元数据管理-元数据采集监控元数据管理-元数据提取和血统追踪模型设计-模型设计总览5模型设计-数据表审核数据开发-离线开发组件数据开发-即席查询调度中心-工作流实例监控调度中心一任务监控调度中心-工作流实例执行调度中心-工作流编排调度中心-工作流实例调度中心-离线任务监控调度中心-实时任务监控调度中心-整库迁移监控数据安全-安全总览数据安全-敏感数据识别数据安全-访问权限控制科研数据开放-科研数据目录临床科研服务平台数据库首页-数据概览数据库首页-数据探索数据库首页-专病仓库数据库首页-专病患者列表智能搜索-全文检索智能搜索-一般检索智能搜索-条件树搜索智能搜索-事件搜索6智能搜索-常用搜索智能搜索-搜索结果课题管理-课题首页课题管理-数据洞察数据申请-下载申请数据申请-下载审批统计分析-数据集管理统计分析-指标聚合统计分析-数据清洗统计分析-分析报告统计分析-组间差异分析统计分析-配对分析统计分析-多组配伍分析统计分析-相关性分析统计分析-回归分析统计分析-生存分析统计分析-机器学习统计分析-预测模型全息视图-全息视图科研随访-CRF工具科研随访-随访任务科研随访-随访日历科研随访-随访记录科研随访-随访计划7科研随访-随访模板多中心科研功能-模式支持多中心科研功能-中心管理多中心科研功能-角色权限多中心科研功能-成员管理多中心科研功能-日志管理件系统管理控制-用户管理系统管理控制-系统日志系统管理控制-角色权限管理系统管理控制-数据权限管理1.数据采集服务(1)数据库对接自动采集通过ETL技术对原始数据库进行抽取、转换、清洗并转存到标准化的数据模型中,形成集中存储的临床数据集,并保持与临床业务数据实时同步,为临床诊疗、科研、质控提供数据服务支撑。(2)接口数据集成服务消息等数据格式和协议,能够处理高并发的数据请求,保证数据传输的效率和准确性。8(3)文件数据迁移服务支持影像、超声、心电等文件数据的安全、高效迁移,迁移服务需要支持多种文件格式,能够在不同存储介质和系统间进行数据迁移,同时确保数据迁移过程中的完整性和一致性。(4)数据探查入库支持通过对数据来源数据存储位置、提供方式字段格式语义和取值分布、数据结构、数据质量等进行多维度探查,充分摸查科研数据来源情况,为数据采集和定义提供依据。支持探查范围包括业务探查、接入方式探查、字段探查、数据集探查、问题数据探查等。支持手工录入、自动采集、数据导入等多种数据采集方式,将院内/院外数据清洗导入专病数据库;提供模板,支持数据一键导入;数据采集提供多种校验,保证临床科研数据质量,包括:在设置CRF表单时,每个题目可设置校验规则;数据导入时,系统根据数据属性进行校验;数据自动采集时,系统根据校验规则进行校验;手工录入:制定CRF量表,人工录入患者数据;自动采集:提供数据采集服务,通过ETL、NLP等技术自动采集数据,然后选择患者入库(可以选择全部入库)。(5)数据探查分析服务提供数据探查和分析服务,深入挖掘数据特征和潜在问题。服务应能够生成详细的数据探查报告,包括数据分布、异常值和缺失值分析,为数据治理提供决(6)数据预处理服务根据数据探查报告制定实现数据的预处理方案,包括数据清洗、格式转换和9编码处理等规则。支持根据项目自定义预处理规则,以适应不同来源的数据处理(7)数据采集验证服务在数据采集过程中实施验证机制,通过数据比对服务确保采集数据的完整性、准确性和有效性。支持识别和过滤错误或不完整的数据,提供数据采集的可靠性(8)统一建模设计科研数据资源建设在实现数据接入前,需要依据数据探查结果,进行系统的数据格式定义。根据数据探查中接入方式探查的结果,定义源数据从源系统中的读取策略。定义从来源数据提取所需数据的策略。来源数据包括原始来源数据、原始库、资源库、专题库和业务库。按照业务需求,定义数据的关联策略,为后续的关联回填、关联提取提供策略支撑。按照业务需求,定义数据的比对策略,明确比对源与比对目标之间的比对条按照业务需求,定义数据的标识策略,明确数据标识时所使用的标签规则。(9)数据索引构建服务在建模设计过程中,定制化为科研数据集中的数据构建高效的索引,支持加速科研数据查询和检索。支持多种大数据查询索引类型,能够在大数据量下保持高性能,同时支持动态索引更新。(10)数据模型规划服务支持将统一建模设计内容匹配数据库类型进行实体模型规划和设计数据模型,支持数据的有效存储和查询。支持不同业务需求定制数据模型。(11)实体关系映射服务(12)数据字典维护服务(13)数据模型版本控制服务(1)异常值检测服务(2)缺失值处理服务(3)数据去重服务(4)数据格式统一服务(5)数据抽取服务(6)数据格式标准化服务支持实现科研数据格式的标准化,确保数据在不同系统和应用间的一致性。(7)术语数据标准化处理(8)数据编码标准化服务(9)病历后结构化(10)病历后结构化数据映射服务(11)病历后结构化数据验证服务(12)数据范围归一化(13)数据类型归一化(14)数据粒度归一化(15)数据维度归一化(16)数据标签化自动识别文本中的医学实体和属性,如阳性/阴性症状、体征、特定研究需求,从病历中抽取结构化信息按预定义的科研的标签进行计算合并。(17)数据标注服务据集的标注,提供标注的审核和修正功能。(18)数据标签规则构建服务支持自定义构建数据标签规则,自动化标签的生成和应用。支持根据数据标签规则自动生成标签,并提供标签规则的管理。(19)标签验证测试服务支持验证数据标签的准确性和有效性,确保标签的正确应用。提供标签的测试和验证服务,以及标签质量的监控。(20)数据时序化基于医学各场景流程的科研事件识别,将入平台数据按时间序列汇总,提高数据可读性及可追溯性。以诊疗场景提炼科研用的患者生命周期时间轴。基于临床结局的轨迹,将患者院内外的数据打通,还原患者的检查、治疗、用药、随访等一系列轨迹。以生命轴方式,展示患者各个生命周期时间段内的服务记录概要,概要信息包括生命周期名称、门诊就诊次数、住院就诊次数、手术次数、体检次数等。(21)时间序列构建服务支持构建时间序列数据模型,以支持时间序列数据分析。支持处理患者时间序列数据的存储、查询和分析。(22)时间数据对齐服务支持对齐不同诊疗时间点的数据,以支持跨时间的数据比较和分析。(23)时间数据存储服务支持存储时间序列数据,确保数据的完整性和可访问性。支持大规模时间数据的存储,并提供高效的数据检索。(24)数据脱敏处理服务数据治理过程中需要处理的数据会包含用户的敏感信息,为防止信息泄露,支持数据脱敏和加密处理,通过脱敏或加密规则进行数据的变形,实现敏感隐私数据的可靠保护,同时依然保持其他数据的格式和属性,保证其可识别性和可用性。为保证数据脱敏后数据的可用性,需实现以下4点:1)数据脱敏前后保证数据特征的保持,例如:身份证号码由十七位数字本体码和一位校验码组成,脱敏规则保证脱敏后依旧保持这些特征信息;2)保持数据之间的一致性,在不同业务中,数据和数据之间具有一定的关联性,例如:出生年月或年龄和出生日期之间的关系。同样,身份证信息脱敏后仍要保证出生年月字段和身份证中包含的出生日期之间的一致性;3)保持业务规则的关联性,保持数据业务规则的关联性是指数据脱敏时数据关联性以及业务语义等保持不变,其中数据关联性包括:主、外键关联性、关联字段的业务语义关联性等;4)脱敏规则的一致性,相同的数据进行多次脱敏,或者在不同的测试系统进行脱敏,确保每次脱敏的数据始终保持一致。(25)数据加密算法选择服务支持选择合适的数据加密算法,以保护数据的安全性。(26)数据加密实施服务实施数据加密,以保护数据在传输和存储过程中的安全。(27)数据安全审计服务进行数据安全审计,以识别和解决数据安全问题,提供数据安全的风险评估和合规性检查。(1)数据异常检测服务欺诈行为。支持提供数据的异常检测监控,并支(2)数据完整性监控服务(3)数据一致性监控服务(4)数据准确性监控服务(5)数据时效性监控服务(6)数据合理性监控服务(7)制定质量完整性规则标准制定数据质量完整性的规则和标准,明确数据完整性的要求。需要能够根据不同业务场景定制完整性规则,并提供规则的管理和维护。(8)制定质量一致性规则标准制定数据质量一致性的规则和标准,明确数据一致性的要求。需要能够根据不同业务场景定制一致性规则,并提供规则的管理和维护。(9)制定质量时效性规则标准制定数据质量时效性的规则和标准,明确数据时效性的要求。需要能够根据不同业务场景定制时效性规则,并提供规则的管理和维护。(10)制定质量合理性规则标准制定数据质量合理性的规则和标准,明确数据合理性的要求。需要能够根据不同业务场景定制合理性规则,并提供规则的管理和维护。(11)制定数据异常检测标准制定数据异常检测的规则和标准,明确异常检测的要求。需要能够根据不同业务场景定制异常检测规则,并提供规则的管理和维护。(12)开发数据质控任务服务通过开发质控任务,完成后对任务进行相关信息及规则的配置,配置定时调度可执行该任务生成质控任务实例,并提供对应的质控任务跟踪服务。(13)开发异常数据处理任务支持开发一个专门处理数据异常的任务服务,持续跟踪识别和分类数据中的异常情况,并提供相应的处理策略,如修正、删除或标记。支持自动执行异常数据的处理,并记录处理结果,以便后续审核和分析。(14)开发数据检测服务(15)输出数据质量分析报告(16)输出数据质量问题报告(17)输出数据质量趋势报告(18)提供数据质量改进咨询服务务应包括数据质量评估、问题诊断和改进方案设计。咨询团队应由具备5年以上(19)提供数据质量改进实施服务(1)标识与索引(2)操作与记录支持在数据录入和处理过程中,自动记录操作的时将操作记录与相应的数据进行关联,以便在需要时追溯数据的来源和变化过(3)可视化展示构建满足AI数据预处理、模型管理和医学AI应用的能力模型,提供基于大语言模型的文本结构化提前处理与术语自动映射的AI数据处理功能;提供AI模型管理功能,支持AI模型的数据上传、测试、分析和应用管理;提供医学AI(1)平台数据标准统计总览(2)术语管理(3)数据项管理(4)数据集管理(5)标准文档(6)审核管理(1)业务系统管理(2)元数据采集支持常见关系型数据库元数据的采集,支持采集任务的新增、编辑、上线/(3)元数据采集监控(4)元数据提取和血统追踪(1)模型设计总览(2)模型层管理DWS、ADS),并提供满足用户个性化需求的自定义模型层管理功能,便于后续(3)主题域管理(4)数据表管理数据表管理是模型设计中心的核心功能,提供对(5)数据表审核包含对数据表增删改的审核,同时记录所有审核记录(1)离线开发组件支持对离线开发任务的图形化拖拉拽操作,实现开发过程的去代码化,满足非技术人员的数据开发需求,完成开发任务创建后支持对开发任务的增删改查、上线、下线、复制操作。(2)即席查询即席查询功能仅支持大数据平台的内部数据,用户通过编写SQL语句的方式对内部的数据源进行快速的数据查询与分析。支持将执行的SQL语句以文件的形式进行保存,便于下次进行相同或类似操作。(3)资源管理类型文档的增删查操作,可记录资源文件在离线开发模块的引用情况。支持对.jar类型函数文件增删查操作,可记录函数文件在离线开发模块的引用情况。提供离线开发所需的函数,在此页面进行函数的增删查改操作,同时可记录函数在离线开发的引用情况。5.调度中心(1)工作流实例监控概览展示某个时间维度下的工作流实例执行成功和失败的数量,并对该时间维度下工作流实例执行的总体的成功和失败比例进行汇总统计展示。(2)任务监控概览在所选时间维度下对各类任务实例数进行量化统计,展示各种类型任务的占比情况;显示当前维度下数据采集的总条数以及采集得到数据的总存储量。(3)工作流实例执行(4)工作流编排支持以拖拉拽的形式以DAG流式的方式将Task组装起来,(5)工作流实例(6)离线任务监控(7)实时任务监控(8)整库迁移监控状态、运行时长、开始结束时间、运行日志等,支持对整库迁移任务进行停止、(1)安全总览安全概览:包括敏感表总览、敏感字段总览、敏感表总数、敏感字段总七天)、敏感数据识别任务质量(近七天)。(2)规则管理支持按《卫生健康行业数据分类分级指南(试行)》提供5个安全级别,脱(3)敏感数据识别(4)访问权限控制支持在数据开发的脚本开发、智能ETL中,数据服务的API服务、数据表(1)API服务配置用接口服务应用的授权管理功能。支持查看服务总体情况,包括数据服务数量、服务调用/推送趋势、服务质量情况、服务排名情况。支持手动创建及接口导入两种方式来完成API接口的注册,支持对API接口服务(2)科研数据开放服务管理支持各科研数据需求方通过服务调用方式,提供已发布数据服务的目录浏览视图,支持搜索感兴趣的数据服务,了解相关服务的基本信息,如调用次数、服务提供方、接口地址、字段信息等,并申请调用相关数据服务。支持对接数据服务API完成注册审批并上架的API接口服务,支持对服务详情的查看、服务的申请、服务的收藏,调用指南的查看,服务的过滤搜索等操作。(3)科研数据目录支持将本次收集的医院异源多维的数据资源,形成不同主题的数据开发目录,为医院数据提供数据资产管理,为业务应用提供数据服务市场,让医院全面掌控自有数据资源。支持构建全院科研应用的开放数据目录,包括人口学信息、诊断信息、就诊记录、疾病史、检验、病理检查、免疫治疗、化疗、手术、医嘱、随访等开放数据目录。支持构建专病应用的开放数据目录,包括专病人口学信息、就诊记录、一诉五史标签、体格检查、诊断依据、生命体征监测、检查相关诊断标签、临床相关诊疗数据标签等开放数据目录。(三)临床科研服务平台1.数据库首页(1)数据概览快速了解数据库数据大概情况,如查看平台纳入了多少患者,多少影像和数据质量如何等,来初步判断是否满足科研需求。展示专病库患者数量、多模态数据统计、数据质量和重要指标的分布图,分布图和指标可以配置更改;根据医院需求展示专病库数据情况进行定制。(2)数据探索(3)专病仓库可通过就诊类型(门诊、急诊、住院)、性别(男、女)等指标进行筛选;支持表(连续型指标采用条形图、折线图,分类型指标采用柱状图、饼图等),通用(4)专病患者列表支持展示每个患者的专病库CRF表单填充进度,支持查看患者CRF表单的具体研人员快速地找到科研病例集。(1)全文检索提供方便快捷的关键词搜索入口,通过字典分析、切词等技术处理,检索符合请求条件的病历结果,并提供各种灵活的筛选方式、排序方式和搜索结构的专搜索关键词可选择关键词出处,如:主诉、现病史、既往史、个人史、月经史、婚育史、家族史、体格检查、专科检查、辅助检查入院诊断等;检查结果可进行列设置,包括:性别、年龄、出院日期、出院科室、出院主要诊断、手术名称、手术日期等。(2)一般检索患者临床特征、免疫组化等信息,快速批量进行精确搜索找到目标患者;支持查看检索完成后的结果展示,包括检索结果、相关结果、指标统计、数检索结果列表内容展示支持自定义设置。(3)自定义检索提供条件树搜索相对于高级搜索更加灵活,能够将并且,或者和排除三种逻辑关系按照需求任何进行组合。同时提供逻辑关系/搜索主题/搜索条件/值域范围四个建立高级搜索条件的变量,以及患者维度/病历维度的搜索展示;支持事件过滤器,包括按频次过滤、时间过滤等,并配置完成显示对应的检索条件文字描述;支持查看检索完成后的结果展示,包括检索结果、相关结果、指标统计、数支持自定义检索/事件过滤后的目标人群,再通过自定义指标聚合运算,提取符合特征的精准人群,可开展回顾性队列或病例对照研究;(4)事件搜索支持通过定义医疗事件与事件前后的条件,精确搜索患者;支持多条件组合,精确定义事件,事件可以是一个条件,也可以是多个条件支持基于事件,在其前后添加多个限定条件。(5)常用搜索支持保留检索条件历史,实现快捷调用;支持用户收藏常用的检索条件,方便下次直接调用检索;提供检索条件进度可视化,支持用户可管理搜索进度,可细化单个搜索条件的耗时统计、命中数据和搜索数量。(6)搜索结果支持展示并导出搜索命中患者及搜索变量的结果。支持查看搜索命中患者全生命周期的病例详情,分类展示包括患者人口学信息、就诊信息、诊断信息、检验结果、检查报告、就诊记录、入院记录、出院记录、手术记录、用药记录、护理记录、生命体征等内容。支持配置展示搜索结果的聚合规则,如首次、末次、最大值、最小值、平均值、求和、所有值等。支持对搜索结果进一步筛选后导出数据。3.课题管理支持科研全流程管理,包括:(1)实验设计(2)数据获取(3)变量提取(4)数据处理(5)统计分析(6)结果输出。提供灵活方便的组合查询筛选界面,以及多维度的诊疗数据检索,可以快速地找到科研病例集,再通过入选和排斥等集合运算实现研究人群的精确筛选,并且可以把多维度查询条件保存,以便满足条件的新病人自动入组进行研究;通过入组的研究队列人群,建立队列人群的可视化,用户可直接点击查看队列人群数据基本情况,包含队列人群的基本情况,如年龄、性别、诊断、手术等分布情况。(1)课题列表提供课题列表管理功能,支持已创建课题的简要信息展示,包括患者数、病例数、关注指标等,可查看课题变量需求列表。支持课题数据锁定,锁定后无法对数据进行更改。支持创建多个单中心科研项目并发布。支持创建多个研究队列,不同队列设置不同的纳排条件。支持课题个性化管理,用户可设置关注课题,并提供便捷进入方式。(2)课题首页支持课题信息可视化展示,包括患者数量、新增患者数、课题组汇总展示。支持自定义关注变量并展示,支持一次性创建完毕,也支持后续补充修改,可展示课题关注变量的数据填充率。支持课题纳排条件编辑。(3)数据洞察支持课题纳排条件的分组样本量、数据分布、数据完整性等数据质量情况展示,支持根据纳排条件逐层分析每个条件下的数据透视数据,支持2-3组纳排分组的同步对比完成数据透视;支持组与组关系纳排,可支持多种数据范围的纳排(同病人:患者所有病历数据;同就诊:同一次就诊所有数据;同报告:一份报告单上的数据),且支持三种方式灵活搭配;(4)患者列表支持展示纳入研究对象列表,纳入样本数量,最新一例患者入组时间,并支持搜索、删除和管理已有患者。支持根据纳排条件在数据更新时,推荐符合条件的患者。支持纳排管理可视化展示,显示每个纳排条件具体命中的患者数和就诊数,示,支持根据纳排条件逐层分析每个条件下的数据透视数据,支持2-3组纳排分支持组与组关系纳排,可支持多种数据范围的纳排(同一患者:患者所有病历数据;同一就诊:同一次就诊所有数据;同一报告:一份报告单上的数据),(5)标签管理(6)患者分组(7)事件管理(1)下载申请支持申请下载目标数据集,支持查看申请的数据集审核状态。支持根据用户权限导出明文数据或脱敏数据、加密数据。支持经过审批同意后的数据下载;支持多种数据导出格式,包括CSV、SPSS、R、Stat、SAS。(2)下载审批支持查看导出数据申请,具有审批权限的角色可以同意或拒绝导出申请。支持具备审批权限的管理人员,查看导出的数据内容,填写拒绝反馈等,保证数据安全。5.统计分析(1)数据集管理支持按患者列表一键生成原始数据集。支持课题内对原始数据集进行复制,并可对新的数据集进行编辑、复制、删支持数据集的数据更新。(2)指标聚合支持新增列操作,可选择具体的聚合方式,例如末次、首次、最大值、最小值、平均值、所有值等。新增列支持事件引用,支持选择已定义事件,支持事件发生的时间以及范围。支持在查看数据明细和查看数据概览间切换。支持查看数据概览时可按数据统计类型切换展现图表,例如柱状图、折线图、饼形图、环形图、条形图、箱线图等。(3)数据清洗支持常见的数据清洗算法,包括类别转变量,记录合并,记录替换,缺失值填补,剔除文本,变量拆分,变量计算,多选转单选,变量分级,异常值修正,数据转换,关键词提取。数据预处理:中位数填补、平均数填补、最大值填补、最小值填补、重新编码为不同变量。连续变量分段:支持将连续变量分成多段,作为分类变量用于统计分析。(4)分析报告支持常见的流行病学统计方法,包括组间差异、配对分析、多组配伍分析、相关性分析、回归分析、生存分析,支持在线对课题数据进行统计分析。支持算法推荐,根据变量类型智能推荐相关算法,也可自主选择算法。支持智能生成研究报告,报告分为描述性分析、统计推断两部分,报告内容以论文常用图表样式展示,且包含算法结果智能分析,支持用户下载成pdf/word描述性统计:为科研项目中的变量进行基本统计量的计算,包括平均值、标准差、最大值、最小值、第一四分位数、中位数、第三四分位数、有效填充率、值域分布、有效值占比。支持报告中描述性分析图表的自定义配置。统计推断:包括统计结果输出,图表说明以及智能分析。统计分析结果保存:统计分析的结果,如统计表、统计图,可以被保存在项目拥有者的账号下,方便管理与查看。(5)组间差异分析支持单样本t检验、独立样本t检验、校正t检验、MannWhitneyU检验/wilcoxon秩和检验、卡方检验、校正卡方检验、Fisher精确检验、单因素方差分析、welch方差、Kruskal-Wallis检验等统计学检验方法。(6)配对分析支持配对样本wilcoxon符号秩检验、配对样本t检验、配对卡方检验等统计(7)多组配伍分析持方差齐性检验、Friedman检验、Friedman检验一事后检验Nemenyi、Cochran'sQ检验、Cochran'sQ检验一事后检验McNemar检验等统计学方法。(8)相关性分析支持pearson相关性分析、Kendall相关性分析、spearman相关性分析等统计学方法。(9)回归分析单因素逻辑回归、多因素逻辑回归、单因素线性回归、多因素线性回归、逐步回归。(10)生存分析单因素生存分析、多因素生存分析。(11)机器学习支持疾病诊断、风险预测等模式建立机器学习模型,用户只需拖拽模型训练所需变量即可建立机器学习模型。支持机器学习算法智能调参,一键运行机器学习模型生成模型智能评价报告。支持模型自动更新学习,模型数据源增量更新自动开启模型更新,将新增数据纳入模型进行训练。支持机器学习建模全流程自动覆盖,自动配置任务参数,一键运行机器学习支持数据集选择、机器学习方法配置、响应变量配置、预测变量配置、变量类型配置、模型参数配置和调整在同屏进行操作。支持多模型对比训练,比较不同模型在数据上的表现。支持机器学习模型,包括xgboost、随机森林、向量机SVM、决策树、逐步回归、神经网络等预测模型,支持分类任务、回归任务。(12)预测模型支持机器学习模型管理,管理所有建立的机器学习任务相关模型,支持模型支持选择机器学习模型建立持久化预测应用。支持根据模型自动创建风险预测计算器,用户只需填写参数即可得到风险预测结果。通过全息视图,可以查看患者全病程的每一个时间节点的诊断、用药、体征数据、检查、检验、治疗、手术等数据,方便用户全面了解患者,实时跟踪患者病情,提高工作效率。简便易操作的CRF编辑与管理功能,灵活设置,具备编辑和自定义功能,降低科研/随访人员使用门槛。提供多个病种专业数据采集模板;支持用户自定义建题,题型包括:单选题、多选题、填空题、横向填空、计算题、复合题、文本说明、分割线等等;提供题目设置多种逻辑关系,实现与本表单题目、跨表单题目、随访事件等设置多条件逻辑关系,并以文字显示逻辑条件显示;支持题目设置,包括:变量名称、数据分级、质控等级、数据类型、值域、敏感信息保护开启/关闭、多模态附件上传开启/关闭等设置;支持表单模板管理,一键添加,可永久复用;支持表单导出或打印。(2)随访任务支持根据随访计划自动生成相应随访任务;支持通过随访状态进行查询,包括全部、待随访、逾期等;支持通过输入患者住院号、姓名等进行查询;随访任务列表内容包括住院号、姓名、前次随访日期、本次随访日期、下次随访日期、已完成随访次数、失访次数、逾期次数、当前状态等;支持对随访列表中的患者进行相关操作,包括随访录入、查看患者信息、修改随访计划等;(3)随访日历自由选择以及切换年/月查看随访日历,对随访任务一目了然;通过月历的形式查看该月份的随访任务;通过不同颜色标注不同随访状态,包括已逾期、进行中、已失访、已完成、点击事件,即可弹窗查看日历事件,事件概览信息包括患者姓名、住院号、随访模板、当次随访事件、随访时间、备注信息等;(4)随访记录提供随访记录过程查询功能;支持通过随访状态进行查询,包
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026安徽铜陵国元小额贷款有限责任公司招聘2人笔试历年参考题库附带答案详解
- 2026内蒙古鄂尔多斯市伊金霍洛旗九泰热力有限责任公司招聘热电分公司专业技术人员综合笔试历年参考题库附带答案详解
- 2026中铝数为(成都)科技有限责任公司社会招聘笔试历年参考题库附带答案详解
- 2025浙江江北区劳动和社会保障事务代理服务有限公司招聘编外人员3人笔试历年参考题库附带答案详解
- 2025广东惠州市龙门县国有资产事务中心下辖县属企业招聘综合发布及考察笔试历年参考题库附带答案详解
- 2025安徽黄山市祁门经济开发区投资有限责任公司招聘拟录用笔试历年参考题库附带答案详解
- 2025四川绵阳市江油鸿飞投资(集团)有限公司招聘笔试笔试历年参考题库附带答案详解
- 2025中国远洋海运集团有限公司校园招聘1200人笔试历年参考题库附带答案详解
- 桥梁风荷载计算方法方案
- 边坡土钉墙施工生态恢复方案
- 幼儿园中班数学课《认识数字1-10》课件
- 2024广东海洋大学教师招聘考试真题及答案
- AR安全风险培训课件
- DBJT15-188-2020 城市综合管廊工程技术规程
- 凯恩斯主义课件
- APQP第三版及CP第一版介绍
- 2025年人教版七年级数学下册期中复习题(基础版)(范围:相交线与平行线、实数、平面直角坐标系)解析版
- 武侯祠历史讲解
- 眼健康知识科普讲座
- 癌痛患者的健康宣教
- 2025年广东省高考政治试卷真题(含答案解析)
评论
0/150
提交评论