版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医院科研检索平台建设需求系统概述系统可以根据不同专科和疾病的特点,规范化、标准化的收集到大量结构化病例,包括:诊疗、随访、实验室检验、检查、用药、社会属性等方面的数据,从而形成具有极大临床及科研价值的患者数据库。系统功能专病临床科研数据中心全量数据接入数据源分析支持对院内业务系统数据进行分析管理,通过对院内各业务系统数据源进行分析,准确地查找和定位到所需的源数据表、视图及数据之间的关联关系。支持对科研关注的纸质文档、图片等多模态数据进行集中管理,结合该类数据的实际应用需求,按需分类并以人工处理的方式优化成电子数据,方便后续导入专科数据库。支持对其他相关数据源进行管理,比如单机版设备仪器数据、院外系统及第三方数据等。ETL采集引擎支持具备从多种不同的数据源(ORACLE、SQLSERVER、MySQL、VIEW、消息、HL7、WS)中进行指定规则的数据提取作业。支持具备数据转换功能,在数据提取的过程中将不同数据源、不同数据类型的数据进行转换。支持具备数据装载功能,平台默认以1000条缓存数据为限,每达到限制数量后执行一次数据装载,并可根据单条数据量大小来修改单次装载量,支持动态配置。支持全量数据/增量数据采集同步。支持指定时间间隔或指定时间点进行自动采集。支持对数据采集过程实施监控预警。如采集任务异常中断,支持一定时效内的自动重启恢复,如多次重启失败,则支持记录同步状态,提交给数据监控预警并生成后端日志文件保存。ODS数据预处理支持在数据采集过程中对数据中的作废标识进行处理。支持在数据采集过程中对数据中的重复数据做去重处理。支持在数据采集过程中对数据中脏数据(空值、异常值等)进行统一清洗。支持数据回收站功能,用于存储作废数据、重复数据和垃圾数据。全量数据治理患者主索引构建系统将充分利用患者身份信息建立患者主索引数据模型,包括患者的个人信息比如性名,性别,出生日期,证件类别,证件编号,婚姻状况,住址以及亲属信息等。同时也可基于院内现有信息化体系中的患者EMPI体系,完成增量患者的主索引识别与绑定,并可支持临床科研人员进行人工审核确认,从而完成增量患者数据与系统历史沉淀数据的统一融合匹配,基于唯一的患者主索引标识,完成所有患者数据的识别和关联。数据质控管理支持准确性分析,对具有规范性的字段进行准确性校验,例如身份证号码,通过正则校验,或者本来应该填写数值类型的,查看是否存在其他类型。支持完整性分析,包括数据是否完整,内容是否齐全等数据完整性校验。支持一致性分析,包括判断数据字典值域是否一致等数据一致性校验。支持及时性分析,能够判断数据的时间逻辑性是否合乎常理的数据及时性校验。支持关联性分析,实现对数据结构中的各表关联字段进行校验,比如索引表和明细表之间是否正确关联等。支持在完成数据准确性、完整性、一致性、及时性和关联性五大维度的数据分析后,输出整体数据质量分析报告。数据归一处理支持提供数据归一化工具,实现源数据生产系统标准字典和重点专病标准数据模型之间的归一规则的维护和管理,确保数据来源的准确性,归一范围需覆盖手术名称、检查名称、检验名称和药品名称。国内外标准映射支持与ICD-10等国内外标准医学术语体系进行关联映射,以实现重点专病数据模型与国内外标准医学术语的互联互通,保障重点专病数据模型的前瞻性和可用性。专病知识图谱构建支持在数据治理的过程中,对收集、整理、标准化的专病医学术语和术语之间的逻辑关系进行关联,实现专病知识图谱体系的构建,并能对后续的增量术语进行统一关联及维护,为后续专病辅助诊疗模型构建、医疗创新应用提供宝贵的专病知识管理体系。医学术语词库构建围绕重点专病患者所涉及的相关症状、病历表述内容进行梳理,囊括具有疾病特色的医疗同义词、反义词等医疗术语,构建符合重点专病科研应用的术语词库并支持统一集中列表管理与展示。支持基于医学术语词库生成对应的可视化知识图谱体系,展示术语之间的关联关系。数据后结构化医疗数据标注引擎支持导入重点专病数据标注所需的患者的就诊病历和所需要标注的数据元并发布任务。支持按主诉、现病史等病历节点进行标注原文展示,通过鼠标框选分词提取原文内容,实现该病历原文所对应的数据元的关联标注。支持通过上传JSON格式的疾病数据元数据,创建疾病同义词标注库,实现疾病数据元的同义词二元属性标注,并支持手工添加到相关数据元的同义词术语库。支持对已标注的疾病数据元及其同义词进行列表展示,并可自动生成对应的可视化知识图谱体系,展示术语之间的关联关系。自然语言处理引擎支持原始病历训练医疗领域的BERT语言模型。支持导入医学术语词库,进行病历文本命名实体识别及自动分词。支持基于BERT语言模型及医学术语词库的医疗文本的后结构化处理。支持跨病种的语言模型迁移学习。病历文本后结构化支持基于自然语言处理引擎,实现重点专病患者的病历内容的后结构化处理,实现一诉五史、入院记录、手术记录等医疗病历文本进行自动化NLP治理,并支持将提取到的结构化数据进行标识和存储。检查报告后结构化支持基于自然语言处理引擎,实现重点专病患者的检查报告的后结构化处理,实现包括超声检查、X线检查、CT检查、MR检查等检查结果中的医疗文本进行自动化NLP治理,并支持将提取到的结构化数据进行标识和存储。科研数据中心专病数据建模专病数据模型需包含以重点专科优势病种为主线收集和整合的所有相关临床数据术语,其范围需覆盖该疾病在诊疗过程中的各个领域,包括基本信息、就诊信息、病历文书、诊断、检验检查、随访表单等。在此过程中,需要参考相应单病种专病库的行业最佳实践,进行细粒度的定制化扩展处理,深入调研和总结针对单病种数据库所需字段,以及字段之间的逻辑关系,并基于临床指南、共识、文献以及专家经验,定义每一个字段的含义、单位、值域等内容,构建完整的专病数据模型。患者数据接入系统支持多种数据接入方式,科研数据中心数据可分历史数据接入、增量数据接入两个步骤进行。历史数据接入可根据医院应用实际,通过备份库、备份文件等多种方式接入,增量数据接入支持消息队列等多种接入方式。所有需要对接的历史数据均采取一次性主动ETL抽取的方式接入,数据内容可见下表所示:表STYLEREF1\s3SEQ表\*ARABIC\s125数据对接范围列表序号所需对接系统基础对接数据范围1HIS系统人口学信息、就诊信息、药品信息。2EMR系统门急诊病历、入院记录、出院记录、首次病程记录、日常病程记录、手术记录、会诊记录、待产记录、转科记录、死亡记录、护理记录。3LIS系统一般检验(检验申请单、检验报告明细表等)、微生物检验。4影像信息管理系统检查报告(超声检查、X线检查、CT检查、DR检查、MR检查、心电图、脑电图、内镜检查、其他检查)。5病案首页诊断信息、手术及操作信息。6病理系统病理诊断、病理报告等。7护理系统生命体征、评估量表。如存在院内业务系统更换等引起的数据源重新接入问题,均在完成旧系统历史数据全量抽取的情况下,再开展与新系统的数据对接,获取后续增量数据并与历史数据相匹配、关联,完成新系统对接后可采取定期增量更新的方式接入。具体数据接入流程如下:(1)确定入库规则确定入库规则是指确定专病专病数据多中心采集与管理平台中拟纳入的患者人群范围,即设置一定的筛选与排除条件,定义数据仓库中的人群范围。(2)历史数据接入历史数据指系统实施之前所产生的业务数据。系统需支持通过ETL工具进行一次性批量接入,并在此过程中,支持构建患者主索引(EMPI)服务,完成入库人群的所有诊疗记录关联。(3)增量数据接入增量数据接入指系统部署实施之后,新增加的诊疗数据。系统需内置定制化的数据治理工具实现自动异步更新。(4)离线设备数据接入离线设备数据接入指单机系统数据的接入,例如:呼吸机数据的接入。系统原则上需支持采用周期性人工导入的方法实现。(5)缺失数据补录缺失数据补录指业务系统中未记录的,需要补充采集的相关数据,缺失数据一般通过系统补录操作界面或数据后台手动实现数据接入。(6)其他相关的第三方数据接入其他相关的第三方数据接入,根据实际情况进行数据手工录入或导入实现数据接入。数据安全管理数据容灾管理支持数据备份机制,默认按照一月一次进行增量备份;数据恢复时长需控制在2小时以内;支持采用ES分布式分片存储,每个分片数据都字段的副本存于其他的节点上,保证数据的安全。数据脱敏管理支持针对患者姓名,身份证,联系方式,住址等隐私数据进行脱敏提取;支持对数据字段内容进行关键词替换操作,如将某数据字段内容转换成“*”号展示。专病临床科研应用平台平台首页概览数据中心概览支持对专病数据库的数据情况进行概览展示,包括纳入患者总数、门诊人数、住院人数、门诊人次、住院人次、门诊/住院就诊人次趋势、就诊患者地域来源、性别占比、年龄分布基础数据统计图表在内;支持对专病临床科研所关心的重要数据指标进行定制化展示,如手术药品使用频数词云图、手术分级数量分布等;支持对专科科室管理人员所关心管理指标数据进行定制化展示,如科室运营、专病质控数据指标等;数据治理概览支持查看数据来源情况,包含数据来源系统总数、数据来源系统表总数、数据来源系统表字段总数;支持查看原始数据处理情况,包含数据抽取总数、数据作废处理总数、数据重复处理总数、数据清洗处理总数;支持查看数据元处理情况,包含数据元总数并按照处理方式分类展示,数据元结果总数并按照处理方式分类展示;支持查看数据元血缘关系查看,包含数据元流入节点和流出节点;支持查看从业务系统抽取数据至ODS库历史抽数结果,包含各业务域数据增量统计,增量总行数统计,抽数时间统计,抽数状态统计;支持按照用户个人维护,统计用户登录次数、检索次数、纳入队列次数、导出次数、曲线图统计;病例检索中心数据检索域基于专病专病标准数据模型,以患者人口学信息、就诊信息、诊断信息、费用信息、一般检验、微生物检验、检查报告、医嘱记录、门急诊病历、住院病历、入院记录、出院记录、病案手术、会诊记录、抢救记录等医疗场景构建检查业务域构建,结合操作简易、高通用化和高效使用的原则完成产品页面的设计,全面赋能临床科室开展所需数据查询和提取。数据元定位支持通过输入任意文字内容进行检索域数据元模糊搜索,定位并展示与检索内容具有相关性的数据元所在业务域,方便用户快捷点选开展队列筛选和创建。事件检索支持基于事件检索出相应的患者,如手术后白细胞>9.5的患者。字典选择新增指标项可下拉选择对应的字典进行检索。实时完整度统计支持基于条件树检索的患者实时统计出各数据元的完整度。数据对齐支持基于某个业务域的数据进行数据对齐,对齐后其他业务域数据同步对齐与所选中的业务域诊次一一对应。二次检索汇总支持查看全部二次检索条件,并支持一键全清除。队列检索维度系统提供患者维度和就诊维度两大检索维度供临床科研人员使用。患者维度:当患者的任意一条就诊记录符合对应检索条件的要求,则将该患者的所有就诊记录的数据进行查询和展示。就诊维度:将符合对应检索条件的所有患者对应的就诊记录的数据进行查询和展示。基于上述两种检索维度,各科室临床科研人员在开展队列检索和创建时可以按照自己的课题需求,自行纳入符合要求的患者对应数据,减少无效就诊数据纳入和采集,助力精细化数据入组。科研全景视图科研360全息视图支持按照患者的门诊、住院就诊时序,逐个展示单个就诊次序下的患者全量诊疗信息,内容包括基本概览信息、病历信息、医嘱信息、检验信息、检查信息、量表信息(如有)、护理信息等。基本概览信息:内容包括单个就诊时序下的患者疾病情况(包含诊断、确诊年龄、就诊时间)、随访量表评估情况(如有)、用药情况、检查报告异常情况和检验异常数据在内。病历信息:包括该次就诊时序下的相关病历文书记录,如入院记录、出院小结等,支持提供原始文书内容查看。医嘱信息:包括该次就诊时序下的所有患者的医嘱信息,包含药品(西药、中草药)、治疗、护理、耗材、手术等在内,支持按医嘱类型和医嘱项目两大类进行筛选查看。检验信息:展示该次就诊时序下的所有患者的检验项目,支持调阅原始检验报告进行查看。检查信息:展示该次就诊时序下的所有患者的检查项目,支持调阅原始检验报告进行查看。量表信息:支持展示患者在该次就诊时序范围所填写的量表数据记录,展示的内容包括量表题目和答案。护理信息:支持对该次就诊时序下患者的血压情况、呼吸情况、体温情况、体重情况、脉搏情况等生命体征数据进行图表可视化展示。科研360全息视图-升级迭代新增手术信息和病理信息展示,新增按照子业务域区分展示,新增展示后结构化指标。后结构化视图支持展示每次诊次的后结构化指标项结果及其溯源信息。CRF表单视图支持展示患者的CRF表单,并支持新建CRF表单进行数据录入,并支持依据规则自动填充,如按最新数据填充,或按照特定事件填充,或按照模板规则填充。患者Timeline视图将患者的所有门诊、住院就诊记录、检验记录、用药记录、检查记录、生命体征记录等数据内容按统一时间线进行可视化展示。用户可按时间进行筛选,支持用户鼠标移动到对应的时间线标识上自动显示该项标识的代表含义内容。诊疗时间轴标识会将该次患者的就诊类型、就诊科室、就诊时间、诊断、就诊医生等信息进行展示。检验时间轴标识会将检验项目名称、检验时间、具体数值等信息进行展示,如该时间节点上的检验数据异常(高于或低于正常值),则对应标识的颜色会将被标记为红色进行凸显展示。用药数据时间轴标识会将医嘱类别、药品名称、规格、每次用量、频次、用法、开始用药时间和结束用药时间等信息进行展示。检查项目时间轴标识会将该项检测项目的名称、报告时间、影像所见、影像诊断/结论等信息进行展示。生命体征时间轴标识会将该患者的所有体征数据进行趋势图展示,用户鼠标移动上去可查看该标识下所记录的具体体征项目名称和数值,此外用户还可通过勾选的方式添加或取消相应生命体征的趋势图展示。科研项目中心科研项目管理各科室临床科研人员可通过创建符合自己科研需求方向的科研项目并进行同一管理,系统支持以卡片的形式对所有项目进行集中展示,展示的内容包括项目名称、纳入病例数、创建人和创建时间。用户可对自己创建的项目的状态进行维护,包含进行中和结题两个状态,当项目处于结题状态时,项目中的任何信息都不可修改,任何操作都不可进行,所有消息都不再通知。具备相应权限的用户可以对项目视图中的项目进行删除操作。用户可通过创建时间、项目名称和创建人进行项目查找操作。支持用户创建科研项目,通过输入项目名称和项目概况资料信息即可完成科研项目创建,后续可通过检索纳入相应患者开展课题研究。项目成员管理项目管理员可对科研项目的成员进行统一管理,包括添加新成员、编辑成员信息、删除成员、设置成员所属科研队列、设置成员角色等操作。项目角色管理具备权限的管理员用户可对科研项目中的功能权限进行设置,自定义功能项目对应的用户角色并保存。具备权限的管理员用户可对用户角色的数据权限进行设置,实现用户角色与科研队列之间的关联与管理。项目病例管理支持在科研项目中按队列的形式展示该队列下的全量病例数据,展示的格式与检索中心保持一致,同时用户可在此页面中对病例进行纳入队列、科研全息、删除病例等操作。支持用户在项目病例列表中将符合自身科研课题需求的患者纳入科研队列中进行管理,支持纳入患者单次和所有就诊病例信息。用户可执行删除患者操作,在删除的同时,还可设置是否删除存在于科研队列中的患者就诊信息。项目数据事件导出新增项目数据基于事件对比导出,可分别导出事件前、事件中、事件后对应指标结果值。项目病例管理-导出次数选择新增可选择导出次数,包含导出第一次、第二次、最后一次。项目病例管理-导出模板新增导出模板存储,并支持调用导出模板自动勾选模板内的数据元。项目病例管理-标签可配置患者标签,并可基于患者标签筛选过滤。项目信息维护用户在此模块中可以查看该项目下属的所有队列情况,并支持对项目基本信息、科研队列进行维护操作,方便管理人员开展相应追溯事宜。支持用户对项目的基本信息进行维护,内容包括项目名称和项目概况描述在内。此外,用户还可在此创建相应的科研队列赋能临床课题研究,支持在原有科研队列的基础上创建亚队列,并相应的设置亚队列的团队以及删除现有队列等操作。科研随访中心随访空间概览支持展示我的随访项目总数/已随访人数/累计随访次数等数据以及最近的随访项目和基本信息。对全部随访计划中的问卷数据分布情况进行概览式探查。随访项目管理支持新建项目,对随访项目进行重命名/结题/终止/删除等操作,可生成供患者扫码入组的二维码。支持对课题基本信息进行录入和修改。支持课题相关文档的上传/搜索/预览/下载/删除。支持对项目成员进行管理以及功能权限菜单配置。支持查看数据下载/隐私数据查看的申请进度和详情。支持查看待审批任务,并进行审批管理。对项目内成员的操作记录进行查询。支持对共享队列审批设置。支持问卷未提交超过n天进行微信消息提醒的自动提醒设置。随访多级队列管理支持项目成员可创建子队列,并对其他项目成员进行“可见/不可见”的隐私设置。支持对整个队列的病例添加计划,队列的新增入组病例自动绑定该计划。支持子队列中数据下载和隐私数据查看的审批流程设置。支持创建者邀请项目成员管理队列,并可删除。支持多种病例入组方式/对病例进行删除。支持以单个/多个病例为随访对象进行计划添加。支持即时/定时对用户进行微信消息推送,可选择内容:问卷/科普/文本/报告和图片上传入口。支持对接专病库数据,支持将检索后的病例导入到随访队列中。支持将病例从科研队列导入到随访队列。支持以列表形式批量录入病例信息,或以excel模版形式导入病例。支持将随访队列中的病例入组至科研队列。支持将随访队列中的病例入组至同项目内其他队列中。汇总病例基本信息和随访信息,支持展示全部随访计划时间轴。支持医生人工录入问卷数据,可录入至计划内或临时随访内。随访进度管理支持为项目内病例添加随访计划,并可对计划时间节点和问卷进行修改。支持对计划进行“启动/终止/暂停”的状态管理。支持为计划内每个队列设置智能入组条件,自动识别专病库新增的匹配病例,并将其抓取到“待入组”页面。支持“手动/入组后自动启动/入组后间隔时间后自动启动”等设置。支持对项目内全部计划推送记录的查看和管理。支持展示各计划在不同进度节点下的人数汇总列表。支持展示各随访进度(待推送/已推送/已完成/已结束/已终止/已暂时)下的病例汇总列表。支持对病例随访状态进行“启动/暂停/终止”等管理。自动填充问卷新增问卷数据基于数据库患者数据自动填充,并支持特定事件抓取数据,如出院后第一次,出院后最后一次。智能入组新增随访入组基于数据库条件树智能入组,定时通过所设定的条件自动抓取符合条件的患者入组,并且支持基于特定事件开启随访,如出院后第N天,门诊后第N天。随访数据质量管理支持对“失访”进行次数定义,并将失访病例推送给医生,进行及时跟踪管理。支持对“逾期”进行时间定义,并将逾期病例推送给医生,进行及时跟踪管理。支持展示不同计划/队列内病例的人口学信息分布统计图。支持展示不同计划内问卷的随访选项与数值分布统计图。支持对连续型变量类型的问卷数据以箱线图展示,并对离群值点进行个体探查。支持对“总分过高/过低、预警选项、数值范围超出”等类型的问卷数据进行预警提醒。支持以列表形式全览问卷内全部题目的数据,支持对多种题型的展示,如单选题/多选题/填空题/表格题/卡尺题等。支持对问卷数据进行修改和审核。支持对问卷数据以excel格式进行下载,可进行问卷/题目/队列/病例等维度的筛选。随访知识库管理支持提供多种题型模版进行问卷编辑,如单选题/填空题/多选题/表格题/卡尺题/总分设置等。支持对问卷添加多个总分,分别进行计算逻辑设置,可累加全部题目分值支持在题目间设置跳转/显示关系,根据患者已选选项进行题目跳转。支持对问卷总分范围/高危选项进行预警提醒设置,获取到预警数据时推送给医生进行处理。支持对个人问卷的展示/搜索/修改/预览。支持将个人创建的问卷共享至项目/本院。支持查看项目/本院成员共享的问卷,进行搜索、预览,并导入个人空间。展示全部随访计划,包含计划名称/计划详情/计划类型等信息。支持对随访计划进行命名/修改和循环类型设置。支持设置不同的推送时间节点,并添加相应的问卷/科普,系统将在对应节点推送微信随访消息给患者。支持根据随访需求,对知情同意书签名环节进行开启或关闭。支持上传科普文档,并进行预览、删除操作。随访移动端支持医生通过移动端查看已创建或已加入的项目的基本信息并生成二维码图片,查看患者列表与患者计划和问卷列表,以及填写问卷内容。支持患者通过移动端扫描二维码并登记入组,签署知情同意书,以及查看所参与的项目列表和问卷列表并支持填写问卷。统计分析中心统计分析首页支持本地数据上传功能,通过选择相应目录下的excel数据文件(.xlsx)即可完成上传,若上后在数据表中未见相应数据文件,可执行数据刷新。支持数据预览功能,可预览100行数据。点击数据清洗功能,可进入数据清洗页面,进行数据清洗。若数据之前已完成清洗,可直接进行数据探查和统计建模分析,若对数据的清洗结果不满意,可重新对数据进行清洗。若数据表中的数据不再使用,可直接进行删除。智能数据清洗支持在数据清洗的过程中设置变量类型,变量类型主要分为两部分:变量名称和类型、目标变量。在变量名称和类型设置过程中,支持用户修改变量名称和数据变量类型选择设置。标记为无效变量的变量,系统将会自动删除该变量,在后续清洗和统计分析中不再使用。在目标变量设置过程中,右侧为可选变量列表,右侧为已选择的目标变量,用户可在左侧勾选相应变量,再点击中间“到右边”按钮,选择要分析的变量。系统支持将把前面标记为无效标量类型的变量自动剔除,并进行展示。系统支持进行异常记录检测,当检测到异常记录,系统将进行相应提示,用户可点击“修改”进行异常记录修改。在异常记录修改页面,用户可点击“修改”进入相应变量的界面,对具体的异常记录进行修改,也可以在左侧勾选相应变量,点击右上角“批量删除”按钮,直接对变量进行剔除。进入修改界面,用户可在右侧填写修正值,或勾选相应的记录,对记录进行删除为缺失值。完成全部异常记录修改后,用户方可进入校正变量类型模块。由于异常记录存在将使后续分析程序发生错误,因此必须对所有异常记录进行修改。在校正变量类型模块中,系统将比较标记变量类型与系统自动检测变量类型的一致性,若存在不一致的变量类型,则提示进行校正,用户可点击修改按钮进入相应界面,若变量类型全部一致,则用户可直接进入处理极端分布变量模块。进入修改界面,用户可点击右侧修改按钮进入相应变量的修改界面。在修改界面中,用户可观察变量的数据分布情况。用户可在界面中对系统检测统计的变量的具体值进行修改,使变量具体值的类型数量与标记类型相对应;若用户认为之前标记的变量类型错误,可点击左上角下拉菜单,修改标记变量类型,并修改变量值。完成修改后可保存并继续修改其他变量。完成全部变量类型校正后,用户可进入处理极端分布变量模块。由于变量类型不正确将使后续分析程序发生错误,因此必须对所有变量类型进行校正。在处理极端分布变量模块中,系统将检测二分类变量的极端分布情况,若存在极端分布情况,则提示进行处理,若不存在极端分布情况,则可直接进入处理异常数值模块。在处理极端分布变量界面,用户可查看变量分布情况。用户可根据分析所需,对变量选择删除或保留操作,若选择删除(系统默认选择删除按钮),则对变量进行剔除,若选择保留,则不对变量做任何处理,即不删除。在处理异常数值模块,系统将基于箱线图法检测各连续变量异常值,若有连续变量存在异常数值,则提示进行处理,若没有连续变量存在异常数值,则进入填补缺失值模块。进入处理异常数值界面,用户可见系统基于箱线图法检测的连续变量异常值上下界。由于上下界的检测是基于连续变量的数据,当数据中有较多不符合实际的异常值时,检测的上下界可能出现不准确或不合理的情况,需要用户进行修改操作。当用户可以选择“默认上下界”,表示使用系统检测的上下界,当用户选择修改上下界,可在弹窗界面修改检测异常值的上下界。当用户点击下一步时,系统将自动对各连续变量超过上下界范围的数值进行删除(后续会进行缺失值填补)。当用户选择保留异常值,则不再对异常值进行删除,即保留所有系统检测的异常数值。在填补缺失值模块界面中,系统将自动执行,用户无需操作。在填补缺失值模块中,系统将保存一份经过前面数据清洗但未填补缺失值的数据,用于数据探查模块和统计建模中的统计分析方法。随后,系统将自动对缺失值数据进行填补,并保存填补后的数据,用于后续建模分析简易数据探查数据探查模块分为数据完整度和变量分布两部分,在数据完整度部分,用户可查看各个变量在数据清洗前后的缺失情况,在变量分布部分,用户可选择变量,查看单个变量的分布情况以及变量分组后的分布情况。在数据完整度模块中,左侧部分为变量列表,用户可勾选相应变量或全选,将其移至已选变量栏进行数据探查,即可在右侧查看对应变量的缺失情况及图表展示情况。用户还可对相应图表数据的结果进行导出。在变量分布模块中,用户可选择分析变量开始进行数据探查,除单一变量外还支持双变量探查或是选择变量作为分组变量和分析变量,系统将按分组变量对分析变量进行分层分组,同样,可在右侧查看变量分组后的分布情况。统计建模分析在统计建模模块中,可选分析方法包括统计分析、回归、分类、全流程建模,其中统计分析、回归、分类方法中,每次只能选择其中一种方法进行分析,而全流程建模则可选择多个机器学习模型进行建模。用户选择分析方法后,可选择相应变量进入分析,点击“开始统计”即可在右侧查看相应分析结果。用户可选择全流程建模分析,系统将自动对数据进行:①自变量与目标变量的单因素统计检验,其中连续变量使用T检验或Mann-WhitneyU检验,分类变量使用卡方检验,选择显著变量(P<0.05)进入后续建模分析;②使用显著的变量集和目标变量数据按7:3进行训练集和测试集划分,并对连续变量进行标准差标准化处理;③使用RFECV算法对变量进一步筛选,选出使基线模型AUC最优的变量集;④使用训练集对用户选择的机器学习模型建模,并使用测试集对模型进行性能测试,并使用bootstrap方法对模型进行1000次测试;⑤最后建立SHAP解释器,SHAP将基于博弈论知识,实现各变量对模型预测结果的正负相关性及重要程度进行解释。系统支持7种基础统计分析算法:一般线性相关系数、卡方检验、单因素方差分析、两独立样本T检验、两独立样本秩和检验、配对样本T检验、正态检验。系统支持9种回归分析算法:一元线性回归、多元线性回归、COX回归、决策树回归、SVM回归、深度神经网络回归、随机森林回归、XGBoost回归、lgb回归。系统支持8种分类统计算法:一元logistic回归、多元logistic回归、决策树分类、SVM分类、深度神经网络分类、随机森林分类、XGBoost分类、lgb分类。系统支持7种建模流程:LR、SVM、GNB、RF、GBM、ANN、ADA。基础管理中心资源管理支持管理所有模块的菜单、页面、按钮和接口,包括新增,修改,删除;支持对专病库中的功能菜单、业务域、科室进行资源配置。组织管理支持对医院基本信息维护;支持对医院科室基本信息维护,并支持科室多级层级结构关系,科室可维护多个子科室;支持对医院的专病库基本信息维护;支持对用户基本信息维护,并支持设置用户账号有效时长;支持对用户分配角色,并支持用户拥有多个角色。权限管理支持自定义角色,并支持对角色的功能权限进行配置,包含可访问页面、可使用按钮以及可使用的接口;支持对用户的数据权限进行配置,包含科室来源、业务域是否可见、数据元是否可见是否脱敏等进行设置。审批流程配置支持对各个审批流程的审批者和审批方式进行设置管理,并支持设定多个审批节点;支持会签和或签两种审方式,其中会签方式支持在同一审批节点所有审批者均审批通过方可进入下个节点,或签方式支持在同一审批节点任意审批者审批通过即可进入下个节点;支持按角色添加审批者或按指定用户添加审批
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年武汉警官职业学院单招职业适应性考试题库参考答案详解
- 仓储配送服务合同范本
- 配送服装物流配送合同协议
- 2026年浙江警官职业学院单招职业倾向性考试题库及参考答案详解
- 2026年宿迁泽达职业技术学院单招职业适应性测试题库参考答案详解
- 无人机航拍技术应用规范
- 2026年南充科技职业学院单招综合素质考试题库及参考答案详解
- 2026年辽宁民族师范高等专科学校单招职业技能测试题库附答案详解
- 2026年宁夏工业职业学院单招职业倾向性考试题库及参考答案详解一套
- 2026年云南林业职业技术学院单招职业倾向性测试题库及参考答案详解
- 2026广西融资担保集团校园招聘补充参考笔试题库及答案解析
- 2026贵州安创数智科技有限公司社会公开招聘119人参考笔试题库及答案解析
- 韩家园林业局工勤岗位工作人员招聘40人备考题库新版
- 2025年云南省人民检察院聘用制书记员招聘(22人)参考笔试题库及答案解析
- 维修班组长设备故障应急处理流程
- 2026年湖南司法警官职业学院单招职业技能测试题库及完整答案详解1套
- 兔年抽红包课件
- DB31∕T 634-2020 电动乘用车运行安全和维护保障技术规范
- 纪念长津湖战役胜利75周年课件
- 医师证租借协议书
- 分割林地协议书范本
评论
0/150
提交评论