




免费预览已结束,剩余4页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Cach 在医疗领域的研究分析及测试对比 陈航陕西省人民医院信息科高级工程师 邮编 710068 西安巿友谊西路 256 号 关健词 Cach 对比测试 摘 要 将数据库 Cach 与目前在我国医疗行业信息化应用中广泛使用的数 据库 Microsoft SQL Server 2000 Oracle9i DB2 在同等条件下进行海量测试 得出 Cach 在医疗卫生领域应用的优势 Cach 是新一代高性能数据库技术 被誉为创新的 后关系型 数据库 Postrelational Database 它以 ANSI 和 ISO 标准 M 语言的独特多维数据 模型为基石 提供了三种整合的 能并发访问同一数据的数据库技术 成熟的 对象访问方式 高性能的 SQL 访问方式以及丰富的多维访问 在 Cach 中的对 象模型具备了符合 ODMG 标准的完整的对象特性 而且融合了为 OLTP 专门优化 过的 SQL 技术 并无缝集成了为实现快速开发 Web 应用的最新技术 Cach 创 新地摆脱了传统关系数据库的局限性 在对象数据 关系型数据以及多维数据 视图之间不需要映射 节省了开发和运行时间 面向对象建模技术是目前编程中的主流技术 Cach 完全面向对象 在构 建数据关系复杂的应用中有独特的吸引力 尤其是在医疗行业中的应用 在国 际上医疗行业信息化相对发达的国家 如美国等 Cach 数据库的使用非常广 泛 美国十大医院和三大实验室都在使用 Cach 数据库 而且在美国国防部的 VA 系统中也使用着 Cach 数据库 Cach 数据库医疗行业的应用有以下特点 5 1 Cach 在医疗领域的多维数据存取 疾病是一个多变而复杂的对象 随时都有可能有新的疾病出现 或者是疾 病的变种 甚至一个病人的疾病也会有变异或者转移的可能 新疾病有着不同 的疾病类型 那么它可以从几种不同的类型里继承出来 同样 一些症状也是 对象 新的症状可以从原来的继承出来 如图 5 1 图 5 1 疾病的演变 在疾病 药物 病人 检查等维系复杂的元素之间 可能存在不同的元素 关系 例如一个元素 A 可能包含着不定数目的元素 B C D E 等 而 B C D E 也可能有着自己的不定包含 如果非要用一个固定的二维表格的话 可能就需要限制包含的数目 以及包含的深度 如果说是对象 只需要图 5 2 的简单的定义就可以了 图 5 2 需要成为被包含元素的 A B C D E 都从一个类里面继承出来 这个基 类可以是一个空的类 然后 A 里面的一个属性 S 作为一个基类的集合 Property S As 基类 Collection list 这样 复杂的关系 就可以简单地表示出来 如上所示 Cach 使用高效的多维形式来存储数据 Cach 运用各种技术存 取数据 如基于对象的访问模式 表格或多维数组模式标准 SQL 访问模式和 Web 访问模式等等 所有这些数据访问模式也可以并发地访问同一个数据 有 了这个多维数据引擎 就可以用任何方式来建模 可以减少多表连接等处理过 程来提高执行效率 这有别于关系型数据库 但现在毕竟是关系型数据库的全 盛时期 许多医疗行业的应用软件 尤其是那些用于数据报表和分析的程序 都使用 SQL 作为它们的查询语言 Cach 通过支持 SQL 数据存取 能很好的兼 容这些应用程序 也使得把它们从关系型数据库上移植到 Cach 上非常容易 大大提高 Cach 的推广性开放性和应用程序开发的能力 5 2 Cach 与关系型数据库在医疗领域的对比研究 5 2 1 研究与测试的背景 目前在我国医疗行业信息化应用中广泛使用的数据库Microsoft SQL Server 2000 Oracle9i DB2等 经过多年的实际应用检验 目前面临的主要 问题有以下几点 1 应用系统软件开发周期长 后期需求变更成本高昂 我国大部分三甲医 院已经建设完成的HIS系统 包含挂号系统 门诊收费系统 药房管理系统 药 库管理系统 入出院管理系统 住院病人费用管理系统 医嘱管理系统等基础 模块 设计 开发 实施所需周期相对其他行业较长 据调查目前西安市三甲 医院的HIS系统开发实施周期需要两年至三年的时间 其中前期投入的需求分析 系统设计 编码测试时间需要两年左右 其主要原因是因为医院中部门繁多 各种对象关系复杂 而且受政策变化影响很大 导致业务流程的具有不确定性 需求容易变更 目前西安市三甲医院的HIS系统在设计应用完成后 数据库中的 用户表达300张以上 由于表间关系的复杂性 导致需求变更所需要的代价高昂 使用户业务拓展困难 2 系统运行速度慢 运行故障率高 根据对西安市应用关系型数据库的各 个医院的调研结果显示 目前在医院业务高峰期 上午9 30 10 30 各个 医院均存在不同程度的系统相应速度慢 用户等待时间长问题 终端用户戏称 为 电脑不如人脑 由于His系统死锁和数据库问题导致的故障平均每年在2 5次 有些系统实施运行时间较长的用户平均故障率居然每月1次 众所周知 医疗行业信息化属于生命相关行业 系统运行关系到患者的生命安全 目前这 种应用状况 不能够满足实际应用中对于系统稳定性和系统性能的要求 3 系统后期维护繁琐 软件升级困难 HIS系统中应用的关系型数据库由 于涉及的用户表众多 又要兼顾用户的业务运行速度 不能使用太多的表间关 联和外键 导致了数据库的数据冗余度差 数据增长速度快 据不完全统计 西安市三甲医院中的关系型数据库增加速度平均在每天10M左右 2003 2006年 增长率分别是100 150 200 左右 平均数据库容量在15G以上 随着近 年来在医院中逐渐推广的医院影像系统 检验系统等系统的多媒体数据的存储 更加剧了这一现象 使得医院数据库成为了名副其实的海量数据库 根据调研 结果显示 这种数据库的增长速度呈逐年增长的趋势 这样的海量数据给医院 数据库的后期的数据安全 备份 索引优化 软件版本升级 数据库迁移都带 来了巨大的压力 在调查中同时发现 各个医院的数据库管理人员有80 不是 专业IT技术人员 而且各个医院的人员配置相对较少 平均3个人左右 有些医 院竟然没有专职的数据库管理人员 数据库管理工作是由其他部门的人员兼职 进行的 这一事实表明 我国目前医疗行业信息化应用的发展过程中 既懂计 算机信息技术 又懂医学以及医院管理的复合型人才十分缺乏 这样的矛盾存 在使得当前各级医院的信息系统后期维护问题更加突出 也导致了系统运行故 障增加的机率 4 系统实施成本偏高 系统运行性价比不高 我国医疗行业信息化应用 中的主要矛盾之一就是资金问题 因为目前国家的拨款只占卫生事业支出的10 左右 所以信息化建设基本上是各级医疗卫生机构自力更生 大多数医院采取 了边积累边建设的方式 由于受到市场经济条件下的行业竞争的压力 大部分 医院更愿意将有限的发展资金投资购买一些可以马上产生效益的医疗设备 如 CT机 麻醉机等 而不愿意在不能直接产生经济效益的信息系统上投入巨资 这个现状表明我国发展中国家的国情决定了 现阶段各级医院在信息化投入的 力度不会太大 据卫生部统计2004 2005年国内建设HIS的医院 平均投入资金 仅占年医院总收入的0 5 左右 目前市场上的信息化产品和数据库产品价格颇 高 这也是限制医疗行业信息化应用的发展因素之一 因此 市场需要一种产 品价格低 对硬件性能要求不高 但是性能稳定 高效的 能充分保护医院投 资的数据库产品 由于后关系型数据库采用了多维数据模型 所以从理论上分析 后关系数 据库系统应该具有比采用二维模型的关系数据库更加高效的性能 但是并没有 进行量化分析 所以本章对后关系数据库以及关系数据库的性能进行测试对比 研究 以验证后关系型数据库在医疗卫生领域的优势 测试数据资料主要来源 于西安交通大学口腔医院 Cach 50 陕西省人民医院 Microsoft Sql Server 2000 西安交通大学第一附属医院 Oracle9i 等医院2003 2006年 历史数据库中医疗信息数据 5 2 2 研究与测试的平台环境 1 测试的硬件环境 采用IBM p510 1路1 5G Hz Power5 CPU 1G chipkill内存 73G硬盘 2 测试的软件环境 Windows2000 NET Framework Cach 5 0 Microsoft Sql Server 2000 5 3 Cach 与关系型数据库在医疗领域的测试对比 5 3 1数据库操作上的性能比较 为了对后关系型数据库及关系型数据库进行性能比较 本人首先抽取护理 信息管理系统 Cach 5 0 数据库中的护理记录类 同时又在 SQL Server 2000 中建立了与护理记录类相对应的表 比较方式是在程序中采用相同的 SQL 语言 来访问这两种数据库 针对这两种数据库进行实际的数据库操作 每项操作执 行 100 次取平均值 每次操作的记录数为 20000 行 最后获得下表 5 1 中的数 值 表 5 1 Cach 5 0 与 SQL SERVER 2000 执行速度对比 平均执行速度平均执行速度相对速度相对速度 数据库操作数据库操作 Cach 5 0SQL SERVER 2000 Cach 5 0 SQL SERVER 2000 INSERT1 994m4 621m1 2 32 SELECT0 016m0 031m1 1 94 UPDATE0 127m0 189m1 1 49 DELETE0 049m0 086m1 1 76 上表显示的数据是在模拟环境中通过作者自己编写的测试程序获得的 没 有考虑实际的网络情况 从上表可以的看出 对后关系型数据库 Cach 5 0 执 行 SQL 访问的速度比关系型数据库 SQL Server 2000 平均要快 1 88 倍 实际上 采用对象方式访问后关系型数据库比采用 SQL 的方法还要快 5 3 2 并发用户的平均响应时间对比 在并发用户的平均响应时间的比较中 分别模拟了 30 60 90 120 150 个并发用户对后关系型数据库 Cach 5 0 与关系型数据库 SQL Server 2000 进 行了测试 测试结果如下表所示 306090120150 0 50 100 150 200 250 300 350 400 450 Cach 5 0 SQL SERVER 2000 毫秒 图 5 3 并发用户的平均响应时间 从以上的图表可以分析得出 在并发用户数不断增加的情况下 后关系型 数据库 Cach 5 0 的平均响应时间的变化率小于关系型数据库 SQL Server 2000 5 3 3 结果分析 通过在相同条件下对后关系型数据库 Cach 5 0 以及关系型数据库 SQL Server 2000 进行实际的实验数据分析 能够得出这样的一个结论 采用后关 系型数据库开发护理部信息管理系统能获得比采用传统关系型数据库所开发的 护理部信息管理系统具备更高效的性能 5 4 Cach 与关系型数据库在医疗领域的综合对比 选取关系型数据库 SQL Server 2000 与 Cach 进行综合对比 综合对比包 括产品定位 表 5 2 医疗卫生行业的经验 表 5 3 线性可扩展能力 表 5 4 性能 表 5 5 总体拥有成本 表 5 6 表 5 2 产品定位 Cach SQL Server 2000 Cach 做为第三代的面向对象的数据库 能够解 决关系型数据库 包括 SQL Server 难于解决的 关系型数据库 应用于不同的行业 针对医疗卫生领域略显逊色 随着数 需要高性能或者对复杂数据进行处理的问题 特 别在医疗卫生领域 由于医疗卫生行业数据的特 殊性 使得 Cach 非常适合处理医学数据 所以 世界上大多数大型的医疗信息系统都使用 Cach 数据库 在欧美的医疗卫生行业 Cach 占据了 70 的市场份额 据量和用户数的增长 其性能瓶颈会 出现 表 5 3 医疗卫生行业的经验 Cach SQL Server 2000 在医疗卫生领域具有 28 年的专业服务经验 是世界 医疗卫生行业第一位的数据库 在欧美的医疗卫生行业占有 70 的市场份额 美国 VA Partners 医疗集团 十佳医院 英国 NHS 都使用 Cach 数据库 多维的数据结构非常适合医疗卫生行业复杂的数据 处理 在医疗卫生领域有说服力的大型应用 案例不多 表 5 4 线性可扩展能力 Cach SQL Server 2000 Cach 具有非常高的延展性 对硬件性能的 要求随着数据量的增长线性增加 做为关系型数据库 对硬件性能的要求随着 数据量的增长呈接近指数增加 有大量的案例可以证明更换 Cach 后 系统 性能提高并且节省了大量的硬件设备 没有实际的案例表明系统更换成 SQL Server 之后性能提高并节省大量的硬件投资 表 5 5 性能 Cach SQL Server 2000 Cach 是一个面向对象数据库 在对缓存处 理的技术上远优于其他的关系型数据库 在 速度方面可以和内存数据库媲美 做为定位于中低端应用的关系型数据库 不 能满足大型 高性能 高可靠系统的需要 在数据挖掘方面 Cach 独特的多维的数据 结构使得在挖掘和分析的同时省去了复杂的 Cube 构建 大大提高了系统的使用效率 在挖掘之前 需要建立 cube 把二维的表转 换成多维的结构 在挖掘的深度方面有着先 天的缺陷 同时挖掘的深度远远超过了关系型数据库 Cach 动态的位图索引技术大大提高了 Cach 的查询速度 同时打破了 OLTP 和 OLAP 的界限 可以在查询的同时做数据的 更新 OLTP 和 OLAP 需要各自独立的数据库 表 5 6 总体拥有成本 Cach SQL Server 2000 总体拥有成本包括前期建设投资成本 所需要的硬件成本和后期使用维护成本 Cach 的综合拥有成本最低SQL Server 的综合拥有成本很高 Cach 对硬件的性能要求远远低于 SQLServer 有大量的案例表明 在更换成 Cach 之后 用户节省了大量的服务器的投 资成本 在存储方面 存储同样的数据 Cach 只需要关系型数据库 5 0 70 的存储 空间 Cach 的设计理念之一是 零 DBA Cach 是最易于管理维护的数据库之一 由于关系数据库固有的缺陷 在许多没有数 据的地方也需要存储空白的单元 所以浪费 了大量的存储空间 同时也影响了处理性能 在使用和维护方面需要有经验的 DBA 来维 护 大大增加了用户的人力成本 5 5 研究与测试的结论 经过以上的测试对比 可以得出以下结论 1 在医疗行业的应用环境下 Cach 比SQL Server2000响应速度更快 并发处理能力更强 大数据量吞吐能力更强 2 Cach 的多维数据结构可以有效的避免数据冗余 提高数据利用率
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025中电建(云浮)新材料有限公司招聘1人年薪20万50万笔试题库历年考点版附带答案详解
- 2025年文化娱乐行业数字化转型与IP价值挖掘研究报告
- 2025年航空航天行业无人机市场应用前景研究报告
- 2025年燃料电池行业燃料电池技术应用前景展望报告
- 2025年出行服务行业出行需求与交通服务研究报告
- 2025年建筑行业绿色建筑设计与可持续建筑发展研究报告
- 2025年环保产业行业环保技术应用案例研究报告
- 2025年化妆护肤行业绿色无害美妆产业发展策略研究报告
- 2025年环保产业行业绿色技术与可持续发展研究报告
- 2025年航空航天行业航空无人机应用前景分析报告
- NoSQL数据库应用与实践 课件 第1-6章 认识NoSQL - 增删改查
- DB37-T4868-2025 既有公路隧道结构健康监测技术规范
- 供应链金融视角下涉农中小企业信用风险评估研究
- 宁夏差旅费管理办法文件
- DB51∕T 3231-2024 公路隧道岩爆防控技术规程
- 新高考考试命题培训心得体会
- 2023CSCO头颈部肿瘤诊疗指南
- DB54∕T 0425.1-2024 公共数据 数据元规范 第一部分:总则
- 七年级语文上册第一单元古诗词赏析训练题
- DZ/T 0275.2-2015岩矿鉴定技术规范第2部分:岩石薄片制样
- 茶叶示范基地管理制度
评论
0/150
提交评论