




已阅读5页,还剩57页未读, 继续免费阅读
(信号与信息处理专业论文)基于XML的电子病历系统的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
北京交通大学硕士学位论文中文摘要 中文摘要 藕要2 随着计算机技术、信息处理及网络技术的迅猛发展及其应用的不断普及,关 系每一位公民健康和切身利益的医疗信息系统( h i s ) 的发展脚步也越来越快。建 立科学、有效的医疗信息系统( h l s ) 的一个关键部分就是要实现电子病历系统 ( e m r s ) 。电子病历系统的建立是医院实施以病人为中心的新一代医院管理信息 系统的核心。可扩展标志语言( d l ) 是当今热门技术之一,它适合描述病历一类 半结构化数据,能够有效的解决对e m r 的描述、存储、处理等问题,同时基于 x m l 的电子病历可以很好的和互联网结合在一起。因此,我们开展了基于x m l 的电子病历系统的研究,在x m l - 与e m r 融合方面进行了有益的探索。 c d a 标准是h l 7 组织发布的医疗行业临床文档架构,提供了临床文件的交换模 型,为电子病历系统的实现提供了标准。本文使用c d a 标准作为电子病历的组织 结构来解决电子病历模型问题,解决了病历难以共享与交换的难题。另外,本文 使用智能文档作为电子病历编辑器,有效解决了实现电子病历系统的又一难题。 本文对电子病历及x m l 语言进行了深入的理解和研究,指出了x m l - 与电子 病历结合的必然性;依据h l 7 c d a 标准,完成了电子病历描述结构的设计,给 出了基于x m l 的电子病历的树型结构定义、文档类型定义、x m l s e 档书写及基 于x m l 电子病历的显示方法:对电子病历系统进行分析设计,给出了关键数据 结构与功能模块的设计;实现了电子病历系统的雏形并对系统安全性进行了初步 研究。 关键词:电子病历( e m r ) 、可扩展标志语言( x m l ) 、临床文档架构( c d a ) 、 医院信息系统( h i s l 北京交通大学硕士学位论文英文摘要 a b 鳓u l c r : w i t ht h er a p i dd e v e l o p m e n to fc o m p u t e rt e c h n i q u e ,i n f o r m a t i o np r o c e s s i n g , i n t e m e tt e c h n i q u ea n dt h es p r e a do fi t su s e t h ed e v e l o p m e n to fh e a l t hi n f o r m a t i o a s y s t e mw h i c hr e l a t e dt oe v e r y o n ei sa l s os w i f t o n eo ft h ek e ys t e p st ob u i l da s c i e n t i f i ca n de f f i c i e n th o s p i t a lh f o r m a t i o ns y s t e mi sr e a l i z ee m r s 1 1 l ek e m e lo f a l a t e m o d e lh o s p i t a li n f o r m a t i o ns y s t e mb a s e do nt h ec l i n i cl n f o r m a t i o no fp a t i e n ti s t oc s t a b l i s he m r x m ue x t e n s i v em a r k u pl a n g u a g e ) i so n eo ft h em o s tp o p u l a r s t a n d a r d st od e s c r i b es e m i s t r u c t u r ed a t as u c ha sm e d i c a lr e c o r d t h ep r o b l e ms u c h a sd e s c r i p t i o n ,s t o r e a n dt r e a t m e n to fe m rc a db ce f f i c i e n t l yr e s o l v e db yx m la i t l l es a m et i m e i ta l s oh a saf r i e n d l yi n t e r f a c ew h e ne x t e n d i n gt oi n t e m e t b a s e do n x m lw eg i v es o r e ei n t e r e s t i n gt h i n g so nt h es t u d yo fe m r s c d as t a n d a r di sa ne m rc o n s t r u c t i o ni nm e d i c a if i e l di s s u e db yo r g a n i z a t i o no f h i j i ti ss t a n d a r df o ri m p l e m e n t a t i o no fe l e c t r o n i cm e d i c a lr e c o r ds y s t e ma n d p r o v i d ee x c h a n g em o d e lf o re l i n i cd o c u m e n t t h i st h e s i ss o l v e st h ep r o b l e mo f e m r sm o d e lb yu s i n gs t a n d a r do fc d aa se m rc o n s t r u c t i o n a n ds o l v e st h e d i f f i c u l tp r o b l e mo fe m r ss h a r ea n de x c h a n t e i na d d i t i o n 。t h i st h e s i su s cs m a r t d o c u m e n ta se m re d i t o r ,s o l v e sa n o t h e rp r o b l e mo fe m r s t h i st h e s i sh a sa c o m p r e h e n s i v er e s e a r c ho ne m ra n dx m l a n dp o i n tt h e i n e v i t a b l ei n t e g r i t yo fe m ra n dx m lw ed e s i g nd a t as t r u c t u r eo fe m r a c c o r d i n gt o h i j c d as t a n d a r 正g i v et h em e t h o d sa b o u td e f i n i t i o no fe m rb a s e dx m ls c h e m a , d e s c r i b i n go fx m ld o c u m e n ta n di t sd i s p l a y t h ek e yd a t as t r u c t u r ea n di m p o r t a n t m o d u l ea r ep u tf o r w a r da f t e rf i n i s h i n ga n a l y s i sa n dd e s i g no fe m r s w ef o u n da s i m p l ee m r sa n dr e s e a r c ht h es e c u r i t yi ne m rb a s i c a l l y k e y w o r d s :e l e c t r o n i cm e d i c a lr c c o r d ( e m r ) 、e x t e a s i b l em a r k u pl a n g u a g e ( x m n 、c l i n i c a ld o c u m e n ta r c h i t e c t u r e ( c d a ) 、h o s p i t a li n f o r m a t i o n s y s t e m ( h i s ) 学位论文版权使用授权书 本学位论文作者完全了解北京交通人学有关保留、使用学位论文的规定。特授权北京交 通大学可以将学侮论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫 描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印 件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:焉冉丹 导师签名 确一钆咯 签字日期:2 叼年j 2 月2 ,1 日签字日期:2 , o , 7 年肛月叫日 独创性声明 本人声明所早交的学位论文是本人在导师指导下进行的研究j 作和取得的研究成果, 除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表戍撰弓过的研究成果, 也不包含为获得北京交通人学或其他教育机构的学位或证1 5 而使h 过的材料。与我一同工作 的同占对本研究所做的任何贡献均已往论文中作了明确的说明井表示了澍意。 学位论文作者签名:j 禹田母签字日期:却呷年店月纠日 致谢 本论文的工作是在我的导师杨晓晖教授的悉心指导下完成的,杨晓晖教授严 谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢三年来 杨晓晖老师对我的关心和指导。 杨晓晖教授和王桂雁老师悉心指导我们完成了实验室的科研工作,在学习上 和生活上都给予了我很大的关心和帮助,在此肉杨晓晖老师和王桂雁老师表示衷 心的谢意。杨晓晖教授对于我的科研工作和论文都提出了许多的宝贵意见,在此 表示衷心的感谢。 在实验室工作及撰写论文期问,黄攀、李莹等同学对我论文中的研究工作给 予了热情帮助,在此向他们表达我的感激之情。 另外也感谢我的家人,他们的理解和支持使我能够在学校专心完成我的学业。 北京交通大学硕士学位论文绪论 1 绪论 随着我国医疗卫生事业的发展和改革的不断深入,医疗卫生行业供应短缺的 矛盾已经得到缓解,服务理念也在医院悄然生根。传统的“以收费为中心”的医 院信息系统已不能适应新的要求,“为病人服务”的临床管理信息化将成为医疗 卫生行业信息化的主要发展方向。我国的医疗信息化目前正在经历从管理信息系 统向临床信息系统过渡的阶段。电子病历系统( e l e c t r o n i cm e d i c a lr e c o r d ,简称 e m r ) 就是临床信息系统的核心及标志,它构成了业务管理、医疗卫生决策系统 的基础。 电子病历( e m r ) ,目前己经成为国际上越来越多的厂商和专家关注的焦点。 在发达国家,像美国、日本,许多大学、研究机构、厂商纷纷投入这一领域的研 究工作。与此相关,也成立了各种民间的和政府的标准化机构开展这方面的标准 制订工作。政府部门也积极参与到这一进程中来,采取各种行动推动电子病历的 发展。由于电子病历涉及医院信息化的方方面面,具有高度复杂性,加上人们对 电子病历也缺乏完整统一的认识,所以尽管在不同的方面均取得了各种进展,但 是完整的电子病历系统还没有建立起来。在国内,医疗行业和越来越多的科研机 构也开始认识到电子病历的重要性。可以断言,电子病历将是国内外医院信息系 统的发展趋势。 1 1 电子病历的定义 电子病历虽然已经引起了国内外的重视,但仍有很多人,对电子病历的理解 并不相同,甚至有人觉得电子病历的概念过于抽象以至难以把握。目前,对电子 病历的定义有很多版本,其涵盖的内容和范围也不断变化。这一方面反映了对电 子病历概念的不同理解,另一方面也反映了人们对电子病历的内容及功能还缺乏 非常清晰的界定。 在各种电子病历的定义中,美国电子病历研究所的定义最具概括性:“电子 病历是以电子化方式管理的有关个人终生健康状态和医疗保健行为的信息,可在 医疗中作为主要的信息源取代纸张病历,提供超越纸张病历的服务,满足所有的 医疗、法律和管理需求。”l l j 从电子病历的这定义当中,不难看出电子病历是对个人医疗信息及其相关 处理过程综合化的体现,是计算机化的病历信息,但不仅仅指静态病历信息,还 包括提供的相关服务。电子病历是指将传统的纸质病历完全电子化,并超越纸质 病历的管理模式。电子病历反映了患者整个的医疗过程,存储了患者全部的医疗 信息,包括病史、各种检验检查和影像资料。 北京交通大学硕士学位论文绪论 电子病历系统是实现病历信息的采集、存储、传递、表现和加工利用的系统, 是病人病历的数字化,也是医院信息系统( s ) 中的一个部分,但电子病历系统 并不等于各个临床信息系统的简单叠加,各类临床信息系统构成了电子病历的数 据源【2 j 。实现电子病历就要实现电子病历系统,研究电子病历不仅包括电子病历 本身,也包括电子病历系统。这里讲的电子病历实质上是整个医院以病人为中心 的计算机信息化,其意义绝不限于病历本身的管理。采用扫描技术将纸张病历存 入光盘管理的病历管理系统、病人信息i c 卡系统,尽管在不同的方面有各自的意 义,但都不是或不完全是这一意义上的电子病历系统。 1 2 电子病历的分类 电子病历按其用途和功能大致可分为:门急诊电子病历、住院电子病历、个 人电子病历和远程医疗电子病历等四种吼分别介绍如下: 门急诊电子病历:主要满足门急诊需要,是病人复诊和医师随访的重要依据。 其内容应包含门急诊就诊的全部内容,如病程记录、化验及检查等。 住院电子病历:包含住院病人完整病历的全部内容。包括病史首页、入院记 录、病程记录、化验和检查资料等。 个人电子病历:是每个人从出生到死亡的病历资料的记载。包括不同医院就 诊,不同诊所就医的全部内容。 远程医疗电子病历:为远程医疗会诊或咨询服务,包括病史资料、影像资料、 会诊意见等,能通过各种途径传输。 1 3 电子病历与医疗信息系统( 】m s ) 的关系 电子病历是h i s 的信息基础i 町 国内现阶段的h i s ,往往是从各个子系统的不同角度来管理病人信息的不 同部分,随着系统规模的扩大,功能越来越复杂,要从整体上把握系统的集成 与数据的共享,同时兼顾未来的扩充与发展,从而对系统韵设计者提出了越来 越高的要求。为了避免新开发的系统不断修补甚至推倒重来,必须将病人信息 ( 病历信息) 作为一个独立于具体应用系统的整体来研究,以实现计算机化的病 历或电子病历( e m r ) 因此,电子病历是从更深层次上保证医院信息系统长期稳 定发展的基础,大力发展电子病历是医院信息管理的发展趋势。 电子病历依附于h i s 电子病历系统不是一个独立于h i s 的新系统,因为病人信息来源于h i s 中的 各个业务子系统中。各个业务系统在完成自身的功能、管理自身业务数据的同 时,也在收集着病人信息。因此,脱离y h i s ,也就不存在电子病历系统。 2 北京交通大学硕士学位论文绪论 电子病历系统与传统的h i s 的不同 从电子病历的角度看病人信息,是完整的、集成的,而从传统的h i s 的每 个子系统来看病人信息,是局部的、离散的,相互之间信息有冗余、有遗漏, 它们往往没有按照一个统一的原则进行设计和管理。在内容上,电子病历对病 人信息与传统h i s 有不同的侧重和要求,电子病历强调病人信息的原始性和完 整性。 1 4 电子病历应用的意义 传统的纸质病历有许多缺点,如:发生霉烂、变质,查找和存取麻烦等,电 子病历则在很大的程度上进行了改善。电子病历的且标和意义从目前来说并不在 于要取代纸张病历,而主要是加速病人信息流通,使病人信息随时随处可以得到, 可以提供纸张病历无法提供的服务,从而起到提高工作效率和医疗质量的作用。 电子病历通过方便的编辑工具,极大地提高了病历书写效率,将医生从繁重 的医疗文书书写中解放出来;计算机自动处理医嘱,也同时减少了护士不必要的 转抄工作;而且,检查、检验申请及结果的无纸化传递,加快了检验结果的传递, 通过网络实现了信息随时随地可得性,这些都使医疗工作效率和工作质量得到了 极大的提高。 另外,电子病历采用的电子存储介质相对于传统存储介质,占用空间小,易 于保管,保存时间长。对于网络化的电子病历,医务人员在自己的计算机终端上 就可以方便地查找、复制、传输、打印病人的动态数据;病人持电子病历卡就医, 可帮助医务人员迅速、直观、准确地了解病人的详细资料,缩短确诊时间,避免 不必要的重复检查,控制医疗费用,减轻了病人的经济负担。 电子病历系统是医院信息系统的重要组成部分。基于手工的医疗过程中到处 充满着导致医生、护士们犯错误的各种可能性。美国医学研究所和疾病控制与预 防中心的统计结果显示:在美国,导致病人死亡的几个主要原因中,医疗处置不 当( 错误) 离第五位,高于肺炎、糖尿病、车祸、自杀和肾脏疾病,人数在4 8 0 0 0 到9 6 0 0 0 之间i ,见下图1 - 1 所示。以上统计结果多少有些耸人听闻,但在中国, 实际的情况可能更为糟糕。 北京交通大学硕士学位论文 绪论 图1 - 1 美国导致死亡的十大主要原因 建立以电子病历系统为基础的医院信息系统对于防止医疗差错,提高医护质 量有突出的作用,其将从根本上改善医生对病人信息和药品信息的掌握。 电子病历无论是对医院、病人还是对医生都有重要的意义和价值。国家卫生 部在其全国卫生信息化发展规划纲要2 0 0 3 2 0 1 0 年中明确指出,建立电子病 历为目前我国医院医疗服务信息系统的建设目标。论文就是在这样的背景之下提 出来的。 1 5 电子病历的发展现状 2 0 多年来,欧、美一些大医院开始建立医院内部的h i s ,随之e m r 在美国、 英国、荷兰、同本、香港等地区有了相当程度的研究和应用。美国政府己在大力 推广、普及e m r 的应用工作;英国己将e m r 的i c 卡应用于孕妇孕期信息、产程 启示及跟踪观察;荷兰阿姆斯特丹医学中心对肾病患者和器官移植病人使用 e m r 卡启示病人透析情况,且病人可持卡异地透析;日本东京大桥妇产科医院 己通过医院局域网的客户服务器系统实现了门诊病人的e m r 管理,医院信息管 理系统协会正在致力于e m r 的安全性研究问题;香港医院管理局的患者卡启示 病人完整的医疗过程,包括医生检查、检验结果、x 片、c t 片m t i 片及处方等。 同时,这些国家和地区已经成立了专门的研究机构,把e m r 作为一个重点课题 研究,组织医疗单位实施和普及。 经过了一定时期的发展,我国的医院信息系统( h i s ) 初具规模,特别是随 着国家金卫工程的展开,许多医院相继建立起医院范围的信息系统,为我国e m r 的研究和应用奠定了坚实的基础。国内成立了e m r 专业委员会,对e m r 的发展 起到了引导作用。这仅仅是e m r 研究应用的起步,相关的研究内容将会随着e m r 的发展而深入。目前我国已有一批医院建立起医院信息系统,具备了向电子病历 发展的基础,已有一些医院和个人开始了电子病历的研究和实验。国家信息技术 和通讯设施的发展己经为此提供了基本条件,有众多的医护人员和工程技术人员 4 北京交通大学硕士学位论文绪论 对这项工程表示出相当高的热情和积极性。虽然距离完整的电子病历系统有很长 的路要走,但电子病历在发展过程将逐步发挥作用。 纵观国内外情况,电子病历的研究缺乏统一标准。各电子病历应用系统之间 不能集成,不能适应不同医务人员的特殊需求等问题。世界医疗机构正在逐渐推 行h l 7 标准,使数据标准化成为可能,为电子病历的发展铺平道路。 1 6 电子病历发展中的难题 电子病历是病人病历的计算机化,电子病历系统实现病历信息的采集、存储、 传递、表现和加工利用【6 】。由于电子病历在医院信息管理中的基础地位以及对人 的健康的重要性,人们投入越来越多的力量来发展它。同时由于病人信息类型的 多样性和内容的复杂性,在电子病历的发展中,存在着一些基础性问题【”。 首先是病历内容的表示问题。对病人信息的表示应当是以单个人为中心的, 这是病历的使用、存储和交换所要求的;对病人信息内容的描述必须是结构化的, 这是电子病历信息后续处理的基本要求。由于病历内容的复杂性和使用上的习 惯,对病历很难设计出一个统一的结构进行描述。 第二是病历的存储问题。电子病历系统要求病人的信息长期保存、随时可以 获得。在传统的医院信息系统中,病人信息以数据库的形式进行存储,这些信息 的存储管理是以支持日常业务管理为目的。出于数据库效率和容量管理方面的考 虑,不可能长期将历史信息联机保存。如何使病人信息在脱离数据库后仍然能够 维持以个人为中心的结构并且随时可以获得,是病历存储要解决的主要问题。 第三是各种表格病历和专科病历的处理问题。这些表格或专科病历都有各自 的结构,它们的内容是病历的重要组成部分,同时又有对其内容进行结构化处理 的各种需求。这样的内容类型繁多,很难针对每种情况开发专用的软件,如何在 电子病历系统中对其进行统一的处理也是十分困难的问题。 第四是病历的共享和交换的问题。由于患者可能需要在多个医疗单位就诊, 因此需要实现电子病历的共享和交换。同时,屯子病历的共享无论是对临床医疗 还是医学研究都有着重要的意义。但是,目前各个医院的系统都是由医院、公司 自行开发研制的,没有统一的标准或者规范可以参考,造成了不同医院、不同公 司的系统相互独立,系统间无法连接或交换数据。对医疗系统的联网、远程医疗 等会造成很大的障碍。 第五是病历的安全问题。病历是病人医疗过程的记录,病历内容具有法律效 力,病人信息是病人个人的隐私。因此使用电子病历系统必须要建立一套安全机 制。这一机制要覆盖病人信息不同表示形式的各组成部分,要控制至0 具体的病人。 第六是文字及各种字符的输入问题。由于医生书写病历是一个创造性思维的 北京交通大学硕士学位论文绪论 过程,目前在大多数推行计算机应用的医院都存在医生文字输入慢及因考虑每 个文字的拼写而打断思维的问题,这是实施电子病历信息系统、提高工作效率的 一个“瓶颈, 这些问题是关系到电子病历系统基础,制约电子病历发展的主要问题。为了 清除电子病历的发展障碍,必须制订一系列的标准和规范。这需要国家有关部门 的积极组织,需要信息技术人员、l 临床工作者、医院管理工作者合作完成。本论 文就以上提到的问题采取了一定的相应措施,以求使电子病历系统能更加满足现 实的需要。 1 6 课题的来源与主要研究内容 本研究来源于实际的工作,主要目的是解决医疗卫生行业信息化中电子病历 开发缺乏指导和规范的问题。本研究是在中国软件与技术服务股份有限公司政府 事业部医疗卫生小组的指导与协助下进行的。 研究电子病历具有非常重要的意义。目前,国内并没有完全意义上的电子病 历。各个厂家研制的电子病历在很多方面有着无法弥补的缺陷,再加上医疗标准 的不统一,不同厂家的电子病历之间难以实现信息共享。以致各个医院系统几乎 成了“信息孤岛”。国外虽然有些电子病历产品非常优秀,但除了使用需求和习 惯不同外,高昂的授权价格也是中国医院很难承受的。所以,研制满足需要的电 子病历系统成了迫切需要解决的问题。 本文针对电子病历的表示、存储及各种表格病历和专科病历的处理问题、病 历的共享和交换的问题、系统的安全问题和文字及各种字符的输入问题等,提出 了如下的解决方法: ( 1 ) 基于x m l 病历的描述。病历的描述模型是电子病历的最基本问题,x m l 为病历内容的描述提供了有效手段。x m l :是一种结构化描述语言,其优 势在于不仅是一种标识语言,更是一种可以定义描述对象结构的元语言。 x m l 文档自含结构,使得系统阔交换的信息可以互相“理解”。 ( 2 ) 基于x m i 病历的存储。使用x m l 描述病历内容,形成的订l 文件是病 历存储管理的基本单位。采用x m l 文件来记录病历,并不排斥病人信息 的数据库表示。病历的x m l 描述与数据库记录有各自的适用范围,它们 将共同存在。两种描述同时存在并保持相对独立,依用途各自使用。 ( 3 ) 基于x m l 病历信息的处理。随着病历内容覆盖越来越多,结构化的内容 会越来越多,结构化程度会不断细化。采用x m l 能随时将新出现的结构 化内容集成到病历中来。x m l 可以轻松地存储各种表格化的病历内容而 无需开发不同的数据结构和应用程序。 6 北京交通大学硕士学位论文 绪论 ( 4 ) 采用医学标准解决信息的共享和交换的问题。系统采用医学通用标准 h l 7 及c d a 等描述电子病历,使得能够有效的解决电子病历信息共享和 交换问题。 ( 5 ) 系统安全解决方法。考虑到对病人信息安全性的保护,在浏览或传递选 定的数据时,依据用户被授权的程度来限制用户权利,审核用户对病人 数据的访问,建立三级检诊制度。此外还使用数字签名及加密技术来保 证病历信息的安全。 ( 6 ) 文字输入解决方法。采用智能文档技术创建电子病历,提供了特定的文 字编辑功能、关键词功能、知识库辅助书写等技术来有效的解决文字输 入的问题。 本文分六章对基于x m l 的电子病历系统进行了研究,文章结构如下: 第l 章:简述了电子病历的定义、分类、应用意义与国内外的发展现状,并 列举出电子病历发展中的几个难题,然后说明本课题的来源与意义, 最后提出了解决病历发展难题的几个方案。 第2 章:首先对x m l 及相关技术进行了研究,然后给出了x m l - 与医学标准的 关系,最后对x m l j 立用于电子病历的优势进行了详细分析。 第3 章:介绍了基于x m l 电子病历系统的设计,包括病历文档的描述结构、 系统的关键数据结构与主要功能模块。 第4 章:介绍了基于x m l 电子病历系统的具体实现,包括本系统采用的开发 平台、开发语言、电子病历编辑器的选择与主要功能模块的实现方 法。 第5 章:介绍了病历系统为保障信息安全采取的一些机制,并对x m l 数字签 名与皿加密技术进行了初步的研究。 第6 章:总结全文。 7 北京交通大学硕士学位论文x m l 概述 2 1x m l 简介 2x m l 概述 x m l ( e x t e n s i b l em a r k u pl a n g u a g e ) 是由万维网协会( w 3 c ) 设计的,是用来描 述数据信息的一种新的标准语言。x m l 推荐标准1 0 版于1 9 9 8 年2 月由w 3 c 发布, 在短短的几年里,x m l 以惊人速度传播开来。x m l 可以说是最新的网络语言, x m l 具有h t m l 所欠缺的伸缩性和灵活性,使用者可以根据需要自行标记来描述 各种数据,从而使数据表示的内容更丰富。随着i n t e r n e t 的飞速发展,h t m l 开始 对更多的网络设计要求力不从心,特别是在电子商务方面的应用。x m l 也就是 在这种大环境下孕育而生的。简要地讲,x m l 是一种描述型的标记语言,与h t m l 同为s g m l ( 标准通用标记语言,一种功能十分强大但也非常复杂的标记语言, 是i s o 8 8 7 9 国际标准) 的一种应用。设计之初,x m l 的目标之一是取代h t m l 为 新出现的复杂的w e b 应用提供标准的i n t e r a c t 语言。然而,由于x m l 在可扩展性、 可移植性和结构性等方面的突出优点而且它也有非常强大的数据支持功能,放其 应用范围早已突破了h t m l , 所达到的范围1 8 】。 x m l 的发展有力地推动了电子病历的发展,x m l :有利于数据交换的特性为 电子病历带来了革命性的冲击。x m l 在电子病历的内容定义和信息交换方面都 起到了重要作用。例如,医学标准h l 7 与c d a ( 临床文档架构) 都是采用x m i 进 行基本描述的。 本章首先对讧【,及其技术进行研究,然后探讨l 与医学标准的关系,最 后就) a 讧l 应用于电子病历的优势进行了详细的分析。 2 2x m l 文档的构成 一篇x m l 文档由标记和内容组成。x m l 中共有六种标记:元素( e l e m e n t s ) , 属性( a t t r i b u t e s ) ,实体引用( e n t i t yr e f e r e n c e s ) ,注释( c o m m e n t s ) ,处理指令 ( p r o c e s s i n g i n s t r u c t i o n s ) 和c d a t a 段( c d a t as e c t i o n s ) p j 。其中,元素用成对出现 的标记来标识与界定,由尖括号分隔。元素是x m l 支:档逻辑结构的基础,一个 x m l 文档实例就是一个元素,称之为根元素或者是文档实体。而且一个x m l 文 档有且只有一个根元素,其余的元素作为其子元素而存在。元素还可以拥有若干 个无序的属性。 x m l 文档的基本思想很简单:利用数据标识表示数据的含义,利用简单的 嵌套和引用来实现数据元素之间的关系。根掘应用领域和用户使用角度的不同, x m l 文档可分为以数据为中心和以文档为中心。数据为中心的x m l 支:档一般有 8 北京交通大学硕士学位论文x m l 概述 着规则的结构,小粒度数据( 最小独立数据单元是包含字符串的元素或属性) ,很 少或没有混合内容,兄弟元素出现顺序无要求等特点,它们经常出现在b 2 b 的应 用中;以文档为中心的“l 文档的特性与以数据为中心的x m l 文档具有相反的 特点,这类文档内容通常包括用户手册、市场宣传等无规则的数据。实际应用中 这种区分不是很明显,如用户手册中可能包含一些规则的结构数据( 如作者姓名、 编著日期等) 。一个具体的x m l 文档往往有两重性。 一个简单的) ( 1 讧l 文档如下: ( ! 一图书信旦召放在。b o o k 晓”文件中一 ( b o o k 深入洼出x i l 贾小珠 人民邮电出版社 2 80 0 c + + b u i l d e r 开发技未 李东 王宏 水利水电出版社 4 0 0 0 v c + + 缩程技术 高强 人民邮电出版社 3 5 0 0 2 3x m l 的特点 r i l 以其良好的数据存储格式、可扩展性、高度结构化、便于网络传输等 优势在许多领域一显身手,便于软件开发人员和内容创作者在网页上组织信息。 不仅能满足不断增长的网络应用需求,而且还能够确保在通过网络进行交互合作 时,具有良好的可靠性与互操作性。它具有以下特点【1 0 l : ( 1 ) 易于扩展。x m l 是摒弃了s g m l 中一些复杂性并考虑到适合w e b 特性的 一个子集,可以定义其他语言,同时x m l 的标记是用户定义的,所以从 理论上讲,其类型的数量可以是无限的。 ( 2 ) 结构性强。x m l 的文件结构嵌套可以复杂到任意程度,能表示面向对象 的等级层次。 ( 3 ) 交互性好。用户与应用进行交互时,使用x m i 同以非常方便地在本地排 序、过滤和进行其他的数据操作。不需要与服务器进行交互,减轻了服 务器的负担。 ( 4 ) 语义性强。) 嘶l 可以自行设计有意义的标记便于异构系统之间的数据交 9 北京交通大学硕士学位论文x m l 概述 换和信息检索。实现机器与机器之间的信息交换。 ( 5 ) 纯文本。几乎任何工具都可创建和编辑x m l ,使得程序可以更简单,从 而提供了从小配置文件到企业级数据仓库的可扩展性。 ( 6 ) 基于内容的数据标识。因而可以被不同程序用于不同目的。 ( 7 ) 可格式化。可扩展样式语言x s l ( e x t e n s i b l es t y l el a n g u a g e ) - 指定如何 显示数据。数据和显示是分离的,可以为同一数据指定不同的样式表用 于不同输出。 ( 8 ) 很强的链接能力。可以定义双向链接、多目标链接、扩展链接和两个文 档问的链接。 ( 9 ) 易于处理。x m l 对格式的定义严格,具有层次结构,而且与厂商无关。 o 毋与平台无关。x m l 文档可无须任何更改直接移植到其他平台上。 2 4x m l 的相关技术 x m l 并不是一个单一的技术,它需要与多种相关的技术相互作用。这些技 术包括d r d ( 文档类型定义) 和x m ls c h e m a ( x m l ) t :纲) ,c s s ( 级联样式表) 和 x s u 可扩展样式语言) 、x u 可扩展的链接语言) 等。在x m l l 0 规范发布之后, x m l 的有关技术规范不断涌现。w 3 c 在1 9 9 9 年先后推出 n a m e s p a c e s ( x m l 中的 命名空自j ) 、c s s 2 等推荐标准。与x m l 有关的重要技术规范还包括d o m 、x q u c r y 、 u r l 和u r i 等。下面对主要的x m l 相关技术做一个介绍。 2 4 id 1 d 和x m l s c h e m a d t d ( 文档类型定义) 用不同于x m l 的独立语法来规定x m 蚊档中各种元素 集合的内容模式,它主要采用元素类型声明和属性表声明限制x m l :史档中元素 的结构【1 l 】。元素类型声明限制了元素的内容,通常也限定了子元素的类型。属 性表声明用于定义与给定元素类型有关的属性集,它还可以指定这些属性的类型 限制并能提供缺省值。通常属性表声明紧跟在元素类型声明之后,其定义由属性 名称、属性类型和缺省值声明组成。如果一个格式良好的x m l 文档,包含了i t i d 说明,那么这个文档就被称为是一个有效的( v a l i d ) x m l 文档。该d t d 声明可以 在文档中,也可以在文档外( 称为外部d t d ) 。有效的x m l 文档中的元素必须符合 d t d 中的定义。 d t d 是x m l 由s g m l 处继承而来并加以发展的文档类型定义方法,有着天生 的缺陷:它本身不是用x m l - 书写的;不支持名字空间( n a m e s p a c e ) ;提供非常有 限的数据类型;不能表达元素中字符数据的数据类型;虽然有扩展的机制,但这 个机制太复杂而且很脆弱,一组被定义为参数体的属性之间不能建立任何联系。 北京交通大学硕士学位论文x m l 概述 相比之下,x m l s c h e m a 更适合于表达x m l 的内容和结构。x m l s c h e m a 是 一种描述信息结构的模型。它用来定义x m l 文档的文本结构、数据类型等x m l 文档描述规则。它为一类文档建立一个模式,规范了文档中的标记和文本的可能 组合形式。它不仅包括了d 1 r d 所能实现的所有功能,而且它还提供了一系列的新 特色,大大弥补了d t d 的不足。x m ls c h e m a 的优点如下: x m l s c h e m a 本身就是x m l 文档,使用标准x m 睛法,因此可直接用一 般x m l 解析器对其进行语法分析,并且有强大、易用的扩展功能。 x m ls c h e m a 支持丰富的数据类型包括数字型、布尔型、整型、日期时间、 u r i ( 统一资源标识符) 、十进制数等等。它允许对数据进行更严格的合法 性检查,而且还支持由这些简单的类型生成更复杂的类型。 x m l s c h e m a 内容模型是开放的,可以随意扩充、更新。 x m l s c h e m a 支持名字空间,保证了标记的唯一性,利用名字空间将文档 中特殊的结点与s c h e m a 说明相联系,一个x m l 皮档可以有多个对应的 s c h e m a 。 由于x m ls c h e m a 的种种优点,现在s c h e m a 己经基本上取代了d t d 。在这种 情况下,国际上一些知名企业和组织审时度势纷纷在战略上向x m ls c h 锄a 倾 斜,提供对x m l s c h e m a 的支持。 2 4 2x s l ( 可扩展样式表语言) 可扩展的样式语言( e x t e n s i b l es t y l el a n g u a g e ,简写为x s l ) 是更为先进的专门 用于x m l 支:档的样式单语言。x s l 文档包括一系列的适用于特定的x m l 元素样 式的规则。x s l 赴理程序读取x m l 文档并将其读入的内容与样式单中的模式相 比较。当在x m l 文档中识别出x s l 祥式单中的模式时,对应的规则输出某些文 本的组合。与c s s ( 级联样式单) 不同,输出的文本比较任意,也不局限于输入文 本加上格式化信息。 c s s ( 级联样式单1 虽也是控制) a 皿度档显示的方法,却只能改变特定元素的 格式,也只能以元素为基础。但x s l 样式单可以重新排列元素。这种样式单可以 隐藏一些元素而显示另外一些元素。更进一步说,还可以选择应用样式的标记, 而不仅是基于标记的,而且还基于标记的内容和特性,还基于标记在文档中相对 于其他元素的位置,以及基于各种其他的准则。 x s l 包括变换语言( t r a n s f o r m a t i o nl a n g u a g e ) 和格式化语言( f o r m a t t i n g l a n g u a g e ) 。每种语言都是一个x m l 应用程序。变换语言提供定义规则的元素如 何将x m l 文档变换成另一个x m l 文档。被变换的x m i 皮档可能使用原文档的标 记和d t d ,或者使用一组完全不同的标记。特别是,可能会使用x s lf o r m a t t i n g 1 l 北京交通大学硕士学位论文x m l 概述 l a n g u a g e 定义的标记。 变换和格式两部分可相互独立地起作用。例如,变换语言可将x m l ,文档变 换成结构整洁的h t m l 文件并且完全忽略x s i _ 格式化对象。i n t e r n e e x p l o r e r5 0 以上支持这种x s l 觯式。 此外,以x s l 格式化对象编写的文档,并非绝对要求在另一个x m l 文档上 使用x s l 度换部分才能产生。例如,很容易想象到这样的一个转换器:它是用j a v a 语言写成的,可读取t e x t 或p d f 文件,并把这些文件翻译成x s l 格式化对象。 变换语言是一种很有用的语言,它与格式化语言无关。它能够把数据从一种 x m l 表示移到另一种表示,这种功能,使它成为基于x m l 的电子商务、电子数 据交换、元数据交换以及应用于需要在相同数据的不同x m l 表示之问进行转换 的重要组成部分。由于缺乏对人们要浏览的显示器上显示数据的了解,这些用途 还要结合起来使用。它们纯粹是用来将数据从一种计算机系统或程序移到另一种 计算机系统或程序中。 因此,许多早期的x s l 实现都毫无例外地将焦点集中在变换部分,而忽略了 格式化对象。这些是不完善的实施方案,但仍然是很有用的。并非所有的数据最 终都必须显示在计算机显示器上或打印到纸上。 2 4 3x p a t h ( x m l 路径语言1 x p a t h ( x m l p a t hl a n g u a g e ,x m i ,路径语言1 是第四代声明式语言,用于定位 x m l 文档中的结点1 1 2 j 。x p a t h 指定需要文档中的哪些结点,而不指定寻找这些结 点的算法。x p a t h 把整个x m 坟档看成一棵结点树,使用的数据模型将每个x m l 文档分成7 种不同的结点:根结点( r o o tn o d e ) 、元素结点( e l e m e n tn o d e ) 、属性结 点( a t t r i b u t en o d e ) 、文本结点( t e x tn o d e ) 、处理指令结点( p r o c e s s i n gi n s t r u c t i o n n o d e ) 、注释结点( c o m m e n tn o d e ) 和名字空问结点( n a m e s p a c en o d e ) 。但不包括 实体引用、c d a t a 段和文档类型声明。实体引用解析为组件文本与元素,c d a t a 段与其他任何文本一样处理,先和相邻文本合并之后再建立文本结点。除了采用 默认属性外,不考虑文档类型声明。 x p a t h 的核心部分是如何表示某一资源的位置,这就用到表达式( e x p r e s s i o n ) 的概念。x p a t h q 嘣j 表达式可以返回结点集( o d e s e t ) 、布尔值( b o o l e a n ) 、数字值 ( n u m b e r ) 、字符* ( s t r i n g ) 等四种基本类型之一。x p a t h 中最重要的表达式是定位 路径( 1 0 c a t i o np a t h ) 。定位路径依次由三部分组成:轴( a x i s ) ,用来确定与当前结 点的相对位置而得到一个结点集:结点测试( n o d et e s t ) ,在从“轴”确定的结点集 中按照结点名称或是结点类型选择对应的结点,从而得到一个子集;谓词 ( p r e d i c a t e ) ,在结点测试选出的结点集中根据定义的谓词再进一步筛选得到最后 北京交通大学硕士学位论文x m l 概述 的结果。定位路径的基本规则是:轴和结点测试是必需的,谓词是可选的;轴和 结点测试之间用双冒号分开,而谓词要用中括号括起来;定位路径选择结点集的 顺序是从左到右【1 3 1 。 2 4 4x q u e r y ( x m l 查询语言】 x m 蠛糊了数据库、文档和消息之间的界线,但是要充分发挥x m l 的所有 特性,还必须要有一个强大的查询语言。目前,x o u e r y 己经成为x m l 所需的查 询语言。 x m l q u e r y i 作组在1 9 9 9 年9 j q 正式成立,任务是创建一种灵活的查询语言 来从x m l 文档中抽取数据【1 4 】。x q u e r y 构建在x p a t h 规范之上。事实上,x q u e r y 的一些特性已公认为是非常基本的,所以它们已被合并入x p a t h 2 0 规范中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宝鸡三和职业学院《清洁生产与循环经济》2023-2024学年第二学期期末试卷
- 河北劳动关系职业学院《古典园林设计》2023-2024学年第二学期期末试卷
- 北京外国语大学《生物育种综合实验技术》2023-2024学年第二学期期末试卷
- 赣州职业技术学院《突发公共卫生事件应急管理》2023-2024学年第二学期期末试卷
- 长沙师范学院《计算机辅助绘图基础》2023-2024学年第二学期期末试卷
- 大兴安岭职业学院《医学信息导论》2023-2024学年第二学期期末试卷
- 巴中职业技术学院《信息安全技术》2023-2024学年第二学期期末试卷
- 昆明理工大学津桥学院《固体表面物理化学》2023-2024学年第二学期期末试卷
- 武汉商学院《国际贸易实务英语(一)》2023-2024学年第二学期期末试卷
- 喀什理工职业技术学院《江南丝竹》2023-2024学年第二学期期末试卷
- GB∕T 17466.1-2019 家用和类似用途固定式电气装置的电器附件安装盒和外壳 第1部分:通用要求
- 钻探设备工具材料共12
- 得到上市招股书:北京思维造物信息科技股份有限公司
- 机动车检测站授权签字人内部培训考题(含答案)
- 2022年浙江省小升初语文试卷(含答案)
- Q∕GDW 12158-2021 国家电网有限公司重大活动电力安全保障工作规范
- 我把没有送给你(课堂版)(1)
- 刘半农雨散文的特点
- 南靖和溪各姓氏源流
- 智能PID算法在液位控制系统中的应用毕业论
- 肾病及生活质量KDQOL-SF
评论
0/150
提交评论