




已阅读5页,还剩76页未读, 继续免费阅读
(化学工程专业论文)中医药信息智能检索系统的设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
a b s t r a c t w i mt h er a p i dd e v e l o p m e n to fi n t e m e t 1 0 t so f i n f o r m a t i o nr e t r i e v a l s y s t e m h a v e b e e n d e s i g n e d a n d r e a l i z e d p e o p l eh o p e t o a c q u i r e i n f o r m a t i o n w h o l l ya n dr a p i d l yb yt h em u l t i f u n c t i o n a la n di n t e l l i g e n t i n f o r m a t i o nr e t r i e v a l s y s t e m a c c o r d i n g t ot h e r e q u i r e m e n t o ft h e i n f o r m a t i o nr e t r i e v a lf o rt r a d i t i o n a lc h i n e s e m e d i c i n e ( t c m ) ,t h ed e s i g n a n dr e a l i z a t i o no f i n t e l l i g e n tr e t r i e v a ls y s t e mf o rt c m i sd i s c u s s e di nt h i s p a p e r t h i sp a p e ri n c l u d e sf i v ec h a p t e r s i nc h a p t e ro n e ,t h ed e v e l o p m e n t o fi n f o r m a t i o nr e t r i e v a la n dt h ei n f o r m a t i o nr e t r i e v a ls y s t e mf o rt c m a r e i n t r o d u c e d i n c h a p t e rt w o ,t h eb a s i ct h e o r yo fi n f o r m a t i o nr e t r i e v a li s i n t r o d u c e da tf i r s t t h e ns o m e t e c h n o l o g yo fi n f o r m a t i o nr e t r i e v a ls y s t e m b a s e do ni n t e r n e ti sd i s c u s s e d i nc h a p t e rt h r e e ,t h eg e n e r a la n a l y s i sa n d d e s i g no ft h es y s t e mi s d e s c r i b e di n d e t a i l ,i n c l u d i n g t h er e q u i r e m e n t a n a l y s i s ,s y s t e mt a r g e t s ,s t r u c t u r eo f t h es y s t e m ,d a t a b a s ed e s i g n i n ga n d s oo n i nc h a p t e rf o u r , t h er e a l i z a t i o no fs y s t e mi si l l u s t r a t e db a s e do n p r e v i o u sc h a p t e r s s o m ef u n c t i o nd u r i n gr e a l i z a t i o ni s s e tf o r t h ,w h i c h i n c l u d eq u e r ye x p a n s i o n ,a s s o c i a t i o nr e t r i e v a la n di n t e l l i g e n t a n a l y s i s f i n a l l y , t h ew o r k o nt h i sp a p e ri ss u m m a r i z e di nc h a p t e rf i v ea n ds o m e s u g g e s t i o n so n f u r t h e rs t u d i e sa r ea l s og i v e n k e y w o r d s :t r a d i t i o n a lc h i n e s em e d i c i n e ;i n t e l l i g e n tr e t r i e v a l ;q u e r y e x p a n s i o n ;i n t e l l i g e n ta n a l y s i s ;b r o w s e r s e r v e r 2 浙江大学硕士学位论文 第一章绪论 本章首先简要介绍本系统的研究背景,接着对信息检索系统及中医药信息检 索系统的发展概况作一介绍,最后概述本论文的总体安排。 1 1 研究背景 中医药是中华民族灿烂文化的重要组成部分。经过几千年来的实践,积累了 大量宝贵经验,并经过人们不断的发展创新与总结提高,逐渐形成了具有中国特 色的系统性的中医药理论及学术体系,为保障人民健康作出了巨大的贡献。在治 疗多种疑难病症和医疗保健方面,中医药及其理论有着其独特的作用。在某些方 面有其不可替代的作用。 目前一个“回归自然”和“重新重视天然药物”的热潮正在世界范围内兴起, 这给中医药的进一步发展和走向世界带来契机。在国内,随着我国加入w t o , 医药产品的知识产权日益得到重视,加快开发具有我国传统特色的中医药产品日 益显得重要。这就要求人们对中医药有更深一步的了解。 要加快深入研究中医药学,必须整理现有的大量中医药信息。一方面,几千 年来积累下的文献典籍据不完全统计约1 1 万种,现存古籍8 0 0 0 种。另一方面, 建国以来出版的中医药图书逾万种,中医药期刊1 0 0 多种,目前以非中文表述的 中医药文献已近4 0 0 0 种1 1 】。对于这些蕴藏着大量丰富的中医药学信息进行检索 与分析研究,发现其中规律性的知识,从而为深入研究中医药学,开发其中有价 值的信息提供重要帮助,这是中医药学术研究的重要组成部分。 随着网络通讯技术的飞速发展,利用网络进行在线检索己成为一项受到广泛 重视的研究课题,建立基于i n t e r a c t 的中医药信息检索系统,将更加方便中医药 信息的检索和交流,做到信息资源的共享。这对于国内外的学者了解中医药动态, 加快中医药信息传递,扩大信息交流,进而促进中医药科研向前发展起到了积极 作用。 为了使现有的中医药信息能更好的为人们的研究工作服务,设计并建立一个 功能强大、使用方便、信息含量大的中医药信息智能检索系统,对架起连接中医 药资源宝库和现代科学的桥梁、推动中医药现代化研究的进程等都具有一定的现 浙江大学硕士学位论文 第一章绪论 本章首先简要介绍本系统的研究背景,接着对信息检索系统及中医药信息检 索系统的发展概况作一介绍,最后概述本论文的总体安排。 1 1 研究背景 中医药是中华民族灿烂文化的重要组成部分。经过几千年来的实践,积累了 大量宝贵经验,并经过人们不断的发展创新与总结提高,逐渐形成了具有中国特 色的系统性的中医药理论及学术体系,为保障人民健康作出了巨大的贡献。在治 疗多种疑难病症和医疗保健方面,中医药及其理论有着其独特的作用。在某些方 面有其不可替代的作用。 目前一个“回归自然”和“重新重视天然药物”的热潮正在世界范围内兴起, 这给中医药的进一步发展和走向世界带来契机。在国内,随着我国加入w t o , 医药产品的知识产权日益得到重视,加快开发具有我国传统特色的中医药产品日 益显得重要。这就要求人们对中医药有更深一步的了解。 要加快深入研究中医药学,必须整理现有的大量中医药信息。一方面,几千 年来积累下的文献典籍据不完全统计约1 1 万种,现存古籍8 0 0 0 种。另一方面, 建国以来出版的中医药图书逾万种,中医药期刊1 0 0 多种,目前以非中文表述的 中医药文献已近4 0 0 0 种1 1 】。对于这些蕴藏着大量丰富的中医药学信息进行检索 与分析研究,发现其中规律性的知识,从而为深入研究中医药学,开发其中有价 值的信息提供重要帮助,这是中医药学术研究的重要组成部分。 随着网络通讯技术的飞速发展,利用网络进行在线检索己成为一项受到广泛 重视的研究课题,建立基于i n t e r a c t 的中医药信息检索系统,将更加方便中医药 信息的检索和交流,做到信息资源的共享。这对于国内外的学者了解中医药动态, 加快中医药信息传递,扩大信息交流,进而促进中医药科研向前发展起到了积极 作用。 为了使现有的中医药信息能更好的为人们的研究工作服务,设计并建立一个 功能强大、使用方便、信息含量大的中医药信息智能检索系统,对架起连接中医 药资源宝库和现代科学的桥梁、推动中医药现代化研究的进程等都具有一定的现 浙江大学硕士学位论文 实意义。 1 2 信息检索发展概况 信息检索( i n f o r m a t i o nr e t r i e v a l ) 又可称为情报检索,作为一种技艺,有着悠 久的历史。在计算机出现之前,人们主要借助于手工来进行信息的检索,但手工 查找费时、费力、检索效果较差。自从计算机产生之后,出现了现代意义上的信 息检索,并作为一个研究领域而诞生【2 】。 信息检索经过几十年的研究与实践,在理论和应用上都取得了重大的发展, 出现了许多类型的检索系统。纵观信息检索的发展历程,伴随着计算机技术的每 一次重大的发展,信息检索技术同时得到了有力的发展。 作为现代意义上的信息检索产生于二十世纪五十年代中期。1 9 5 4 年,美国 两位文献学家k e n t 和p e r r y 3 1 就利用i b m 公司制造的分析计算机以8 0 列穿孔卡 片为载体,开始机器信息检索的研究。在同年,美国海军机械实验中心使用 i b m 7 0 1 型机建成计算机文献检索系统的雏形。它把文献号和少量索引词存在计 算机中,通过词的组配找出对应的文献号,实现了单元词组配检索。虽然由于计 算机系统各方面的局限性,并未真正投入实际使用,但是它拉开了计算机信息检 索的序幕。1 9 5 7 年,b a r n i l l i e l i y l 4 韫早讨论将布尔逻辑用于计算机检索的可能性, 1 0 年后,布尔检索正式成为大型目录库检索系统实现的方法,并逐步实现商业 化,成为一种重要的检索方法。同年,i b m 的工程师h p l u l m 在i b m 的“研究 与发展”杂志上发表“文本的编码与检索”,最先用统计方法标引与检索,为现 代计算机检索奠定了方法基础。这一时期的计算机检索系统采用脱机批处理的方 式,用户不能直接使用计算机,而由情报中心将问题汇集起来,表示成检索语言, 分类装入计算机存贮介质中,然后由计算机分类检索,形成打印结果提供给用户。 由于刚处于起步阶段,因此这一阶段的检索系统的数据存取与数据通信能力都比 较差。 进入6 0 年代以后,随着计算机技术的迅速发展,产生并发展了联机信息检 索系统,使检索方式由脱机检索发展到联机检索。从1 9 6 0 年开始,美国麻省理 工学院( m 1 1 ) 开始实施有关联机情报检索系统的“技术情报计划”( t i p ) 。1 9 6 1 年, m b m o r o n 等对概率标弓l 进行研究,发表了“概率标引与情报检索的论文”,为 4 浙江大学硕士学位论文 实意义。 1 2 信息检索发展概况 信息检索( i n f o r m a t i o nr e t r i e v a l ) 又可称为情报检索,作为一种技艺,有着悠 久的历史。在计算机出现之前,人们主要借助于手工来进行信息的检索,但手工 查找费时、费力、检索效果较差。自从计算机产生之后,出现了现代意义上的信 息检索,并作为一个研究领域而诞生【2 】。 信息检索经过几十年的研究与实践,在理论和应用上都取得了重大的发展, 出现了许多类型的检索系统。纵观信息检索的发展历程,伴随着计算机技术的每 一次重大的发展,信息检索技术同时得到了有力的发展。 作为现代意义上的信息检索产生于二十世纪五十年代中期。1 9 5 4 年,美国 两位文献学家k e n t 和p e r r y 3 1 就利用i b m 公司制造的分析计算机以8 0 列穿孔卡 片为载体,开始机器信息检索的研究。在同年,美国海军机械实验中心使用 i b m 7 0 1 型机建成计算机文献检索系统的雏形。它把文献号和少量索引词存在计 算机中,通过词的组配找出对应的文献号,实现了单元词组配检索。虽然由于计 算机系统各方面的局限性,并未真正投入实际使用,但是它拉开了计算机信息检 索的序幕。1 9 5 7 年,b a r n i l l i e l i y l 4 韫早讨论将布尔逻辑用于计算机检索的可能性, 1 0 年后,布尔检索正式成为大型目录库检索系统实现的方法,并逐步实现商业 化,成为一种重要的检索方法。同年,i b m 的工程师h p l u l m 在i b m 的“研究 与发展”杂志上发表“文本的编码与检索”,最先用统计方法标引与检索,为现 代计算机检索奠定了方法基础。这一时期的计算机检索系统采用脱机批处理的方 式,用户不能直接使用计算机,而由情报中心将问题汇集起来,表示成检索语言, 分类装入计算机存贮介质中,然后由计算机分类检索,形成打印结果提供给用户。 由于刚处于起步阶段,因此这一阶段的检索系统的数据存取与数据通信能力都比 较差。 进入6 0 年代以后,随着计算机技术的迅速发展,产生并发展了联机信息检 索系统,使检索方式由脱机检索发展到联机检索。从1 9 6 0 年开始,美国麻省理 工学院( m 1 1 ) 开始实施有关联机情报检索系统的“技术情报计划”( t i p ) 。1 9 6 1 年, m b m o r o n 等对概率标弓l 进行研究,发表了“概率标引与情报检索的论文”,为 4 渐江大学硕士学位论文 建立概率检索模型做了开创性工作。1 9 6 2 年美国系统发展公司( s d c ) 在全文检索 系统p r o t o s y n t h e x 上,进行世界上最早的联机情报检索实验【5 1 。1 9 6 5 年,美国系 统发展公司研制成功o r b i t 联机情报检索软件。标志着联机情报检索系统阶段的 开始。著名的d i a l o g 在线数据库联机检索系统也产生于这段时期。这一时期检 索系统的数据存取和数据通信能力也较差。 在7 0 年代,在几项计算机技术上取得了重大的进展,包括高性能分时计算 机、带终端的远程处理系统、廉价的大容量随机存贮器、分组交换网、网状数据 库管理系统等方面,为信息检索的进一步发展提供了良好的计算机支持,这使得 联机检索由原来的内部使用发展为面向社会公众的商业性服务,并逐步形成区域 性、全国性的机检系统的联机网络,用户可以通过网络内的任何一台终端,检索 网络内任何一台主机系统所拥有的数据库。在这一期间,d i a l o g 、m e d l i n e 、o r b i t 等著名的联机检索系统先后投入商业性运营和网络化服务。我国于1 9 7 4 年开始 实施汉字信息处理工程一7 4 8 工程,即新闻、出版和情报处理自动化。我国汉语 主题表的编制,就是这一工程的初步结果,后来的检索事业大发展与此工程密切 相关。这一时期的检索系统集中管理联机数据库,具有完备的检索功能、检索范 围较广、速度快和互动性好等特点,但数据通信能力较差。 进入8 0 年代之后,信息检索在文档内容表示、索引模型、匹配策略等方面 取得了丰硕成果。随着p c 的产生并迅速普及,出现了光盘信息检索系统。光盘 信息检索系统因其设备简单、使用方便、检索费用低等优点,已被世界各地广泛 使用。但与联机检索系统相比,存在更新时间慢、数据容量小等不足。联机信息 检索系统在此期间得到进一步的发展与完善。由c o m e l l 大学开发的s m a r t 系 统和由m a s s a c h u s e t t s 大学开发的i n q u e r y 系统投入使用嘲。在这期间,伴随着 人工智能研究热潮的兴起,出现了许多将人工智能技术与信息检索技术相结合的 智能情报检索专家系统,如o r a n t 、i o t a 、c o d e r 等,然而由于实现商业化 的难度,上述系统大多只是作为实验模型,很少能做到具有实际应用价值,到 9 0 年代,很少有关于这方面的论文发表。 进入9 0 年代,由于i n t e m e t 的兴起,极大地改变了人们的生活工作方式, 并为信息检索的向前发展,提供了广阔的天地。在1 9 9 1 年,美国t h i n k i n g m a c h i n e 公司推出了w a i s 系统。w a i s 系统允许用户检索整个因特网网上文本信息资源, 浙江大学硕士学位论文 因而通常把这一年作为网络信息检索系统的开端。明尼苏达大学推出的g o p h e r , 使用户能十分容易地获取i n t e m e t 上的信息资源。而后y a h o o 的问世,使网上信 息检索更加的方便。网上检索系统大多采用分布式的网络化管理,其信息资源的 主要特点是:数字形式表达,多媒体,内容覆盖广,分布无序,难以规范化和结 构化,内容特征抽取复杂,用户界面要求高等。这些特点导致了信息处理模式从 传统模式向新型模式的转变,如体系结构从终端主机方式到c l i e n t s e r v e r 方式, 再到b r o w s e s e r v e r 方式;网络环境从局域网到因特网;应用接口从封闭界面到 w w w 的开放界面等。基于i n t e r n e t 的网络信息检索系统主要分成两大类。一类 是i n t e m e t 上的资源数据库检索系统。由于可用普通的w e b 浏览器进行检索,因 此获得了极大的发展。传统的联机检索向i n t e m e t 迁移,各提供数据库检索服务 的著名公司,如d i a l o g 、s t n 等纷纷提供基于i n t e m e t 的检索服务。另一类是网 上的各种资源检索工具,如y a h o o 、a r av i s t a 等w e b 搜索引擎,搜寻f t p 的a r e h i e 等。基于i n t e m e t 的网络信息检索系统己成为功能最强、发展最快的一种现代信 息检索系统。 目前,信息检索在检索方式上,机检、光盘检索、联机检索和i n t e m e t 检索 等各种方式并存。在研究领域上主要是集中于两大方向:一是传统的信息检索在 全文检索和基于内容的多媒体信息检索等方面继续向前深入研究;二是对于海量 的w e b 信息进行检索的研究。i n t e m e t 信息检索的方法主要分为三类:搜索引擎、 个性化信息滤波系统和浏览式检索系统【7 i 。为了改善网上信息的检索效果,人们 提出了多种相应的方法,例如,基于概念的智能搜索 8 1 ,基于a g e n t 的智能信息 检索p 1 01 1 】,以及基于本体论的信息检索【1 2 1 等方法相继被研究并投入应用。其中 基于a g e n t 的信息检索近年来已经成为热门的研究领域。 1 3 中医药检索概况 与国外现代医学信息系统发展相比,我国中医药信息系统起步较晚。我国中 医药信息系统的建设起步于8 0 年代中期,中国中医研究院信息所于1 9 8 5 年建立 了针灸( 中英文版) 文献库,并随后建立了第一个大型综合性中医药学文献检索系 统i l ”。为了加快中医信息事业现代化的步伐,1 9 9 2 年7 月国家中医管理局建立 了中国中医药文献检索中心,使数据库的建立得到统一完善,并逐步建成“全国 6 浙江大学硕士学位论文 因而通常把这一年作为网络信息检索系统的开端。明尼苏达大学推出的g o p h e r , 使用户能十分容易地获取i n t e m e t 上的信息资源。而后y a h o o 的问世,使网上信 息检索更加的方便。网上检索系统大多采用分布式的网络化管理,其信息资源的 主要特点是:数字形式表达,多媒体,内容覆盖广,分布无序,难以规范化和结 构化,内容特征抽取复杂,用户界面要求高等。这些特点导致了信息处理模式从 传统模式向新型模式的转变,如体系结构从终端主机方式到c l i e n t s e r v e r 方式, 再到b r o w s e s e r v e r 方式;网络环境从局域网到因特网;应用接口从封闭界面到 w w w 的开放界面等。基于i n t e r n e t 的网络信息检索系统主要分成两大类。一类 是i n t e m e t 上的资源数据库检索系统。由于可用普通的w e b 浏览器进行检索,因 此获得了极大的发展。传统的联机检索向i n t e m e t 迁移,各提供数据库检索服务 的著名公司,如d i a l o g 、s t n 等纷纷提供基于i n t e m e t 的检索服务。另一类是网 上的各种资源检索工具,如y a h o o 、a r av i s t a 等w e b 搜索引擎,搜寻f t p 的a r e h i e 等。基于i n t e m e t 的网络信息检索系统己成为功能最强、发展最快的一种现代信 息检索系统。 目前,信息检索在检索方式上,机检、光盘检索、联机检索和i n t e m e t 检索 等各种方式并存。在研究领域上主要是集中于两大方向:一是传统的信息检索在 全文检索和基于内容的多媒体信息检索等方面继续向前深入研究;二是对于海量 的w e b 信息进行检索的研究。i n t e m e t 信息检索的方法主要分为三类:搜索引擎、 个性化信息滤波系统和浏览式检索系统【7 i 。为了改善网上信息的检索效果,人们 提出了多种相应的方法,例如,基于概念的智能搜索 8 1 ,基于a g e n t 的智能信息 检索p 1 01 1 】,以及基于本体论的信息检索【1 2 1 等方法相继被研究并投入应用。其中 基于a g e n t 的信息检索近年来已经成为热门的研究领域。 1 3 中医药检索概况 与国外现代医学信息系统发展相比,我国中医药信息系统起步较晚。我国中 医药信息系统的建设起步于8 0 年代中期,中国中医研究院信息所于1 9 8 5 年建立 了针灸( 中英文版) 文献库,并随后建立了第一个大型综合性中医药学文献检索系 统i l ”。为了加快中医信息事业现代化的步伐,1 9 9 2 年7 月国家中医管理局建立 了中国中医药文献检索中心,使数据库的建立得到统一完善,并逐步建成“全国 6 浙江大学硕士学位论文 中医药信息网”。在9 0 年代中期之前,中医药检索系统以光盘检索系统为主。主 要有中国中医研究院信息所的中医药光盘检索系统与由中国医学科学院医学信 息研究所的中国生物医学文献光盘数据库检索系统。随着i n t e m e t 的迅速发展, 许多研究机构和公司提供了基于i n t e m e t 的中医药信息的检索系统。人们获取中 医药信息的途径也更倾向于通过i n t e m e t 来实现。逐渐改变了原来光盘数据库检 索系统占据主导地位的情况,形成光盘数据库检索系统与基于i n t e m e t 的检索系 统并存的两大类中医药数据库检索系统。 9 0 年代初中国中医研究院信息研究所成功地研制国内第一个中英文联机标 引系统和中医药主题词自动校对、中英文自动转换系统,这大大加速了中医药数 据库的开发研制工作。国内外已有不少各具特色,规格不一、专题不同的中医药 数据库,为今后的中医药的科研工作奠定了良好的基础。 目前国内主要的中医药信息数据库及检索系统有;1 ) 中国中医研究院信息研 究所研制的中医药文献数据库检索系统。它包括中医药文献数据库,中医药科技 成果数据库,中医药报刊资料数据库,针灸文献数据库,中成药商品数据库,中 国中药企业数据库等。这是目前国内最权威的中医药信息检索系统,收录国内外 1 0 0 0 余种公开生物医学及相关中文期刊内的中医药文献,中医药学文献十分丰 富。2 ) f l j 中国医学科学院医学信息研究所开发研制的中国生物医学文献光盘数据 库( c b m d i s c ) ,该数据库覆盖了生物医学的各个领域,内容涉及基础医学、临 床医学、预防医学、药学、中医学及中药学等各方面,数据库文献题录内容丰富。 该库收录了1 9 8 3 1 9 9 7 年间的生物期刊、汇编、会议论文等期刊近9 0 0 种,文 献量达1 0 0 万篇左右。 此外,还有万方公司的万方数据医药信息系统,维普公司的中文科技期刊数 据库,北京中医药大学研制的中药方剂信息数据库,由国家中药保护品种委员会 研制的国家中药保护品种数据库等。国外的一些机构也提供中医药信息的检索服 务,如美国针灸服务系统( h t t p :w w w a c u p t m c t u r e c o r n ) ,是查找国外中医药信息 的重要途径。 纵观上述的中医药信息检索系统,在某些方面能较好的满足用户的需求,性 能和功能上有所提高。然而由于各种各样的原因,这些系统还存在着令人不满意 的地方。现有中医药信息检索系统存在的主要问题有:1 ) 中医药名称的同义现象 浙江大学硕士学位论文 较多,文献的规范化程度不高,造成中医药信息的查全率受到较大的影响。2 1 信息之间的关联性较差,无法体现信息之间的规律性知识。3 ) 数据库表之间未建 立关联关系,未能全面反映出用户的信息需求等等。据此,本文提出一种将基于 词表的扩展检索、相似性检索、关联检索以及智能分析技术相结合用于中医药信 息智能检索的方法,根据中医药信息检索的特点,并结合实际的用户需求,构建 了一个基于i n t e m e t 的中医药信息智能检索系统。该系统通过利用中医药之间的 相关性,揭示了一些中医药信息之间潜在的规律,并有效地提高了中医药信息的 利用率。 1 4 本文的安排 本文第二章综述信息检索理论,并对基于i n t e r a c t 的信息检索系统的开发技 术进行分析与讨论。第三章阐述本系统的分析与设计,主要包括系统的需求分析、 系统目标、系统结构、系统网络设计、数据库设计、系统安全设计和应用开发工 具的选择。第四章讨论本系统的实现,在前几章的基础上,建立并实现了本系统, 并重点阐述若干功能的实现,包括基于词表的扩展检索、关联检索等检索方法以 及智能分析的实现。最后,第五章对本论文的工作进行总结与评价,并对系统的 进一步研究工作进行了展望。 参考文献 1 1 李精锐查新咨询与中医药科研立题和成果报奖( 二) 科技情报开发与济, 1 9 9 9 ,9 ( 2 ) :2 6 - 2 7 2 1c j v a l lr i j s b e r g e n i n f o r m a t i o n r e t r i e v a l l o n d o n :b u t t e r w o r t h s ,1 9 7 9 【3 丁蔚,倪波等情报检索的发展一情报学世纪回眸之一情报科学,2 0 0 1 , 1 9 ( 1 ) :8 l - 8 6 【4 】贾同兴人工智能与情报检索北京图书馆出版社,1 9 9 7 【5 】赖茂生等计算机情报检索北京大学出版社,1 9 9 3 6 j a m e s p c a l l a n ,w :b r u c ec r o f t ,t h ei n q u e r yr e t r i e v a ls y s t e m , 8 浙江大学硕士学位论文 较多,文献的规范化程度不高,造成中医药信息的查全率受到较大的影响。2 1 信息之间的关联性较差,无法体现信息之间的规律性知识。3 ) 数据库表之间未建 立关联关系,未能全面反映出用户的信息需求等等。据此,本文提出一种将基于 词表的扩展检索、相似性检索、关联检索以及智能分析技术相结合用于中医药信 息智能检索的方法,根据中医药信息检索的特点,并结合实际的用户需求,构建 了一个基于i n t e m e t 的中医药信息智能检索系统。该系统通过利用中医药之间的 相关性,揭示了一些中医药信息之间潜在的规律,并有效地提高了中医药信息的 利用率。 1 4 本文的安排 本文第二章综述信息检索理论,并对基于i n t e r a c t 的信息检索系统的开发技 术进行分析与讨论。第三章阐述本系统的分析与设计,主要包括系统的需求分析、 系统目标、系统结构、系统网络设计、数据库设计、系统安全设计和应用开发工 具的选择。第四章讨论本系统的实现,在前几章的基础上,建立并实现了本系统, 并重点阐述若干功能的实现,包括基于词表的扩展检索、关联检索等检索方法以 及智能分析的实现。最后,第五章对本论文的工作进行总结与评价,并对系统的 进一步研究工作进行了展望。 参考文献 1 1 李精锐查新咨询与中医药科研立题和成果报奖( 二) 科技情报开发与济, 1 9 9 9 ,9 ( 2 ) :2 6 - 2 7 2 1c j v a l lr i j s b e r g e n i n f o r m a t i o n r e t r i e v a l l o n d o n :b u t t e r w o r t h s ,1 9 7 9 【3 丁蔚,倪波等情报检索的发展一情报学世纪回眸之一情报科学,2 0 0 1 , 1 9 ( 1 ) :8 l - 8 6 【4 】贾同兴人工智能与情报检索北京图书馆出版社,1 9 9 7 【5 】赖茂生等计算机情报检索北京大学出版社,1 9 9 3 6 j a m e s p c a l l a n ,w :b r u c ec r o f t ,t h ei n q u e r yr e t r i e v a ls y s t e m , 8 浙江大学硕士学位论文 较多,文献的规范化程度不高,造成中医药信息的查全率受到较大的影响。2 1 信息之间的关联性较差,无法体现信息之间的规律性知识。3 ) 数据库表之间未建 立关联关系,未能全面反映出用户的信息需求等等。据此,本文提出一种将基于 词表的扩展检索、相似性检索、关联检索以及智能分析技术相结合用于中医药信 息智能检索的方法,根据中医药信息检索的特点,并结合实际的用户需求,构建 了一个基于i n t e m e t 的中医药信息智能检索系统。该系统通过利用中医药之间的 相关性,揭示了一些中医药信息之间潜在的规律,并有效地提高了中医药信息的 利用率。 1 4 本文的安排 本文第二章综述信息检索理论,并对基于i n t e r a c t 的信息检索系统的开发技 术进行分析与讨论。第三章阐述本系统的分析与设计,主要包括系统的需求分析、 系统目标、系统结构、系统网络设计、数据库设计、系统安全设计和应用开发工 具的选择。第四章讨论本系统的实现,在前几章的基础上,建立并实现了本系统, 并重点阐述若干功能的实现,包括基于词表的扩展检索、关联检索等检索方法以 及智能分析的实现。最后,第五章对本论文的工作进行总结与评价,并对系统的 进一步研究工作进行了展望。 参考文献 1 1 李精锐查新咨询与中医药科研立题和成果报奖( 二) 科技情报开发与济, 1 9 9 9 ,9 ( 2 ) :2 6 - 2 7 2 1c j v a l lr i j s b e r g e n i n f o r m a t i o n r e t r i e v a l l o n d o n :b u t t e r w o r t h s ,1 9 7 9 【3 丁蔚,倪波等情报检索的发展一情报学世纪回眸之一情报科学,2 0 0 1 , 1 9 ( 1 ) :8 l - 8 6 【4 】贾同兴人工智能与情报检索北京图书馆出版社,1 9 9 7 【5 】赖茂生等计算机情报检索北京大学出版社,1 9 9 3 6 j a m e s p c a l l a n ,w :b r u c ec r o f t ,t h ei n q u e r yr e t r i e v a ls y s t e m , 8 塑壁堡圭堂堡堡壅 h t t p :c i t e s e e r n j n e c c o m r d 0 h t t p 3 a 2 f 2 f c i i r c s u m a s s e d u i n f o p s n i e s , r p u b s c a l l a n c r o f t d e x a 9 2 p s g z 【7 】宁玲,马军z n t e m e t 侣g , 息检索分析与研究现代图书情报技术,2 0 0 1 ,( 1 ) : 3 7 4 0 【8 】张琳w w w 上基于概念的智能搜索上海海运学院学报,2 0 0 0 ,2 1 ( 4 ) : 8 - 1 2 3 【9 】刘树勋,李卫华i n t e m e t 网上智能检索a g e n t 的实现方法计算机系统应用, 1 9 9 9 ,( 1 0 ) :2 0 - 2 3 【10 j 徐振宁,张维明等基于o n t o l o g y 的智能信息检索计算机科学,2 0 0 1 ,2 8 ( 6 ) : 2 1 2 6 ,4 4 1 1 c a b d ,g i a c o m o ;l e o n a r d i ,l e t i z i a a g e n t sf o ri n f o r m a t i , d nr e t r i e , a l :i s s u e 8o f m o b i l i t ya n dc o o r d i n a t i o nj o u r n a lo f s y s t e m sa r c h i t e c t u r ev o l u m e :4 6 ,i s s u e :15 d e c e m b e r3 1 ,2 0 0 0 ,p p 1 4 1 9 - 1 4 3 3 1 2 t u , h s i e h c h a n g ;h s i a n g ,j i e h , a na r c h i t e c t u r ea n d c a t e g o r yk n o w l e d g ef o ri n t e l l i g e n ti n f o r m a t i o nr e t r i e v a la g e n t s d e c i s i o ns u p p o r t s y s t e m sv o l u m e :2 8 ,i s s u e :3 ,m a y , 2 0 0 0 ,p p 2 5 5 一- 2 6 8 【13 1h t t p :l l w w w c i n t c m a c c n l a n m ua c a b o u t h t m 9 浙江大学硕士学位论文 第二章信息检索的基本理论与技术 本章首先综述信息检索的基本理论,然后对基于i n t e m e t 的信息检索系统的 开发技术,包括c g i 、a s p 、p h p 等,进行讨论分析。 2 1 信息检索 2 1 1 信息检索的概念 信息检索( i n f o r m a t i o nr e t r i e v a l ) 有广义和狭义上的理解之分。广义上的信息 检索是指信息的描述、加工与有序化、建立数据库和从数据库中查询所需的信息, 包括文档存贮和检索两个过程。而狭义上的信息检索仅指后者即从信息存贮库检 出所需信息的过程。计算机信息检索就是利用计算机来进行信息的存贮的过程。 广义上讲,凡是用计算机来查询特定的问题都可以说是计算机信息检索。信息检 索已成为人们获取信息的一种重要手段。 2 1 2 信息检索系统的概念 信息检索系统是指为满足信息用户的需求而建立的,存储经过整理的信息集 合,拥有一定存储、检索与传送技术设备,并提供一定的存储与检索方法及检索 服务功能的工作系统。简而言之,信息检索系统即信息存储和检索的系统。 信息检索系统的逻辑构成通常由信息采集子系统、标弓l 子系统、建库子系统、 匹配子系统、用户接口子系统组成。信息检索系统的物理构成通常由分为硬件部 分、软件部分和数据库等,其中数据库可分为文献数据库和非文献数据库两大类。 信息检索系统的类型很多,根据不同的划分标准,有以下几种划分: 1 1 按处理功能来划分 文献检索系统:文献检索对象主要是有关文献资料的信息。把文献的标题、 文摘、作者、主题词等内容存贮于计算机上,并组成一定结构的数据库,用户通 过查询,可以得到所需的文献信息。 数值检索系统:在这类检索系统中,存贮的信息是数值数据和一些由符号组 成的代码。 事实检索系统:系统数据库中存贮的数据一般是用来描述人物、机构、事物 1 0 浙江大学硕士学位论文 第二章信息检索的基本理论与技术 本章首先综述信息检索的基本理论,然后对基于i n t e m e t 的信息检索系统的 开发技术,包括c g i 、a s p 、p h p 等,进行讨论分析。 2 1 信息检索 2 1 1 信息检索的概念 信息检索( i n f o r m a t i o nr e t r i e v a l ) 有广义和狭义上的理解之分。广义上的信息 检索是指信息的描述、加工与有序化、建立数据库和从数据库中查询所需的信息, 包括文档存贮和检索两个过程。而狭义上的信息检索仅指后者即从信息存贮库检 出所需信息的过程。计算机信息检索就是利用计算机来进行信息的存贮的过程。 广义上讲,凡是用计算机来查询特定的问题都可以说是计算机信息检索。信息检 索已成为人们获取信息的一种重要手段。 2 1 2 信息检索系统的概念 信息检索系统是指为满足信息用户的需求而建立的,存储经过整理的信息集 合,拥有一定存储、检索与传送技术设备,并提供一定的存储与检索方法及检索 服务功能的工作系统。简而言之,信息检索系统即信息存储和检索的系统。 信息检索系统的逻辑构成通常由信息采集子系统、标弓l 子系统、建库子系统、 匹配子系统、用户接口子系统组成。信息检索系统的物理构成通常由分为硬件部 分、软件部分和数据库等,其中数据库可分为文献数据库和非文献数据库两大类。 信息检索系统的类型很多,根据不同的划分标准,有以下几种划分: 1 1 按处理功能来划分 文献检索系统:文献检索对象主要是有关文献资料的信息。把文献的标题、 文摘、作者、主题词等内容存贮于计算机上,并组成一定结构的数据库,用户通 过查询,可以得到所需的文献信息。 数值检索系统:在这类检索系统中,存贮的信息是数值数据和一些由符号组 成的代码。 事实检索系统:系统数据库中存贮的数据一般是用来描述人物、机构、事物 1 0 浙江大学硕士学位论文 等非文献信息源的情况、现象、特征等方面的事实性信息。 多媒体检索系统:系统数据库把文字、数值、声音、图像等性质不同的信息 存贮于不同媒体上进行一体化处理和管理。 2 ) 按工作方式来分:脱机检索系统,联机检索系统,光盘检索系统,网络 检索系统等。 2 1 3 检索系统的评价 检索系统的质量影响着检索系统的使用效果,一般来说,可以从以下几个指 标来对检索系统进行评价:收录范围,查全率,查准率,响应时间,用户负担。 检索系统信息收录的范围在很大程度上决定了检索结果是否满足用户的需 求。所谓查全率,是指系统在进行某一检索时,检索出的相关文献时与系统文献 库中的相关文献总量之比率。查准率是指系统在进行某一检索时,检索出的相关 文献量与检索出的文献总量之比率。影响查全率的因素很多,例如库的大小、标 引的质量、用户提问的表达质量等。为了提高标引质量,可以采取多加标引、使 用各种辅助表、进行加权等措施。为了提高用户的提问质量,可以使用加权、进 行相关反馈等方法。与查全率和查准率相对应的是漏检率和误检率。漏检是影响 检索质量的主要因素,误检是影响检索效果的主要因素。查全率一般控制在 6 0 7 0 ,查准率控制在4 0 5 0 是较好的检索结果。查全率和查准率是目前人 们最常用的评价指标。 国际上的t r e cc o n f e r e n e e ( h t t 6 p :t r e e n i s t g o v ) 是由美国国家标准和技术协 会( t h en a t i o n a li n s t i t u t eo f s t a n d a r d sa n d t e c h n o l o g y ) 和国防部高级研究计划署( t h e d e f e n s ea d v a n c e dr e s e a r c h p r o j e c t sa g e n c y ) 联合举办,被认为是最具权威的信息 检索技术评测规范。 2 1 4 检索模型 在文献检索系统中,系统的关键是用户提问与文献库中的文本匹配的过程。 目前主要有以下几种数学模型来建立这一过程【l 】。 1 ) 布尔检索模型 布尔检索模型采用布尔代数的方法,用布尔表达式表示用户的提问,通过对 浙江大学硕士学位论文 等非文献信息源的情况、现象、特征等方面的事实性信息。 多媒体检索系统:系统数据库把文字、数值、声音、图像等性质不同的信息 存贮于不同媒体上进行一体化处理和管理。 2 ) 按工作方式来分:脱机检索系统,联机检索系统,光盘检索系统,网络 检索系统等。 2 1 3 检索系统的评价 检索系统的质量影响着检索系统的使用效果,一般来说,可以从以下几个指 标来对检索系统进行评价:收录范围,查全率,查准率,响应时间,用户负担。 检索系统信息收录的范围在很大程度上决定了检索结果是否满足用户的需 求。所谓查全率,是指系统在进行某一检索时,检索出的相关文献时与系统文献 库中的相关文献总量之比率。查准率是指系统在进行某一检索时,检索出的相关 文献量与检索出的文献总量之比率。影响查全
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版事业单位代理记账及财务合规审核合同
- 2025版智能化外墙装饰工程合同范本下载
- 2025版建筑工程施工图纸设计与承包合同
- 2025年仓储转租与仓储设备租赁及维护协议
- 2025版京东平台品牌授权代理合作协议
- 2025年企业园区场地租赁及配套设施服务合同汇编
- 2025电梯紧急救援服务合同
- 医药电商行业合规管理前沿2025:运营模式与风险防控报告
- 2025年旅游行业导游培训服务合同
- 2025房地产项目预售许可证办理服务合同
- 推广服务合同范例
- 《分红保险的魅力》课件
- 住建局条文解读新规JGJT46-2024《施工现场临时用电安全技术标准》
- 叉车装卸货合同范例
- 电力设备运行与维护管理手册
- 工程审计课程设计
- 附件2:慢病管理中心评审实施细则2024年修订版
- 食品安全制度管理目录
- (正式版)SH∕T 3548-2024 石油化工涂料防腐蚀工程施工及验收规范
- 医院科研诚信课件
- 小学校园安全知识
评论
0/150
提交评论