(英语语言文学专业论文)基于WordNet的英语隐喻自动处理研究.pdf_第1页
(英语语言文学专业论文)基于WordNet的英语隐喻自动处理研究.pdf_第2页
(英语语言文学专业论文)基于WordNet的英语隐喻自动处理研究.pdf_第3页
(英语语言文学专业论文)基于WordNet的英语隐喻自动处理研究.pdf_第4页
(英语语言文学专业论文)基于WordNet的英语隐喻自动处理研究.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(英语语言文学专业论文)基于WordNet的英语隐喻自动处理研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

福建师范人学许雅缘硕i :学位论文 福建师范大学学位论文使用授权声明 2 0 0 5 4 8 2 所呈交的论文( 基于w o r d n e t 的英语隐喻自动处理研究m e t a p h o rp r o c e s s i n g s y s t e mb a s e do nw o r d n e t ) 是我个人在导师指导下进行的研究工作及取得的 研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包 含其他人已经发表或撰写过的研究成果。本人了解福建师范大学有关保留、 使用学位论文的规定,即:学校有权保留送交的学位论文并允许论文被查阅 和借阅:学校可以公布论文的全部或部分内容;学校可以采用影印、缩印或 其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 学位论文作者签名悭指导教师签名 签名日期 诃富,6 、y 福建师范大学许雅缘硕士学位论文 摘要 作为自然语言理解最棘手的问题之一,隐喻逐渐引起了学者们的关注。当前的篇章处 理已经取得了较大的成就,但在准确性上仍然无法令人满意。句子是篇章的重要构成元素, 对句子的处理是篇章处理的关键。对于常规的句型处理,目前的篇章处理技术已经基本上 可以满足需求。然而,对篇章中的一些较为特殊的句子的理解,机器处理还存在较大问 题,隐喻句的处理就属于这一类。隐喻问题若不能得到较好的解决,篇章理解的准确度便 难以突破,一系列依赖于篇章理解准确度的技术比如自动文摘、机器翻译、信息检索等也 难以取得令人满意的进展。 、 本文致力于隐喻的自动处理研究:我们从认知角度对隐喻的定义、分类和识别进行探 讨,指出隐喻识别的主要标准冲突。接着,以w o r d n c t 这个在线词典数据库系统里的 各种语义知识和语义关系为基础,开发出一个处理“ai sb ”形式的英文隐喻自动处理系 统。该系统主要包括对语句的预处理和隐喻语句的自动判别。系统对语句先进行预处理, 包括分词和句法分析;并对主、表语进行知识搜索和语义计算( 语义相似度) ,进而判别是 否为隐喻。我们采用数据库管理系统的相关技术,使得隐喻理解处理时需要的知识可以很 方便的在其中搜索,提高系统对隐喻处理的效率。最后,我们分别从g o a t l y 创建的英语隐 喻语料库m e t a l u d e 和桂诗春创建的中国学习者英语语料库中选取大量隐喻和非隐喻的例 子,对系统进行测试和评估,证实了该系统的合理性和可行性。 关键词:隐喻计算化;w o r d n c t ;相似度;语料库 福建师范大学许雅缘硕士学位论文 a b s t r a c t m e t a p h o rh a sa l w a y sb e e nt h ef o c u so fr e s e a r c h s i n c eh 3 , k o f fa n dj o h n s o np u tf o r w a r dt h e c o n c e p t u a lm e t a p h o rt h e o r y ,m o r ea n dm o r ep e o p l eh a v ed e v o t e dt h e m s e l v e st om e t a p h o r s t u d i e sf r o mt h ep e r s p e c t i v eo fc o g n i t i v es c i e n c e m e t a p h o ri sn o wn ol o n g e rt a k e n 雒a d e v i a t i o nf r o mt h er e g u l a rl a n g u a g e ,w h i c hi sm e r e l yad e v i c eo ft h ef i g u r eo fs p e e c hf o r d e c o r a t i o n , b u ta sab a s i ch t l m a nt h i n k i n gw a yo rc o g n i t i v ep r o c e s s t h es c o p eo fm e t a p h o r s t u d i e sh a sb e e ng r e a t l ye x t e n d e d ,c o v e r i n gc o g r n t i o n , p s y c h o l o g y , p h i l o s o p h y , p r a g m a u c s , s e m i o t i c s ,a n da r t i f i c i a li n t e l l i g e n c e ,e t c n a t u r a ll a n g u a g ep r o c e s s i n g ,w h i c hi sab r a n c ho f a r t i f i c i a li n t e l l i g e n c e p l a y sa ni m p o r t a n tr o l en o w a d a y s g r e a ta c h i e v e m e n t sh a v eb e e nm a d e o nr e g u l a rs e n t e n c ep r o c e s s i n g ,b u to t h e rs e n t e n c e si n c l u d i n gm e t a p h o r i c a ls e n t e n c e sr e m a i na b o t t l e n e c kf o rn a t u r a ll a n g u a g ep r o c e s s i n g a u t o m a t i cp r o c e s s i n go fm e t a p h o r , w i l lp a v et h e w a yf o ra u t o m a t i cd i g e s t ,m a c h i n et r a n s l a t i o na n di n f o r m a t i o nr e t r i e v a l w be n d e a v o rt oc a r r yo u tar e s e a r c hi na u t o m a t i cp r o c e s s i n go fm e t a p h o r f i r s t l y , w ee x p l o r e t h em e t a p h o rt h e o r i e s ,i n c l u d i n gd e f i n i t i o n , c l a s s i f i c a t i o na n di d e n t i f i c a t :i o no fm e t a p h o r b a s e d o nw 6 r d n e t ,a l lo n - l i n el e x i c a lr e f e r e n c es y s t e m w et h e nd e s i g nam e t a p h o ra u t o m a t i c p r o c e s s i n gs y s t e mw h i c hd e a l sw i mt h ea sbp a t t e r n t h es y s t e mc o n s i s t so fs e n t e n c ep a r s i n g m o d u l e ,w b r ds e a r c h i n gm o d u l e ,d a t a b a s ea d m i n i s t r a t i o nm o d u l ea n ds i m i l a r i t yc a l c u l a t i n g m o d u l e i ta n a l y z e st h es e n t e n c e ,e x t r a c t st h es u b j e c ta n dp r e d i c a t e ,c a l c u l a t e st h e i rs i m i l a r i t y a n dj u d g e sw h e t h e rt h es e n t e n c ei sam e t a p h o r w ea d o p tj a v ad a t a b a s ec o n n e c t i v i t yt o a d m i n i s t r a t ed a t a b a s es ot h a tt h es y s t e mw i l lw o r km o r ee 伍c i e n t l y b o t hm e t a p h o r i c a la n dl i t e r a l e v i d e n c ei so f f e r e di nt h i s 也e s i st oe v a l u a t et h es y s t e m al a r g en u m b e ro fm e t a p h o r i c a l s e n t e n c e sa r ec o l l e c t e df r o mt h ee n g l i s hm e t a p h o rc o r p l 】s 一_ m e t a l u d e l i t e r a ls e n t e n c e sa r e m a i n l yc o l l e c t e d 丘0 mt h ec h i n e s el e a r n e re n g l i s hc o r p u s k e y w o r d s :c o m p u t a t i o n a lm e t a p h o r ;w o r d n e t ;s i m i l a r i t y :c o r p u s n 福建师范大学许雅缘硕士学位论文 中文文摘 对隐喻的研究可以追溯到古希腊的a r i s t o t l e ,他提出的对比论影响着修辞学领域的隐喻 研究长达两千多年。2 0 世纪3 0 年代以来,r i c h a r d s 和b l a c k 分别从修辞哲学和结构主义语 言学角度提出了隐喻的互动理论学说,把隐喻的研究推向了句子层面,指出隐喻的理解过程 涉及到本体概念和喻体概念之间的互动过程,为后续认知语言学派的隐喻研究打下了理论 基础。8 0 年代,l a k o f f 和j o h n s o n 从认知角度提出概念隐喻理论,逐步确立了隐喻在思维及 语言中的中心地位。之后,出现了隐喻理解的多种认知模型,如结构映射匹配理论、现代隐 喻理论、概念映射模型等。如今,隐喻已经成为众多学科如语义学、哲学、心理学、认 知科学等的研究对象,隐喻理论发展日趋成熟、完善。 自然语言理解是人工智能研究的重要课题,同时也是前沿的难题。在如今这个信息时 代,其重要性不言而喻。当前的篇章处理已经取得了较大的成就,但在准确性上仍然无法 令人满意。句子是篇章的重要构成元素,对句子的处理是篇章处理的关键。对于常规的句 型处理,目前的篇章处理技术已经基本上可以满足需求。然而,对篇章中的一些较为特 殊的句子的理解,机器处理还存在较大问题,隐喻句的处理就属于这一类。隐喻问题若不 能得到较好的解决,篇章理解的准确度便难以突破,一系列依赖于篇章理解准确度的技术 比如自动文摘、机器翻译、信息检索等也难以取得令人满意的进展。 隐喻自动处理也就是隐喻的计算研究,是在语言学隐喻理解的基础上,借助计算机建 立模型实现计算机对隐喻语句的自动处理。不论是语篇理解还是机器翻译都需要进行隐喻 理解的处理,而隐喻理解模型的构造需要一个扩展的知识库,其中包括数量巨大的概念和 关系。以前的研究要么没有涉及知识库的构建,只停留在理论上的模型构建;要么是手工 构建数据库,不仅工作繁琐,难以管理,同时出现很多问题,不适合广泛使用。我们选择 了w o r d n e t 这个在线词典数据库系统,它不仅含有丰富的词汇资源,而且按照语义关系组 织成一个语义网。本课题通过结合相关的隐喻理论基础,并利用w o r d n e t 这部语义词典中 提供的各种语义知识和语义关系,构建了英语隐喻自动处理模型,采用j a v a 语言将其付诸 实际。隐喻自动处理系统e s 主要包括对语句的预处理和隐喻语句的自动判别。该系统 对语句先进行预处理,包括分词、句子结构分析和句法分析:并对主、表语进行知识搜索 和语义计算( 语义相似度) ,进而判别是否为隐喻。我们采用数据库管理系统的相关技术, 使得隐喻理解处理时需要的知识可以很方便的在其中搜索,提高系统对隐喻处理的效率。 最后,我们分别从g o a t l y 创建的英语隐喻语料库m e t a l u d e 和桂诗春创建的中国学习者英 语语料库中选取大量隐喻和非隐喻的例子,对系统进行测试和评估,证实了该系统的合理 性和可行性。 本文的第一部分首先介绍了本课题的研究背景,回顾了l s 玉 o f j f 和j o h n s o n 的概念隐喻 理论:在隐喻的计算研究方面主要介绍了基于优先语义学方法的m e t 5 系统、基于实例方 法的m i d a s 系统和基于逻辑推理的结构映射引擎s m e 等。最后介绍了本课题的研究目标 及论文的框架结构。 在第二章中,我们从认知角度对隐喻理论进行深入的探讨和研究。首先,我们阐明了 隐喻的定义。接着,我们探讨了隐喻的分类问题。标准不同,隐喻的分类方法也不同。 i n d u r l d a y a 将隐喻分为常规隐喻,基于相似性的隐喻和创造相似性的隐喻。l a k o f fa n d j o h n s o n 将隐喻分为根隐喻和派生隐喻。本文采纳的则是他们的另外一种分类方法:结构 隐喻、方位隐喻和本体隐喻。最后,我们探讨隐喻的识别问题。我们的判断依据是冲突或 者说矛盾性( i n c o n g r u i t y ) ,束定芳称其为范畴错置。每一个隐喻至少涉及两个概念,把两 个本来属于不同范畴的概念通过某种句法手段并置或者等同起来( 比如a i sb ) ,往往构成 福建师范大学许雅缘硕士学位论文 一种语义上的冲突。这种冲突是我们识别隐喻的重要依据。当然,如果是一个不合理的句 子,a 和b 也可能产生冲突,但却不是隐喻,所以我们必须排除这种从句法来说没有错误 但却没有意义或者说不合理的句子。 第三章是方法论,我们介绍了w o r d n e t 的特点、词汇矩阵和语义关系。w o r d n e t 将词 汇分成名词、动词、形容词、副词和虚词五类,实际上目前忽略了英语中较小的虚词集。 w o r d n e t 3 0 版本中词汇量高达1 5 5 2 8 7 个。w o r d n e t 根据词义而不是词形来组织词汇信息。 名词在词典存储中是按主体的等级层次组织的,动词按各种搭配关系来组织,形容词和副 词以n 维超空间组织。w o r d n e t 的语义关系包括同义关系、反义关系、上下位关系和部分 关系。w o r d n e t 丰富的词汇资源和合理的语义关系为我们的系统开发提供了有利的条件。 第四章是本文的重点和主要创新之处,我们开发了自己的隐喻自动处理系统e m p s 。 我们首先介绍了开发系统时采用的主要关键技术,然后给出了系统的体系结构。英语隐喻 自动处理系统e m p s 主要包括语句预处理子系统,词义、词类检索子系统,数据库管理子 系统和词语相似度计算子系统。各个子系统的工作机制和实现功能如下: 1 ) 语句预处理子系统:本子系统首先对用户输入的句子进行句型分析,判断是否符合本 系统分析的句型结构( 型如:ai sb ) 。如果不符合则退出系统,并给出提示信息,让 用户重新输入符合句型结构的语句:如果符合本系统的句型结构,则对用户输入的句 子进行词法分析,并结合j a v a 语言的正则表达式功能分析句子,以提取句中的主语和 表语。 2 ) 词义、词类检索子系统:对第一步求得的主语和表语进行检索。首先在系统的本地数 据库中检索主语和表语的相关词义及词类。如果检索不成功,则通过网络访问w o r d n e t , 查询主语和表语对应的词义以及所属的词类,并将检索的结果添加到本地数据库中, 以备后用。 3 ) 数据库管理子系统:j a v a 语言提供了对数据库管理的支持。在系统的隐喻判别过程中 要不断地对数据库进行检索、更新、添加新记录等多种操作,本系统利用j a v a 语言强 大的数据库管理功能( j d b c ) ,对系统中使用到的数据库的几种基本操作进行封装,并 提供相应的调用接口以供系统中别的子系统进行方便调用。 4 ) 词语相似度计算子系统:利用第二步检索的结果,首先以词汇语义分类作为基础,抽 取出其中的同义词,然后采用基于向量空间的方法计算出相似度。最后根据求得的相 似度的值来判断旬中的主语和表语是否能构成隐喻。 在第五章中,我们对英语隐喻自动处理系统e m p s 进行测试和评估。我们分别从g o a t l y 创建的英语隐喻语料库m e t a l u d e 和桂诗春创建的中国学习者英语语料库中选取大量隐喻 和非隐喻的例子,对系统进行测试。斯坦哈特分析了5 种关于“是”的逻辑涵义。第一, 表达可数同一性的“是”;第二,作为分类谓述的“是 ;第三,理论还原的“是 :第四, 表示角色一位置的“是 ;第五,仿本对应( c o u n t e r p a r t c o r r e s p o n d e n c e ) 的“是。 我们的例子涵盖了以上五类。通过测试,我们发现e m p s 对隐喻旬的处理正确率为9 2 3 ( 例 子总数为1 1 7 ) ,而处理非隐喻句的正确率高达9 8 0 6 ( 例子总数为1 0 3 ) 。 第六章是本文的结论部分。我们首先对本文作出总结,然后指出本课题的研究价值, 列出本文的不足之处,并对进一步深入本课题的研究提出了建议。 福建师范大学许雅缘硕士学位论文 :s y n o d s i s s t u d i e so nm e t a p h o rc a t lb et r a c e db a c kt oa r i s t o t l e ,w h o s ec o m p a r i s o nt h e o r yh a s d o m i n a t e dm e t a p h o rs m d i e sf o rm o r et l l a n2 0 0 0y e a r s i n19 3 6 ,r i c h a r d sp u tf o r w a r dt h e i n t e r a c t i o nt h e o r yw h i c hw a sf u r t h e re x p l o r e db yb l a c k s i n c el k k o f fa n d j o h n s o np u b l i s h e d m e t a p h o r sw el i v eb y ( 19 8 0 ) ,m o r ea n dm o r ep e o p l eh a v ed e v o t e dt h e m s e l v e st om e t a p h o r s t u d i e sf r o mt h ep e r s p e c t i v eo fc o g n i t i v es c i e n c e ( e g g e n t n e r ss t r u c t u r em a p p i n gt h e o r y , l a k o f f st h ec o n t e m p o r a r yt h e o r yo fm e t a p h o r ,a h r e n s c o n c e p t u a lm a p p i n gm o d e le t c ) m e t a p h o ri sn o w n ol o n g e rt a k e na sad e v i a t i o nf r o mt h er e g u l a rl a n g u a g e ,w h i c hi sm e r e l ya d e v i c eo ft h ef i g u r eo fs p e e c hf o rd e c o r a t i o n , b u ta sab a s i ch u m a nt h i n k i n gw a yo rc o g n i t i v e p r o c e s s t h es c o p eo fm e t a p h o rs t u d i e sh a sb e e ng r e a t l ye x t e n d e d ,c o v e r i n gc o g n i t i o n , p s y c h o l o g y , p h i l o s o p h y , p r a g m a t i c s ,s e m i o t i c s ,a n da r t i f i c i a li n t e l l i g e n c ee t c n a t u r a ll a n g u a g e p r o c e s s i n g ,w h i c hi sab r a n c ho fa r t i f i c i a li n t e l l ig e n c e ,p l a y sa ni m p o r t a n tr o l en o w a d a y s g r e a t a c h i e v e m e n t sh a v eb e e nm a d eo nr e g u l a rs e n t e n c ep r o c e s s i n g ,b u to t h e rs e n t e n c e si n c l u d i n g m e t a p h o r i c a ls e n t e n c e sr e m a i nab o t t l e n e c kf o rn a t u r a ll a n g u a g ep r o c e s s i n g a u t o m a t i c p r o c e s s i n go fm e t a p h o r , w i l lp a v e 也ew a yf o ra u t o m a t i cd i g e s t , m a c h i n et r a n s l a t i o na n d i n f o r m a t i o nr e t r i e v a l a u t o m a t i cp r o c e s s i n go fm e t a p h o rm e a n st os t u d ym e t a p h o rb yc o m p u t a t i o n a la p p r o a c h t o p u ti tc l e a r l y , i tm e a n s t oc o n s t r u c tam o d e la n dl e tt h ec o m p u t e ra u t o m a t i c a l l yp r o c e s sm e t a p h o r i np r e v i o u ss t u d i e s m e t a p h o rc o m p r e h e n s i o nm o d e l sa r ec o n s t r u c t e dw i t had a t a b a s e m a n u a l l yc o n s t r u c t e d ,o re v e nw i t h o u tad a t a b a s et oa d m i n i s t r a t et h ei n f o r m a t i o n s o m e r e s e a r c h e r sc o n s t r u c tam o d e li nt h e o r yb u tt h e yd o n tm a k ep r o g r a m s s ow h e t h e ri tc a r lb e p r o c e s s e db yc o m p u t e ri ss t i l li nq u e s t i o n ad a t a b a s ec o n t a i n i n gp l e n t yo fc o n e e p t sa n dr e l a t i o i l s w i l lb eh e l p f u la n dp o w e r f u lw h e nw ec o n s t r u c tt h em o d e l w b r d n e t , a no n - l i n el e x i c a lr e f e r e n c e s y s t e m ,c o n t a i n sa1 a r g en u m b e ro fc o n e e p t sa n dr e a s o n a b l er e l a t i o n s w em a k en s eo ft h e r e s o u r c e sp r o v i d e db yw 6 r d n e tt oc o n s t r u c tam e t a p h o rp r o c e s s i n gm o d e lw h i c hd e a l sw i t h s e n t e n c e sl i k ea sb w ba d o p tk e yt e c h n o l o 留 e ss u c ha sj a v ad a t a b a s ec o n n e c t i v i t yt o a d m i n i s 仃a t ed a t a b a s es ot h a t 也es y s t e mw i l lw o r km o r ce f f i c i e n t l y t h ed a t a b a s ei sc o n s t r u c t e d a n da d m i n i s t r a t e di nat o t a l l ya u t o m a t i cw a y ko f f e rb o t hm e t a p h o r i c a la n dl i t e r a le x a m p l e st o e v a l u a t et h es y s t e m a1 a r g en u m b e ro fm e t a p h o r i c a ls e n t e n c e sa r ec o l l e c t e df r o mt h ee n g l i s h m e t a p h o rc o r p l 】s _ m e t a l u d e l i t e r a ls e n t e n c e sa r em a i n l yc o l l e c t e df r o mt h ec h i n e s el e a r n e r e n g l i s hc o r p u s t h et h e s i si sd i v i d e di n t os i xp a r t s i nc h a p t e ro n e t h eb a c k g r o u n di so f f e r e df o rt h ef o l l o w i n gr e s e a r c h w bf o c u so n c o m p u t a t i o n a la p p r o a c h e so nm e t a p h o rs t u d i e s w be x a m i n es e v e r a lc o m p u t a t i o n a lm o d e l ss u c h a sw i l k s m o d e lb a s e do np r e f e r e n c es e m a n t i c s ,f a s s m o d e lb a s e do nc o l l a t i v es e m a n t i c s , w e i n e r sm o d e lb a s e do ns e m a n t i cn e ta p p r o a c ha n dm a r t i n sm ) a se t c f i n a l l y , t h e o r g a n i z a t i o no f t h et h e s i si sp r o v i d e d ,a n dt h eo b j e c t so f t h es t u d ya r ep r e s e n t e da sw e l l i nc h a p t e rt l o w e , a n a l y z em e t a p h o rm a i n l yf r o mc o g n i t i v ep e r s p e c t i v e f i r s t l y , w e e x p l o r e t h ed e f i n i t i o no fm e t a p h o r w ed i s c n s sd e f i n i t i o n sb yl i n g u i s t ss u c ha sa r i s t o t l e r i c h a r d sa n d l a k o f f m e t a p h o r sc a nb ec l a s s i f i e di n t od i f f e r e n tc a t e g o r i e si na c c o r d a n c ew i t hd i f f e r e n tc r i t e r i a w ea d o p tl a k o f fa n dj o h n s o n sm e t h o da n dc l a s s i f ym e t a p h o r si n t os t r u c t u r a lm e t a p h o r s o r i e n t a t i o n a lm e t a p h o r s ,a n do n t o l o g i c a lm e t a p h o r s p e r s o n i f i c a t i o ni saf o r mo fo n t o l o g i c a l m e t a p h o r w 色d o n tt a k em e t o n y m ya so n ef o r mo f m e t a p h o r , b e c a u s ei nm e t a p h o r ,w ep r o j e c t p a r to ft h es o u r c ed o m a i no n t ot h et a r g e td o m a i n ;i nm e t o n y m y , t h ep r o j e c t i o nt a k e sp l a c ew i t h i n t h es a n l ed o m a i n m e t a p h o ri n v o l v e sam i s - c a t e g o r i z i n gb e t w e e nt h et o p i ca n dt h ev e h i c l e ,h e n c e as e n s eo fi n c o n g r u i t y t h e s ea c t 懿也ed e m a r c a t i n gl i n et os e p a r a t em e t a p h o r sf r o m n o n - m e t a p h o r i c a le x p r e s s i o n si nt h es a m ef o r m w ea d o p tt h es e n s eo fi n c o n g r u i t ya st h e c r i t e r i o nt oj u d g em e t a p h o r s c h a p t e rt h r e ei sd e v o t e dt ot h ed i s c u s s i o no f r 0 r d n e t b r d n e ti sa no n 1 i n el e x i c a l v 福建师范大学许雅缘硕士学位论文 r e f e r e n c es y s t e r nw h i c hi sc o n s i d e r e d 也em o s ti m p o r t a n tr e s o u r c ea v a i l a b l et or e s e a r c h e r si n c o m p u t a t i o n a ll i n g u i s t i c s ,t e x ta l l a l y s i s ,a n dm a n yr e l a t e da r e a s w r o r d n e td i v i d e st h e1 e x i c o n i n t of i v ec a t e g o r i e s :n o u n s ,v e r b s ,a d j e c t i v e s ,a d v e r b sa n df u n c t i o nw o r d s w ea l s od i s c u s st h e f e a t u r e sa n dt h el e x i c a lm a t r i xo fw o r d n e ti nt h i se h a d t e f i nc h a p t e rf o u l , w h i c hi st h em o s ti m p o r t a n ta n di n n o v a t i v ep a r to ft h et h e s i s ,w ec o n s t r u c t o u ro w nc o m p u t a t i o n a lm o d e la n dr e a l i z ei tw i t hj a v al a n g u a g e k e yt e c h n o l o g i e sa n d 血e a r c h i t e c t u r eo ft h es y s t e r na r ed e m o n s t r a t e d 。功ee n g l i s hm e t a p h o rp r o c e s s i n gs y s t e mi sm a i n l y c o m p o s e do ff o u rs u b s y s t e m s :s e n t e n c ep a r s i n gm o d u l e ,w o r ds e a r c h i n gm o d u l e ,d a t a b a s e a d m i n i s t r a t i o na n ds i m i l a r i t yc a l c u l a t i n gm o d u l e i nt h es e n t e n c ep a r s i n gm o d u l e ,t h eu s e ri sa s k e dt oi n p u tas e n t e n c ew i t ht h ep a t t e r no f a s b t h es y s t e mt h e na n a l y z e st h es e n t e n c ea n di u d g ew h e t h e ri ti st h ep a t t e r no fa sb s i n c et h e s y s t e md e a l sw i t ht h ea sbt y p e i ft h es e n t e n c ei n p u tb yt h eu s e ri sn o to ft h i sp a t t e r n , 也e s y s t e mw i l lr e m i n dt h eu s e ra n da s kt h eu s e rt oi n p u tas e n t e n c eo fa sbp a t t e r n i ft h es e n t e n c e p a t t e r nm e e t st h er e q u i r e m e n t ,t h es y s t e mw i l lf u r t h e ra n a l y z et h es e n t e n c e ( m o r p h o l o g i c a l a n a l y s i s ) w i t h 也eh e l po fr e g u l a re x p r e s s i o n so fj a v a , 也es y s t e mw i l lg e tb o t ht h es u b j e c ta n d t h ep r e d i c a t e a f t e rt h es y s t e mg o tt h es u b j e c ta n dt h ep r e d i c a t ei nt h es e n t e n c ep a r s i n gm o d u l e ,i tc o m e s t ot h ew b r ds e a r c h i n gm o d u l e i nt h i sm o d u l e t h es y s t e mw i l ls e a r c hi nt h el o c a ld a t a b a s e 也e s u b j e c ta n dt h ep r e d i c a t er e s p e c t i v e l y i fi tf a i l s i tw i l lv i s i tt h eh o m e p a g eo fw b r d n e ta n d s e a r c hi n f o r m a t i o na b o u tt h es u b je c ta n dt h ep r e d i c a t e t h ei n f o r m a t i o na b o u tt h ew o r df o r m , w o r dm e a n i n ga n dc a t e g o r yw i l lb es a v e di n t ot h ed a t a b a s e t h es y s t e mh a st oc o n s t a n t l yc a i t yo nm a n yk i n d so fo p e r a t i o ns u c ha ss e l e c t i n s e r t a n du p d a t ei nt h ep r o c e s so fi d e n t i f y i n gm e t a p h o r s j a v ad a t a b a s ec o n n e c t i v i t y ( j d b c ) ,t l l e c o r ep a r to ft h ej a v ap l a t f o t l n ,i sv e r yh e l p 如lf o rd a t a b a s ea d m i n i s t r a t i o n i ti sat e c h n o l o g yt h a t e n a b l e st h e a v ap r o g r a mt om a n i p u l a t et h ed a t ai n 也ed a t a b a s ec o n v e n i e n t l y w eu s et h e p o w e r f u ld b c t oe n c a p s u l a t eo p e r a t i o n so ft h ed a t a b a s e a c c o r d i n g l y , w eo f f e ri n t e r f a c eh e r e s ot h a to t h e rs u b s y s t e m sa r ea b l et ou s ei tc o n v e n i e n t l y t h ei n p u td a t ao fs i m i l a r i t yc a l c u l a t i n gm o d u l ei st h ei n f o r m a t i o ns e a r c h e db yp r e v i o u s m o d u l e b a s e do nt h ec a t e g o r i e so f 也es u b j e c ta n dt h ep r e d i c a t e t h es y s t e me x t r a c t st h es y n s e t s a n dc a l c u l a t e st h es i m

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论