




已阅读5页,还剩45页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
论文答辩委员会二蒸 广西师范大学硕士研究生学位论文基于本体的中文问答系统中问句的语义理解学科专业:计算机应用技术研究方向:人工智能就需要专业的查询语句。而用户输入的是自然语言的问句,需要在理解用户问句的基础上得到相应的查询语句。问句的理解与分析不仅是问答系统的第一步,其旬意分析的好坏更是直接影响到问答系统答案的优劣。从问答系统的处理流程来看,一般包括三个子系统:问题理解子系统、信息检索子系统和答案抽取子系统。问题理解子系统主要对用户输入的自然语言提问进行分析和分类,同时提取用户的提问意图,并以某种形式来表示该语义信息;信息检索子系统根据问题理解部分提供的结果进行检索,找到包含正确的知识表示或是找到可能包含答案的范围;答案抽取子系统的主要工作是对检索的结果进行过滤,并按照自然语言生成算法,将检索到的知识表示生成精确的问题答旬,而后将答案返回给用户。本论文在对问旬进行预处理后,对问句的句法分析树进行语义查询图的构造,目的是将自然语言问旬构造成为机器可以理解的查询语句,实现对本体知识库的查询。论文研究的主要内容: :甌 甀 甌,盩 广西师范大学硕士研究生学位论文目本体查询工具的使用 广西师范大学硕士研究生学位论文 广西师范大学硕士研究生学位论文为解决上述所讲的传统引擎的两个问题,促使很多研究人员参与对自然语言处理和语人们希望可以有一个用自然语言句子提问,直接返回答案的检索系统出现,而这正是自动问答系统。问答系统精准、简洁的特点也促进了自动问答系统进一步的研究。但由于中文自然语言的复杂性和处理技术的局限性,现在的问答系统大都是以领域问答系统为主。领域问答系统是针对特殊领域的问答系统。本实验组试图研究并实现一个基于本体的桂林旅游问答系统,系统致力于根据本体库中的知识回答某个地区的包含旅游景点、酒店、小整合了很多网上的资源,而要使用这些海量的数据,通常需要专业的查询语句,如 广西师范大学硕士研究生学位论文句,系统利用查询语句在本体库中查找。问答系统研究现状。很多机构和大公司纷纷加入到 广西师范大学硕士研究生学位论文、天涯问答等。法来从数据库中找到最贴切的答案。例如用户说:“问答式检索系统是提交用户问句,从本地文档集合或从网络中检索出相关文本或网页用户用自然语言表述的问题作为查询问旬,系统在问句理解的基础上返回较为精准的信 广西师范大学硕士研究生学位论文问答系统,能以较快的速度回答有关地理、历史、文化等方面的简单问题。问题:是年斯坦福大学开发的对句子结构进行语法分析的分析器,它可以支持英文句子和中文句子的分析,它的产生是对自然语言处理的重大突破。,该系统将结构化和半结构化的数据与自由格式文本分开处理,是较为成功的 广西师范大学硕研究生学位论文回的是一组候选答案集,并为答案集中每个答案赋予置信度。相对于国外的研究,国内在问句处理方面面临的中文处理难度更大、研究也相对更落捎肳等对关键词进行扩展。 广西师范大学硕士研究生学位论文这类处理方法避免了复杂的词法分析、句法分析,在分析句子前,先要对大量的语料库进行分析,总结出所有可能的句模,系统存储这些旬模,每一种旬模都对应着一种或者多种解释,建立旬模知识库。在用户问句理解阶段,会对用户问句进行逐一匹配,找到与用户问句相匹配的句模后,就可以比较容易地找到用户查询的焦点。句型模式匹配在系统中存储尽可能多的句型模板,输入问旬后与句模匹配。这种方法可以直接分析出用户的问句意图,从而得出相应的语用信息。对于特定领域模板匹配有其高效的好处,但对于开发领域中,模板匹配的方法需要系统中存储大量的句型模板,需要占用了大量的空间,而且句型模板也不可能包含所有的句型,对于匹配失效的问句的查准率不高,因此这种方法也具有一定的局限性。基于语义分析的方法通常的做法是利用句法分析树和知识库来启发式理解问句,也有方法,它是将问句划分为短语,并将短语映射到知识库中,构成短语三元组,接着利用候浞治龌侄逃铩癢”,“”,短语“”映射为“”或者是 广西师范大学硕士研究生学位论文 广西师范大学硕士研究生学位论文领域本体构建技术本体的建立是一件消耗大量人力、物力的事情,本文构建的领域本体采用现在最流行、下几种分词方法:最小 广西师范大学硕士研究生学位论文本文所采用的中科院分词器捎肗最短路径的分词策略,并用人民日报 广西师范大学硕士研究生学位论文通常情况下,由实体名词和专有名词而引发的分词错误是影响汉语分词系统性能的主要命名实体【】是指人名、地名、机构名等专有名词和时间、日期等数量短语。命名实体识信度。这类方法是识别中使用较早的一种方法,规则的编写通常由语言学专家完成。但花费的代价很高,当系统移植到新的领域时,通常需要修改规则甚至是重新归纳出新规则。 广西师范大学硕士研究生学位论文和数据驱动的分析方,其采用的是文法与依存冢渲蠥为非终结符号组成的有英语老师认真干活专印洗干净根据上述文法,判定句子是否合法,如句子:去买东西 广西师范大学硕士研究生学位论文 鬚判定句子“去买东西”为合法句子,并产生句子的句法树如下:豢推导出分析树的概率为所有使用规则概率的乘积,此模型基于以下三个基本假设:例如如下基于文法: 广西师范大学硕士研究生学位论文比较两者概率,结构一比结构二更合理。哪常用的块标记集如下表: 本体查询工具的使用下图为输出本体中类名、类与类之间的上下层关系。谴聁吖奸蕊。巍:琽:一縚量一置輎图读取本体中的类名 广西师范大学硕士研究生学位论文则将查询菁兴斜淞恐斜昵!癤”的资源。行时需要将查询语句写在一个为后缀的文件中,如:海痺畂在命令行中输入:上述畂为桂林旅游本体,作为的数据源,查询语句保存的位置为眃: 广西师范大学硕士研究生学位论文”:畃保躷”:此查询为在本体中查询所有类型为住宿类的实体,并按其价格的降序排序,运行结果如 广西师范大学硕士研究生学位论文本体的定义一般将本体形式化定义为一个七元组【】,珹琷,其中:正是因为有了概念间属性的不同,才使得概念间有差别,才有着不同的个体集合。早期的本体语言包扩、龋琌受这些语言的影响很大,具体发展 广西师范大学硕士研究生学位论文桂林旅游领域本体的构建并形式化成本体;图为桂林旅游本体中定义的概念“旅游景区”的层次关系;图为本体中构建概念间的关系定义; 广西师范大学硕士研究生学位论文鷂口傻瘛痚期纑獇嬷萜“坤;岫疆盟强翻嬲蜀盟翻蹑嗣幽蠢匿藩嗣蕊瞄翻豳龉世毋室化谴产每肚粹自然翱戈他遗产图桂林旅游本体概念层次图軻岫曼蔓圃赢甄磊燕量燕趸蕊虽:量受赢嚣二:二:二一二:憾璉:二辫辫骥掣然嬲蹦幽黻“口啡悖篽雌。辑;参弘睺鲰纭挢觥龊铡觥瘛鯫鰀稚辩接铷嚣瞳弼描站设椎啪删玪竹緉膋州带鼻宦化“单体协仳界然产皓莳词口讲匕厣杈雠人造区冀游盈俘州蚺街所擞虹:嚣,二: 广西师范大学硕士研究生学位论文概念间关系的表旅游本体属性关系糠 广西师范大学硕士研究生学位论文簉定义一个“酒店”类的实例,编码如下:簉”凸荨保痮: 广西师范大学硕士研究生学位论文预处理阶段预处理阶段是对用户输入的问句进行词法分析、句法分析,然后输出合理的句法分析畁琲:”:加入词性,个体词性均为名词:将这个词加入到用户字典中甴图加入词表后的分词系统界面注:词典的结构为:词词性纾汗阄魇洞笱 广西师范大学硕士研究生学位论文将问句分词的结果作为输入,用分析器进行句法分析。结果如下:。泠!避譬熏一曼塑童:【输出的结果分别为句法分析树和短语间的依存关系,句法分析树画成树形结构如下:表籌句法标记符合内容描述名词组合形式直接宾语主从关系状语 广西师范大学硕士研究生学位论文问句分类算法表问句类型特定个体人物、团体机构、人物列举、人物其他地址、景点方位、城市、地点其他数量、价格、距离、面积、号码、范围、数字其他交通工具、旅游景点、食物、娱乐、实体其他起源时间、发车时间、旅游佳期、交通时间、历史年代交通线路、方法、景点描述、其他描述未知檎椅示渲械囊晌蚀省紫热斯晌蚀时鞹和纾篢中包括“为什么”、 广西师范大学硕士研究生学位论文师范大学附近”的影响。其中俟,数学公式表示为:】、改进的构造查询语义图算法实体的多关系查询,搜索引擎得不到很好的结果。为此北京大学的许坤在文献【】中提出的查询语义图算法,能在一定程度上解决多实体关系的查询,其算法的主要思想是:第一步是将句法树中的名词短语调用名词性节点构造函数,动词短语调用动词节点分析函数,最后以动词节点构造关系连接代表主体的名词性节点与代表客体的名词性节点。引入的关系是从修饰性名词节点到被修饰性名词节点的边,如“桂林阳朔有什么景点”中的两个名词性节点是从修饰性节点“桂林”到“阳朔”。其中名词性节点分为命名实体和名词性变量。处理方法为建立命名实体表,主要包括人名形、地名、组织机构名,在词性标注时,分别用、表示,其余的非命名实体则为名词性变量,用表不。 广西师范大学硕士研究生学位论文图问旬“桂林十一期间有哪些景点免费”的语义图 广西师范大学硕士研究生学位论文一期间”为一名词性变量,在“桂林”和“十一期间”中引入一条从“十一期间”节点到如若例二的问句为“从桂林市到阳朔怎么走”,继续采用上述构造语义图的方法,其 广西师范大学硕士研究生学位论文图问句“从桂林市到阳朔怎么走”的语义图 广西师范大学硕士研究生学位论文法分析树及语义构造图如下图所示: 广西师范大学硕士研究生学位论文名词性节点构造函数构造一个节点入已构造节点集合中 广西师范大学硕士研究生学位论文景致光景风月风物风光景色山水 广西师范大学硕士研究生学位论文其中,口是一个可调参数,表示、相似度为时的得出:门票入场券昂贵腾贵高昂值钱贵米珠薪桂质次价高构造查询语句桂林阳朔有 二:广西师范大学硕士研究生学位论文桂林阳朔有桂林阳朔存在 广西师范大学硕士研究生学位论文本文的系统结构图本文对中文问句处理分为预处理阶段和语义查询阶段,系统总体的流程图如下:本论文在以前几章内容为基础,实现了一个简单的基于桂林旅游本体的问答平台来检 广西师范大学硕士研究生学位论文由于本体中没有“十一期间”这个概念,在查找“免费”这个概念时,本体中不存在,查找同义词林:免役免职免税免费免票免检免征本体中“价格”属性中存在“免票这个概念,于是将原来查询语句扩展为“免票景点”。查询问句的分类结果为交通线路,选取结果属性为交通线路的答案,得到如下答案:图问句“七星公园门票贵吗”查询问旬为: 而对于输入的问句为一个命名实体,这种情况下,答案返回的是所有这个命名实体有 广西师范大学硕士研究生学位论文实验结果分析其中为用户对答案满意的结果个数,表示问句总数。的效果还不佳。与文献【】对各类问题准确率的对比如下图: 广西师范大学硕士
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年公务员考试公共基础知识试题库带答案详解
- 2025年食品安全知识考试试题库及解析答案
- 2025年辽宁省鞍山市事业单位工勤技能考试题库及答案
- 2025年国家宪法日知识竞赛试题库(含答案)
- 2025年《基本医疗卫生与健康促进法》测考试练习题(附答案)
- 2025年基本公共卫生知识考试题及参考答案
- 2025年贵州省六盘水市社会工作者职业资格社会工作法规与政策真题含答案
- 2025年安全生产考试题库(消防安全设施维护)应急演练试题
- 易拉罐包装制作创新创业项目商业计划书
- 坚果废弃物利用创新创业项目商业计划书
- GB/T 45345-2025金属及其他无机覆盖层工程用直流磁控溅射银镀层镀层附着力的测量
- 无人机教员聘用协议书
- 药物非临床研究质量管理规范
- 脑科生理病理图谱解读
- 全国青少年科技辅导员专业水平认证笔试考题
- (行业)常用表面处理工艺详解(行业讲座教学培训课件)
- 《STEMI再灌注治疗策略》课件
- 配电网安健环设施标准
- 2025年物产中大集团股份有限公司招聘笔试参考题库含答案解析
- 家校合作下的学生心理问题预防与干预
- 2024年学校安全教育讲稿范文(2篇)
评论
0/150
提交评论