信息查询论文信息查询 关键词 语义依存 依存树 相似度 重排序.doc_第1页
信息查询论文信息查询 关键词 语义依存 依存树 相似度 重排序.doc_第2页
信息查询论文信息查询 关键词 语义依存 依存树 相似度 重排序.doc_第3页
信息查询论文信息查询 关键词 语义依存 依存树 相似度 重排序.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息查询论文:基于加权语法依存度的查询模型研究【中文摘要】中文信息处理技术在日常生活中有十分重要的地位,但其中的基于语义层面上的深层次相似度计算的进展却比较缓慢,目前关于汉语相似度计算的方法或多或少的存在不足,本文基于语义依存度计算对汉语句子相似度算法进行了研究。本文针对汉语句子相似度算法和信息检索的特点,对语义依存算法进行了改进,提出了一种基于加权语义依存的句子相似度算法,并将该算法应用于信息查询模型中,对查询结果进行重排序,取得了较好的效果。主要研究内容如下:改进语义依存相似度算法。通过深入分析基于语义依存相似度算法的特点,针对该算法判定句子有效搭配对权重存在不全面的问题,在判定句子有效搭配对的权重时加入了语义角色标注信息;针对该算法丢弃句子有效次关键词信息的问题,结合词形与词义相似度算法的特点,对语义依存进行加权。提出了基于加权的语义依存相似度的算法,实验结果表明该算法提高了句子相似度计算的准确性。改进算法的应用提出重排序算法。如何同时提高查询系统的查全率和查准率是信息查找领域的一个难题。针对该问题,用基于加权语义依存相似度算法对查询结果做重排序处理,通过计算原查询语句与查询结果的前K个文档标题的相似度,对查询结果重新排序,从而提高前K个返.【英文摘要】The technology about processing Chinese information is important in daily life. But the progressing of Chinese semantic similarity algorithms research was slow, which is very important status in Chinese information processing technology. And at present the methods about the Chinese semantic similarity algorithms has some disadvantages more or less. So the Chinese sentence similarity algorithms was explored and researched in this thesis. According to analyzing the characteristics of Chinese sentence similari.【关键词】信息查询 关键词 语义依存 依存树 相似度 重排序【英文关键词】Information inquiry Keywords Semantic interdependent Interdependence tree Similarity Start sorting【索购全文】联系Q1:138113721 Q2:139938848【目录】基于加权语法依存度的查询模型研究摘要2-3ABSTRACT3-4第1章 引言8-141.1 研究背景及目的8-91.2 国内外研究现状9-121.3 论文的主要工作及内容安排12-141.3.1 论文的主要工作12-131.3.2 论文的内容安排13-14第2章 相关理论与关键技术综述14-242.1 汉语的特点14-172.1.1 汉语理解的特殊问题14-152.1.2 相似度的概述15-172.2 句子相似度的概述172.3 句子相似度计算方法17-222.3.1 基于向量空间模型(VSM)的句子相似度计算17-182.3.2 基于词义距离的句子相似度计算18-192.3.3 基于语义依存的句子相似度算法192.3.4 词形与词序结合的方法19-212.3.5 基于关键词语义的句子相似度计算21-222.4 本章小结22-24第3章 基于加权语义依存的句子相似度计算24-483.1 基于语义依存的相似度计算24-313.1.1 依存语法的理论24-253.1.2 依存语法的基本原则25-273.1.3 依存语法的构建方法27-283.1.4 依存关系的建立28-303.1.5 相似度计算30-313.2 词形与词序结合的相似度计算31-333.2.1 词形相似度313.2.2 词序相似度31-323.2.3 句子相似度32-333.3 改进算法的任务333.4 改进算法的基本思想33-343.5 LTP 平台概述34-423.5.1 LTP 总体说明34-383.5.2 实验使用的LTP 接口说明38-403.5.3 使用平台进行句子分析40-423.6 基于加权的语义依存相似度计算42-473.6.1 语义相似度计算42-433.6.2 词形相似度计算433.6.3 句子相似度计算43-443.6.4 实现步骤44-473.7 本章小结47-48第4章 基于加权语义依存的句子相似度算法的应用48-594.1 算法应用的总体思想48-494.2 查询模型49-504.3 模型模块50-524.4 模块中的关键算法52-574.4.1 语义扩展52-534.4.2 统计扩展53-544.4.3 查询扩展范围的控制54-564.4.4 二次排序56-574.5 查询结果重排序57-584.5.1 查询模型数据库和查询结果的预处理574.5.2 查询结果的重排序57-584.6 本章小结58-59第5章 实验及实验结果59-665.1 实验平台595.2 基于语义的相似度算法59-615.2.1 实验数据59-605.2.2 实验结果及分析60-615.3 对比实验61-635.3.1 评价标准615.3.2 基于语义依存度的相似度计算615.3.3 词形和词序相结合的相似度计算61-625.3.4 实验结果及对比62-635.3.5 结果分析635.4 查询结果的重排序63-655.4.1 实验数据6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论