




已阅读5页,还剩44页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
原创性声明所呈交的学位论文,是本人在导师的指导下,独立进行研究论文作者签名:学位论文版权使用授权说明 关键词:复述识别;电阻距离;拉普拉斯矩阵;混联电路 甌琻 ,瑂 , 瑃 吨M返挠镆逑嗨贫取 课题背景 篠级别 迅速,并且每年都会有优秀的论文发表,而且实验效果也越来越好,但是复述研究 本文研究的意义虺芃。依据目前的复述技术,机器翻译系统的性能可以利用复述技术进行多个方面的改进,复述能复述在信息抽取上述段落介绍了很多复述的重要研究领域,不过除此之外,复述技术还可以在信息检索虺艻,自动文摘和自然语言生成,简称等等很多领域中都当前国内外相关技术和甅緇 ,緇刻岢隽耸褂没诜聪蜃;晃姆为复述问题建模的方法从而进行基于句法信息的复述识别。,梅聪蜃;晃姆的模型,即使他只使用了反向转换文法的知识,并且只借助了句法上的相似就已经让自己的实验结果得到了一个很大的提升。析,从而来判断依存树中的两条路径是否有相似的语义。 出来,从而来构建复述句对。本文的主要研究内容起,权重的倒数即是两个词之间的电阻,由于其中同义词对应的节点之间不能合 本文的内容安排公式算出两个句子之间的电阻距离从而根据复述判别规则来判别这两个句子是否 第二章相关技术研究引言度,所以由此看来,复述识别的基础也就是词语之间的相似度。由此我们可以看出,概念计算的基础就是义原相似度的计算。赪的英语词语相似度计算普林斯顿大学的心理学家,语言学家以及计算机工程师在年共同设计了 :中所有的同义词;两个句子之间的意义相似度,如下公式。 尼脚,秐獯臹针撼鱿諻;的指标集,撼鱿謜。的指标集。我们可以利用如下的公式来计算词语相似度,如下公式。舕芈短瘐矢疽凰撇綽獁膕个数,獁膕个数。琓 有监督的训练方法在复述句识别中运用的很广泛。在文献【】的工作基础上,我腔赪的相似度特征。 主语范围否定时间蔷渥中的论元特征,蔷渥中的论元特征。瞧涞穆墼5某煞值南嗨贫龋浩湎嗨贫任颐强梢酝来计算。 磍尸从上面的论述中我们可以看出,在新闻背景下与普通背景下的语句复述是有一基于文本规范化的复述识别方法 表被动语态转换成主动语态,元文法的精度。举个例子,如下两个句子和:猼猠埘羗兰猤 朋印耍琓:而且,我们对于上述特征的计算完全基于文字标注的水平。举个例子,我们在聪蜃;晃姆为了能更好的理解文本反向转换文法,我们举一个例子。我们考虑如下的一对句子翻译的语法解析树。 渴莂专【】母怕剩驶愎嬖駻万夙,堋芑皌骉对于所有的瑂,瑄,沟胠琌啊 于混联电路的复述识别方法。本章的方法是基于和蠲堑姆椒右愿慕蚆的方法中同样也是生成两个句子的图,然后合并这两个图计算出每两个节点之间的电阻,然后把每个电阻相加除以总词数来得到电阻距离,这相当于是用串联的方式来计算电阻距离,最后应用在信息检索中。而本章的方法是通过混联电路的形式算出两个句子之间的电阻距离来判断这两个句子是否是复述句对。图籰描述了本章所要进行工作的系统流程图。 最主要的贡献之一就是他的论文论文的出现,后人撰写了更多先进的专业论文,比如虷】的图 颐前阉娜亍蘅闯墒俏锢硌械牡绲糃,其相应的电阻的电阻值为卮笥诘扔的两个节点之间的电阻值小于等于。在第谥薪樯芩玫搅礁鼍渥又涔叵低糋的过程中,两个同义词之间 霉厂矾辨甜 为中心,其中节点为谓语,节点为宾语。在和节点连接的上半部分中,和节觥馹琻所以我们可以得到此时电路的总电阻熹去,因为壶,所以。 琑,。大于模訵,因此我们可以得到盧调。所以 图电阻网络图转换为串联电路图的一般形式,所以我们一定可以得到如图5缏返牡缱鑂并计算公式如下公式。一琣一 图缱柰缤糋对应的混联电路图其中,毂硎玖礁鼍渥又涞幕炝5缏纷艿缱柚担琗表示两个句子合并之后的但是用这种方法计算出来的电阻距离并不是十分的精确,实验效果也没有达到如图兴荆柚敌诘扔牡缱柘嗟庇谄胀藕牛柚滴的电阻相当于噪声信号,所以我们还必须对电阻距离进行优化,优化公式如下公式。面 判别方法如下:实验与分析:獂 表不同阈值九时,正确率倩芈蔙和值,;,按照本章电阻距离的计算方法,可以得到第谥械睦中的电阻距离 所示。 第四章基于拉普拉斯矩阵混联电路的复述识别在上章介绍的工作中,我们使用电阻距离来判断两个句子之间是否是复述句以改进。 基于拉普拉斯矩阵混联电路的复述识别方法拉斯矩阵计算公式,如下公式。狝 图编号之后的图图是一个有向图,数字代表有向图的度。 果如下所示。 因此我们可以得到这两个句子之间的电阻距离,如第三章公式。但是用这种方法计算出来的电阻距离并不是十分的精确,实验效果也没有达到预期的标准。所以我们还必须对电阻距离进行优化,优化公式如下公式。 实验与分析图取不同阈值九时,其所对应的值的取值 种方法进行比较,同时我们也将会与第三章的方法作比较,为了表示简洁,我们把表实验结果对比从表可以看出,第三章方法的值为,而第四章方法的值比第值要高出,召回率要高出。综上所述,第四本章小结 了明显的提高,其正确率岣吡倩芈蔙提高了,值提高了。 第五章本文总结与未来工作展望本文总结很多方向都有很广泛的应用,复述的研究也很具有实际意义,越来越多的研究者开始涉猎复述领域。随着这些年对复述的研究越来越多,很多领域系统的性能得到了很大的提升,比如复述识别技术可以实时处理机器翻译中遇到的未登录短语;复述识别技术也能识别自动问答系统中多重问句形式从而提高系统性能;复述识别技术还能在多文档自动摘要系统中用于生成、压缩、相似句子识别等等。本文的主要内容是基于混联电路的复述识别方法研究,把物理学中电阻的知识融入进计算机的知识中,并且取得了不错的效果。 样例对,实验得到结果的正确率为倩芈饰,值为。通过相关的实验证明了该方法的有效性,该方法提高了复述识别的正确率和值,但是我们的方法和国内外领先的方法之间还是存在了一些差距,我们还是要不断继续深入研究下去,找到更好的方法从而来提高复述识别的正确率、召回率和值。提高复述识别的正确率。 】
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 离婚协议书范例:财产分割、子女抚养及情感补偿协议
- 金融行业特殊劳动关系风险控制专家聘用合同
- 离婚财产债务分割及子女生活支持协议书模板
- 环保材料研发中心租赁及环保设备转让全面协议
- 离婚协议书见证与共同债务处理合同
- 电子商务企业员工保密协议与客户数据保护合同样本
- 能源合同签订流程及新能源项目采购管理规范
- 石灰石矿山承包综合利用与环境保护合同
- 离婚协议签订时共同财产评估与分割合同
- 智能净水系统租赁与水质在线监测服务协议
- 2025年驾驶员安全培训考试试题库卷(答案+解析)
- 无人机培训课件
- 2025辽宁沈阳副食集团所属企业招聘3人考试参考题库及答案解析
- 储罐区的安全题库及答案解析
- 交大入党测试题及答案
- 培训如何开早会的课件
- 2025年河北沧州市中心医院、沧州博施康养集团公开招聘辅助岗工作人员113名考试参考试题及答案解析
- 消防员抗洪抢险知识培训课件
- 历年时事政治试题及答案
- 摄像基础培训课件
- 低钾血症课件
评论
0/150
提交评论