主观性语义特征及其在机器翻译中的应用.pdf_第1页
主观性语义特征及其在机器翻译中的应用.pdf_第2页
主观性语义特征及其在机器翻译中的应用.pdf_第3页
主观性语义特征及其在机器翻译中的应用.pdf_第4页
主观性语义特征及其在机器翻译中的应用.pdf_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主观性语义特征及其在机器翻译中的应用幸 张霄军 陕西师范大学外国语学院西安7 1 0 0 6 2 E m a i l A n d y z x j 1 2 6 c a m 摘要 本文分析和比较了主观量 主观性和主观化三个主观范畴的概念 认为主观性语义特征普遍存在于 语言系统的各个层面 包括实词 进而区分了主观性语义特征和主观性命题特征 改进了F i l l m o r e 所提出 的句子语义模式 认为 情态 与 命题 密不可分 主观性语义特征是针对指称对象的情态 主观性命 题特征是针对命题的情态 主观性语义特征的提取和主观性语义特征组合模式的总结有助于自然语言理解 与处理 在词语搭配获取和机器翻译的词义消歧方面已经初步显示出其优越性和解释力 关键字 主现j 生 主观性语义特征 主观性命题特征 情态 搭配获取 词义消歧 S u b j e c t i v eS e m a n t i cF e a t u r e sa n dM T Z h a n gX i a o j u n F o r e i g nL a n g u a g e sS c h o o lo fS h a a n x in o r m a lU n i v e r s i t y X i a n7 10 0 6 2 C h i n a E m a i l A n d y z x j 12 6 c a m A b s t r a c t T h i sp a p e ra n a l y z e sa n dc o n t r a s t st h r e ec o n c e p t s s u b j e c t i v eq u a n t i f i e r s u b j e c t i v i t ya n d s u b e c t i v i l i z a t i o n c o n c l u d e st h a tt h es u b j e c t i v es e m a n t i cf e a t u r e se x 括ti na l l t h el i n g u i s t i cl e v e l sb e s i d e sh a m i n a l T h e ni td i s t i n g u 括h e st w ot e r m sa ss u b j e c t i v es e m a n t i c f e a t u r e sa n ds u b j e c t i v ep r o p o s i t i o n a l f e a t u r e st oi m p r o v eC J F i l l m o r e ss e n t e n c e s e m a n t i cm o d e l T h eH e wm o d e lr e g a r d st h a tt h em o d a l i t ya n d p r o p o s i t i o no f as e n t e n c e s f u s e db u tt h ef o r r H e rc a nb ed i v i d e di n t os u b j e c t i v es e m a n t i cf e a t u r e s w h i c hi sf o c u s e do nr e f e r e n t a n dS U b j e c t i v e p r o p o s i t i o n a l f e a t u r e s w h i c hi s f o c u s e do np r o p o s i t i o n T h ee x t r a c t i o no f s s Fa n ds s F c o m b i n a t i o nm o d e I sp l a y s a ni m p o r t a n tr o l ei nn a t u r a ll a n g u a g eu n d e r s t a n d i n ga n dp r o c e s s i n gs u c ha sc o l l o c a t i o na c q u i s i t i o na n d w o r d s e n s e d i s a m b i g u t yi nm a c h i n et r a n s l a t i o n K e y w o r d s s u b j e c t i v i 移 s u b j e c t i v es e m a n t i c f e a t u r e s s u b j e c t i v ep r o p o s i t i o n a l f e a t u r e s m o d a l i t y c o l l o c a t i o na c q u i s i t i o n w o r d s e n s e d i s a m b i g u t y 1 主观量 主观性和主观化 主观量 是客观世界的量范畴在语言中的一种表现 是一种含有说话人主观评价的 量 陈小荷 1 9 9 4 1 8 2 4 主观性 是指在话语中多多少少总是含有说话人 自我 的 表现成分 也就是说 说话人在说出一段话的同时表明自己对这段话的立场 态度和感情 从而在话语中留下自我的印记 L y o n s 1 9 7 7 主观化 是指语言为表现主观性而采用相 应的结构形式或经历相应的演变过程 沈家煊 2 0 0 1 2 6 8 陈小荷 1 9 9 4 1 8 具体分析了 就 才 和 都 等副词表达主观量的情况 如 在下例中 例句1 三天 例句2 都三天了 例句3 才三天 副词 都 和 才 分别表达了说话者对 三天 这个量的大小的态度 包含了说话 人的主观评价 因此 可以认为在量范畴中 副词 就 才 都 等是主观量 此外 王弘字 1 9 9 6 7 4 8 0 考察了 仅 就 的主观量问题 李宇明 1 9 9 7 3 7 则将数量 本文得到国家社会科学基金项目 汉语词语搭配和语义特征分析的相互关系研究 0 7 B Y Y 0 5 0 和陕西 师范大学校级重点项目资助 写作过程中曾多次和李斌博士讨论 受益匪浅 一并致谢 2 3 l 结构中的主观量做了分类 由此可见 主观量目前集中在量范畴内研究其构成格式 人们早就已经注意到语言的 主观性 问题 但由于长期以来受结构语言学和形式语 言学等 科学主义 的影响 主观性直到上世纪9 0 年代才随着认知语法等 人文主义 的 复苏而重新进入研究者的视野 E d w a r dF i n e g a n 1 9 9 5 1 1 5 认为 主观性 主要体现在 以下三个方面 1 说话人的视角 p e r s p e c t i v e 2 说话人的情感 a f f e c t 和3 说话人 的认识 e p i s t e m i cm o d a l i t y 视角 就是说话入对客观情状的观察角度 或是对客观情状加以叙说的出发点 一般 这种 视角 主观性是以隐晦的方式在语句中体现的 如以 体 的形式 完成体的主观 性就高于非完成体 比较句a J o h ni sg o n e 和句b J o h nh a sg o n e 可以得知 旬a 只是客观 地报道过去发生的一个动作及其结果 而句b 还涉及说话人的视角 说话人主观上认为这 个动作及其结果跟 现在 有关系 比如说 约翰走了 所以他帮不上忙了 情感 包括感情 情绪 意向 态度等等 E O c h e s 然后 详细地阐述了分析器 生成器的实现机制 介绍了系统的知识体系结构 分析了英汉翻译系统的 泛 特性 即规则解释器的通用 性 知识处理的 泛 特性 最后探讨了 泛 语言处理机制的基本思想 语言描述策略 提出 泛 语言处理机制的黑板控制体系结构 8 会议论文 王博 蒋宏飞 梁华参 张春越 孙加东 赵铁军 刘树杰 马永亮 王欣欣 CWMT2008机器翻译评测技术报告 2008 本文对哈尔滨工业大学机器智能与翻译实验室向CWMT2008所提交的机器翻译系统及译文融合系统进行了介绍 其中包括3个机器翻译系统和3个译文 融合系统 机器翻译主评系统为一个加入了句法信息的基于短语的统计机器翻译系统 第一对比系统为一个在训练阶段加入了词对齐优化过程的基于短语 的统计机器翻译系统 第二对比系统为前两个系统的句子级融合结果 译文融合主评系统为一个基于最小贝叶斯风险的句子级融合系统 第一时比系统为 一个基于多特征和机器学习方法的句子级融合系统 第二对比系统为一个基于最小风险的词汇级与句子级混合的融合系统 本文对以上6个系统的技术内 容进行了详细介绍 并通过实验验证了系统的性能 9 学位论文 罗雪兵 汉语组块识别的研究 2007 随着自然语言处理中词法分析的R趋成熟 句法分析已经成为当前研究的重点和难点 组块识别的提出是为了降低完全句法分析的复杂性 通过采用 分而治之 的策略将句法分析分为组块识别和组块间关系分析 这样将词级的处理转换为组块级的处理 降低了句法分析的难度 本文的目的就是在 词法分析的基础上 完成汉语句子的组块识别 为完全句法分析和其他自然语言处理任务提供基础 论文阐述了组块识别的研究现状及研究意义 给出了本文研究的组块定义及组块分类 研究并实现了基于特殊隐马尔可夫模型 Hidden markov model HMM 支持向量机 Support vector machine SVM 以及条件随机域 Conditional random fields CRF 的组块识别系统 应用特征扩展和 voting组合法改善组块识别结果 文中给出了特殊HMM SVM CRF三种统计学习模型的识别效果 通过错误数据分析 发现特殊符号 并列关系以及较粗的词性会导致识别错误 并针 对这些问题提出了一个特征扩展方法 在此基础上 给出了一种基于标点符号分割段的voting法结合三种统计模型 进一步改善了组块的识别效果 实验表明 三种基本组块识别模型都取得了较好的结果 其中特殊HMM组块识别结果的F值为86 01 SVM组块识别结果的F值为90 89 CRF组块识 别结果的F值为91 08 从实验上验证了三种模型的有效性 在引入特征扩展特征和voting组合法后 组块识别结果的F值提高到91 39 本文的研究成果可应用于实际翻译系统中 达到简化句子结构 提高机器翻译系统整体性能的目的 另外还可进一步应用到信息检索 文本分类等 自然语言处理领域中 10 会议论文 孙广范 宋金平 万缨 许亮 肖健 第四届全国机器翻译研讨会CCID技术报告 2008 本文介绍了中国电子信

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论