中文网页褒贬态度的机器评价.ppt_第1页
中文网页褒贬态度的机器评价.ppt_第2页
中文网页褒贬态度的机器评价.ppt_第3页
中文网页褒贬态度的机器评价.ppt_第4页
中文网页褒贬态度的机器评价.ppt_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文网页褒贬态度的机器评价,导师:俞士汶教授,孙斌副教授 硕士毕业生:苏玉梅 2004年5月 硕士学位论文答辩,中文网页褒贬态度的机器评价,引言 相关工作与工作基础 网页褒贬态度评价模块 实验结果及展望,引言,天网知名度系统 网页观察机器评价视角下看中文网页类型 项目延伸网页褒贬态度的机器评价 本实验的研究内容及意义,天网知名度系统,基础:天网搜索引擎,计算语言学技术 定位:用户定制查询,个性化网络检索服务 数据:75万中文网页,近300个名人实体,注册实体信息库,引言,天网知名度系统 网页观察机器评价视角下看中文网页类型 项目延伸网页褒贬态度的机器评价 本实验的研究内容及意义,网页观察机器评价视角下 看中文网页类型,强文字相关的信息类网页 例如:个人简历型网页 弱文字相关的事件或事物展开型网页 例如:事件报道,节目单,引言,天网知名度系统 网页观察机器评价视角下看中文网页类型 项目延伸网页褒贬态度的机器评价 本实验的研究内容及意义,项目延伸网页褒贬态度的机器评价,网页是传递信息的。 从效果上看,人们通过构建网页来传递信息,也可以进而表达态度和传递情感即,网页所包涵的褒贬态度信息。,网页褒贬评价关系分析图,引言,天网知名度系统 网页观察机器评价视角下看中文网页类型 项目延伸网页褒贬态度的机器评价 本实验的研究内容及意义,本实验的研究内容及意义 项目延续,符合天网知名度系统个性化网络服务的立意 可以利用已有的数据基础和实验平台 此项实验具有研究和实验展开的可延续性,本实验的研究内容及意义 语言基础,网络是重要的信息传播媒介。 现实网页中的褒贬态度表达往往含有明确的目标、动机和效果期望,因此构造者会很重视语言知识这个交流手段。 网页中的褒贬态度表达也就是一个典型的修辞行为,所以实验可以充分利用修辞学的理论成果,具有理论指导基础。,本实验的研究内容及意义 创新价值,从语言学角度看,修辞涉及语言的附加意义,这区别于概念意义。因而此项实验具有丰富创新性研究价值。,中文网页褒贬态度的机器评价,引言 相关工作与工作基础 网页褒贬态度评价模块 实验结果及展望,相关工作与工作基础,语言手段 评价规范及标准 资源准备 系统基础,实验考察,实验考察,语言手段,词语手段,句式手段,修辞手段,评价规范及标准,实验考察与实验资源的对应分布,相关工作与工作基础,语言手段 评价规范及标准 资源准备 系统基础,资源准备,基础褒贬义词典 典型网页文本搜集 领域补充褒贬义词集 褒贬评价模板搜集,基础褒贬义词典,常用褒贬义词语详解词典 静态褒义、贬义词语,包括双音词,成语,惯用语,以及少数谦辞、敬辞。每个词条包括三部分内容:褒贬色彩,词性,释义,例句等;提示,重叠形式,同义解析等;近义,反义等。 仅选取了每个条目中的两项信息,例如(诚挚 )和(草率 ),生成了褒贬评价系统使用的褒贬义电子词典。,典型网页文本搜集,典型网页文本示例,领域补充褒贬义词集样例,褒贬评价模板搜集样例,相关工作与工作基础,语言手段 评价规范及标准 资源准备 系统基础,天网知名度系统,天网知名度系统模块浏览,用户界面模块 用户注册 用户检索 指定文本内容的评价 主动推送服务 网页分析与索引模块 用户信息维护模块 网页相关度评价模块,中文网页褒贬态度的机器评价,引言 相关工作与工作基础 网页褒贬态度评价模块 实验结果及展望,网页褒贬态度评价模块,数据需求 设计思想 模块设计,数据需求,网页表示库,数据需求,实体信息库,设计思想,语言手段是基础 话题的实体有关性 针对领域标准的褒贬评价,注:网页褒贬评价流程图,褒贬结构要素,褒贬结构识别模板表达式,UAP UBP UCP UDP UAAPFP UACPGP UADPHP UP UPE C“和”|“与”|“,”|“、”|“且” P=WCW2,关键结构P,p结构是褒贬结构的基本组成部分 识别策略是:使得由链接词语链接在一起的词序列中不允许出现褒贬互逆,同时需要满足,仅当词语本身具有褒贬含义,或者W本身不在褒贬词典中但该序列中其他词语有褒贬含义,此时才形成合法的P,同时把未在褒贬词典中出现但出现在结构中的这个词语抽取出来,并依照此序列中的已有褒贬含义按照一致性原则猜测,把这个未登录词语纪录为未证褒贬词语。 注:考虑到褒贬评价的领域性,这里的未证褒贬词语也是根据领域来分别记录的。,中文网页褒贬态度的机器评价,引言 相关工作与工作基础 网页褒贬态度评价模块 实验结果及展望,实验结果及展望,成批网页褒贬评价结果浏览 7 指定内容褒贬评价浏览 7/test.htm,结果浏览示例实体,结果浏览示例实体,改进方向,更精细的褒贬评价模板(内容、层次) 转折结构及褒贬权重 更精确的褒贬冲突控制 褒贬评价的程度考虑 更精细的褒贬义词典构造,实验评价,修辞是有意识的行为,褒贬是有指向目标的态度,网络是当代生活的重要传媒手段。 天网知名度系统立足发展个性化网络服务,因此其系统基础和系统数据资源恰好为褒贬态度的机器评价提供了合适的实验和检验平台。 为合适的应用选择合适的处理方法,为合适的技术发现合适的应用领域,这种研究策略,在交叉领域是有效,更是饶有趣味的。,参考文献与资料,文献 1【英】杰弗里N利奇语义学上海外语教育出版社 2 史有为主编从语义信息到类型比较北京语言文化大学出版社 3 陈汝东对外汉语修辞学广西教育出版社 4 陈汝东认知修辞学广东教育出版社 5 王逢鑫英汉比较语义学外文出版社 6 亚里斯多德修辞学罗念生译,生活读书新知三连书店 1991年版 7 张志公 张志公语文教育论集

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论