基于新闻环境的人物肖像检索_第1页
基于新闻环境的人物肖像检索_第2页
基于新闻环境的人物肖像检索_第3页
基于新闻环境的人物肖像检索_第4页
基于新闻环境的人物肖像检索_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于新闻环境的人物肖像检索基于新闻环境的人物肖像检索http:/ 2.0 n如何提高阅读效率?如何提高阅读效率?n辅以图片等多媒体信息辅以图片等多媒体信息n图片在信息表示上的优势图片在信息表示上的优势n根据新闻的相关内容,向用户提供图片等多媒根据新闻的相关内容,向用户提供图片等多媒体信息,让用户迅速领悟新闻主旨,提高阅读体信息,让用户迅速领悟新闻主旨,提高阅读效率,增加阅读兴趣效率,增加阅读兴趣n本文希望从新闻主体人物出发,向用户提本文希望从新闻主体人物出发,向用户提供人物肖像,达到更好的人机交互的目的供人物肖像,达到更好的人机交互的目的相关工作相关工作n图像搜索引擎ngoogle, msn,

2、yahoo n基于内容:webseekn本场合不适用ndiogenes n检索一些名人的肖像n本身有一个图片库n家庭影集人物关联系统n根据标注好的样例,检测对应的人物相关工作相关工作nportrait (cmu)ne-mail 阅读n搜寻主页,得到相关图片,检测图像本文工作本文工作n完全根据新闻本身检索新闻人物肖像n不限于少数名人n没有数据库n没有供学习的样例n没有直接的人物所属机构,主页,邮件信息n充分利用现有搜索资源系统描述系统描述系统步骤框图系统步骤框图人名及关键字提取人名及关键字提取n命名实体识别类别:n实体名,包括人名、地名、机构名;n时间表达式,包括日期、时间和持续时间n数字表达式

3、,包括钱、度量衡、百分比n识别方法n隐马尔可夫模型(hmm)n最大熵(me)n条件随机场(crf)n统计与规则相结合d m bikel, r l schwartz, r m weischedel. an algorithm that learns whats in a namej. machine learning, 1999, 34(13): 211231. 新闻内容的重要性新闻内容的重要性n由于新闻人物与事件的紧密联系,事件的内容是检索人物肖像的重要环境参数n重名问题n检索结果不相关问题n新闻内容表示n词频统计 tf-idfn 单个词ti 在文档di 中的个数n 单个词ti 在所有文档d

4、中的个数nn 文档总数( , )in t dlog(1( , )log(/ ( ,)idiiwn t dn n t d( ,)in t dn图片检索n将提取出的人名提交给搜索引擎n抓取前十页的网页和图片n剔除坏的网页,图片n去除网页标记,提取正文主题内容匹配主题内容匹配n相关度计算n基于改进的vsm的方法n综合考虑内容和命名实体n文档表示n线性组合1212(,)ddkdddndduuuwww ,docne keywords,112222,1111()()(,)(1)tti mi ni mj niimntttti mi ni mi niiiiwwuusim ddwwuu获取肖像获取肖像n肖像检测

5、n内容相关性比较后,很多图片并非人物肖像n人脸检测n基于神经网络的人脸检测方法特征特征简化参数简化参数个数 n分为1个,2个和2个以上三种位置 p分为图片中心占50面积的方形区域内和区域外两种比例 r分为0,1/4,(1/4-2/4,(2/4-3/4,3/4以上四种颜色 c灰度和彩色获取肖像获取肖像n实际中只考虑个数,比例n只含有一个人脸n人脸区域占图像比例大于一定的阈值reference:neural network-based face detection, by henry a. rowley, shumeet baluja, and takeo kanade. ieee transac

6、tions on pattern analysis and machine intelligence, volume 20, number 1, pages 23-38, january 1998. /nnfacedetector/实验实验n新闻源rss种子来源平均每日提供新闻yahoo!entertainment13bbc sport15bbc entertainment11sina english20cnn sports15cnn world12n取100条新闻n包含人名432个n取内容相关前20位的条目n人脸检测top5的图片n结果评价n对最后检

7、测的top5的图片,主观判断是/不是人物肖像,再对所有结果求和平均n结果n新闻内容检测有效过滤不相关图片n肖像检测有效获取人物肖像相关实验结果相关实验结果具体应用具体应用reference:t wang, n yu, z li,et al. nreader: reading news quickly, deeply and vividlya. sigchi 06 extended abstracts on human factors in computing systemsc. qubec, canada: acm press, 2006,13851390. 总结总结n根据新闻本身,检索新闻人物主体的肖像图片,使新闻阅读生动具体,为新闻阅读提供了新思路n综合利用了n现有搜索引擎技术n文档相关性比较n人脸检测n避免了一般系统的不足问题问题n每一步都有误差n命名实体抽取n新闻内容相关性n人脸检测ne.g 检索schmidt n如何综合考虑,达到较满

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论