基于新闻环境的人物肖像检索_第1页
基于新闻环境的人物肖像检索_第2页
基于新闻环境的人物肖像检索_第3页
基于新闻环境的人物肖像检索_第4页
基于新闻环境的人物肖像检索_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于新闻环境的人物肖像检索/sundae_meng主要内容背景介绍相关工作系统框架实验及应用总结一些问题背景介绍新闻数量急剧膨胀各种新闻网站(BBC,CNN)各种分类(体育,军事)各种RSS聚合各种范围(国家大事,地区新闻)Web2.0如何提高阅读效率?辅以图片等多媒体信息图片在信息表示上的优势根据新闻的相关内容,向用户提供图片等多媒体信息,让用户迅速领悟新闻主旨,提高阅读效率,增加阅读兴趣本文希望从新闻主体--人物出发,向用户提供人物肖像,达到更好的人机交互的目的相关工作图像搜索引擎Google,MSN,Yahoo基于内容:WebSeek本场合不适用Diogenes检索一些名人的肖像本身有一个图片库家庭影集人物关联系统根据标注好的样例,检测对应的人物相关工作Portrait(CMU)E-mail阅读搜寻主页,得到相关图片,检测图像本文工作完全根据新闻本身检索新闻人物肖像不限于少数名人没有数据库没有供学习的样例没有直接的人物所属机构,主页,邮件信息充分利用现有搜索资源系统描述系统步骤框图人名及关键字提取命名实体识别类别:实体名,包括人名、地名、机构名;时间表达式,包括日期、时间和持续时间数字表达式,包括钱、度量衡、百分比识别方法隐马尔可夫模型(HMM)最大熵(ME)条件随机场(CRF)统计与规则相结合D

MBikel,RLSchwartz,RMWeischedel.Analgorithmthatlearnswhat’sinaname[J].

MachineLearning,1999,34(1~3):211~231.

新闻内容的重要性由于新闻人物与事件的紧密联系,事件的内容是检索人物肖像的重要环境参数重名问题检索结果不相关问题新闻内容表示词频统计TF-IDF

单个词ti在文档di中的个数单个词ti在所有文档D

中的个数N文档总数图片检索将提取出的人名提交给搜索引擎抓取前十页的网页和图片剔除坏的网页,图片去除网页标记,提取正文主题内容匹配相关度计算基于改进的VSM的方法综合考虑内容和命名实体文档表示线性组合获取肖像肖像检测内容相关性比较后,很多图片并非人物肖像人脸检测基于神经网络的人脸检测方法特征简化参数个数N分为1个,2个和2个以上三种位置P分为图片中心占50面积的方形区域内和区域外两种比例R分为[0,1/4],(1/4-2/4],(2/4-3/4],3/4以上四种颜色C灰度和彩色获取肖像实际中只考虑个数,比例只含有一个人脸人脸区域占图像比例大于一定的阈值Reference:NeuralNetwork-BasedFaceDetection,byHenryA.Rowley,ShumeetBaluja,andTakeoKanade.IEEETransactionsonPatternAnalysisandMachineIntelligence,volume20,number1,pages23-38,January1998./NNFaceDetector/实验新闻源RSS种子来源平均每日提供新闻Yahoo!Entertainment13BBCSport15BBCEntertainment11SinaEnglish20CNNSports15CNNWorld12取100条新闻包含人名432个取内容相关前20位的条目人脸检测top5的图片结果评价对最后检测的top5的图片,主观判断是/不是人物肖像,再对所有结果求和平均结果新闻内容检测有效过滤不相关图片肖像检测有效获取人物肖像相关实验结果具体应用Reference:TWang,NYu,ZLi,etal.nReader:ReadingNewsQuickly,DeeplyandVividly[A].

SIGCHI'06extendedabstractsonHumanfactorsincomputingsystems[C].Québec,Canada:ACMPress,2006,1385~1390.

总结根据新闻本身,检索新闻人物主体的肖像图片,使新闻阅读生动具体,为新闻阅读提供了新思路综合利用了现有搜索引擎技术文档相关性比较人脸检测避免了一般系统的不足问题每一步都有误差命名实体抽取新闻内容相关性人脸检测e.g检索Schmidt如何

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论