新闻类视频结构化ppt课件.ppt

上传人：闯*** IP属地：广东上传时间：2020-01-03 格式：PPT 页数：64 大小：10.96MB 积分：25 举报 版权申诉

已阅读5页，还剩59页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

新闻类视频结构化 1 主要内容视频新闻内容分析现有新闻类分析系统 2 结构示意图 3 新闻类视频结构化可行性视频结构化应用最广泛也最成功的领域是新闻类视频新闻节目是一个连续数据流有新闻开始和新闻结束并且有时候在新闻中还有广告等内容不像其他视频节目的结构不是很明显新闻视频节目中具有明显的结构使结构化新闻视频数据不仅成为可能而且也易于判断结构化的结果是否正确 4 视频新闻内容分析时域结构新闻视频的时域结构它是新闻项的序列新闻项指先是主持人镜头然后是新闻报道最后是主持人镜头接着进行下一个新闻项 5 视频新闻内容分析目的新闻视频分析就是根据这些相对粗糙的类别将所有镜头进行归类从而组合场景目前新闻视频分析的目的就是把切分出来的镜头组合成一个个独立的新闻故事去除在新闻节目流中广告和天气预报等观众不感兴趣的数据流使人们可以单独去了解独立的新闻事件而不需要把整个时段的所有新闻节目都看下来 6 视频新闻内容分析步骤对视频新闻节目进行分析需要分成如下三步首先将新闻视频流分割成一个个的镜头单元然后根据事先定义的镜头模型将这些切分出来的各类镜头归类最后把分类后的镜头单元组合成独立的新闻故事 7 镜头切分任务分类镜头切分的任务就是检测镜头边缘把视频流分割成镜头单元镜头边缘有两大类型突变和渐变突变就是简单的镜头切换 cut 而渐变是具有某种特殊效果的逐渐过渡如fade dissolve和wipe 8 镜头分类在视频新闻中主要考虑两种镜头类型主持人镜头和新闻镜头可以根据主持人在画面上位置来进一步区分不同类型的主持人镜头一是包含一位主持人的镜头二是包含两位主持人的镜头新闻镜头就复杂很多没有固定的结构因此可认为那些不能确定为主持人模型的镜头就是新闻镜头镜头切分包含以下两步首先定义两类主持人镜头模型然后设计一种相似度衡量方法判断某个镜头是否为主持人镜头 9 主持人镜头模型定义当有一个主持人进行新闻报道时画面可以分成三个部分主持人人脸节目或电视台图标和背景画面主持人背景台标 10 4种常见的主持人模型区别的关键在于主持人数目和是否有图标 11 主持人新闻报道镜头识别主持人新闻报道镜头识别的任务从新闻视频中分割出得到的镜头中找出那些属于主持人新闻报道的镜头单元主持人新闻报道镜头的特征在主持人报道新闻主旨时主持人基本保持不动只是嘴头或者肩膀会有小许细微运动而背景和图标会完全静止主持人进行新闻报道时相邻图像帧之间的差别很小帧与帧之间的变化仅仅是由于主持人微小的身体运动以及随机噪音引起的所以主持人镜头中相邻两帧的平均差别小于新闻镜头中两帧之间的平均差别怎么检测主持人新闻报道镜头 12 主持人新闻报道镜头识别步骤先筛选出一些帧间运动变化差别小的镜头这样的镜头就是可能的主持人报道镜头然后将这些可能的主持人新闻报道镜头与前面定义的四类主持人报道模型进行匹配如果它们的空间结构基本一致则认为选择的镜头是主持人新闻报道镜头如果所选择的可能镜头与所定义的任何一种模型均不匹配则这个镜头就不是主持人新闻报道镜头 13 选出可能主持人镜头方法优点大大减轻了后边进行主持人镜头模型匹配判断的计算量因为不需要逐一判断每一个分割出的镜头是不是主持人镜头而只需要在可能的主持人镜头中选出真正的主持人镜头具体步骤对于分割出来的镜头单元计算这个镜头中相邻帧的特征平均值和方差当和满足如下条件时认为该组镜头为可能的主持人镜头和 14 选出可能主持人镜头方法续其中t1和t2是判断阈值为了使分析过程快速简单一般在计算中采用基于灰度直方图矩阵的统计量来衡量相邻帧之间的差别对判断出来的这些可能是主持人的镜头将在下面做进一步分析判断筛选出真正的主持人镜头 15 主持人镜头选择判断方法判断主持人候选镜头中是否有主持人出现如果有主持人出现则候选镜头是真正主持人新闻报道镜头否则不是 16 主持人镜头选择判断算法用图所定义的主持人镜头模型中各区域特征下面以判断是否为两位主持人新闻报道镜头为例在图 a 所定义的两位主持人新闻报道模型中可以知道两位主持人新闻报道镜头中相邻帧间变化主要来源于两位主持人的身体主要是面部因此计算相邻帧画面中对应的A B和C这三个区域特征平均值和方差 17 主持人镜头选择判断由于头部运动发生在区域A和B中而区域C没有变化所以有和和及和 18 主持人镜头选择判断如果某个候选镜头中的帧满足以上条件就可以断定该镜头属于图 a 所定义的两位主持人新闻报道镜头同样的方法可以判断候选镜头是否属于上图所定义的其他主持人新闻报道模型如果某个候选镜头不属于上图所定义的任何主持人新闻报道模型则这个镜头不是真正的主持人新闻报道镜头 19 视频新闻内容分析目的进行新闻内容分析其目的是要分析出每个独立的新闻故事 20 视频新闻内容分析主要思路独立新闻故事一般在两种情况下发生 1 先是主持人报道一个独立新闻故事的简要主旨然后是非主持人新闻镜头报道故事详细介绍当这个独立新闻故事报道完毕后又出现主持人新闻报道镜头开始了下一条独立新闻故事的报道对这种情况只需要把前一个主持人新闻报道镜头到下一个主持人新闻报道镜头之间的视频帧组合到一起形成一个独立新闻故事介绍就可以了 21 视频新闻内容分析 2 镜头中出现主持人画面可主持人实际上报道了好几条新闻如简讯从语义上来看这样一个主持人镜头里包含了好几个新闻故事需要将这几个新闻故事分割开来因为它们是独立的新闻故事在这种情况下每当主持人从一条简讯转到下一条新简讯时画面中的图标也会相应的变换因为画面中的图标是当前新闻故事的概要所以当主持人报道下一条新闻时前一条新闻的图标消失出现下一条新闻的概要可以依据这个特定信息统计该主持人镜头中图标区域变化情况把独立的新闻简讯分割开来 22 视频新闻内容分析 2续判断方法如果在一个主持人新闻报道镜头中其相邻两帧图标区域部分的特征变化超过某一预定阈值那么这两帧就是新闻故事的分界点找出这些分界点就可以把主持人新闻报道镜头进一步分割成好几个新闻内容独立的主持人镜头 23 构造新闻故事目的将属于同一新闻故事的镜头组合起来便于数据库的检索 24 构造新闻故事新闻故事的一般结构主持人内容简介镜头新闻详细报道镜头根据这个特征将识别出的每一个主持人新闻报道镜头及它到下一个主持人新闻报道镜头间的所有镜头组合成一个独立的新闻故事 25 构造新闻故事开始对应主持人新闻报道镜头而新闻故事对应非主持人出现的详细新闻报道对于主持人连续报道好几条新闻简讯的情况构造出的独立新闻故事仅包含主持人新闻报道镜头而无详细新闻报道镜头 26 构造新闻故事对连续的视频新闻构造出独立新闻故事后就实现了新闻节目在内容上的自动分割这为视频数据库的检索和管理提供的方便 27 构造新闻故事建立新闻故事索引对这些独立的新闻故事提供文本标注用每个独立新闻故事的关键帧来对这个新闻故事进行索引 28 构造新闻故事说明对于新闻节目会出现的其他镜头如天气预报也可以通过事先定义天气预报镜头模块来判断因为天气预报镜头有固定结构对于广告节目使用预定义模块的方法很难达到判断识别目的因为广告节目镜头没有固定模式但是广告节目的背景音与新闻报道背景音存在很大差别观众可以不看视频数据只是听与视频流对应的音频流在大多数情况下就能判断出哪些是广告节目哪些是新闻报道节目所以在新闻节目分析中可以结合音频信息进行分析 29 现有新闻类分析系统 CMU的Informedia浙江大学计算机系多媒体计算组的新闻视频分析系统体育新闻节目结构化 30 CMU的Informedia 概述 CMU的InformdiaDigitalLibraryProject综合了自然语言理解图像处理语音识别和视频压缩等技术从文本音频和视频几个角度分析视频进行结构化它以新闻广播作为结构化的测试样本得到了很好的结果 31 CMU的Informedia 视频新闻的分析处理步骤 1 将新闻节目转化为MPEG格式音频和视频作为独立的流分开处理保留各自的时间标志 2 应用Sphinx 语音识别系统去识别音频流中的语言并把识别结果翻译成文本卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx 此后严格来说语音识别技术并没有脱离HMM框架 32 33 34 CMU的Informedia 视频新闻的分析处理步骤 3 判断镜头边缘和镜头中的关键帧其它的视频处理比如人脸的识别和视频字幕识别都可以应用于新闻节目分析 4 如果有视频字幕视频字幕和语音识别对应起来这样就能够把语音识别得到的文本的时间信息附给字幕 35 CMU的Informedia 视频新闻的分析处理步骤 5 视频新闻流被分割成独立的新闻故事或段落可以用于检索或者回放 6 构造新闻故事的抽象数据比如新闻总结镜头的关键帧新闻主题和新闻梗概 7 视频新闻中的视频图像流和音频流结合在一起成为索引用户通过InformationClient的界面搜索视频 36 CMU的Informedia 37 CMU的Informedia 38 39 40 41 现有新闻类分析系统浙江大学计算机系多媒体计算组的新闻视频分析系统针对体育新闻节目结构化 42 体育新闻节目结构化为了检验算法的有效性浙江大学计算机系多媒体计算组设计并实现了一个新闻视频分析系统该系统是在windows2000环境下用visualC 开发的该系统包括镜头切分主持人镜头识别和视频内容分析三大部分其中视频内容分析出的结果是一个一个内容独立的新闻故事 43 体育新闻节目结构化由于针对的是体育新闻所以系统主要考虑这两种镜头类型主持人新闻报道镜头体育新闻详细报道镜头 44 体育新闻节目结构化在新闻节目中主持人新闻报道画面多是只有一个主持人在介绍如图 45 体育新闻节目结构化这个系统中采用双阈值法来检测镜头边缘该模块以用户提交的一个视频段作为输入输出结果为检测出的所有镜头单元 46 体育新闻节目结构化该图显示了提交一段视频体育新闻后的镜头分割结果 47 体育新闻节目结构化图中上部分是整个视频新闻中相邻帧之间特征变化情况在这里帧特征取直方图图中所画的两条水平线分别是双阈值法中的高阈值和低阈值从图中上部分显示的视频新闻图像帧特征变化曲线可以看到镜头边缘检测的关键是阈值的确定选择恰当的阈值就能获得令人满意的结果图中左下部是提交的视频体育新闻图右下部是采用双阈值法分割出来的镜头 48 体育新闻节目结构化算法将视频帧画面分成背景和主持人两部分分别计算各区域中相邻帧的特征变化选择可能镜头主持人新闻报道镜头然后按照上面介绍的区域特征匹配和独立新闻故事组合等方法得到独立的体育新闻故事完成体育视频新闻流分割任务 49 新闻视频分析中集成视频音频和文本信息上面介绍了两个在对视频新闻进行结构化的系统其实视频信息只是多媒体数据中的一部分现在已经在一些视频新闻分析中已经开始把图像音频和语音分析结合起来达到视频新闻结构化的目的 50 新闻视频分析中集成视频音频和文本信息第一在识别新闻片断时综合分析图像和音频特征将音频识别结果与视频处理结果融合考虑精化新闻分析 51 新闻视频分析中集成视频音频和文本信息第二文本是新闻电视中经常包含的一种重要信息源它是描述新闻电视内容的有用数据尤其是对高层语义内容分析如新闻分类和相关故事搜索怎么获取广播新闻电视文本信息可来自视频帧后期制作所形成的视频字幕在信号噪声水平低的情况下文本信息还可以通过语音转录识别获得 52 新闻视频分析中集成视频音频和文本信息在许多情况下新闻节目的说明文本不能获得而语音识别不能得出高精度的文本抄本在这种情况下直接从图像序列中提取视频字幕信息在新闻电视内容分析中扮演了重要的角色这通常被称为OCR 采用视频OCR技术从帧中检测文字这是获取文本信息用于归类的好来源尤其是在不能获得新闻抄本和说明时 53 新闻视频分析中集成视频音频和文本信息最后采用自然语言处理技术根据由说明或视频OCR过程获得的文本对新闻故事进行自动分类文本分类是根据内容将自然语言的文字指派到一个或多个预定义的类中去的过程这是许多信息组织和管理工作中的关键部分对于基于内容的新闻视频浏览和搜索需要将分析过程获得的新闻视频故事归类到预定义常用的新闻类中这将提供给用户一张内容表类似于印刷书的内容表方便新闻内容的快速导航和搜索 54 视频相似性度量 55 视频相似性度量 Dependingonquerytype videosimilaritycanbeclassifiedintofeaturematching textmatching ontology basedmatching andcombination basedmatchingFeaturematching averagedistancebetweenthefeaturesonthecorrespondingframesStaticfeaturesofkeyframesObjectfeaturesMotionfeatures Personspotting facefeatures facematching trajectoriesofmajorobjects Dependingonusers demands 56 视频相似性度量 TextmatchingmatchingthenameofeachconceptwithquerytermsOntology basedmatching usingtheontologybetweensemanticconceptsorsemanticrelationsbetweenkeywordsEnrichquerywithextraknowledge e g WordnetCombination basedmatchingLeveragesemanticconceptbylearningthecombinationstrategiesfromatrainingcollection 57 视频摘要 VideoSummarization StaticvideoabstractsconsistacollectionofkeyframesMerits Rapid simpleLimitations missaudiocontentanddynamicvisualcontentDynamicvideoskimsConsistacollectionofvideosegments andcorrespondingaudiosegments 58 视频摘要生成方法简单方法基于视觉信息的生成方法应用各种视频和图像处理技术进行镜头探测关键帧提取场景聚类运动特征提取等一系列操作最终生成具有代表性的关键桢序列或缩略视频融合多特性的生成方法基于视觉方法的基础上融入其他媒体提供的信息准确地判断视频片段的重要程度基于视频句法语义的生成方法从视频的句法结构分析入手探寻镜头与镜头之间场景与场景之间的结构规则将视频的句法语义尽可能完整的保存在摘要中 59 MemoryMatrix ANovelUserExperienceforHomeVideo Homevideo特点大量冗余信息拍摄质量不高 theX coordinaterepresentsthespaceaxiswhileY coordinatedenotesthetimeaxis TheMemoryMatrixautomaticallyorganizeshomevideosub shotsaccordingtothetimestampsandbackgroundscenes 60 Memo

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

新闻类视频结构化ppt课件.ppt

文档简介

温馨提示

最新文档

评论

新闻类视频结构化ppt课件.ppt

文档简介

温馨提示

最新文档

评论

相关文档