第5章数字媒资的编目与检索_第1页
第5章数字媒资的编目与检索_第2页
第5章数字媒资的编目与检索_第3页
第5章数字媒资的编目与检索_第4页
第5章数字媒资的编目与检索_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数字媒体资产管理数字媒体资产管理1第5章 数媒资产的编目与检索刘士军数字媒体资产管理2本章内容n5.1 数字媒体资产的编目技术n5.2 数字媒体资产的检索技术数字媒体资产管理31.编目技术n所谓编目就是对信息资源的形式及内容特征进行分析、选择和记录,然后再将这些描述信息按照一定的规则有序化地组织起来n数字媒体资产的编目是对音、视频对象整理和提炼的过程,将其中有价值的画面和资料的相关信息整理成为独立的文件,便于检索和再利用n编目是数字媒体资产应用的基础和关键,各类音、视频节目和素材资料的入库必须经过科学严格的编目,否则对于海量存储系统来说,其后果可能是永远也找不到该资料数字媒体资产管理4传统的卡

2、片目录S 种植优良新品种/李登春等主编.北京32 气象出版社,1992.084015 298页;7-5029-0961-3 (平) 5.50元.92303030-31(2) 数字媒体资产管理5 国际联机检索nDialog OpenAccessq美国DIALOG系统是世界上最早和最大的专业情报检索系统,也是我国科技界广泛使 用的系统。该公司自1972年起,开始为用户提供服务工作q系统拥有600多个数据库。其数据库类型主要有四种:即文献型、数值型、名录字典型、全文型。涉及多个语种,收录的信息涉及的专业范围广泛nCALIS联合目录q中国高等教育文献保障系统(China Academic Librar

3、y & Information System,简称CALISq联机合作编目始于2000年3月数字媒体资产管理6CALIS联合编目系统例子数字媒体资产管理7数字媒体资产管理8编目标准n目前一般类资料编目中可借鉴的标准主要有UNIMARC标准和CNMARC标准qMARC就是机读目录,即Machine-Readable Catalogue,称机器可读目录,是计算机编目的产品qUNIMARC ( Universal Machine-Readablee Catalogue,通用机读目录)于1976年在USMARC的基础上由国际图书馆联合会制定,目的是能够适应不同文种和文献类型间数据交换的需要qC

4、NMARC我国依据UNIMARC制定的中国机读目录格式,主要用于国内图书情报部门和其他国家书目机构之间的信息交换与检索数字媒体资产管理9机读目录MARC编目nMARC编目是通过编制目录来控制文献的存在状况及存在特征,对文献信息进行整序和控制,以达到利用馆藏资源、交流书目和资源共享的目的nMARC编目是使文献有序化,包括对文献信息的著录、标引和组织。它是图书馆的基础工作,是图书馆读者服务工作得以顺利开展的根本保证nMARC数据就是元数据。是详细的、严谨的、专业性要求高的一种元数据数字媒体资产管理10MARC编目的历史n1965年美国国会图书馆首先研制;n1966年9月生产出试验性磁带MARCI式

5、;n1967年试制出MARCII式;n1969年正式向该国图书馆订购馆发行MARCII式英文图书磁带;n1971年成为美国国家标准;n1973年其格式成为国际标准(ISO2709)数字媒体资产管理11UNIMARCn国际机读目录,1972年由IFLA推出。n随后产生了q英国 UKMARC;q日本 JMARC;q中国 CNMARC数字媒体资产管理12CNMARC中国机读目录通讯格式n1979年,北京图书馆、北京大学图书馆、清华大学图书馆、中国科学院图书馆等共同引进并研究了美国国会图书馆的MARC磁带,成立了北京地区机读目录研制协作组,于1992年出版n1995年正式成为文化行业标准数字媒体资产管

6、理13Z39.50信息检索协议n信息检索协议qANSI/NISO Z39.50qISO 23950qMARC数据的交换和共享通过Z39.50协议实现nZ39.50 维护管理机构 美国国会图书馆q /z3950/agency/数字媒体资产管理14Z39.50原理nZ39.50的服务和机制q11种机制与相应服务、服务类型、启动方式nZ39.50 是客户机、服务器模式q但称之为源端( Origin)与目的端 (Target)Client/originServer/target数字媒体资产管理15我国广播电视音像资料编目规范n音频媒体资料有其自身的特殊属性,广电总

7、局于2004年10月13日发布了广播电影电视行业标准广播电视音像资料编目规范第一部分:电视资料(GY/T 202. 1 -2004)n该标准提出的编目项目对广播电视节目采编、制作、存储、交换、播出、接收等各个环信息的规范化收集整理起到指导作用,同时方便海量的音像、文字和图片息资料的再利用n我国编目规范中使用的元数据标准为都柏林核心( Doulin Core,DC)元数据集数字媒体资产管理16我国广播电视音像资料编目规范n国家广电总局的编目规范规定,视音频资料的元数据总体上分为四个层次,从上到下分别为节目层、片段层、场景层和镜头层n各层次分别包含相应的元素类,在元素类下面是各层对象的具体编目元数

8、据项n对视音频资料编目时,应从节目层开始著录,片断层、场景层、镜头层著录可以根据实际需要灵活选择视音频资料元数据的层次、结构数字媒体资产管理17与编目相关的术语和定义n著录、标引q著录、标引是指对视音频资料的内容和形式特征进行分析、归纳和记录的过程n著录项q著录项是用以揭示视音频资料内容和形式特征的记录项目n元数据q元数据是用于描述数据的数据,指对视音频资料的描述信息n素材q素材是指具有使用价值的、可用于制作节目的视音频资料数字媒体资产管理18与编目相关的术语和定义n节目q节目是指具有独立主题意义的、已经制作完成的完整的视音频资料n片段q片段是节目或素材中一段连续的视音频资料,由个以上相互关联

9、的场景构成n场景q场景是指节目或素材中背景或场景不变的一段连续视音频部分,由时间或空间上相关的一个或多个镜头组成n镜头q镜头指同一摄像机一次摄录的连续画面数字媒体资产管理19编目系统的业务流程n通过一次编目完成从导人的数据或者EDL表中提取相关信息。二次编目对一次编目后的信息进行加工、处理,对素材进行分类、增加主题词、详细说明等;正常编目工作完成之后,提供对已编目资料进行多次编目的功能,丰富并完善编目的信息数字媒体资产管理20编目系统的描述n编目系统的基本原则q高效性原则q易用性原则q开放性原则q高可靠性原则数字媒体资产管理21编目系统的描述n编目系统应具备的功能q(1)编目系统要符合编目标准

10、,建立节目、片段、场景、镜头具有层次关系的视音频元数据结构q(2)编目系统要能够浏览低码流的视音频数据对象,同时可以方便快速地浏览和帧精度定位q(3)编目系统要能够对关键帧进行浏览和编辑,并可以实现自动或手动进行节目或节目片段的关键帧分析和提取q(4)编目系统可以采用各种灵活的字段结构以及编目输入界面,能够灵活方便的处理各种复杂编目元数据,如受控词处理、重复字段处理、绑定关系处理、分类树处理等数字媒体资产管理22编目系统的描述n编目系统应具备的功能q(5)编目系统应支持工作流程的管理、运行和配置,能够实现多结点、多用户的协调流水线方式的编目生产,以提高编目效率q(6)在整个编目流水线上,应具备

11、审核机制,并可以对任何未能通过审核的编目元数据建立返工机制q(7)编目管理要能够配置各种编目参数,包括流程的配置,同时能够提供对不同流程的编目功能定义以及功能权限的限制q(8)编目管理要能够方便地对整个或单个的编目流程进行数据统计和分析,对编目流程、在编条目进行工作量统计计算,以便于管理人员进行工作量统计和流程管理。数字媒体资产管理23编目系统的描述n编目工作站q编目工作站的客户端软件,主要用于生成对编目数据库的初级新闻资料编目文件进行详细编目处理,建立稿件关联,并将生成的编目数据上载到编目数据库服务器中,由它完成数据入库的工作数字媒体资产管理24编目系统的描述n编目数据库服务器q编目数据库服

12、务器主要用于创建和维护编目数据库和用户身份数据库q建立一个结构严谨、数据完整的编目据库对媒体资产管理的后期运行非常重要q通常系统构建编目数据库结构时应采用分层结构,采用挑选编目标准字段子集,并过字段映射的方式建立自己的编目数据库结构数字媒体资产管理25编目工作方式n媒资系统数据编目必须同时支持自动和手动两种方式q自动方式主要用于基本编目数据的提取。如关键帧的提取可在采集时,利用软件画面比较技术,实时或后台自动提取切换镜头转换帧,见图所示数字媒体资产管理26编目工作方式n媒资系统数据编目必须同时支持自动和手动两种方式q还可以通过422协议,读取磁带上的U bit或IC芯片信息,实时或后台捕获画面

13、获取转换帧q自动编目的另一个应用是自动继承业务系统中产生的元数据,如素材的压缩格式、时码、人员信息等q此外,编目系统还要支持通过浏览高或低码流数据,手动选取关键帧,或按时间间隔生成序列关键帧n编目的内容有些是非常简单的物理特征,而有些则需要编目人员具有高度的专业知识才能完成标引;用户可以根据自身的需要进行多层次编目n引入编目签章和审核签章的概念,用于控制编目流程与编目质量数字媒体资产管理272.数字媒体资产的检索技术n检索是系统的窗口,是数字资产再利用的关键,随着数字媒体资产内容的日益益积累,如何在海量视音频资料中快速检索出所需要的内容就显得至关重要n传统的基于文本信息(即关键词)的检索方法是

14、建构于关系型数据库基础之上的,是结构化的方法,因为其述能力有限、主观性强、手工标注等原因,已经不能满足海量数字媒体资产检索的需求n目前基于内容的视频分析和检索技术成为应用的热点数字媒体资产管理28检索系统的流程n通过浏览器直接进入检索页面n输入检索条件或节目信息,查询浏览库存节目数据n检索命中结果可立即浏览低码率视音频信息,并可察看关键帧信息n满足需要的节目可提交下载申请,或设置入点、出点信息后提交该片段下载申请数字媒体资产管理29检索系统的数据流程n(1)发出检索指令n(2)传递给应用服务器解析n(3)查询数据库检索n(4)传递回WEB服务器n(5)WEB服务器传递给用户(6)查看流媒体数据

15、指令给应用服务器(7)URL文件定位给流媒体服务器(8)从媒资在线存储区找到媒体文件(9)通过RTP/UDP将流媒体文件数据传递给用户端数字媒体资产管理30检索系统的功能要求n1快速整合检索能力n2支持混合检索并提供友好的查询界面n3向用户提供多种用途的检索服务n适应网络化、智能化和个性化的检索方式是视音频内容检索实现的目标数字媒体资产管理31检索方式n1客户端检索软件与WEB检索方式q采用检索客户端软件的优势在于部分软件功能较易实现,对于诸如访问权限、检索计费的处理较为容易;检索界面的专用性很强等q对于网络规模较大,甚至是广域网环境,则通常需要采用WEB检索方式,以降低客户端检索软件的安装和

16、维护成本q另外,可以在存储管理系统中引入电子商务的理念,同时加入检索计费、会员管理、超市下载、远程编辑等,为以后系统的扩展打下良好的基础数字媒体资产管理32检索方式n2先控词检索方式q检索系统通常采用自然语言、先控语言以及后控词表等几种方式进行检索控制q所谓“先控”是指在输入标引阶段就对自然语言语词先行控制,包括:同义词、准同义词、同形异义、一词多义等数字媒体资产管理33检索方式q先控方式相对自然语言具备以下优点:n1)促使主题表达的一致性,能有效防止同一主题资料的分散n2)减少主题表达的含糊和失真,能有效防止不同主题资料的混同n3)有助于进行全面广泛的检索,能较好的满足扩检、缩检和改变检索范

17、围的要求n4)减轻检索者设想同一检索课题所有相关检索词的负担,大大加快检输出速度q但也存在下列缺陷n1)先控方式专指度普遍不足n2)编目标引负担较重,资料加工处理速度慢、费用高n3)先控语言过于专业,易用性较差n4)词表、类表的编制及维护难度很大,费用较高n5)对新生事物、新概念反应迟钝,控制滞后,甚至“失控”n6)检索系统将自然语言语词转换成词表或类表中的规范词难度较大数字媒体资产管理34检索方式n3自然语言检索方式q自然语言是人们日常用于交流的语言,其“不受控制”的特点产生以下优点:n1)表达文献主题和情报需要可以达到完全专指n2)是人们熟悉的、习惯的语言,易用性好n3)不依附于词表数据库

18、,具有良好的兼容性且标引成果可以共享n4)文献编目标引负担较轻,输入速度快且费用较低n5)自然语言可以方便、及时地反映新概念、新术语和新事物,不会滞后或失控q目前的媒体资产管理系统大多采用自然语言的编目检索方式,但是也存在一些自身难以克服的缺陷:n1)全面检索某一主题难度较大n2)难免产生检索噪音,影响检准率n3)扩检、缩检和改变检索范围较困难n4)检索者负担较重,检索输出速度慢、效率低数字媒体资产管理35自然语言检索方式由百度技术支持的ChinaRen“孙悟空”搜索引擎将帮助您如愿以偿,使网站对您的信息查寻要求有问必答。智能化的“孙悟空”搜索引擎具有独特的解析软件,用户即使输入一个问句搜索引

19、擎也能够清晰地分析出问话里的关键词,而查找到相应的能够回答问题的网站。因此,使用“孙悟空”搜索引擎在ChinaRen网站上搜索时,您可以用自己习惯的语言提出问题,如“谁的个人主页最酷?”,“未来十年什么行业最热门?”,“哪里的手机价钱最便宜?”,搜索引擎前端的智能分析系统将自动对您问题中的关键词进行检索,然后搜索到您需要的内容。 数字媒体资产管理36检索方式n4后控词表检索方式q“后控”是指在系统输入阶段不进行控制,而在系统输出阶段进行一定的控制,它把“控制”不放在标引阶段,而放在检索阶段。后控检索一般过后控词表来实现,是利用先控语言的原理和方法编制语言的自然语言的检索用控制词表q主要是对自然

20、语言中大量存在的等同关系、等级关系和部分的相关关系进行控制和揭示,通过这些措施达到对自然语言检索中各种不利因素的事后控制q后控词表与自然语言检索系统的结合,在很大程度上弥补了纯自然语言检索系统由于自然语言的“不受控制”而产生缺陷,大大提高了自然语言检索系统的性能和效率n控词表综合了自然语言与先控语言的优点,“后控”检索方式无疑是数字资产存储管理系统的应用方向数字媒体资产管理37基于内容的检索n基于内容的检索是指根据多媒体对象的语义、特征进行检索,如图像中颜色、纹理、形状,视频中的镜头、场景、镜头的运动,声音中的音调、响度、音色等n它需要从媒体数据中提取指定的特征,然后再根据这些特征从媒体数据库

21、中检索出具有相似特征的图像或者视频内容n特点:q(1)是一种近似匹配q(2)适于从媒体内容中提取信息线索q(3)适于对大型多媒体数据库的快速检索数字媒体资产管理38基于内容的检索类型n基于内容的图像检索n基于内容的视频检索n基于内容的音频检索n基于内容的图形检索n基于内容的文本检索数字媒体资产管理39基于内容的图像检索技术n主要依据图像的颜色、纹理、形状特征,以及图像中子图像的特征进行检索。其中有:q颜色查询,使用户查到与用户所选择的颜色相似;q纹理查询,使用户查到含有相似纹理的图像;q形状查询,用户选择某一形状或勾勒一幅草图,利用形状特征或匹配主要边界进行检索;q图像对象查询,对像中所包含的

22、静态子对象进行查询。n查询条件可综合利用颜色、纹理、形状特征,逻辑特征和客观属性等形状形状平均颜色平均颜色色彩组合色彩组合纹理纹理图像检索图像检索数字媒体资产管理40基于文本的图像检索技术 TBIRn从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR),利用文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。目前还在广泛使用,一张照片,配以文字说明照片拍摄的时间、地点、事件的主要内容等数字媒体资产管理41图 新华社图片稿件基于文本的图像检索技术TBIR数字媒体资产管理42 存在

23、的问题:n在基于文本的图像检索系统中,需要先对所有的图像进行关键字标注,然后才能使用全文检索技术对图像进行搜索。这种方法存在两个方面的问题:q一是这种方法需要较多的人工参与,而且随着图像数目的增加,这种方法很难实现;q二是由于图像所包含的信息量庞大,不同的人对于同一张图像的理解也不相同,这就导致对图像的标注没有一个统一的标准,因而检索的结果不能很好地符合用户的需求数字媒体资产管理43图 不同的人关心不同的内容基于文本的图像检索技术数字媒体资产管理44基于内容的图像检索CBIRn到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索(

24、Content-based Image Retrieval,简称CBIR)技术。属于图像分析的一个研究领域nCBIR属于基于内容检索(Content-based Retrieval ,简称CBR)的一种,CBR中还包括对动态视频、音频等其它形式多媒体信息的检索技术数字媒体资产管理45 图像检索原理n在检索原理上,无论是基于文本的图像检索还是基于内容的图像检索,主要包括三方面:q1、对用户需求的分析和转化,形成可以检索索引数据库的提问;q2、收集和加工图像资源,提取特征,分析并进行标引,建立图像的索引数据库;q3、根据相似度算法,计算用户提问与索引数据库中记录的相似度大小,提取出满足阈值的记录作

25、为结果,按照相似度降序的方式输出数字媒体资产管理46基于内容的图像检索n查询条件本身就是一个图像,或者是对于图像内容的描述n建立索引的方式是通过提取底层特征,然后通过计算比较这些特征和查询条件之间的距离,来决定两个图片的相似程度q1、提取特征值:利用一些数学规则(公式),把图像进行一个量化的描述,按照色彩、形状、图案、纹理等不同要求,把一张图片转化为一组数字,称其为特征值。由于是采用的同样的规则,所以每一张图片都能提取出一组特征值数字媒体资产管理47基于内容的图像检索q2、特征值的比对:由于采用的规则是相同的,如果两张图片是一样的,提取的特征值也会相同,这样就可以把两张图片的内容比较转化为两组

26、特征值的数字比较,也就是用数字量的比较代替了模拟量的比较;n如果两张图片是相似的,提取的特征值也是相近的;反过来讲,如果两张图片相差很大,其特征值也会有很大的差距;q3、结合语义分析:相同特征值的图片不一定就是相同的内容,结合图片的语义进行分析判断数字媒体资产管理48 基于内容的图像检索n图像的低层特征值提取q对于图像的低层特征,主要采用的是图像的颜色、纹理及其形状等特征q颜色特征n颜色特征和图像的大小、方向无关,而且对图像的背景颜色不敏感,因此颜色特征被广泛应用于图像检索。颜色特征中包括颜色直方图、颜色相关图、颜色矩等颜色特征颜色布局示例数字媒体资产管理49 基于内容的图像检索n图像的低层特

27、征值提取q纹理特征n纹理特征代表了物体的视觉模式,它包含了物体表面的组织结构以及与周围环境之间的关系。常用的方法有相关矩阵法,粗糙度、对比度等纹理表示方法,以及小波变换等纹理特征数字媒体资产管理50 基于内容的图像检索n图像的低层特征值提取q形状特征n这些低层的特征将通过各种方法抽取出来,并形成一组特征向量,建立相关索引并存储到数据库中n形状特征则包括两种,一种是基于边界的形状特征,另外一种则是基于区域的形状特征。最常用的表示方法有傅利叶变换和不变矩等灯管 杯子基于边缘的形状表示 基于区域的形状表示数字媒体资产管理51冰箱图冰箱与洗衣机的后视图对比洗衣机基于内容的图像检索n单独使用低层特征值的

28、弊端q单纯使用图像的底层特征值,容易产生混淆,因为不同的图像也会有近似的特征组合,例如:一个冰箱和一个洗衣机从正面看二者有较大的区别,但从后面看其后视图时,二者的差距很小,相似度较高,无法有效区分数字媒体资产管理52基于内容的图像检索n建立语义特征q必要性n由于低层的特征并不直接代表图像的语义信息,还需要抽取图像的语义特征q可行性n采用了相关文字信息来表征图像的语义特征,比如:分类号、产品名称、设计人、通讯地址等q效果n通过使用文字信息,使不同类别、不同名称之间的图像有了明显的区分,避免了混淆,提高了检索精度q举例n上面的图,两个方框,加上产品名称后,冰箱和洗衣机就不会混淆了数字媒体资产管理5

29、3基于内容的图像检索n示例数字媒体资产管理54基于内容的图像检索n通过设置检索输出门限值,可以控制检索结果的输出数量n检索结果的显示需要考虑显示效率和显示效果的矛盾数字媒体资产管理55基于内容的图像检索n基于内容的图像检索技术的特点q1.属于模糊查询,检索结果不是唯一的n基于内容的图像检索与文字检索的一个主要区别是,基于内容的检索都是属于模糊查询,一般不会给出单一的检索结果,输出的是一个结果排序集合,按照图像的相似程度,从最像到最不像n最后需由人来判断最终的结果是否满足检索需要,是人机结合的典范;由计算机来做大量简单烦琐的工作,由人做分析工作数字媒体资产管理56基于内容的图像检索n基于内容的图

30、像检索技术的特点q2.检索结果是逐渐逼近n在检索过程中不断修订检索条件,可以逐步达到最终的检索结果;通过调整特征参数组合,可以得到不同的检索结果q3.计算工作量大n每次查询都需要根据临时提交的特征标准,对全部特征值进行匹配运算;数据计算时对计算机的要求高,查询时间相对长一些数字媒体资产管理57Google Goggles nGoggles可以把拍下的相片送到Google数据库比对,使用者得到搜寻结果q如果相片里的主体是风景可以得到相关的旅游信息与搜寻结果q如果相片里的主体是书籍可以得到相关的比价、评价与搜寻结果q如果相片里的主体是图画可以得到相关的作者、介绍与搜寻结果q如果相片里的主体有条形码

31、可以直接通过该条形码找到该产品相关信息q如果相片里的主体是名片可以把名片里面的联络人、电话与地址自动建立到通讯簿里 数字媒体资产管理58Google GogglesnLOGO数字媒体资产管理59Google Gogglesn条形码数字媒体资产管理60Google Gogglesn书籍数字媒体资产管理61Google Gogglesn名片数字媒体资产管理62Google Gogglesn解数独 数字媒体资产管理63基于内容的视频检索n基于内容的视频检索是当前多媒体数据库发展的一个重要方向,它通过对非结构化的视频数据进行结构化分析和处理,采用视频分割技术,将连续的视频流划分为具有特定语义的视频片段

32、镜头,作为检索的基本单元,在此基础上进行代表帧的提取和动态特征的提取,形成描述镜头的特征索引n依据镜头组织和特征索引,采用视频聚类等方法研究镜头之间的关系,把内容相近的镜头组合起来,逐步缩小检索范围,直至查询到所需的视频数据n其中,视频分割、代表帧和动态特征提取是基于内容的视频检索的关键检术数字媒体资产管理64基于内容的视频检索技术n视频可用场景、镜头、帧来描述q帧是一幅静态的图像,是组成视频的最小单位q镜头是由一系列帧组成的一段视频,它描绘同一场景,表示的是一个摄像机的移动操作、一个事件或连续的动作。一个镜头由一个或多个关键帧表示q场景包含有多个镜头,针对同一批对象,拍摄的角度不同,表达的含

33、义不同数字媒体资产管理65基于内容的视频检索技术n基于关键帧的检索,是对代表视频镜头的关键帧进行检索。关键帧是一幅幅图像,可以采用与图像检索相似的方法。一旦检索到目标关键帧,用户可以播放观看它代表的视频片段n基于运动的检索,是基于镜头和视频对象的时间特征来检索,是视频检索的进一步要求。可以查询摄像机的移动操作和场景移动,以及运动方向和运动幅度等特征来检索运动的主体对象数字媒体资产管理66ShotShotShotVIDEOSceneSceneScene基于内容的视频检索数字媒体资产管理67基于内容的视频检索n镜头分割n镜头表示q运动目标的半自动分割q背景图象的拼接n运动分析n视频浏览与检索数字媒

34、体资产管理68基于内容的视频检索n视频镜头检测q镜头是摄像机在一次连续操作期间拍摄所得的视频帧序列;q一个镜头内所有图象描述的应当是比较一致的内容,可以把镜头作为基本索引单元数字媒体资产管理69 基于内容的视频检索n镜头切换类型q两类镜头切换:q1. 突变:两镜头直接衔接q2. 渐变:两镜头间通过特技操作平滑过渡,包括渐隐,淡入,淡出,扫换等数字媒体资产管理70 镜头切换例子数字媒体资产管理71镜头检测的基本原理n基本假定: 一个镜头内的相邻帧间有较强的连续性和相似性,内容不会有大的变化n选择合适的帧间差别测度和合适的阈值,当相邻帧图象间的差别大于阈值时,就认为出现了镜头切换n对帧间差别测度的要求:q对镜头切换敏感q对镜头内图象的变化不敏感数字媒体资产管理72镜头检测的主要方法n基于像素差的方法;n基于统计量的方法;n基于图象特征的方法;n基于灰度或彩色直方图的方法;n区域块法;n时空流法;n压缩域中的方法;n数字媒体资产管理73 颜色直方图n常用测度:颜色直方图q镜头内图象变化的原因:运动,光照,小噪声 q颜色直方图对目标运动和小噪声不敏感,因此得到广泛应用q颜色直方图对光照变化非常敏感,简单的光强变化就会引起直方图的突变数字媒体资产管理74颜色比值直方图n相邻象素颜色的比值在光照变化时是不变的n颜色比值直方图的差可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论