数字媒资的编目与检索.ppt_第1页
数字媒资的编目与检索.ppt_第2页
数字媒资的编目与检索.ppt_第3页
数字媒资的编目与检索.ppt_第4页
数字媒资的编目与检索.ppt_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章数媒资产的编目与检索 刘士军lsj 数字媒体资产管理 2 本章内容 5 1数字媒体资产的编目技术5 2数字媒体资产的检索技术 数字媒体资产管理 3 1 编目技术 所谓编目就是对信息资源的形式及内容特征进行分析 选择和记录 然后再将这些描述信息按照一定的规则有序化地组织起来数字媒体资产的编目是对音 视频对象整理和提炼的过程 将其中有价值的画面和资料的相关信息整理成为独立的文件 便于检索和再利用编目是数字媒体资产应用的基础和关键 各类音 视频节目和素材资料的入库必须经过科学严格的编目 否则对于海量存储系统来说 其后果可能是永远也找不到该资料 数字媒体资产管理 4 传统的卡片目录 S种植优良新品种 李登春等主编 北京32气象出版社 1992 084015298页 7 5029 0961 3 平 5 50元 92303030 31 2 数字媒体资产管理 5 国际联机检索 DialogOpenAccess美国DIALOG系统是世界上最早和最大的专业情报检索系统 也是我国科技界广泛使用的系统 该公司自1972年起 开始为用户提供服务工作 系统拥有600多个数据库 其数据库类型主要有四种 即文献型 数值型 名录字典型 全文型 涉及 多个语种 收录的信息涉及的专业范围广泛CALIS联合目录中国高等教育文献保障系统 ChinaAcademicLibrary InformationSystem 简称CALIS联机合作编目始于2000年3月 数字媒体资产管理 6 CALIS联合编目系统例子 数字媒体资产管理 7 数字媒体资产管理 8 编目标准 目前一般类资料编目中可借鉴的标准主要有UNIMARC标准和CNMARC标准MARC就是机读目录 即Machine ReadableCatalogue 称机器可读目录 是计算机编目的产品UNIMARC UniversalMachine ReadableeCatalogue 通用机读目录 于1976年在USMARC的基础上由国际图书馆联合会制定 目的是能够适应不同文种和文献类型间数据交换的需要CNMARC我国依据UNIMARC制定的中国机读目录格式 主要用于国内图书情报部门和其他国家书目机构之间的信息交换与检索 数字媒体资产管理 9 机读目录MARC编目 MARC编目是通过编制目录来控制文献的存在状况及存在特征 对文献信息进行整序和控制 以达到利用馆藏资源 交流书目和资源共享的目的MARC编目是使文献有序化 包括对文献信息的著录 标引和组织 它是图书馆的基础工作 是图书馆读者服务工作得以顺利开展的根本保证MARC数据就是元数据 是详细的 严谨的 专业性要求高的一种元数据 数字媒体资产管理 10 MARC编目的历史 1965年美国国会图书馆首先研制 1966年9月生产出试验性磁带 MARCI式 1967年试制出MARCII式 1969年正式向该国图书馆订购馆发行MARCII式英文图书磁带 1971年成为美国国家标准 1973年其格式成为国际标准 ISO2709 数字媒体资产管理 11 UNIMARC 国际机读目录 1972年由IFLA推出 随后产生了英国 UKMARC 日本 JMARC 中国 CNMARC 数字媒体资产管理 12 CNMARC 中国机读目录通讯格式 1979年 北京图书馆 北京大学图书馆 清华大学图书馆 中国科学院图书馆等共同引进并研究了美国国会图书馆的MARC磁带 成立了北京地区机读目录研制协作组 于1992年出版1995年正式成为文化行业标准 数字媒体资产管理 13 Z39 50信息检索协议 信息检索协议ANSI NISOZ39 50ISO23950MARC数据的交换和共享通过Z39 50协议实现Z39 50维护管理机构 美国国会图书馆http lcweb loc gov z3950 agency 数字媒体资产管理 14 Z39 50原理 Z39 50的服务和机制11种机制与相应服务 服务类型 启动方式Z39 50是客户机 服务器模式但称之为源端 Origin 与目的端 Target 数字媒体资产管理 15 我国广播电视音像资料编目规范 音频媒体资料有其自身的特殊属性 广电总局于2004年10月13日发布了广播电影电视行业标准 广播电视音像资料编目规范第一部分 电视资料 GY T202 1 2004 该标准提出的编目项目对广播电视节目采编 制作 存储 交换 播出 接收等各个环信息的规范化收集整理起到指导作用 同时方便海量的音像 文字和图片息资料的再利用我国编目规范中使用的元数据标准为都柏林核心 DoulinCore DC 元数据集 数字媒体资产管理 16 我国广播电视音像资料编目规范 国家广电总局的编目规范规定 视音频资料的元数据总体上分为四个层次 从上到下分别为节目层 片段层 场景层和镜头层各层次分别包含相应的元素类 在元素类下面是各层对象的具体编目元数据项对视音频资料编目时 应从节目层开始著录 片断层 场景层 镜头层著录可以根据实际需要灵活选择 视音频资料元数据的层次 结构 数字媒体资产管理 17 与编目相关的术语和定义 著录 标引著录 标引是指对视音频资料的内容和形式特征进行分析 归纳和记录的过程 著录项著录项是用以揭示视音频资料内容和形式特征的记录项目 元数据元数据是用于描述数据的数据 指对视音频资料的描述信息 素材素材是指具有使用价值的 可用于制作节目的视音频资料 数字媒体资产管理 18 与编目相关的术语和定义 节目节目是指具有独立主题意义的 已经制作完成的完整的视音频资料 片段片段是节目或素材中一段连续的视音频资料 由 个以上相互关联的场景构成 场景场景是指节目或素材中背景或场景不变的一段连续视音频部分 由时间或空间上相关的一个或多个镜头组成 镜头镜头指同一摄像机一次摄录的连续画面 数字媒体资产管理 19 编目系统的业务流程 通过一次编目完成从导人的数据或者EDL表中提取相关信息 二次编目对一次编目后的信息进行加工 处理 对素材进行分类 增加主题词 详细说明等 正常编目工作完成之后 提供对已编目资料进行多次编目的功能 丰富并完善编目的信息 数字媒体资产管理 20 编目系统的描述 编目系统的基本原则高效性原则易用性原则开放性原则高可靠性原则 数字媒体资产管理 21 编目系统的描述 编目系统应具备的功能 1 编目系统要符合编目标准 建立节目 片段 场景 镜头具有层次关系的视音频元数据结构 2 编目系统要能够浏览低码流的视音频数据对象 同时可以方便快速地浏览和帧精度定位 3 编目系统要能够对关键帧进行浏览和编辑 并可以实现自动或手动进行节目或节目片段的关键帧分析和提取 4 编目系统可以采用各种灵活的字段结构以及编目输入界面 能够灵活方便的处理各种复杂编目元数据 如受控词处理 重复字段处理 绑定关系处理 分类树处理等 数字媒体资产管理 22 编目系统的描述 编目系统应具备的功能 5 编目系统应支持工作流程的管理 运行和配置 能够实现多结点 多用户的协调流水线方式的编目生产 以提高编目效率 6 在整个编目流水线上 应具备审核机制 并可以对任何未能通过审核的编目元数据建立返工机制 7 编目管理要能够配置各种编目参数 包括流程的配置 同时能够提供对不同流程的编目功能定义以及功能权限的限制 8 编目管理要能够方便地对整个或单个的编目流程进行数据统计和分析 对编目流程 在编条目进行工作量统计计算 以便于管理人员进行工作量统计和流程管理 数字媒体资产管理 23 编目系统的描述 编目工作站编目工作站的客户端软件 主要用于生成对编目数据库的初级新闻资料编目文件进行详细编目处理 建立稿件关联 并将生成的编目数据上载到编目数据库服务器中 由它完成数据入库的工作 数字媒体资产管理 24 编目系统的描述 编目数据库服务器编目数据库服务器主要用于创建和维护编目数据库和用户身份数据库建立一个结构严谨 数据完整的编目据库对媒体资产管理的后期运行非常重要通常系统构建编目数据库结构时应采用分层结构 采用挑选编目标准字段子集 并过字段映射的方式建立自己的编目数据库结构 数字媒体资产管理 25 编目工作方式 媒资系统数据编目必须同时支持自动和手动两种方式自动方式主要用于基本编目数据的提取 如关键帧的提取可在采集时 利用软件画面比较技术 实时或后台自动提取切换镜头转换帧 见图所示 数字媒体资产管理 26 编目工作方式 媒资系统数据编目必须同时支持自动和手动两种方式还可以通过422协议 读取磁带上的U bit或IC芯片信息 实时或后台捕获画面获取转换帧自动编目的另一个应用是自动继承业务系统中产生的元数据 如素材的压缩格式 时码 人员信息等此外 编目系统还要支持通过浏览高或低码流数据 手动选取关键帧 或按时间间隔生成序列关键帧编目的内容有些是非常简单的物理特征 而有些则需要编目人员具有高度的专业知识才能完成标引 用户可以根据自身的需要进行多层次编目引入编目签章和审核签章的概念 用于控制编目流程与编目质量 数字媒体资产管理 27 2 数字媒体资产的检索技术 检索是系统的窗口 是数字资产再利用的关键 随着数字媒体资产内容的日益益积累 如何在海量视音频资料中快速检索出所需要的内容就显得至关重要传统的基于文本信息 即关键词 的检索方法是建构于关系型数据库基础之上的 是结构化的方法 因为其述能力有限 主观性强 手工标注等原因 已经不能满足海量数字媒体资产检索的需求目前基于内容的视频分析和检索技术成为应用的热点 数字媒体资产管理 28 检索系统的流程 通过浏览器直接进入检索页面输入检索条件或节目信息 查询浏览库存节目数据检索命中结果可立即浏览低码率视音频信息 并可察看关键帧信息满足需要的节目可提交下载申请 或设置入点 出点信息后提交该片段下载申请 数字媒体资产管理 29 检索系统的数据流程 1 发出检索指令 2 传递给应用服务器解析 3 查询数据库检索 4 传递回WEB服务器 5 WEB服务器传递给用户 6 查看流媒体数据指令给应用服务器 7 URL文件定位给流媒体服务器 8 从媒资在线存储区找到媒体文件 9 通过RTP UDP将流媒体文件数据传递给用户端 数字媒体资产管理 30 检索系统的功能要求 1 快速整合检索能力2 支持混合检索并提供友好的查询界面3 向用户提供多种用途的检索服务适应网络化 智能化和个性化的检索方式是视音频内容检索实现的目标 数字媒体资产管理 31 检索方式 1 客户端检索软件与WEB检索方式采用检索客户端软件的优势在于部分软件功能较易实现 对于诸如访问权限 检索计费的处理较为容易 检索界面的专用性很强等对于网络规模较大 甚至是广域网环境 则通常需要采用WEB检索方式 以降低客户端检索软件的安装和维护成本另外 可以在存储管理系统中引入电子商务的理念 同时加入检索计费 会员管理 超市下载 远程编辑等 为以后系统的扩展打下良好的基础 数字媒体资产管理 32 检索方式 2 先控词检索方式检索系统通常采用自然语言 先控语言以及后控词表等几种方式进行检索控制所谓 先控 是指在输入标引阶段就对自然语言语词先行控制 包括 同义词 准同义词 同形异义 一词多义等 数字媒体资产管理 33 检索方式 先控方式相对自然语言具备以下优点 1 促使主题表达的一致性 能有效防止同一主题资料的分散2 减少主题表达的含糊和失真 能有效防止不同主题资料的混同3 有助于进行全面广泛的检索 能较好的满足扩检 缩检和改变检索范围的要求4 减轻检索者设想同一检索课题所有相关检索词的负担 大大加快检输出速度但也存在下列缺陷1 先控方式专指度普遍不足2 编目标引负担较重 资料加工处理速度慢 费用高3 先控语言过于专业 易用性较差4 词表 类表的编制及维护难度很大 费用较高5 对新生事物 新概念反应迟钝 控制滞后 甚至 失控 6 检索系统将自然语言语词转换成词表或类表中的规范词难度较大 数字媒体资产管理 34 检索方式 3 自然语言检索方式自然语言是人们日常用于交流的语言 其 不受控制 的特点产生以下优点 1 表达文献主题和情报需要可以达到完全专指2 是人们熟悉的 习惯的语言 易用性好3 不依附于词表数据库 具有良好的兼容性且标引成果可以共享4 文献编目标引负担较轻 输入速度快且费用较低5 自然语言可以方便 及时地反映新概念 新术语和新事物 不会滞后或失控目前的媒体资产管理系统大多采用自然语言的编目检索方式 但是也存在一些自身难以克服的缺陷 1 全面检索某一主题难度较大2 难免产生检索噪音 影响检准率3 扩检 缩检和改变检索范围较困难4 检索者负担较重 检索输出速度慢 效率低 数字媒体资产管理 35 自然语言检索方式 由百度技术支持的ChinaRen 孙悟空 搜索引擎将帮助您如愿以偿 使网站对您的信息查寻要求有问必答 智能化的 孙悟空 搜索引擎具有独特的解析软件 用户即使输入一个问句搜索引擎也能够清晰地分析出问话里的关键词 而查找到相应的能够回答问题的网站 因此 使用 孙悟空 搜索引擎在ChinaRen网站上搜索时 您可以用自己习惯的语言提出问题 如 谁的个人主页最酷 未来十年什么行业最热门 哪里的手机价钱最便宜 搜索引擎前端的智能分析系统将自动对您问题中的关键词进行检索 然后搜索到您需要的内容 数字媒体资产管理 36 检索方式 4 后控词表检索方式 后控 是指在系统输入阶段不进行控制 而在系统输出阶段进行一定的控制 它把 控制 不放在标引阶段 而放在检索阶段 后控检索一般过后控词表来实现 是利用先控语言的原理和方法编制语言的自然语言的检索用控制词表主要是对自然语言中大量存在的等同关系 等级关系和部分的相关关系进行控制和揭示 通过这些措施达到对自然语言检索中各种不利因素的事后控制后控词表与自然语言检索系统的结合 在很大程度上弥补了纯自然语言检索系统由于自然语言的 不受控制 而产生缺陷 大大提高了自然语言检索系统的性能和效率控词表综合了自然语言与先控语言的优点 后控 检索方式无疑是数字资产存储管理系统的应用方向 数字媒体资产管理 37 基于内容的检索 基于内容的检索是指根据多媒体对象的语义 特征进行检索 如图像中颜色 纹理 形状 视频中的镜头 场景 镜头的运动 声音中的音调 响度 音色等它需要从媒体数据中提取指定的特征 然后再根据这些特征从媒体数据库中检索出具有相似特征的图像或者视频内容特点 1 是一种近似匹配 2 适于从媒体内容中提取信息线索 3 适于对大型多媒体数据库的快速检索 数字媒体资产管理 38 基于内容的检索类型 基于内容的图像检索基于内容的视频检索基于内容的音频检索基于内容的图形检索基于内容的文本检索 数字媒体资产管理 39 基于内容的图像检索技术 主要依据图像的颜色 纹理 形状特征 以及图像中子图像的特征进行检索 其中有 颜色查询 使用户查到与用户所选择的颜色相似 纹理查询 使用户查到含有相似纹理的图像 形状查询 用户选择某一形状或勾勒一幅草图 利用形状特征或匹配主要边界进行检索 图像对象查询 对像中所包含的静态子对象进行查询 查询条件可综合利用颜色 纹理 形状特征 逻辑特征和客观属性等 数字媒体资产管理 40 基于文本的图像检索技术TBIR 从20世纪70年代开始 有关图像检索的研究就已开始 当时主要是基于文本的图像检索技术 Text basedImageRetrieval 简称TBIR 利用文本描述的方式描述图像的特征 如绘画作品的作者 年代 流派 尺寸等 目前还在广泛使用 一张照片 配以文字说明照片拍摄的时间 地点 事件的主要内容等 数字媒体资产管理 41 图新华社图片稿件 基于文本的图像检索技术TBIR 数字媒体资产管理 42 存在的问题 在基于文本的图像检索系统中 需要先对所有的图像进行关键字标注 然后才能使用全文检索技术对图像进行搜索 这种方法存在两个方面的问题 一是这种方法需要较多的人工参与 而且随着图像数目的增加 这种方法很难实现 二是由于图像所包含的信息量庞大 不同的人对于同一张图像的理解也不相同 这就导致对图像的标注没有一个统一的标准 因而检索的结果不能很好地符合用户的需求 数字媒体资产管理 43 图不同的人关心不同的内容 基于文本的图像检索技术 数字媒体资产管理 44 基于内容的图像检索CBIR 到90年代以后 出现了对图像的内容语义 如图像的颜色 纹理 布局等进行分析和检索的图像检索技术 即基于内容的图像检索 Content basedImageRetrieval 简称CBIR 技术 属于图像分析的一个研究领域CBIR属于基于内容检索 Content basedRetrieval 简称CBR 的一种 CBR中还包括对动态视频 音频等其它形式多媒体信息的检索技术 数字媒体资产管理 45 图像检索原理 在检索原理上 无论是基于文本的图像检索还是基于内容的图像检索 主要包括三方面 1 对用户需求的分析和转化 形成可以检索索引数据库的提问 2 收集和加工图像资源 提取特征 分析并进行标引 建立图像的索引数据库 3 根据相似度算法 计算用户提问与索引数据库中记录的相似度大小 提取出满足阈值的记录作为结果 按照相似度降序的方式输出 数字媒体资产管理 46 基于内容的图像检索 查询条件本身就是一个图像 或者是对于图像内容的描述建立索引的方式是通过提取底层特征 然后通过计算比较这些特征和查询条件之间的距离 来决定两个图片的相似程度1 提取特征值 利用一些数学规则 公式 把图像进行一个量化的描述 按照色彩 形状 图案 纹理等不同要求 把一张图片转化为一组数字 称其为特征值 由于是采用的同样的规则 所以每一张图片都能提取出一组特征值 数字媒体资产管理 47 基于内容的图像检索 2 特征值的比对 由于采用的规则是相同的 如果两张图片是一样的 提取的特征值也会相同 这样就可以把两张图片的内容比较转化为两组特征值的数字比较 也就是用数字量的比较代替了模拟量的比较 如果两张图片是相似的 提取的特征值也是相近的 反过来讲 如果两张图片相差很大 其特征值也会有很大的差距 3 结合语义分析 相同特征值的图片不一定就是相同的内容 结合图片的语义进行分析判断 数字媒体资产管理 48 基于内容的图像检索 图像的低层特征值提取对于图像的低层特征 主要采用的是图像的颜色 纹理及其形状等特征颜色特征 颜色特征和图像的大小 方向无关 而且对图像的背景颜色不敏感 因此颜色特征被广泛应用于图像检索 颜色特征中包括颜色直方图 颜色相关图 颜色矩等 颜色特征 颜色布局示例 数字媒体资产管理 49 基于内容的图像检索 图像的低层特征值提取纹理特征 纹理特征代表了物体的视觉模式 它包含了物体表面的组织结构以及与周围环境之间的关系 常用的方法有相关矩阵法 粗糙度 对比度等纹理表示方法 以及小波变换等 纹理特征 数字媒体资产管理 50 基于内容的图像检索 图像的低层特征值提取形状特征这些低层的特征将通过各种方法抽取出来 并形成一组特征向量 建立相关索引并存储到数据库中 形状特征则包括两种 一种是基于边界的形状特征 另外一种则是基于区域的形状特征 最常用的表示方法有傅利叶变换和不变矩等 灯管杯子基于边缘的形状表示基于区域的形状表示 数字媒体资产管理 51 冰箱 图冰箱与洗衣机的后视图对比 洗衣机 基于内容的图像检索 单独使用低层特征值的弊端单纯使用图像的底层特征值 容易产生混淆 因为不同的图像也会有近似的特征组合 例如 一个冰箱和一个洗衣机从正面看二者有较大的区别 但从后面看其后视图时 二者的差距很小 相似度较高 无法有效区分 数字媒体资产管理 52 基于内容的图像检索 建立语义特征必要性由于低层的特征并不直接代表图像的语义信息 还需要抽取图像的语义特征可行性采用了相关文字信息来表征图像的语义特征 比如 分类号 产品名称 设计人 通讯地址等效果通过使用文字信息 使不同类别 不同名称之间的图像有了明显的区分 避免了混淆 提高了检索精度举例上面的图 两个方框 加上产品名称后 冰箱和洗衣机就不会混淆了 数字媒体资产管理 53 基于内容的图像检索 示例 数字媒体资产管理 54 基于内容的图像检索 通过设置检索输出门限值 可以控制检索结果的输出数量检索结果的显示需要考虑显示效率和显示效果的矛盾 数字媒体资产管理 55 基于内容的图像检索 基于内容的图像检索技术的特点1 属于模糊查询 检索结果不是唯一的基于内容的图像检索与文字检索的一个主要区别是 基于内容的检索都是属于模糊查询 一般不会给出单一的检索结果 输出的是一个结果排序集合 按照图像的相似程度 从最像到最不像最后需由人来判断最终的结果是否满足检索需要 是人机结合的典范 由计算机来做大量简单烦琐的工作 由人做分析工作 数字媒体资产管理 56 基于内容的图像检索 基于内容的图像检索技术的特点2 检索结果是逐渐逼近在检索过程中不断修订检索条件 可以逐步达到最终的检索结果 通过调整特征参数组合 可以得到不同的检索结果3 计算工作量大每次查询都需要根据临时提交的特征标准 对全部特征值进行匹配运算 数据计算时对计算机的要求高 查询时间相对长一些 数字媒体资产管理 57 GoogleGoggles Goggles可以把拍下的相片送到Google数据库比对 使用者得到搜寻结果如果相片里的主体是风景可以得到相关的旅游信息与搜寻结果如果相片里的主体是书籍可以得到相关的比价 评价与搜寻结果如果相片里的主体是图画可以得到相关的作者 介绍与搜寻结果如果相片里的主体有条形码可以直接通过该条形码找到该产品相关信息如果相片里的主体是名片可以把名片里面的联络人 电话与地址自动建立到通讯簿里 数字媒体资产管理 58 GoogleGoggles LOGO 数字媒体资产管理 59 GoogleGoggles 条形码 数字媒体资产管理 60 GoogleGoggles 书籍 数字媒体资产管理 61 GoogleGoggles 名片 数字媒体资产管理 62 GoogleGoggles 解数独 数字媒体资产管理 63 基于内容的视频检索 基于内容的视频检索是当前多媒体数据库发展的一个重要方向 它通过对非结构化的视频数据进行结构化分析和处理 采用视频分割技术 将连续的视频流划分为具有特定语义的视频片段 镜头 作为检索的基本单元 在此基础上进行代表帧的提取和动态特征的提取 形成描述镜头的特征索引依据镜头组织和特征索引 采用视频聚类等方法研究镜头之间的关系 把内容相近的镜头组合起来 逐步缩小检索范围 直至查询到所需的视频数据其中 视频分割 代表帧和动态特征提取是基于内容的视频检索的关键检术 数字媒体资产管理 64 基于内容的视频检索技术 视频可用场景 镜头 帧来描述帧是一幅静态的图像 是组成视频的最小单位镜头是由一系列帧组成的一段视频 它描绘同一场景 表示的是一个摄像机的移动操作 一个事件或连续的动作 一个镜头由一个或多个关键帧表示场景包含有多个镜头 针对同一批对象 拍摄的角度不同 表达的含义不同 数字媒体资产管理 65 基于内容的视频检索技术 基于关键帧的检索 是对代表视频镜头的关键帧进行检索 关键帧是一幅幅图像 可以采用与图像检索相似的方法 一旦检索到目标关键帧 用户可以播放观看它代表的视频片段基于运动的检索 是基于镜头和视频对象的时间特征来检索 是视频检索的进一步要求 可以查询摄像机的移动操作和场景移动 以及运动方向和运动幅度等特征来检索运动的主体对象 数字媒体资产管理 66 基于内容的视频检索 数字媒体资产管理 67 基于内容的视频检索 镜头分割镜头表示运动目标的半自动分割背景图象的拼接运动分析视频浏览与检索 数字媒体资产管理 68 基于内容的视频检索 视频镜头检测镜头是摄像机在一次连续操作期间拍摄所得的视频帧序列 一个镜头内所有图象描述的应当是比较一致的内容 可以把镜头作为基本索引单元 数字媒体资产管理 69 基于内容的视频检索 镜头切换类型两类镜头切换 1 突变 两镜头直接衔接2 渐变 两镜头间通过特技操作平滑过渡 包括渐隐 淡入 淡出 扫换等 数字媒体资产管理 70 突变 渐变 镜头切换例子 数字媒体资产管理 71 镜头检测的基本原理 基本假定 一个镜头内的相邻帧间有较强的连续性和相似性 内容不会有大的变化选择合适的帧间差别测度和合适的阈值 当相邻帧图象间的差别大于阈值时 就认为出现了镜头切换对帧间差别测度的要求 对镜头切换敏感对镜头内图象的变化不敏感 数字媒体资产管理 72 镜头检测的主要方法 基于像素差的方法 基于统计量的方法 基于图象特征的方法 基于灰度或彩色直方图的方法 区域块法 时空流法 压缩域中的方法 数字媒体资产管理 73 颜色直方图 常用测度 颜色直方图镜头内图象变化的原因 运动 光照 小噪声颜色直方图对目标运动和小噪声不敏感 因此得到广泛应用颜色直方图对光照变化非常敏感 简单的光强变化就会引起直方图的突变 数字媒体资产管理 74 颜色比值直方图 相邻象素颜色的比值在光照变化时是不变的颜色比值直方图的差可以作为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论