第8章 多媒体数据库_第1页
第8章 多媒体数据库_第2页
第8章 多媒体数据库_第3页
第8章 多媒体数据库_第4页
第8章 多媒体数据库_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第8

多媒体数据库引言8.1多媒体数据库概述8.1.1传统的数据库技术8.1.2多媒体数据库的特点8.1.3多媒体数据库的功能8.2多媒体数据库的管理8.2.1多媒体数据的管理8.2.2多媒体数据库管理系统的体系结构8.3多媒体数据库的检索8.3.1基于文本的多媒体数据库检索8.3.2基于内容的多媒体数据检索技术概述8.3.3基于内容检索的应用8.3.4多种类型媒体对象检索的应用本章小结思考与练习引言与数值、字符等格式化数据不同,图像、音频、视频等媒体信息所涉及的是非格式化数据,并且数据量相对庞大,我们一般称其为多媒体数据。

传统的数据库系统在多媒体数据的处理、存储和检索上显得力不从心,因此需要研究和建立一种新型数据库技术——多媒体数据库技术。

本章首先介绍了传统数据库的一些基本知识,然后介绍了多媒体数据库涉及的主要内容,最后对多媒体数据库中的一个重要的研究内容:基于内堂的数据检索做了介绍。8.1多媒体数据库概述数据库(Database)是一个依照某种数据模型,组织、存储和管理数据的数据集合。数据库的两层含义:1.数据库基本概念是一个实体,能够合理保管数据的“仓库”,用户在“仓库”中存放要管理的事务数据。是数据管理的新方法和技术,能更合适的组织数据、更方便的维护数据、更严密的控制数据和更有效的利用数据。8.1.1传统的数据库技术2.数据库管理数据的特点数据结构化:从全局整体观点组织数据。描述数据时,既描述数据本身,又描述数据间关系;既考虑某个应用的数据结构,又考虑整个组织的数据结构。数据具有高共享性、低冗余度:通过数据模型和数据控制机制提高数据共享性数据共享可以大大减少数据冗余数据和程序之间独立性较高指数据的组织和存储方法与应用程序互不依赖、彼此独立包括物理数据的独立性和逻辑数据的独立性两个方面。2.数据库管理数据的特点数据的安全性和完整性较高数据库系统通过数据保护措施防止数据破坏。数据库系统能提供完整性检查。数据可以并发使用并能保证数据的一致性数据库系统提供并发机制和协调机制,允许在同一时间内,多个用户同时对数据实现多路存取,而不产生任何冲突,数据不遭到破坏。数据库的故障恢复提供一套方法及时发现故障和修复故障,从而防止数据不被丢失或破坏。数据库的运行管理功能:核心功能,包括:多用户环境下的并发控制安全性检查和存取限制完整性条件检查和执行运行日志组织管理事务管理和自动恢复等数据库操作功能:数据操作语言DML可进行增删改查等操作数据定义功能:DBMS提供数据定义语言DDL提供建库机制,可建立和修改库结构、存储结构、数据间联系,定义数据的完整性约束条件和保证完整性的触发机制等。3.数据库管理系统的主要功能数据库维护功能:包括:数据库数据的载入、转储和恢复,数据库的维护及数据库的功能、性能分析和检测等。数据库通信功能:与操作系统的联机处理、分时系统及远程作业输入的相关接口负责处理数据的传送与网络中其他软件的通信以及数据库之间的互操作3.数据库管理系统的主要功能表示数据之间联系的方法。先后经历了层次模型、网状模型、关系模型和面向对象模型等阶段目前关系模型在实际应用中处于主导地位,而面向对象模型估计在不久的将来将会得到广泛的应用。4.数据模型满足以下条件:有且仅有一个结点无父结点,这个结点称为根结点。除根结点之外,其他结点有且仅有一个父结点。层次模型满足以下条件:允许一个以上的结点无父结点。一个结点可以有多个父结点。网状模型数据:二维表中的元素,表格中每一行称作一个元组,相当于一个记录值;列:属性值集,列的名字称为属性名。关键字(Key):能够唯一识别一个元组的属性。关系模型多媒体数据的数据量大,数据差异也大。媒体种类多,且每种媒体数据在又演变出几十种不同的媒体格式。多媒体数据具有模糊性。难以表达和描述。多媒体数据的分布性。多媒体事务的处理时间比传统事务要长。不同应用系统对多媒体数据的传输、表现和存储方式的质量要求不一样。多媒体信息涉及的版本众多,包括历史版本和选择版本。数据量大,8.1.2多媒体数据库的特点1.多媒体数据的特点需要设计合适的数据库的组织和存储方法。多种媒体类型增加了数据处理的困难。数据库的多解查询。用户接口的支持。多媒体信息的分布性影响多媒体数据库体系。数据库应增加处理长事务的能力。

对于不同应用的不同的服务质量的要求,要根据的情况进行控制。版本控制的问题。2.多媒体数据对数据库的影响8.1.3多媒体数据库的功能能表达和处理多种复杂的数据类型。存储技术具有数据压缩和解压等新功能。有能组织和管理各种媒体数据的特征和集成机制的时空关联的方法。强调物理数据、逻辑数据和媒体数据独立性。提供比传统数据库更强大的操作。提供网络分布式数据功能。具有开放功能。提供事务和版本管理功能。多媒体数据库的恢复和安全机制功能。8.2多媒体数据库的管理8.2.1多媒体数据的管理实现多媒体数据管理的三种途径:1、扩充关系数据库2、面向对象数据库方式3、基于超文本和超媒体方式1.扩充关系数据库主要有三种:扩展现有的数据类型。增加一种大二进制对象BLOB(BinarylargeObject)字段来支持对多媒体数据对象的存取。扩充用户自定义的数据类型允许用户自定义一个抽象数据类型作为另一关系的列的值,而不仅仅是采用系统己定义的数据类型。扩充嵌套语义,采用NF2数据模型

2.面向对象数据库方式更接近人类思维方式。面向对象数据模式语义丰富,具有很强的抽象能力,具有良好的可扩充性,可以很好地满足复杂的多媒体对象的各种表示需求。以非线性的信息组织方来管理多媒体对象,较符合人们的思维方式,较适合制作电子文档或电子出版物,但不适合一般用户的资料管理。3.基于超文本和超媒体的方式8.2.2多媒体数据库管理系统的体系结构针对每一种媒体建立一个独立的数据库管理系统;这些数据库通过相互通信来协调和执行相应操作;对每种多媒体数据的管理是分开的。缺陷:当多种媒体的联合操作时,增加了用户的负担。如果各种媒体数据库设计时没有按照标准化的原则进行,他们之间的通信和使用都会产生问题。1.组合型多媒体数据库结构各种类型的媒体统一建模,只用一个单一的多媒体数据库进行管理,并只用一个多媒体数据库管理系统对这些媒体信息进行操作,各种用户需求被统一到一个多媒体用户接口上,多媒体的查询检索结构可以统一表现。缺陷:目前还没有一个比较恰当而且高效的方法来管理所有的多媒体数据,因此很难实现。2.集中型多媒体数据库结构多个数据库管理系统组成的,每个数据库管理系统之间没有主从之分,只要求系统中每个数据库管理系统能谐调地工作。缺陷:通信中必须首先解决每个成员多媒体数据库系统的差异。3.协作型多媒体数据库结构适合网络环境下的工作。系统对每一种媒体的操作各用一个服务器来实现,所有服务的综合和操作也用一个服务器完成,与用户的接口采用客户进程实现。客户与服务器之间通过特定的中间系统连接。缺陷:要对服务器和客户进行仔细的规划和统一的考虑,采用标准化和开放的接口界面。4.客户机-服务器型多媒体数据库结构8.3多媒体数据库的检索8.3.1基于文本的多媒体数据库检索利用人工对多媒体信息进行分析,并抽取反映该多媒体数据的物理特性和内容特性的文本信息;对这些文本信息按照学科领域分类,或用关键字标引,并建立类似于文本文献的标引著录数据库。用户则通过输入关键字,匹配查询(关键字)和多媒体信息的注释来搜索相关数据。1.基于文本的多媒体数据库检索流程利用文件扩展名和超文本标识。将多媒体文件名和文字解说中带有的媒体信息作为关键词。多媒体所在网页的标题或多媒体数据附近的文本。人工选择或指定的某些多媒体信息内容的关键词。2.检索途径优点:利用关键字匹配的多媒体检索技术成熟,查询效率高。缺点:人工注释工作量大,在海量系统中几乎是不现实的;支持的查询复杂程度完全取决于人工标注的详尽程度,会出现同一对象描述程度不一的情况;人工标注信息带有很大的主观性;文本描述无法完全揭示和表达多媒体信息的实质内容和语义之间的关系,难以充分揭示和描述多媒体数据中有代表性的特征;对于实时广播流媒体,人工处理是完全不可行的3.基于文本检索的优缺点“内容”的概念:概念级内容:表达对象的语义,一般用文本形式来描述,通过分类和目录来组织层次浏览,用链来组织上下文关联。感知特征:视觉特征,听觉特征等。逻辑关系:音频、视频对象的时间和空间关系,语义和上下文关联等。信号特征:通过信号处理方法获得的明显的媒体区分特征。特定领域的特征:与应用相关的媒体特征。8.3.2基于内容的多媒体检索技术概述特征抽取系统。将用户或系统标明的媒体对象的特征提取出来。可由人工或系统自动完成;可以是全局性的或针对某个目标的。查询系统。以示例查询的方式向用户提供检索接口。主要是相似性检索。1.基于内容检索系统的体系结构(1)提交查询要求。(2)相似性匹配。(3)返回候选结果。(4)特征调整。2.基于内容检索的过程(1)模式识别法用户在查询请求中给定图像、声音或视像数据,系统用模式识别技术,把该媒体对象与多媒体数据库中存储的同类媒体对象进行逐个匹配。(2)特征描述法给每个媒体对象附上一个特征描述数据,用这种特征描述来表达媒体数据的内容。关键问题是如何获取这种特征描述数据。(3)特征向量法用图像压缩技术对图像进行分解并向量化。3.基于内容的检索方法直接从媒体内容中提取信息线索。基于内容的检索是一种近似匹配,这一点与常规数据库检索的精确匹配方法有明显不同,基于内容的检索只能是一种相似度的检索。在应用中要换取其他性能的提高(比如检索速度),因此不要求查询结果一定是多媒体数据库中满足相似度和检索结果集合大小限制的所有对象,而允许有所遗漏。特征提取和索引建立可由计算机自动实现,避免了人工描述的主观性,也大大减少了工作量。4.基于内容检索的特点关键技术颜色特征的提取颜色特征表达方法有颜色直方图、颜色矩、颜色集、颜色聚合向量以及颜色相关图等,而颜色直方图是最常用一种方法。纹理特征的提取纹理特征的提取方法主要有结构分析方法、统计分析方法和频谱分析方法。形状特征的提取形状表示:基于边界的和基于区域的。前者典型方法是傅立叶描述子;后者典型方法有不变矩等。8.3.3基于内容检索的应用1.基于内容的图像检索关键技术(1)镜头分割技术通过对镜头边界的检测将视频分割为各个独立的镜头。主要有基于全局特征的切变检测、基于局部特征的切变检测以及闽值法、光流法和模型法渐变检测法。(2)关键帧提取技术有基于镜头边界、基于图像信息、基于运动分析、基于某种聚类算法等各种方法。(3)动态特征提取技术利用摄像机操作的表示来查询镜头,可以利用运动方向和幅度特征来检索运动的主体目标。2.基于内容的视频检索分类:(1)语音检索。语音检索技术主要包括①基于关键词检出技术的语音检索。②基于大词表连续语音识别技术的语音检索。③基于子词基元的语音检索。④基于说话人的语音检索技术。(2)音乐检索。可以采用哼唱、节拍拍打、演奏输入、乐谱录入等多种方式提交查询请求进行检索。(3)音频例子检索。可以分为两种:一种是将某类音频用一个模板表示出来,对于用户提交查询的音频例子,先使用模板去进行匹配,判断其属于模板,然后将这类模板对应的音频例子按序反馈给用户;另一种是对每个音频例子建立模板,然后进行相似匹配。3.基于内容的音频检索查询结果既能反映语义层次上的相似性,而能体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论