数字图书馆音视频资源信息检索技术研究.doc_第1页
数字图书馆音视频资源信息检索技术研究.doc_第2页
数字图书馆音视频资源信息检索技术研究.doc_第3页
数字图书馆音视频资源信息检索技术研究.doc_第4页
数字图书馆音视频资源信息检索技术研究.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-装- - 订 -线- 班级 姓名 学号 - 广 东 商 学 院 答 题 纸(格式二)课程 信息管理学 2011 2012 学年第 2 学期成绩 评阅人 请选取信息管理学课程内容相关主题:信息技术、信息采集与组织、信息分析与评价、信息检索与服务、信息系统、信息产业管理、企业信息管理、政府信息管理、个人信息与信息结构管理、信息人文管理、信息管理的历史、知识管理理论和信息管理学理论等,独立完成期末课程论文,格式参考毕业论文要求,字数3000-5000字。严禁剽窃、抄袭等作弊行为!本学期课程的期末成绩均已公布.虽然评分标准第一次课都讲过了,但还是在这里公示一下,各位同学可以对应着了解自己分数的来源. 北京林业大学20 0 200 学年第 2 学期论文考试要求 课程名称:两性关系与两性文化课程所在学院:人文学院考试班级:公选命题人:方刚论文要求: 1、 论文题目(范围) 1,本课程的收获与体会;2,中国多性伙伴或男性要解放读后感(二选一); 2、 论文要求手写 打印,字数范围为 2000-4000 字; 3、 论文上交时间: 2009年5月13日、14日随堂 4、 写作要求(请任课教师详细说明本次论文考试的内容要求)严禁剽窃、抄袭等作弊行为!分以下:全全文抄袭,或未按时交卷,或与选题内容毫不相关按不及格处理。信息管理学课程论文评分标准分值得分论文选题具有现实意义,文章结构安排合理。10分论文写作规范,引注正确。10分论文具有逻辑性条理清晰,论证有力。20分文章资料翔实,真实可靠。20分文章理论阐述全面,能够联系实际分析问题,解决问题。20分文章能够围绕主题合理论证,有自己的独立见解,分析问题透彻。10分文章富有创新性,能够提出新的观点。10分成绩数字图书馆音视频资源信息检索技术研究内容摘要随着互联网技术的发展,数字图书馆的资源种类也越来越丰富,不仅包括不同的信息格式,如磁盘、光盘等,还包括不同的信息类型,如书籍、图像、音频、视频等,但相应的数字资源信息检索技术却没有发展起来。本文通过对比三种信息检索技术在音视频资源检索上的优缺点,并选取其中一种技术来研究如何更有效、更准确地对音视频资源进行检索。关键词: 数字图书馆 音视频资源 信息检索技术AbstractWith the development of Internet technology, the types of digital library resources has become increasingly diverse, which including not only the different information formats, such as disk, CD-ROM,but also the different types of information, such as books, images, audio, video. But corresponding with digital resources, information retrieval techniques are not developed. By making the contrast of advantages and disadvantages of the three kinds of information retrieval in the retrieval of audio and video resources, and select one of them to study how to make it more effectively and more accurate to do the retrieval of audio and video resources.Key words: digital library audio and video resources Information retrieval techniques1 数字图书馆现状1.1 数字图书馆的特点(1)文献存储传统图书馆的馆藏载体主要是纸质文献,与之相比数字图书馆对藏书建设的影响,首先表现在图书馆“ 馆藏”的含义已被扩展,不仅包括不同的信息格式( 如磁盘、光盘、磁带等),还包括不同的信息类型(如书目信息、全文信息、图像、音频、视频等),如图1所示。这使得数字图书馆将不再受制于物理空间,它们所能收藏的书刊等资料的数量也将没有空间制约。数字图书馆是把信息以数字化形式加以储存,一般储存在电脑光盘或硬盘里,与过去的纸质资料相比占地很小。图1 数字图书馆数字化资源(2)主要技术具体来说,其涉及数字化技术、超大规模数据库技术、网络技术、多媒体信息处理技术、信息压缩与传送技术、分布式处理技术、安全保密技术、可靠性技术、数据仓库与联机分析处理技术、信息抽取技术、数据挖掘技术、基于内容的检索技术、自然语言理解技术等。1.2 存在的问题(1)资源浪费问题中国不少高校在盲目地建设数字图书馆,合作建设少、各自为政多的现象屡见不鲜,各数字图书馆的用户检索界面、检索语言和管理系统等存在较大差异,不同馆的数据库各不兼容,各系统之间难以相互联通、应用,大量的财力、人力、物力资源浪费在低水平的重复建设上。(2)信息版权问题计算机技术、自动化技术和网络技术的高速发展,使文献资源的格式转换、数字化作品的复制、下载、盗版等变得更加容易,数字化作品的知识产权保护问题比传统纸质文献也更为复杂和突出。(3)建设资金问题图2显示的是数字图书馆的硬件设备构成,可以看出数字图书馆建设是一个庞大、系统、长期的工程,硬件设备和软件资源的购置、网络布线工程、人员培训、数字化资源的更新、馆藏文献的数字化转换等等,都需要充足的经费作后盾,但经费不足偏偏又是困扰高校图书馆发展的老大难问题。图2 数字图书馆硬件设备结构7(4)图书馆员素质问题目前中国高校图书馆员队伍整体现状是专业知识和技能普遍不能适应数字图书馆发展的要求。随着数字图书馆的兴起,馆员队伍中专业人员与技术人员少、工作热情欠缺、年龄老化等现实问题显得更为尖锐。而且一直以来高校图书馆存在高素质人才难以引进、另一方面馆内人才纷纷跳槽另谋高就的现象。对现有馆员队伍缺乏系统的、有计划的在职学习和培训,馆员和业务水平难以出现质的提高,知识结构和观念落后陈旧,无法适应提供数学化信息资源服务的要求,这也是不容忽视的一点。(5)信息检索技术问题传统的信息检索技术主要是针对文本文献,通过书名、作者以及出版社等标识来检索,在数字图书馆环境下,以多媒体、超文本为主要存储形式的海量数字化信息资源,关键词检索技术无法深入到多媒体信息的内容。例如存在一个视频:2012年政府工作报告,其中包含一个片段为:2011年政府工作回顾,当我们想找这个片段时搜索“2011年政府工作回顾”,是无法搜索到“2012年政府工作报告”这个视频的。1.3 研究点研究点:数字图书馆音视频资源的信息检索技术多媒体信息包括文本、图像、音频、视频等信息。若使用关键词检索就只能查询到媒体文件对应的文件名等特征,而无法对媒体文件的内容进行查询。所以对于多媒体信息的查询应该不同于简单的书目信息的查询。2 相关理论技术分析(1)全文检索技术 全文检索技术利用计算机程序扫描每篇文章中的每一个词, 建立以词或字为单位的倒排索引, 在此基础上, 用户使用关键词对文档进行查询时, 系统将返回包含该关键词的结果。图3所示为全文检索技术的过程。图3 全文检索概要过程全文检索技术主要是针对文本文献, 而对多媒体数据库检索方法的处理则比较简单。(2)基于内容的检索技术 基于内容的检索主要是利用媒体对象的语义、媒体的视觉特征或听觉特征进行检索, 它利用图像处理、模式识别、计算机视觉、图像理解等学科中的一些方法作为部分基础技术, 直接对图像、音频、视频内容进行分析, 抽取特征和语义, 利用这些内容特征建立索引并进行检索1。(3)智能信息检索技术 智能信息检索技术是一种主动信息检索技术,它可以根据用户事先定义的信息检索要求,甚至能从用户日常的检索行为、浏览行为中学习用户的兴趣、推理用户隐含的需求,检索出具有个性化的内容。最终选择:根据研究的主题选择:基于内容的检索技术。3 技术实现过程3.1 基于内容的音频检索 (1)概要 音频是对声音进行数字化处理得到的结果。音频数据一般用音量、音调、音强、带宽、音长和音色等属性来描述,其中音量、音调、音强、带宽和音长这五个属性易于通过技术手段进行信息化建模,而对音色的处理较为复杂。所谓音频检索, 是指通过音频特征分析, 对不同音频数据赋予不同的语义, 使具有相同语义的音频在听觉上保持相似2。在检索前,首先要对音频数据建立索引,索引可以基于韵律、旋律以及其它的感知或声学特征。(2)实现过程建立数据库, 对音频数据进行特征提取, 将音频数据装入数据库的原始音频库部分, 将特征装入特征库部分, 通过特征对音频数据聚类, 将聚类信息装入聚类参数库部分。检索时用户通过查询界面确定样本并设定属性值, 提交查询后系统对样本提取特征, 结合属性值确定查询特征矢量。检索引擎对特征矢量与聚类参数集匹配, 在特征库和原始音频库中检索一定数量的相应数据, 并通过查询接口返回给用户。图4所示为音频检索系统的结构示意图。图4 音频检索系统结构示意图3.2 基于内容的视频检索(1)概要视频是一个时间坐标上的图像帧序列3。视频检索就是在大量的视频数据中找到所需要的视频片断。视频数据可以用场景、镜头和帧来描述。动态视频检索需要对视频信息进行视频分割,将视频数据分割为镜头, 在此基础上,从每个镜头中抽取关键帧,关键帧是用于描述一个镜头的关键图像,可按颜色、形状、纹理等特征检索。图5所示为视频的分层结构图。图5 视频分层结构图(2)实现过程 根据运动和视觉信息将一段视频分割为视频序列, 然后在此基础上构造高层的语义结构, 如场景等, 同时在镜头内找到若干个关键帧来代表镜头的视觉内容。 在视频结构化的基础上, 提取各关键帧的观察特征以及运行参数和相机参数, 并存入视觉数据库中。由用户构造查询, 系统基于数据库中的特征处理查询并将结果反馈给用户。图6所示为视频检索过程。图6 视频检索过程4 总结(1)优势基于内容的检索技术解决了在多媒体上按关键词检索的局限性,它能从媒体内容中提取信息线索, 它突破了传统的基于关键字检索的局限,直接对文本、图像、视频、音频进行分析, 抽取特征, 利用这些内容特征建立索引并进行检索。这对于具有丰富内涵的音视频信息的检索, 更能满足查询者的需求。(2)存在问题 主要包括多媒体特征的描述和特征的自动提取、多媒体的同步技术、匹配和结构的选择问

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论