




已阅读5页,还剩63页未读, 继续免费阅读
(教育技术学专业论文)网络多媒体教育资源数据库检索研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山东师范大学硕士学位论文 网络多媒体教育资源数据库检索研究 摘要 不断向前发展的社会对教育提出的要求越来越高。作为一种现代化的教学手段, 多媒体教学有效地促进了教育的信息化,积极地推动了教育的改革和发展。多媒体 教学的开展离不开多媒体教育资源,目前,网络已成为全球最大的多媒体教育资源 库。搜索引擎是人们从网上获取信息的亲密助手,但通用的搜索引擎多采用基于关 键词的检索,利用它们从网上检索教学和学习所需的多种媒体资源的效率往往不高。 本文在研究基于内容的多媒体检索的基础上,完善了一个面向基础教育的网络多媒 体数据库检索系统,以期为中小学教师和学生等相关用户提供高效的、专业的网络 多媒体资源检索服务。 本文以中小学教材为依据组织基础教育多媒体主题词,从网上搜索、下载与主 题词相关的多媒体教育资源。然后分析、提取多媒体的相关属性,建立多媒体教育 资源属性索引数据库。对基于内容的图像、动画( f l a s h ) 、视频和音频数据库检索 进行了研究,以a s p 技术为支持实现了一个网络多媒体教育资源数据库检索系统。 检索系统是本篇论文的主要内容,检索一开始,系统要对用户提交的多媒体内 容和颜色这两项查询文本进行处理。论文提出了一种新的中文分词算法快速双 向分词算法,并根据该算法开发了一个分词模块,用于对内容描述查询文本进行中 文分词。将中文分词所得结果中没有实际意义的词语和系统设定的缺省词语过滤掉, 即可得到描述目标多媒体内容的关键信息。系统将根据该信息计算目标多媒体和数 据库多媒体的内容描述相似度。另一方面,系统还需将颜色查询文本中的颜色名转 换成h s i 颜色模式值,以便于计算目标多媒体和数据库多媒体的颜色相似度。 图像、动画、视频和音频四种多媒体类型各有其特征和属性,检索系统根据它 们的主要属性设置检索条件,这些检索条件是和数据库多媒体表中的主要字段对应 的。论文用相似度来衡量目标媒体和库中媒体之间的差距,系统通过比较用户根据 检索条件提供的查询信息与数据库表中记录的相应字段值,计算目标媒体和库中媒 体的相似度。不同的多媒体检索条件的相似度计算方法不同:对于格式和大小等简 单的检索条件,系统采用布尔检索计算其相似度,即只有当用户提供的和库中存储 的严格匹配时相似度才为l ,否则为0 。而对于内容和颜色等相对较复杂的检索条件, 系统采用模糊检索计算其相似度,不同的检索条件的模糊算法不同。比如,系统比 较处理后的内容描述查询文本与数据库表中记录的内容描述字段值,把它们的同义 t 山东师范大学硕士学位论文 词比率定义为目标媒体和库中媒体的内容相似度。多媒体总相似度等于多媒体各相 似度之积。 为了提高检索效率,系统为多媒体数据库各表中的内容描述字段建立了索引, 索引的使用加快了检索系统在多媒体内容描述检索条件上的检索速度。在为用户输 出结果之前,检索系统将结果记录集放入了缓存,缓存的使用缩短了用户在输出页 面进行翻页的时间。另外,本文还研究了如何提高a s p 的执行效率,对检索系统的 程序代码进行了改善。 用户登录网络多媒体教育资源数据库检索系统后描述目标媒体,发出检索请求, 然后由系统自动处理查询信息,计算各数据库媒体与目标媒体的相似度,把满足条 件的记录资源的预览图和相似度等相关信息返回给用户。初步实验结果表明,对于 多媒体数据库表中属性信息标注准确、详实的记录,系统检索结果的准确率较高, 索引和缓存等的使用使系统检索的速度明显提高。 【关键词】多媒体主题词;索引数据库;中文分词;相似度 【分类号】6 4 3 4 i i 山东师范大学硕士学位论文 r e s e a r c ho nr e t r i e v a lo fn e t w o r km u l t i m e d i ae d u c a t i o n a lr e s o u r c e s d a t a b a s e a b s t r a c t t h es o c i e t yd e v e l o p sc o n t i n u o u s l y , a n di tm a k e si n c r e a s i n gd e m a n d so ne d u c a t i o n a sam o d e mt e a c h i n gm e t h o d ,m u l t i m e d i ai n s t r u c t i o nh a sp r o m o t e dt h ei n f o r m a t i z a t i o n , r e f o r ma n dd e v e l o p m e n to fe d u c a t i o na c t i v e l ya n de f f e c t i v e l y m u l t i m e d i ae d u c a t i o n a l r e s o u r c e sa r en e c e s s a r yf o rt h ea p p l i c a t i o no fm u l t i m e d i ai n s t r u c t i o n a tp r e s e n t ,t h e i n t e r a c th a sb e c o m et h eb i g g e s tl i b r a r yo fm u l t i m e d i ae d u c a t i o n a lr e s o u r c e s s e a r c h e n g i n e sa r ep e o p l e sg o o dh e l p e r sw h e nt h e yt r yt oo b t a i ni n f o r m a t i o nf r o mt h ei n t e r a c t h o w e v e lm o s tg e n e r a ls e a r c he n g i n e sa r eb a s e do nk e y w o r d s ,a n dt h e ya r en o tv e r y e f f i c i e n ti ns e a r c h i n gf o rav a r i e t yo ft e a c h i n ga n dl e a r n i n gm e d i am o r eo f t e nt h a nn o t a f t e rs t u d y i n gc o n t e n t - b a s e dr e t r i e v a lo fm u l t i m e d i a ,t h i sp a p e ri m p r o v sar e t r i e v a ls y s t e m o fn e t w o r km u l t i m e d i ad a t a b a s e si ne l e m e n t a r ye d u c a t i o n ,w i t hav i e wt op r o v i d et e a c h e r s , s t u d e n t sa n do t h e rr e l a t e du s e r sw i t he f f i c i e n t ,p r o f e s s i o n a lr e t r i e v a ls e r v i c eo fn e t w o r k m u l t i m e d i ar e s o u r c e s t h i s p a p e ro r g a n i z e sm u l t i m e d i ak e y w o r d sa c c o r d i n gt op r i m a r ya n ds e c o n d a r y s c h o o lt e x t b o o k s ,a n dt h e ns e a r c h e sa n dd o w n l o a d sm u l t i m e d i ae d u c a t i o n a lr e s o u r c e s f r o mt h ei n t e r a c t t h e n ,i ta n a l y s e sa n de x t r a c t st h ep r o p e r t i e so ft h o s em u l t i m e d i a r e s o u r c e s ,a n de s t a b l i s h e si n d e xd a t a b a s e so fm u l t i m e d i ae d u c a t i o n a lr e s o u r c e s i td o e s s o m er e s e a r c ho nc o n t e n t - b a s e dr e t r i e v a lo fi m a g e ,f l a s h ,v i d e oa n da u d i od a t a b a s e s ,a n d d e v e l o p sar e t r i e v a ls y s t e mo fn e t w o r km u l t i m e d i ae d u c a t i o n a lr e s o u r c e sd a t a b a s ew i t h a s p t h er e t r i e v a ls y s t e mi st h em a i nc o n t e n to ft h i st h e s i s a tt h eb e g i n n i n go fr e t r i e v a l , t h es y s t e md e a l sw i t hc o n t e n ta n dc o l o rd e s c r i p t i o n so ft a r g e tm e d i a t h i sp a p e rb r i n g s f o r w a r dan e wa l g o r i t h mf o rc h i n e s ew o r ds e g m e n t a t i o n f a s ta n dt w o w a ya l g o r i t h m , a n dd e v e l o p sac h i n e s ew o r ds e g m e n t a t i o nm o d u l et os p l i tt h et e x to fc o n t e n td e s c r i p t i o n a f t e rt h a t ,t h es y s t e mf i l t e r so u tu s e l e s sw o r d sa n df i n a l l yg e t st h ek e yi n f o r m a t i o no f c o n t e n td e s c r i p t i o n o nt h eo t h e rh a n d ,t h en a m e so fc o l o r si nc o l o rd e s c r i p t i o nn e e dt ob e c o n v e r t e dt ov a l u e so fh s ic o l o rm o d e l i m a g e ,f l a s h ,v i d e oa n da u d i oh a v et h e i ro w nc h a r a c t e r i s t i c sa n dp r o p e r t i e s t h e r e t r i e v a ls y s t e ms e t sr e t r i e v a lc o n d i t i o n s ,w h i c hc o r r e s p o n dt ot h em a i nf i e l d so f m u l t i m e d i ad a t a b a s et a b l e s ,a c c o r d i n gt ot h em a i np r o p e r t i e so fm u l t i m e d i a s i m i l a r i t yi s u s e dt om e a s u r et h eg a pb e t w e e nt a r g e tm e d i aa n dl i b r a r ym e d i a t h es y s t e mc a l c u l a t e s i i i 山东师范大学硕士学位论文 s i m i l a r i t i e sb e t w e e nt a r g e tm e d i aa n dl i b r a r ym e d i ab yc o m p a r i n gq u e r yi n f o r m a t i o na n d t h ev a l u e so fc o r r e s p o n d i n gf i e l d s d i f f e r e n tc o n d i t i o n sh a v ed i f f e r e n tm e t h o d so f s i m i l a r i t yc a l c u l a t i o n t h e r ea r es o m es i m p l er e t r i e v a lc o n d i t i o n s ,s u c ha sf o r m a ta n ds i z e a sf o rt h e s ec o n d i t i o n s ,t h es y s t e mc a l c u l a t e sb ym e a n so fb o o l e a n ,t h a ti s ,t h es i m i l a r i t y i s1o n l yw h e nt a r g e tm e d i aa n dl i b r a r ym e d i am a t c hs t r i c t l y , a n do t h e r w i s ei ti s0 a sf o r t h eo t h e rc o n d i t i o n s ,s u c ha sc o n t e n ta n dc o l o r , t h es y s t e mc a l c u l a t e sb ym e a n so ff u z z y d i f f e r e n tc o n d i t i o n sh a v ed i f f e r e n tm e t h o d so ff u z z ys i m i l a r i t yc a l c u l a t i o n t h et o t a l s i m i l a r i t yo f m u l t i m e d i ai st h ep r o d u c to fe a c hs i m i l a r i t yo fm u l t i m e d i a i no r d e rt oi m p r o v et h ee f f i c i e n c yo ft h er e t r i e v a l ,t h es y s t e mi n d e x e sc o n t e n tf i e l d s o ft h et a b l e so fm u l t i m e d i ad a t a b a s e s t h eu s eo fi n d e xs p e e d su pt h er e t r i e v a lo f m u l t i m e d i ac o n t e n td e s c r i p t i o n b e f o r et h es y s t e mp r o v i d e sr e s u l t st ou s e r s ,i tp u t sr e s u l t s i n t oc a c h e t h eu s eo fc a c h ec a nr e d u c et h et i m eo fp a g e i n g i na d d i t i o n ,t h i sp a p e r d i s c u s s e sh o wt oi m p r o v ea s p se f f i c i e n c ya n dp r o g r a mc o d e sa r ei m p r o v e d u s e r sd e s c r i b et a r g e tm e d i aa n dg i v er e t r i e v a lr e q u e s t sa f t e rt h e yl o gi n t h e n ,i ti su p t ot h er e t r i e v a ls y s t e mt od e a lw i t hq u e r yi n f o r m a t i o na u t o m a t i c a l l y , a n dt h e nc o m p u t e s i m i l a r i t i e so fl i b r a r ym e d i a a tl a s t ,r e s u l t sa r ep r o v i d e dt ou s e r s ,i n c l u d i n gp r e v i e w s , s i m i l a r i t i e sa n do t h e rr e l a t e di n f o r m a t i o n a si ss h o w nb ye x p e r i m e n t a lr e s u l t s ,a sf o r t h o s er e c o r d sw h o s ei n d e xi n f o r m a t i o ni sa c c u r a t ea n dd e t a i l e d ,t h er e s u l t so fh a sh i g h e r a c c u r a c y a tt h es a m et i m e ,t h eu s eo fi n d e xa n dc a c h es p e e d su pt h er e t r i e v a lo b v i o u s l y 【k e y w o r d s m u l t i m e d i ak e y w o r d ;i n d e xd a t a b a s e ;c h i n e s ew o r ds e g m e n t a t i o n ; s i m i l a r i t y c a t e g o r y g 4 3 4 i v 独创声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究 成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已 经发表或撰写过的研究成果,也不包含为获得( 注:如没有其他 需要特别声明的,本栏可空) 或其他教育机构的学位或证书使用过的材料。与我一 同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名: 酹确 新粹冶螂 学位论文版权使用授权书 本学位论文作者完全了解堂撞有关保留、使用学位论文的规定,有权保留并 向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授 权堂撞可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影 印、缩印或扫描等复制手段保存、汇编学位论文。( 保密的学位论文在解密后适用本 授权书) 学位论文作者签名:西任两 导师签字: 签字日期:2 0 0q 年f 月t0 1 9 殇磅铭 签字日期:2 0 0 t 年忆月卜日 山东师范大学硕士学位论文 第一章绪论 1 1 研究背景和意义 计算机是人类最伟大的科技发明之一,它从根本上改变了人们的生活方式,成 为人们生活中不可或缺的一部分。随着计算机技术的快速发展,计算机被广泛应用 于社会生活的各个领域,包括教育。 多媒体教学是计算机技术在教育领域的应用的一个重要表现。多媒体教学是将 计算机、多媒体技术和现代教学有机结合起来的一种辅助教学手段。近年来,多媒 体教学在学校课堂中被广泛推广、运用,为信息时代改革、发展中的教育注入了一 股新鲜的活力,引起了从教学方法、教学模式到教学内容、教学理论等的一系列变 革。 作为一种现代教学手段,多媒体教学利用文字、图片、声音等多种媒体向学生 传递信息,这不仅可以有效地激发学生的学习热情,引起学生的学习兴趣,使学生 在轻松愉快的情感体验中自然地进入积极的思维状态n 3 ,而且可以为学生的多种感官 提供若干个兴奋点,有利于学生注意力的保持,增加获取信息数量,延长保持知识 时间乜3 。多媒体教学使教学的重点由单纯的传授知识技能转向开发学生的智力、培养 学生的能力。实践证明,合理运用多媒体教学可以在很大程度上优化教学效果、提 高教学质量。 相对于传统的教学手段,多媒体教学的优势是不言而喻的,而这要归功于多媒 体自身。多媒体一词译自英文m u l t i m e d i a ( 由m u t i p l e 和m e d i a 复合而成) ,一般 地,我们可以将其理解为文本、图像、声音、影片等信息载体中的两个或多个的组 合。文、图、声、像等媒体形式各有其特点,且它们的很多特点对教育教学来说特 别宝贵,正因如此,多媒体教学才在教育领域发挥出了如此强大和绝对的优势。 本文讨论图像、动画( f l a s h ) 、视频和音频四种多媒体形式,目前,它们在多 媒体教学中扮演着越来越重要的角色,它们在教育中的应用也成为越来越多的教育 工作者研究的热点。 随着网络和多媒体技术的快速发展,网上的图像、动画、视频和音频等资源越 来越丰富。当今的因特网已成为最大的多媒体资源库,越来越多的朋友喜欢从网上 下载图片、f l a s h 、电影和音乐等。资源共享是计算机网络最大的特点,互联网空前 地允许人们在一个最大的范围内共享海量的多媒体资源。 搜索引擎的出现为帮助人们从网上查找有用信息提供了极大便利。搜索引擎分 1 山东师范大学硕士学位论文 通用搜索引擎和专业搜索引擎口1 。通用搜索引擎多采用基于文本的检索,随着网络资 源的多样化,利用通用搜索引擎从网上寻找有用资源的效率通常很低。专业搜索引 擎也称垂直搜索引擎或者主题搜索引擎h 3 ,它针对某一特定领域,专注于自己的特长 和核心技术,在提供专业信息方面有着大型通用搜索引擎无法比拟的优势。相对于 基于文本的通用搜索引擎,基于内容的专业搜索引擎在多媒体资源检索方面的准确 率往往高很多。在教育领域,相对于利用g o o g l e 和b a i d u ,一个专业的网络多媒体 教育资源检索系统能够帮助教师和学生更有效地获取目标多媒体资源。 本课题正是基于以上背景,从中小学课本出发,建立基础教育多媒体主题词集, 搜索、下载网络多媒体教育资源,分析、提取多媒体的属性,并将多媒体整合到索 引数据库中。同时,开发一个面向中小学的网络多媒体教育资源数据库检索系统, 为教师、学生、家长以及其他相关用户提供高效的图像、动画、视频和音频检索服 务。登录网络多媒体教育资源数据库检索系统之后,用户可以使用自然语言发出检 索请求,然后由系统自动提取有关目标多媒体的关键信息,并根据该信息对多媒体 索引数据库表中的记录进行检索,最终将符合条件的资源作为检索结果返回给用户。 利用网络多媒体教育资源数据库检索系统,中小学教师和学生可以快速、准确 地获取自己所需的图片、f l a s h 、影片和声音,进而利用这些多媒体教育资源开展多 媒体教学或进行自主学习。网络多媒体教育资源数据库检索系统对于促进信息时代 中小学教育教学的信息化具有积极意义。 1 2 研究现状 1 2 1 基于内容的多媒体检索研究现状 传统的检索多是基于文本的,即利用关键词进行检索。基于关键词的检索方法 只是在用来检索文本信息时,其准确率才相对较高,而对于诸如图像、视频、动画、 音频等多媒体形式而言,其实质内容和语义关系是难以或无法用简单的关键词描述 的,因此,利用关键词检索图像、视频、动画、音频时,检索的精度很低,很难满 足用户的要求。为了解决这一问题,近十多年来,基于内容的多媒体检索在许多领 域逐渐活跃起来,并被若干学者积极研究、讨论。 所谓基于内容的多媒体检索,就是对多媒体本身的内容如图像的颜色、形状、 纹理,视频的镜头、关键帧,动画的场景、颜色,声音的音调、响度、音色等进行 分析,抽取其特征和语义,利用特征和语义建立索引并进行检索哺1 。图像、视频、动 画和音频具有不同的内容,它们的检索方法不尽相同。 2 山东师范大学硕士学位论文 1 基于内容的图像检索 基于内容的图像检索( c b i r ,c o n t e n t b a s e di m a g er e t r i e v a l ) 采用某种算法 提取图像的特征,对特征进行索引并把它存入数据库。在检索阶段,系统计算目标 图像的特征与特征库中的数据的相似度,将满足条件的图像返回给用户。 基于内容的图像检索的关键技术包括特征提取和相似性度量等。 ( 1 ) 特征提取 从广义上讲,图像的特征包括文本特征( 如注释) 和视觉特征( 如颜色) 两类。 图像特征的提取是基于内容的图像检索技术的基础,可以提取的图像特征包括颜色、 形状和纹理等旧。 ( 2 ) 相似性度量 相似性度量是指用某种函数来确定两幅图像的相似程度。由于图像相似性度量 依赖于具体的底层特征,因此其方法多种多样,没有哪一种适用于所有情况。相似 性度量方法对图像检索系统的性能有显著影响,其好坏影响到图像检索的性能,其 复杂度影响到图像检索的响应时间h 1 。 近年来,基于内容的图像检索得到了长足的发展,较有影响力的检索系统有: i b m 公司开发的第一个商品化的q b i c ( q u e r yb yi m a g ec o n t e n t ) 检索系统,哥伦 比亚大学研制的v i s u a ls e e k 图像查询系统和中国科学院计算机技术研究所的多媒 体信息检索系统m i r e s 等。 2 基于内容的视频检索 基于内容的视频检索( c b v r ,c o n t e n t - b a s e dv i d e or e t r i e v a l ) 采用分割技术 将视频序列分割成镜头,并在镜头内选择关键帧。然后提取镜头和关键帧的特征, 把特征存入索引数据库。最后,系统根据用户描述的目标视频的特征检索视频特征 库,将满足条件的视频返回给用户。 基于内容的视频检索的关键技术包括镜头分割和关键帧提取等。 ( 1 ) 镜头分割 镜头之间的转换方式分切变和渐变两种。切变镜头的检测方法有模板匹配法、 直方图法、基于边缘的方法、“滑动”窗口法和“双重窗口检测法等。对于镜头渐 变的检测,己经提出的方法有双阈值比较法、“滑动窗口法、基于模型的方法和b 一 样条拟合法等阳3 。 3 山东师范大学硕士学位论文 ( 2 ) 关键帧提取 提取镜头关键帧的方法有很多,把镜头的起始帧、中间帧或终止帧提取出来作 为关键帧是最简单的种方法。较理想的方法是通过分析视频视觉内容( 颜色直方 图等) 随时间的变化情况,确定所需关键帧数目,然后按照一定的规则为镜头抽取 关键帧。还有其它方法,如用无监督聚类技术来选择关键帧,甚至可以用拼接方法 生成一个全景图作为关键帧3 。 目前,国内外很多研究机构都在进行相关的视频检索工作,已经研发出多个基 于内容的视频检索系统,主要包括:i b ma l m a d e n 研究中心开发的q b i c 系统,哥伦 比亚大学的v i s u a ls e e k 系统和v i d e o q n 们系统,还有清华大学开发的t v f i ( t s i n g h u a v i d e of i n di t ) 系统。 3 基于内容的动画检索 动画是一种不可忽视的媒体类型,此处所说的动画不是指“动画影片 ,而是指 网页上的动画。通过分析网页动画,我们发现f l a s h 动画的数量最多,因此本文将 动画限定为f l a s h 动画。 f l a s h 动画的内容特征包括外部特征和内部特征。其中,内部特征是动画内部各 种媒体对象的特征,能够体现动画的主要内容。f l a s h 动画内部特征的提取可以根据 s w f 文件格式说明,利用内容分析方法,通过数学计算提取出来m 3 。基于内容的f l a s h 动画检索原理与图像和视频类似。 目前,浙江大学数字媒体计算与设计实验室提出并开发了一组能够有效管理 f l a s h 动画的工具集,该工具集按照对象、事件和交互三种概念分层描述f l a s h 动画 的内容,检索f l a s h 动画。 4 基于内容的音频检索 基于内容的音频检索要从音频数据中提取音频特征。音频的特征有两种,一种 是感知特征,如响度、音高、节奏等;另一种是非感知特征,如m e l 频率倒频谱系 数、平均过零率、基频、能量等n 刳。基于内容的音频检索原理与图像和视频类似。 国外研究机构对音频检索进行了多方面的研究。m u s c l e f i s h 是个商业化的基 于音频感知特征的音频搜索引擎。m a r y l a n d 大学的v o i c e g r a p h 结合基于内容和基于 说话人的查询进行检索,并能为用户提供一个音频图示查询接口n 朝。目前,国内研 究机构对基于内容的音频检索也做了大量探索,上海交通大学图书馆开发了一个基 于内容的音乐检索系统。 4 山东师范大学硕士学位论文 基于内容的多媒体检索是一个新兴的领域,国内外对它的研究仍处于探索阶段。 目前,诸如对多媒体内容特征的描述不够成熟、相关算法的处理速度慢、漏检和误 检率高、检索效果的评价体系不完善、不支持多种检索手段等问题还没有得到解决。 但随着网络技术、多媒体技术和数据库技术等的迅速发展,人们对基于内容的多媒 体检索的要求将不断增加,对基于内容的多媒体检索的研究将不断深入。 1 2 2 国内中小学多媒体教学资源网站建设现状 多媒体教学的开展离不开多媒体教学资源。随着网络的快速发展,多媒体教学 资源网站已成为最大的多媒体教学资源库。教学资源类网站以提供各种各样的教学 资源为主,如“k 1 2 中国中小学教育教学网 主要面向中小学教师、学生和家长, 为他们提供中小学教育教学资源。 国内具有代表性的中小学多媒体教学资源网站有:清华同方新课程多媒体教学 资源库( h t t p :2 1 8 9 4 3 1 7 m d l # ) 、中国教育资源网( h t t p :w w w c e r n n e t c n ) 、中小学教育资源中心( h t t p :e d u d o w n n e t ) 、创奇多媒体教学资源中心 ( h t t p :w w w c h 7 7 7 7 c n ) 和k 1 2 中国中小学教育教学网( h t t p :w w w k 1 2 c o m c n ) 等。 从多媒体教学资源和多媒体资源检索两个方面对这些网站进行调查,得出如下 结论: ( 1 ) 网络多媒体教学资源数量多,类型多,涉及各个学段的各门学科。比如, “清华同方新课程多媒体教学资源库 包含1 2 万余个文本、图形图像、音频、视频、 动画、课件等多媒体素材,“k 1 2 中国中小学教育教学网 的教案、图片、动画、视 频、音频和课件资源总数超过2 8 万条,且资源覆盖小学、初中、高中的语文、数学、 英语、物理、化学、生物、历史、地理、思品政等大部分科目。 ( 2 ) 网络多媒体教学资源检索功能不强。能否帮助用户快速、准确地查找教学 资源是教学资源网站面临的一个重要问题。目前,尽管一部分大型教育网站配备了 搜索引擎,但实际上许多教育网站在资源检索方面仍需迸一步改进。被调查的中小 学多媒体教学资源网站在多媒体资源检索方面存在以下具体问题: 一是教学资源网站多属于分类网站。按工作原理的不同,可以把搜索引擎分为 全文搜索引擎、目录搜索引擎和元搜索引擎三类。其中,目录搜索引擎虽然具有搜 索功能,但它算不上真正意义上的搜索引擎,而仅仅是按目录分类的链接列表而已。 中小学多媒体教学资源网站的搜索引擎多是目录搜索引擎,站中资源从学段、学科、 5 m 东师范七学硕士学位论文 类型等方面被分为若干类,用户仅是在靠分类目录查找教学资源。 二是教学资源网站多采用基于文本的检索方式。无论是基本检索,还是高级检 索,中小学多媒体教学资源网站为用户设置的检索条件,都是诸如名称、作者、简 介、类型和来源等信息而不涉及多媒体的具体内容。如中国教育资源网,其基本 搜索和高级搜索界而分别如图11 和幽1 2 。 口婀打怖3 # vm 群r 豫 二一圆 圈卜l 申图教育贵塬网基本搜索界面 “一 “0 l z 笆! j 图1 2 中固教育资塬网高级搜索界面 1 3 论文的工作和组织 论文的工作包括整理基础教育多媒体丰题词,建立毛题词集,利用g o o g lo 和 b a i d u 从网上下载1 7 丰题词相关的阁像、动画、视频和音频:分析并提取图像、动画、 视频和音频的文件属性和内容属性,并将属性信息存储到多媒体索引数据库巾。论 文的主要工作是完替网络多媒体教育资源数据库榆索系统,以期为中小学教师和学 等三等提供更富效率、更加实用的多媒体检索服务。主要工作包括以下三个方面: ( 1 ) 处理用户提交的多媒体内容和颜色查询文木以提取用一定形式表示的关 键查询信息,为厉续相似度计算做准备。 ( 2 ) 对于不同的多媒体检索条件,采用不同的方法,计算数据库多媒体与目标 多媒体之问的相似度,数据库记录的相似度大小是对数据库记录进行筛选和排序的 依据。 _ 兰 ; 麓罴三|虽 砌 聃; 山东师范人学硕士学位论文 ( 3 ) 通过为数据库表中的内容描述字段建立索引、将结果记录集暂时放入缓存、 优化a s p 程序代码,提高检索系统的效率,以为用户提供更加有效的检索服务。 论文的具体组织如下: 论文的第一章指出了本文的研究背景和意义,简要介绍了基于内容的多媒体检 索和国内中小学多媒体教学资源网站建设的现状。 论文的第二章负责介绍整个基础教育网络多媒体资源搜索系统及其三大模块: 多媒体资源的预搜索,多媒体属性的分析、提取和索引,网络多媒体教育资源数据 库检索系统。其中,检索系统是搜索系统的主体部分,也是本篇论文的主要内容。 论文的第三章介绍了网络多媒体教育资源数据库检索系统对用户提供的多媒体 内容和颜色两项查询文本的处理,重点介绍了对多媒体内容描述自然语言查询文本 的一系列处理。 论文的第四章介绍了图像、动画、视频和音频四种多媒体的相似度计算方法, 重点介绍了图像内容描述、主色调和主体相似度计算方法,在动画、视频和音频相 似度计算部分只介绍了它们与图像的不同之处。 论文的第五章介绍了提高数据库检索系统效率的几项技术,包括索引的建立和 使用、缓存的使用以及提高a s p 执行效率的一些做法。 论文的第六章记录了图像、动画、视频和音频检索实验结果,并从查准率和响 应时间两个方面对网络多媒体教育资源数据库检索系统的实验结果进行了分析。 7 山东师范大学硕士学位论文 第二章基础教育网络多媒体资源搜索系统 随着计算机和多媒体技术的发展,多媒体教学在教育尤其是中小学教育中的应 用越来越普遍。作为一种现代化的教学手段,多媒体教学为传统课堂注入了一股新 鲜的活力,其优越性在于它能够营造一个逼真的教学环境,增强教学信息的表现力, 提升学习的兴趣和效率m 3 等,而这些都得益于多媒体自身的特点集文、图、声、 像于一身。本文讨论图像、动画、视频和音频四种多媒体类型,目前,它们在多媒 体教学中扮演着越来越重要的角色,它们在教育中的应用也成为越来越多的教育工 作者研究的重点。 随着网络和多媒体技术的快速发展和结合,网上的多媒体越来越多。海量的多 媒体资源中蕴含着大量的图像、动画、视频和音频教育资源,为相关用户提供了广 阔的选择和发展空间,这是好事儿。但是,随着网络多媒体教育资源数量的激增和 类型的多样,人们想要借助通用搜索引擎,快速、准确地从网上获取自己感兴趣的 目标资源就不再是一件容易的事儿了。鉴于此,本章讨论“基础教育网络多媒体资 源搜索系统 ,该系统由多媒体资源的预搜索,多媒体属性的分析、提取和索引,网 络多媒体教育资源数据库检索系统三部分组成。其中,网络多媒体教育资源数据库 检索系统是基础教育网络多媒体资源搜索系统的主体,它是一个面向基础教育的, 基于内容的图像、动画、视频和音频检索平台,能够为中小学教师、学生和其他相 关用户提供专业的、有效的网络多媒体教育资源检索服务。 2 1 基础教育网络多媒体资源搜索系统总体结构 基础教育网络多媒体资源搜索系统由多媒体资源的预搜索,多媒体属性的分析、 提取和索引,网络多媒体教育资源数据库检索系统三大模块构成。其中,资源预搜 索模块根据基础教育多媒体主题词集,利用综合搜索引擎从网上搜索并下载图像、 动画、视频和音频四种多媒体文件和相关网页。属性分析、提取和索引模块负责分 析、提取上述四种多媒体的文件属性和内容属性,并将多媒体属性信息存入建立的 多媒体索引数据库。在最后一个模块,我们开发了一个“网络多媒体教育资源数据 库检索系统”,该系统旨在为相关用户提供高效的多媒体检索服务,它既是搜索系统 的主体部分,也是本篇论文的主要内容。 用户在登录网络多媒体教育资源数据库检索系统的同时,即确定了将要访问的 多媒体数据库,之后用户可以选择进入图像、动画、视频或音频子系统,通过输入 界面输入查询信息,然后由系统自动根据查询信息检索相应的多媒体索引数据库, r 山东师范大学硕士学位论文 最终把符合条件的数据库记录资源作为检索结果输出给用户。 基础教育网络多媒体资源搜索系统的总体结构如图2 一l n 副。 ; 多媒体资源的预搜索 ; 多媒体属性的分析、提取和索引 i 图2 一l 基础教育网络多媒体资源搜索系统总体结构 2 2 多媒体资源的预搜索 2 2 1 基础教育多媒体主题词集的建立 建立基础教育多媒体主题词集是实现基础教育网络多媒体资源搜索系统的第一 步。在多媒体资源的预搜索阶段,基础教育多媒体主题词集是后续搜索、下载的依 据,我们将根据基础教育多媒体主题词,如伟人照片、诗歌朗诵等,从w e b 中搜索、 下载图像、动画、视频和音频资源。 我们把可以用图像、动画、视频或音频表达的词称为多媒体主题词,如“柳絮 一词可以用图像表达,那么“柳絮 就是一个图像主题词。通过人工摘取词语和借 鉴他人词典两种途径,我们对人教版中小学课本中出现的多媒体主题词进行了收集 和整理。中小学教材涉及大量丰富的词语,我们在收集、整理多媒体主题词时遵循 了以下几条原则: ( 1 ) 从词性的角度看,多媒体主题词多为意义较实在的名词和动词,如“雪山 、 9 山东师范大学硕士学位论文 “读书 。 ( 2 ) 我们把一些课文题目、专业术语等也看作多媒体主题词,如“小壁虎借尾 巴 、“尺规作图”。 ( 3 ) 如果某主题词可用多种媒体类型表达,那么该主题词归属多个主题词文件。 如“布谷鸟”既是小学语文图像里的一个主题词,也是小学语文视频里的一个主题 词。 最终,我们从学段、学科和类型三个维度建立了基础教育多媒体主题词集。其 中,学段有小学、初中和高中三个;小学学科有五门:语文、数学、社会、科学、 思想品德与生活,初中学科有五f 1 :语文、数学、物理、化学、生物,高中学科也 有五门:语文、数学、物理、化学、生物;类型分为图像、动画、视频和音频四种。 基础教育多媒体主题词集由6 0 个主题词文件组成,主题词文件按“学段+ 学科+ 类型 的命名规则保存为t x t 格式的文件,如小学语文图像t x t 、初中物理动画t x t 和高 中生物视频t x t 等。 图2 - 2 是基础教育多媒体主题词集的组织结构示意图,各主题词文件中的多媒 体主题词数如表2 - 1 。 1 0 图2 - 2 基础教育多媒体主题词集组织结构( 部分) 表2 - 1 基础教育多媒体主题词数统计表 图像 动画视频音频 语文 1 0 2 33 0 81 6 59 0 数学 3 6 7 2 8 51 4 18 小学科学 8 9 6 37 25 社会 4 5 9 5 64 94 1 思品 5 9 0 1 6 81 1 75 1 山东师范大学硕士学位论文 表2 - 1 基础教育多媒体主题词数统计表( 续) 语文 1 9 l1 4 91 3 81 8 0 数学 1 6 53 0 44 91 9 初中物理 1 2 79 48 32 2 化学9 84 0 4 02 5 生物 1 7 91 2 01 5 31 9 语文 2 7 91 6 71 2 31 5 2 数学 8 77 22 73 0 高中物理1 3 2 9 87 61 2 化学 1 9 l1 5 41 1 61 8 生物 2 3 34 l6 08 另外,为了在基础教育范围内收集更多与多媒体资源相关的主题词,我们还建 立了一个w e b 多媒体基础教育资源主题词提交系统( h t t p :w w w c b x y s d n u e d u c n c b x y w o r d u p i n d e x a s p ) ,用以扩充我们的主题词集,扩大我们的预搜索范围。 2 2 2 网络多媒体教育资源的搜索和下载 在w e b 中搜索多媒体资源的有效方法是利用搜索引擎,搜索引擎分两种:通用 搜索引擎和专业搜索引擎。通用搜索引擎搜索范围较大,搜索准确率较低。专业搜 索引擎搜索范围较小,搜索准确率较高,但目前还没有商品化的专业的多媒体教育 资源搜索引擎n 朝。 我们根据基础教育多媒体主题词集,利用“w e b 多媒体个性化搜索分析系统”搜 索、下载网络多媒体教育资源。w e b 多媒体个性化搜索分析系统利用通用搜索引擎 g o o g l e 和b a i d u
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 离谱医生考试题及答案
- 课件显示作图过程
- 2025年中国拔罐器数据监测报告
- 客服管家考试题及答案
- 绞盘机司机数字化技能考核试卷及答案
- 井矿盐制盐工专项考核试卷及答案
- 多维地理信息采集员知识考核试卷及答案
- 旅游团队领队晋升考核试卷及答案
- 静脉抽血考试题及答案
- 河北石家庄市42中7年级下册数学期末考试专项练习试题(含答案解析)
- 2025-2026粤教粤科版(2024)科学三年级上册教学设计(附目录)
- 广东省深圳市福田区2024-2025学年八年级上学期语文期中考试试卷(含答案)
- 福建省泉州市2025届高三上学期质量监测(一)历史试卷(含答案)
- 《西门子S7-1200PLC编程及应用教程》全套教学课件
- 《鸿蒙应用开发项目教程》全套教学课件
- 肠道准备课件
- 精神运动康复
- 2025年陕西省中考数学试题卷(含答案详解)
- 2025年注册计量师考试计量器具管理与维护试卷
- 国内公司外汇管理办法
- 高中数学教师学情分析现状的调查研究
评论
0/150
提交评论