(教育技术学专业论文)图书馆用户的多媒体资源使用行为分析.pdf_第1页
(教育技术学专业论文)图书馆用户的多媒体资源使用行为分析.pdf_第2页
(教育技术学专业论文)图书馆用户的多媒体资源使用行为分析.pdf_第3页
(教育技术学专业论文)图书馆用户的多媒体资源使用行为分析.pdf_第4页
(教育技术学专业论文)图书馆用户的多媒体资源使用行为分析.pdf_第5页
已阅读5页,还剩46页未读 继续免费阅读

(教育技术学专业论文)图书馆用户的多媒体资源使用行为分析.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 随着多媒体技术和网络技术的快速发展,图1 5 馆可以获得的多媒体资源越米越多,同时 用户对多媒体资源的需求也越米越大。用户已经成为图二1 5 馆信息资源建设需要考虑的第一要 素。通过研究j f j 户的行为能够发现用户的使用习惯利兴趣点,进而对信息资源实施组织优化 和深度揭示。目前,多媒体资源的用户行为的研究主要集中在直观数据量统计上,而对于用 户行为分析和特征提取、用户行为模式的生成等方面的研究还有待加强。 基二f 以上的原因,本文在研究多媒体资源服务的特征和用户行为分析理论的基础上,提 出了一种通过收集用户使用资源的行为数据,进行数据整理君i 挖掘分析的模型。该模型包含 以下阶段:数据收集、用户识别、会话识别、生成规则和规则应用。论文中对该模型进行了 整体规划和详细设计,并利用w e b 使用挖掘等技术实现了一个多媒体资源川户行为分析的原 型系统。该系统的特点有:直接使用数据库存储 l j 户的资源使 j 记录,从而达到了简化数据 过滤的目的:采川了频繁模式树算法对,h j 户信息进行分析。 将该原型系统应用于南京师范火学图二口馆多媒体资源的用户行为分析上,详细阐述了实 验的具体过程、实施方法和检验手段,提出了三种针对多媒体资源特色服务的应用: 1 )个性化资源推荐。对用户资源的使用信息进行分析,发现用户的资源使用习惯和使 用兴趣,进而为用户提供个性化的资源推荐。 2 )形成专题资源。根据资源之间的关联程度形成某一研究领域的专题资源,方便用户 使用,同时也提高了资源的利用率。 3 )借鉴式学习。通过提供最近用户的资源使用情况,为当前用户的学习提供可以借鉴 的样例。 本文完成了对图书馆多媒体资源的用户行为分析的理论研究和实验应用,并提出了进一 步完善行为分析模型的设想。对于改进资源组织结构,提供个性化特征的资源服务等相关研 究具有一定的参考价值。 关键词:多媒体资源用户行为关联规则个性化推荐 a b s t r a c t w i t ht h ed e v e l o p m e n to fm u l t i m e d i at e c h n o l o g ya n dn e t w o r kt e c h n o l o g y ,m o r ea n dm o r e m u l t i m e d i ar e s o u r c ec a l lb eu t i l i z e db yl i b r a r y a tt h es a m et i m e ,t h ed e m a n df o ri n d i v i d u a lu s e rt o s h a r ea n de x c h a n g et h em u l t i m e d i ar e s o u r c eb e c o m e si n c r e a s i n g l yg r e a t e r t h eu s e rh a sb e e nt h e f i r s te s s e n t i a lf a c t o rw h e nl i b r a r yb u i l d s t h ei n f o r m a t i o nr e s o u r c e b ys t u d y i n gt h eu s e r sb e h a v i o r , w ec a nf i n dt h eu s e e sh a b i t sa n di n t e r e s t s t h e nw ec a no p t i m i z et h es t r u c t u r eo fr e s o u r c ea n dt h e d e e pe x p o s u r eo fc o n f i g u r a t i o n a tt h ep r e s e n tt i m e ,t h er e s e a r c ho fu s e rb e h a v i o rf o rm u l t i m e d i a r e s o u r c em o s t l yf o c u s e so ns t a t i s t i cd a t a t h e s ed a t aa r ec o m m o n l yi n t u i t i o n i s t 。b u t 如e ya r e d e f i c i e n ti nt h ea n a l y s i so fu s e rb e h a v i o r h o wt od i s t i l lt h e c h a r a c t e ro fu s e ra n db u i l dt h ep a t t e r n o f b e h a v i o ra r en o te n o u g h b a s e do nt h eu p w a r dr e a s o n ,t h ep a p e rf i r s t l ys t u d i e st h ec h a r a c t e ro fm u l t i m e d i ar e s o u r c e t h e nt h ep a p e rr e s e a r c h e st h e o r e t i cf o rt h eb e h a v i o ro fu s e r t h i sp a p e rp u t sf o r w a r dam o d e l w h i c ha c t u a l i z eb yc o l l e c t i n gt h ed a t ao fu s e rb e h a v i o r , t h e nc l e a nu pt h ed a t aa n dm i n e 。t h i s m o d e li n c l u d et h et h e r e i n a f l e rm o m e n t s :i n g a t h e r i n gt h ed a t a 、i d e n t i f yt h eu s e r 、r e c o g n i z et h e a f f a i r 、b u i l dt h er u l e 、a p p l yt h er u l e t h i sp a p e rf i r s ti n t r o d u c e st h ew h o l el a y o u ta n dd e t a i l e d d e s i g no ft h i sm o d e t h e n ,ap r o t o t y p es y s t e mo ft h i sm o d e lh a sb e e ni m p l e m e n t e db a s e do n d a t am i n i n g 。i nt h i sp r o t o t y p em a n yb a s i cf u n c t i o n sh a v eb e e na c c o m p l i s h e ds u c ha sr a wd a t a c a p t u r i n g ,b e h a v i o rd a t ap r e p r o c e s s i n g ,m o d ed e f i n i t i o n ,m o d em i n i n g ,m o d em a i n t e n a n c ea n d m o d ec o n t r a s t t h i sp r o t o t y p eh a st w ob a s i cs p e c i a l t i e s :p u tt h eu s e rb e h a v i o ri n t od a t a b a s e s t r a i g h ta n da d o p t i n gf p - t r e ea r i t h m e t i ct oa n a l y z et h ed a t a 。 t h ep a p e ra p p l i e st h ep r o t o t y p ei n t ot h eb e h a v i o ro f u s i n gm u l t i m e d i af i o s l 琏譬e t h e s er e s o u r c e s a r ec o m i n gf r o mt h el i b r a r yo fn a n j i n gn o r m a lu n i v e r s i t y t h e n ,t h ep a p e rp a r t i c u l a r l ye x p a t i a t e s t h ec o u r s eo fe x a m i n ea n dt h em e a n so fi m p l e m e n t a tt h el a s t ,t h ep a p e rb r i n g sf o r w a r dt h r e e c h a r a c t e r i s t i cm i n i s t r a n t st ot h em u l t i m e d i ar e s o u r c e t h e ya r e : 耋) i n d i v i d u a lr e s o u r c ec o m m e n d s b ya n a l y z i n gt h eu s e rb e h a v i o r , w ec a nf i n dt h eh a b i ta n dt h e i n t e r e s to f u s e r t h e nw ec a l lr e c o m m e n dt h er e s o u r c et ot h eu s e rv e r a c i o u s l y 2 ) f o r m i n gt h es u b j e c tr e s o u r c e w ec a np r o v i d et h es u b j e c tr e s o u r c et ou s e r t h e s es u b j e c t s f o u n do nc o r r e l a t i v er e s o u r c e s 。t h em e a s u r es u p p l i e sc o n v e n i e n c et ot h eu s e r , a n di m p r o v e st h e u s i n go f r e s o u r c e s 3 ) l e a r n i n gf r o mu s ef o rr e f e r e n c e w eo f f e rt h ee x a m p l eo fo t h e r su s e rf o rt h ec u r r e n tu s e r i n t h i sw a y , t h e yc a nl e a r ne f f i c a c i o u s l y f i n a l l y , t h i sp a p e rh a v er e s e a r c h e dm o d eu p d a t ea n da n o m a l yi d e n t i f i c a t i o nt e n t a t i v e l ya n d g i v e ns o m ef a r t h e rs u g g e s t i o n so fi m p r o v e m e n t ,t h i sp a p e rp r o v i d e sai m p a c tr e s e a r c hf o r p e r s o n a l i z a t i o no f m u l t i m e d i ar e s o u r c e k e y w o r d s : m u l t i m e d i ar e s o u r c e , u s e rb e h a v i o r , a s s o c i a t i o nr u l e s ,p e r s o n a l i z e d r e c o m m e n d a t i o n i l 学位论文独创性声明 本人郑重声明: 1 、坚持以“求实、创新 的科学精神从事研究工作。 2 、本论文是我个人在导师指导下进行的研究工作和取得的研究 成果。 3 、本论文中除引文外,所有实验、数据和有关材料均是真实的。 4 、本论文中除引文和致谢的内容外,不包含其他人或其它机构 已经发表或撰写过的研究成果。 5 、其他同志对本研究所做的贡献均已在论文中作了声明并表示 了谢意。 作者签名: 日期: 学位论文使用授权声明 本人完全了解南京师范大学有关保留、使用学位论文的规定,学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电 子版和纸质版;有权将学位论文用于非赢利目的的少量复制并允许论 文进入学校图书馆被查阅;有权将学位论文的内容编入有关数据库进 行检索;有权将学位论文的标题和摘要汇编出版。保密的学位论文在 解密后适用本规定 作者签名: 日期: 第1 章绪论 1 1 图书馆多媒体资源建设概述 随着计算机技术和网络技术的应用与发展,图二传馆文献在存贮载体上呈现出了多样化的 趋势。多媒体技术将计算机处理的信息从文本和数据,扩展到图形、图像、动画、视频、语 言、音乐等多种形式,以生动活泼的动态形式表现出来,使图1 5 馆的用户进入剑一个具有多 种层次的交互、控制和通信的信息活动中,给人以很强的视觉冲击力,留卜深刻的印象。 白2 0 世纪9 0 年代以米,美、英、德、意等两方国家和洲的日本、新加坡等国相继开始 数字图二持馆建设计划和开发,全球范嗣内兴起了一股数字图f 5 馆建设的热潮,并很快影响到 我国。中国试验型数字式图二 s 馆项目、教育部数字化图二够馆攻关计划、中国数字图书馆一i 二 程等国家级项目纷纷立项和实旌。多虫! i l 体资源是数字图j 饽馆的核心内容,多媒体资源建设是 数字幽j 侈馆建设的基础,是传统图二辂馆迈向数字图伟馆的必由之路。因此,对于高校图j 侈馆 来说,多媒体资源建设已经成为其目前面临的主要任务,进行多媒体资源建设已经成了高校 图侈馆发展的迫切需要心儿。 多媒体资源是指所有以电子数据的形式把文字、图像、卢音、动画等多种形式的信息存 储在光、磁等1 f 纸质载体中,并通过网络通信、计算机或终端等方式再现出米的资源。与传 统的文献信息资源相比,多媒体资源拥有无可比拟的优势,其内容丰富多样,占用存储空间 小,易于通过网络快速传输,获取十分方便、快捷,不受时空限制,并支持智能化的信息检 索手段。随着计算机和网络技术的迅猛发展,多媒体资源日益成为人类社会发展最重要的战 略资源,多媒体资源建设也相应引起了图书馆界越来越多的重视。从国内外图二1 5 馆的发展来 看,数字化和网络化是新的必然的发展方向。4 1 。 多媒体信息技术的发展,使图书馆改变了传统的单向信息传播模式,实现了双向信息传 播和多向信息传播,也为图二持馆的发展指明并提供了新的方向。如何充分地开发利刚好这些 资源,成为图1 5 馆t 作者密切关注的一个问题。要解决好这个问题,首先必须研究多媒体资 源服务对象,即 j 户。通过研究j j 户在使用多媒体资源时的各类操作行为,也就是用户的资 源使用行为,才能够发现用户的兴趣点和使h j 习惯,从而达到优化资源组织结构和提供个性 化服务的目的。 1 2 用户行为分析的相关应用 行为分析原本是心理学范畴的一个概念,由丁它具有很强的实用性和指导性,目前被应 用于多个领域。近年来国内外已经有一些研究机构对相当一部分领域的用户行为进行了相应 的研究,并加入了信息技术的元素,以下列举了些已存在的行为分析研究领域临引 1 。 、 ( 1 ) 消费市场用户行为分析 在商业领域,各行各业的竞争日趋加剧。商家之间在各个可能的地方展示实力,引进信 息技术,提高内部营运效率,竞争已警现多角化、多层次性。但无论采取何种竞争策略和手 段,都必须及时把握消费者的心理及行为特征。消费者受职业背景、文化层次、年龄结构的 影响,他f l j 的购物心理与行为既有一些共性规律,义有突出的个性特征。冈此,如果研究和 提取各个层次、各种类型用户的消费行为特征,针对不同受众的消费行为特征采取相应的营 销创新,就能够做剑有的放矢,并在竞争中取胜。 各类金融行为遇到了网络义有了很大的变化,电子商务、网络营销等新的商业形式纷纷 涌现,网上购物作为一种新的购物模式受到了消费者的普遍关注。网上购物是指j h 户为完成 购物或与之有关的任务而在网上虚拟的购物环境中浏览、搜索相关商品信息,从而为购买决 策提供所需的必要信息,并实践决策和购买的过程。它包括了两个部分,即一般的消费者购 物决策的信息活动模式和特殊的网上购物的信息活动模式。 不管是在传统的销售模式还是在网络销售模式中,对丁经销商而言消费者的行为都是复 杂而重要的。只有把握了消费者在不同时期的购物决策行为特征,并针对这些特征做出准确 的反应,才能成为激烈竞争中的胜利者。a d v e r t i s i n g c o m 通过对j e t t a4 网站用户行为的 研究发现旧1 ,如果基丁用户行为分析实施定向投放网络广告,将收到更加明显的效果。由此, 消费市场用户行为分析越来越受到各大行业的重视,各类用户行为分析的软件也应运而生。 如,国内的b m s y s 分析系统是北京广播学院i m i 市场信息研究所与清华紫光经过6 年市场历 练与磨合共同开发研制,专门针对企业、广告公司、媒介、市场研究公司、金融等行业用户, 为其提供有关消费者商品消费、媒体接触、生活形态等各方面的量化的分析,从而实施更为 准确和有效的市场营销策略的相关的软件分析系统。自b m s y s 分析系统面世以来,获得了多 方好评。 ( 2 )电信行业客户行为分析 中国电信市场正面临着一个全面开放的环境。由入世承诺中我们看到,国外的通信公司 将凭借资金、技术实力及管理、市场经验,在中国电信市场从增值业务开始,到数据业务移 动业务,再到基础电信业务和基础通信设施领域展开激烈角逐。如何把握市场变化、拥有稳 定的客户源、不断提高服务水平、科学配置资源、降低经营管理成本等课题就直接摆在了我 国电信企业决策者的面前。 电信客户行为分析是通过分析客户的通信活动即客户行为,识别对企业最有价值的客 户,分析哪些客户电信业务在增长,哪些客户在下降,增k 或下降的原冈是什么,通过挖掘 这些有价值的信息,提供决策支持,使电信企业可以采用更有效的市场营销策略和销售方法, 提高服务质量和客户满意度,保持现有客户和吸引新客户,降低成本,扩大市场份额。客户 行为分析的根本目的是提高电信企业的效益。 在数据仓库的应用中,最重要、最能产生效益却不被酱遍理解的就是对客户行为进行分 析。这类数据仓库应用主要是对客户态度和行为有一个完整的理解,因为许多电信企业现在 正在从垄断向不规则环境转变,这是客户驱动的结果,也就依次导致了一个通用的、迫切的 客户型数据仓库的概念。客户型的数据仓库,如客户化的呼叫计划和非高峰期折扣,已经成 为革新市场竞争的中心( 如m c i 的“朋友和家庭”计划,中国移动的“动感地带”等) ,其中 2 一些关键的应 j 包括:客户分割、促销分析、产品渗透、产品包的交叉销售分析、客户价值 分析、欺诈发现、竞争者跟踪、信h j 得分、价格灵活性和弹性分析、季节性影响分析、产品 收益率分析、忠诚度分析、需求预测、宏观经济影响分析等等。 ( 3 )w e b 使用 随着i n t e r n e t 的普及和w w w 的迅猛发展,用户对w e b 访问的信息已经成为世界上最大 的信息仓库之一。而信息的爆炸式增k 与人们注意力的有限性之间的矛盾也随之加剧。w e b 使j ;j 记录挖掘正是解决这一矛盾的有效手段,它从服务器、浏览器端的日忐记录和用户的个 人信息中抽取出感兴趣的模式信息,以发现用户访问站点的浏览模式,为站点管理员提供各 种利于w e b 站点改进或可以带米经济效益的信息,并可以通过w e b 推荐系统为 j 户提供个性 化服务。电子商务通过w e b 上的使用记录挖掘所提供的足够的知识,可以锁定相当数量的顾 客进入商务关系中,以改善销傅状况和保存客户关系,从而增加市场效益。另外,通过w e b 使用的个性了解,比较已存在顾客的综合个性,能在已有顾客的知识帮助下发掘出潜住的新 顾客的个性、生活方式和特点。w e b 使j j 记录挖捌结合了数据挖掘、信息处理、可视化、数 理统计等领域的成熟技术,但是在新的环境中,仍有许多新的问题需要考虑和研究。 ( 4 )网络入侵检测 网络的入侵检测系统就是根据分析用户的历史行为,基于川户的当前行为,完成对入侵 的检测,并留下证据,为数据恢复和事故处理提供依据。从检测方法米说,入侵检测主要可 以分为基于行为的和基丁知识的两种。基于知识的入侵检测也叫误用检测,它首先对标识特 定入侵行为的模式进行编码,建立误用特征数据库,然后对实际检测过程中得剑的审计事件 数据进行过滤,检查是否包含入侵行为的标识,从而得出结论。这种方法的原理和结构:作常 简单,准确性也很高。基于行为的入侵检测也叫异常检测,它对用户的历史行为进行建模, 建立正常情况下的概率模型。同时,对用户的行为进行检测,并和正常模型进行比较。如果 用户的行为偏离了正常的轨道,系统即进行记录和警报。由于这种方法在正常行为和用户历 史行为之间存在了较大的差异,所以会产生一些误报现象。 1 3 本文研究的目的与意义 1 3 1 研究的目的 目前,图书馆用户的多媒体资源使用行为的研究主要集中在统计读者使, j 网站及资源的 访问情况,如门户及资源的访问次数、经常访问的栏目和资源、资源的每天每月每年的访问 情况对比等,通过点击次数和点击率的研究来确定用户对资源的喜好。侧重于把访问量作为 评估资源的重要指标,通过增加如点击排行、最近热门等栏目米反映用户对资源的利川状况, 反映用户对不同资源的需求。但是当前的研究主要有以下的不足: 访问量统计方法不能反映出被访问资源之间的关系。 点击排行榜中的资源列表可以向用户呈现某段时间内哪些资源是被使用最多的,心户可 以根据这个列表米选择自己需要的资源,或者将这些资源作为优先使用的对象。多数推荐系 3 统的做法是根据文献的阅读频率或按人为的分类进行推荐,没有考虑用户的阅读习惯和阅读 兴趣。这些资源只是按照在某段时间内被点击次数的多少排序显示的,它们之间没有任何联 系,都是彼此孤立的呈现在用户的面前。 缺少对用户使用资源的过程性的分析 访问统计记录用户的每次点击资源的行为,在注册用户的历史记录中可以查询到其以往 的操作,但目前的应用主要足用于读者夯询自己的信息,从中找到可能需要再次使川的资源。 这些信息一般是按照时间顺序排列显示,而不能揭示山用户使用资源时的关注点。特别是缺 少对丁匿名访问的用户的资源使用过群的揭示,无法对匿名用户的行为特点进行分析。 个性化程度弱 为用户进行资源推荐时只能按照用户预先的设置的兴趣点进行推荐,要求用户提供必要 的信息,在信息提供的格式、准确性利系统操作上给州户带来诸多不便。而不能通过用户的 行为实时提供其可能需要的信息。 因此,本文研究的重点就是建立在如何有效的获取多媒体资源的j j 户行为,采用什么样 的方式进行处理和分析,试图挖掘出被访问资源的内在关系,以及片j 户使用资源的喜好,为 多媒体资源个性化服务提供可行的实施方案。 1 3 2 研究的意义 随着校园信息化的不断推进,高校图书馆已购买和自建了大量的多媒体资源,这些资源 日益成为教学科研活动中不可或缺的主要信息资源。而由于多媒体资源中存在着大簧的重复 信息,不同的资源间各不相关和异构,无法体现学科知识的内在联系,因此,这些资源还没 有充分发挥其作用,广大师生对多媒体资源的利用并不尽如人意。高校图书馆如何对多媒体 资源进行重组与优化管理,构建满足高校需要的知识库和知识网络,构建高质量、高效益的 多媒体资源服务体系,实现由信息服务到知识服务的转变,是目前积极思考和解决的重要课 题1 5 1 。对用户的使用行为进行分析在数字图j f 5 馆资源建中具有重要的意义: ( 1 )有利于实现资源重组:即打破原有信息资源的体系结构进行横向或纵向的重组、 去重或归并,形成新的有机整体,是一种化学性而非简单物理性的整合。具体的有两种应用 方式:一是按照新的标准,通过一定的技术手段,对单个原始资源库深化组织,提供在线分 类浏览服务,以增强用户对资源整体结构的把握;二是专题研究,对多个原始资源库中特定 专题信息进行提取、整理、加t ,依据特定的技术要求和内容标准,形成新的专题信息资源 库。 ( 2 ) 为个性化服务提供支持:即为特定的用户、特定的需求以特定的方式整合特定的 多媒体资源,挖掘出用户感兴趣信息、整合后主动推送,通过研究用户信息以挖掘相应的兴 趣爱好;也可是定题跟踪,即长期收集、整理、研究用户所需信息,整合后提供给用户,侧 重研究用户所需信息的内容,以提供浓缩性强的优质的信息产品。 4 1 4 本文的研究内容和组织结构 通过广泛收集整理资料,研究图饽馆多媒体资源服务的特点和用户行为分析理论,建立 用户行为分析模型,并给山基于关联规则挖掘模式的原型系统,以南京师范人学图+ l s 馆多媒 体资源的用户行为为背景,设计实现对数据集的描述,结果描述和分析,提出了针对多媒体 资源服务的具体应用。 本文共分五章: 第一章论述图二h 馆多媒体资源建设概况和用户行为分析的研究现状。指出目前研究的不 足,提出本文研究的目的和意义。然后介绍本文研究的内容和目录结构。 第二章研究图书馆多媒体资源的基本特点,为后面的研究提供可行性分析。 第三章研究用户行为分析理论,建立多媒体资源用户行为分析模型,并介绍行为分析所 采用的关键技术。 第四章没计多媒体资源的,f j 户行为分析原型系统,包括数据采集,用户识别,会话识别, 算法实现,生成规则等过程。 第五章以南京师范大学图- 5 馆多媒体资源服务平台为应h j 对象,进行具体实验,并将实 验结果应用到多媒体资源服务上。 最后是结论和展望,对所做:i :作进行总结,并阐述进一步的研究方向。 5 第2 章图书馆多媒体资源特征分析 本章主要介绍当前图1 5 馆多媒体资源服务的基本特点,了解用户使川其资源的背景。图 书馆多媒体资源的资源类型、服务对象和服务方式都有其自身的特点。图。1 5 馆多媒体资源类 型多样又相对固定,主要有:电子图二传、电子期刊、视频、音频、图片、课件等。用户利用 资源的目的性比较明确,主要的用户群体为教师和学生,他们的使朋多媒体资源时不同丁访 问一般的网站资源。 2 1 特定的资源类型 丰富的多媒体信息资源是图f 5 馆为用户提供多方面服务的物质保障,它主要包括随二 5 光 盘、音像资料、互联网上的信息资源及自身建设的信息资源库等。 随二饽光盘是随着电子信息技术及出版技术的日益成熟而出现的,在近年米呈现不断增多 的趋势。这类光盘主要包括各种随二传、随刊光盘,主要是以图j 1 5 、刊物为主。光盘作为书的 附件,对图够的内容进行形象、生动的延伸和补充,它与图j 5 是一个整体,两者配合使用才 能真正提高1 5 刊及电子附件的利用率和使用价值。 音像资料是经特殊技术加上而成的信息高度浓缩化的资料,主要包括多媒体c d r o m 光盘、d v d v c d 、c d 、磁带等,在图二饽馆馆藏中的比重将会逐渐增加,实用价值也会越来 越高。它的信息储量之大,给读者带米的视觉、听觉的直观效果是纸质文献所无法替代的。 网络技术的发展和互联网络的普及,为图二传馆提供了丰富的信息资源保障,拓展了广阔 的信息空间。图书馆多媒体资源建设根据自身服务对象的特点,选择合适的网络信息资源库, 努力申请获得合法使用权,使读者能够合法地充分利用网上资源。图j 1 5 馆整理、a n - r :形成特 色的多媒体信息资源库,主要包括各类电子图二传、电子期刊和各类专业电子数据库。 自建数据库内容上包括本馆馆藏书目数据资料库和自身创建独具特色的数据库,具备向 访问者提供二辂目数据、学习课件和专题素材库等。 以南京师范大学图书馆多媒体资源库为例,截至到2 0 0 7 年6 月份,多媒体资源收集情况 见表2 1 : 表2 1 南京师范大学图书馆多媒体资源表 资源类型数量 电子图二转6 3 1 0 8 5 电子期刊 3 6 1 1 2 视频文件 1 0 7 9 8 音频文件3 4 0 5 9 随1 5 光盘1 2 4 7 0 电子课件 5 6 9 2 。这里的多媒体资源分布于不l 司的管理甲台,通过专业软件m e t a l i b 实施统一资源调度。 6 这些资源采用数字化技术,将信息转换成计算机可识别的数字形式,并存放在远程服务 器上,用户可通过高速的网络传输通道,用智能检索技术手段获取。具有以下特点: ( 1 ) 信息形式数字化 数字式信息为压缩存储空间、改进信息的组织方式、提高检索速度、方便远程川户检索 奠定了基础。 ( 2 ) 传输方式网络化。 多媒体资源是通过网络进行传输的,这使得资源的利川超越时空观念,跨越地域界限。 ( 3 )组织结构网状化。 多媒体资源的信息组织形式为直接、网状的信息组织方式,信息可以按本身的逻辑关 系组织成相互联系的网状。因而,用计算机系统能更好地发现信息,特别是可以完成从一个 信息源跳剑另一个信息源程序的参考:f :作,提高了搜索能力和浏览能力。 ( 4 ) 资源利用共享化。 多媒体资源不受复本量的限制,终端用户可以共同使用这些多媒体资源,可以实现世界 范围内的信息资源共享。 2 2 基于数据库的资源组织方式 数据库管理数据阶段具有数据可以长期保存、共享性好、冗余度小、并且不依赖丁程序 冈而具有良好的独立性等特点。在这种方法中,数据集合可由多个应用程序共享,每个程序 使用数据库中相关的数据集合而不是各臼拥有自己的时间文件。这样就可以减少数据冗余, 更有效地利用存储空间。由于数据在多数情况下只存放在二处,使得修改和更新更为容易, 也提高了数据的完整性。所有的应用程序都能用相同的过稃来检索数据和信息。另外这种方 法也有利丁数据和程序的独立性和数据存取的标准化n0 1 。 利朋数据库技术管理数据可以实现长期、共享、完整地管理数据,从而提高数据的利用 效率。所以我们可以说,利用数据库技术管理数据是数据管理的最好组织形式。 2 2 1 数据库管理 数据库是依照某种数据模型组织起来并存放二级存储器中的数据集合。这种数据集合具 有如下特点:尽可能不重复,以最优方式为某个特定组织的多种应用服务,其数据结构独立 予使用它的应用程序,对数据的增、删、改和检索由统一软件进行管理和控制。从发展的历 史看,数据库是数据管理的高级阶段,它是由文件管理系统发展起来的。 数据库具有以下主要特点刳: ( 1 )实现数据共享。数据共享包含所有用户可同时存取数据库中的数据,也包括用户 可以用各种方式通过接口使用数据库,并提供数据共享。 ( 2 )减少数据的冗余度。同文件系统相比,由于数据库实现了数据共享,从而避免了 用户各自建立应用文件。减少了人量重复数据,减少了数据冗余,维护了数据的一致性。 7 ( 3 )数据的独立性。数据的独立性包括数据库中数据库的逻辑结构和应用程序相互独 立,也包括数据物理结构的变化不影响数据的逻辑结构。 ( 4 ) 数据实现集中控制。文件管理方式中,数据处丁一种分散的状态,不同的用户或 同一川户在不同处理中其文件之间毫无关系。利川数据库可对数据进行集中控制和管理,并 通过数据模型表示各种数据的组织以及数据间的联系。 ( 5 ) 数据一致性和可维护性,以确保数据的安全性和可靠性。主要包括:安全性控 制:以防i :数据丢失、错误更新和越权使用;完整性控制:保证数据的正确性、有效性和 相容性;并发控制:使在同一时间周期内,允许对数据实现多路存取,又能防i 卜用户之间 的不正常交互作用;故障的发现和恢复:由数据库管理系统提供一套方法,可及时发现故 障和修复故障,从而防i 卜数据被破坏。 2 2 2 元数据描述资源 图。b 馆和信息研究领域主要从两个角度米定义元数据:一是强调结构化的数据。元数据 是提供关于信息资源或数据的一种结构化的数据,是对信息资源的结构化的揣述。二是突出 其功能,元数据是j j 来规定数字化信息的组织的一种数据结构标准,描述信息资源或数据对 象,其目的在于使用户能够发现资源,识别资源,评价资源,而且对相关的信息资源进行选 择、定位和调用,追踪资源在使用过程中的变化。实现信息资源的整合、有效管理和长期保 存。 数字化图j 1 5 馆一方面是传统图书馆的延伸,另一方面也是现代信息技术发展的结果。数 字化图书馆元数据是建立在传统技术和现代技术两个基础之上,且呈现出以下基本特征u 3 1 : ( 1 )元数据首先是一种编码体系,特别是指根据某种标准来对文献中的词及其他元素 进行编码,从而揭示,描述文献的这些基本元素。元数据提供了一种数据框架体系和方法来 描述、表征数字化信息的基本特征,并通过一整套公用的编码框架体系管理、交流、传播和 组织数字化信息。 ( 2 )元数据是用米描述数字化信息资源,特别是网络信息资源的编码体系,这导致了 元数据和传统的基于印刷型文献的编目体系的根本区别。数字化信息具有传统印刷型信息所 不具各的基本特征和属性,是机读型信息,必须借助计算机及其网络读写和传播;是分布式 的,这些信息可能并不存储在同一个地方,而可能分布在不同的数据服务器上:具有严格的 格式化特征。元数据不仅要描述数字化信息的内容特征,而且更要描述数字化信息的这些基 本属性,使得数字化信息得以被有效传播、交流和利用。 ( 3 )元数据的最为重要的特征和功能是为数字化信息资源建立一种机器可理解框架。 元数据土要是为了帮助计算机系统获得并理解数字化信息的基本特征,包括系统特征、内容 特征、权利特征诸方面。所谓计算机可理解就是指利用元数据体系,使得计算机系统可以自 动辨析、分解、提取和分析归纳数字化信息资源的基本特征。 元数据应片j 的主要目的:确认和检索、著录描述、资源管理、资源保护与k 期保存。 多媒体资源的主要描述内容见表2 - 2 : 8 表2 - 2 多媒体资源元数据描述 分类中文名称 英文名称说明 题名t i t l e资源的名称 主题s u b j e c t资源的主题 描述d e s c r i p t i o n 对资源内容所作的文字描述 描述资源内容来源 s o u r c e 提供当前资源文件的有关信息 语种 l a n g u a g e 网络资源所采用的语种 关系r e l a ti o n 相关资源之间的关系 覆盖范围 c o v e r a g e资源内容所覆盖的时空特征 创建者c r e a t o r资源的作者或制作者 出版者p u b lis h e r 负责以当前形式制作可获得资源的实体 , 知识产权描述 责任者 c o n t r i b u t o r 为资源创建作出相对次要的智力贡献的个 人或团体 权限 r i g h t s产权管理说明 日j 弱d a t a 资源可获得的日期 类型 t y p e资源类型的划分 、 外部属性描述 格式 f o r m a t 描述资源的数据格式和大小 识别符 i d e n t i f i e r 唯一识别资源的字符串或数字 多媒体资源是视频、音频、图像、文档和网页等常见资源的集合,这些资源既有共性, 义有各自资源本身的特点。为了准确地描述各种多媒体资源,我们需要为各种多媒体资源定 义两类属性:一是固有属性,二是附加属性。 固有属性是指多媒体资源本身的属性,是可以通过文什系统获得的属性,其内容是i 嗣定 的。图像文件的长、宽、颜色数,卢音文件的播放时长和音质等都是嗣有属性。 附加属性指的是用户对多媒体资源的描述,它基于h j 户对资源的理解。不同的用户,不 同的角度,其描述是不相同的。一幅图片,从内容的来看,用户可以将其描述为山水,也可 以描述为风光;从画质的来看,可以描述为高质量或普通质量。这两种属性中,用户更为关 心的往往是附加属性,冈为它提供了更多的人性化信息,因此附加属性越多,能提供的检索 信息也就越多,查询资源也就越容易。但是附加属性也不能无限的增多,否则会造成管理复 杂,用户使用不便。因此附加属性的取舍既要完备又要精练。 对于一个具体多媒体资源来说,不论是其同有属性还是其附加属性,都是由与多媒体资 源类型相关和无关的属性组成的。我们把与多媒体资源类型无关的属性提取山来,存放到文 件表中,构成公共属性:与多媒体资源类型相关的属性则存放到此类资源的属性表中,构成 私有属性u “。 多媒体资源的常用属性包括: 名称:对于乐、歌曲、电影、电视剧等,指的是歌曲名或影片名;对于其它素材, 则是指最能描写其主要特征的一个简短的句子。 9 关键词:用于描述素材主题特征的词,是在“名称”基础上的进一步描述。用逗号 分隔,按重要性从左剑右依次排列。 主题分类类别( 索引) :指出该素材在主题树中的位置。 作者a :人名,可多个,川逗号分隔。 作者b :人名,可多个,用逗号分隔。 说明:有关该素材的文字描述。在实现的时候,该字段的前半部存放其它字段的信 息( 按重要性依次存放) ,后半部存放说明本身。 生产商:指向生产商信息表。 提供者:素材提供者信息,指向人员信息表。 语种:指出是采川哪国语言。 国家:指出音乐、电影等来自哪个国家。 质量o 文什的质量。取值:很好,好,中等,差,未知。 文件大小。 文件格式:文件后缀名。如:g i f ,j p g ,m p e g 等。 位置:虚拟路径光箍编号u r l e m a i l 。 入库时间。 2 2 3多媒体资源管理与服务平台 多媒体资源由丁其生动、形象的表现形式,在辅助学习和研究、提高综合素养等方面发 挥着独特作用,而通过因特网来提供多媒体资源服务,则更具有单机服务无可比拟的诸多优 点。如何通过网络来有效管理和利用馆藏的各类多媒体资源( 尤其是书刊附盘) ,一直是图书 馆所关注的问题之一【i 列。 与纸质类文献相比,多媒体资源的网络化管理具有以下特点: 由于载体材质更易受损,实现在线管理和阅览,对数据可起剑备份和长期保存作用; 数据文件较人,存储空间建设需要较火投入; 对服务器、网络带宽和终端阅览设备有更高要求; 资源种类和文件格式繁多,对管理平台要求较高: 对资源进行格式转换或压缩处理,需要多种专门的加工设备; 分类和标引目前还没有统一的规范。总之,实现多媒体资源的网络化管理和服务具 有一定挑战性。 多媒体资源管理服务平台的基本功能如表2 - 3 : 表2 - 3 多媒体资源管理平台的基本功能 主要功能说明 支持多种数据格式支持多媒体资源的文什格式,提供在线阅览和本地卜载。 资料制、作元数据自定义根据资源类裂,可自定义多媒体的元数据。 1 0 对象文件管理对发布的资源目录或文件能够进行方便的操作。 编目数据提取可以与馆藏数据库中的元数据实现匹配。 主题对象揭示 各类资源具备主题关联功能 川户管理功能 实施对朋户的分配利管理。 分布式存储支持多服务器数据管理和迁移 类目管理调整和设置多级类目名称, 用户个性化设置用户根据个性化的要求设置页面,信息获取方式等 远程管理管理员通过网络能够进行完整的制作和管理操作 数据统计功能具有各类用户使j f j 数据,资源利用数据 2 3b s 结构的架构方式 b s ( b r o w s e r s e r v e r ) 结构即浏览器和服务器结构。它是随着i n t e r n e t 技术的兴起, 对c s 结构的一种变化或者改进的结构。在这种结构卜,用户:r 作界面是通过w w w 浏览器来 实现,极少部分事务逻辑在前端( b r o w s e r ) 实现,但是主要事务逻辑在服务器端( s e r v e r ) 实现,形成所谓三层结构。这样就大大简化了客户端电脑载荷,减轻了系统维护与升级的成 本和工作量,降低了用户的总体成本。 以目前的技术看,局域网建立b s 结构的网络应用,并通过i n t e r n e t i n t r a n e t 模式下 数据库应用,相对易于把握、成本也是较低的。它是一次性到位的开发,能实现不同的人员, 从不同的地点,以不同的接入方式访问和操作共同的数据库:它能有效地保护数据平台和管 理访问权限,服务器数据库也很安全n 町n 引。 随着网络信息管理系统向i n t e r n e t 和i n t r a n e t 的迁移,出现了w w w 技术与数据库技术 相结合的w e b 数据库应用即b r o w s e s e r v e r ( 浏览器服务器) 计算模型,这种模式也可称为 三层客户机服务器( c s ) 模式,实现了信息从静态发布到动态发布的转变。它具有客户机 服务器( c s ) 模式的全部优点而无其缺点。浏览器能从内部和外部服务器上获得信息。而服 务器可以在任何位置,运行在不同的操作系统上,通过浏览器为用户提供多种形式的信息。 三层w e b 结构的模式的优越性如下: 在前端用户方面 统一标准易用的浏览器界面; 用户只需学习简单的w e b 页面与超链接( h y p e rl i n k ) 操作; 大大降低学习障碍和培训成本。 在w e b 开发者方面 用户端不需要特殊设置与软件交装: 应用软件集中在服务器端开发管理; 减少构建维护成本,加快连机过程。 在系统环境方面 前端可使用任何浏览器( i e 、n e t s c a p e 等) ; l 】 后端可存取任何数据库( s q l 、a c c e s s 等) ; 可使用各种脚本语言开发( v b s c r i p t 、j a v a s c r i p t 、p e r l 等) 。 三层客户机服务器模型的w e b 数据库应j 1 j 体系结构是将应用系统分解为如下三个逻辑 层的服务模型。 用户服务层( u s e rs e r v i c e ) :用户服务层提供可视界面,用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论