




已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
论文独创性声明 本论文是我个人在导师指导下进行的研究工作及取得的研究成果。论文中除了特别 加以标注和致谢的地方外,不包含其他人或其它机构已经发表或撰写过的研究成果。其 他同志对本研究的启发和所做的贡献均已在论文中作了明确的声明并表示了谢意。 作者签名; 论文使用授权声明 日期:婴2 :基 本人完全了解复旦大学有关保留、使用学位论文的规定,即:学校有权保留送交论 文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用 影印、缩印或其它复制手段保存论文。保密的论文在解密后遵守此规定。 作者签名:皇跹导师签名:丝盘导师签名:缢二纽 l o g i s t i c 回归在电子资源评价中的应用研究 中文摘要 本文在评析电子资源评价相关理论和研究的基础上,运用 l o g i s t i c 回归对电子资源评价进行应用研究。首先,分析国内外已有 的电子资源评价理论方法和指标体系,结合复旦大学图书馆的具体情 况,对适合该馆试用电子资源分析评价相关指标进行具体概述;然后 将l o g i s t i c 回归理论与电子资源评价相结合,详细讨论l o g i s t i c 回归 的推理、假设条件等具体过程,并就电子资源选购建议评价的升级以 及选购建议的多极分类进行必要的讨论。说明l o g i s t i c 回归由于具有 善于处理定性变量、能选择显著变量等优点,而适合于电子资源评价。 在此基础上,本文使用l o g i s t i c 回归对复旦大学图书馆电子资源评价 分析报告数据进行实证分析,构建了电子资源选购建议的l o g i s t i c 回 归模型,用s p s s 软件进行l o g i s t i c 回归处理,并对结果进行详细说 明。除去样本的特殊性,结果反映文中所用的若干变量当中对该馆电 子资源选购建议影响较大、显著水平较高的一些重要指标。就模型本 身而言,l o g i s t i c 回归对于建议购买或建议不购买的分类准确率较高。 模型运行过程比较简单,对于样本只要求因变量表述成建议购买或建 议不购买两类电子资源,而结果能得到精确的分值。本文尝试将 l o g i s t i c 回归应用于该馆电子资源评价决策中,是对实际工作的科学 描述和解释,并对以后电子资源评价工作提供参考。至于模型的扩展, 还有待进一步的研究。 l o g i s t i c 回归在电子资源评价中的应用研究 关键词:l o g i s t i c 回归电子资源评价s p s s 应用研究 中图分类号:g 2 5 0 l o g i s t i c 回归在电子资源评价中的应用研究 b a s e do na n a l y s i so ft h et h e o r ya n dr e s e a r c hi ne - r e s o u r c ee v a l u a t i o n , t h i s p a p e ra p p l i e sl o g i s t i cr e g r e s s i o nt oe r e s o u r c ee v a l u a t i o n f i r s t , a f t e ra n a l y z i n gt h ee x i s t i n gt h e o r yr e s e a r c hm e t h o d sa n di n d e xs y s t e m so f e r e s o u r c ee v a l u a t i o n ,t h ep a p e ri n t r o d u c e sar e f e r e n c ei n d e xs y s t e m w h i c hi ss u i t a b l et ot h ee v a l u a t i o no ft h et e s t i n ge r e s o u r c ei nf u d a n u n i v e r s i t yl i b r a r y ;a n dt h e n c o m b i n e se r e s o u r c ee v a l u a t i o nw i t h l o g i s t i cr e g r e s s i o nt h e o r y , d i s c u s s i n gt h ed e t a i l s a b o u t l o g i s t i c r e g r e s s i o n sr c a s o n i n g ,h y p o t h e s i se t c m e a n w h i l e ,t h ep a p e rm a k e st h e d i s c u s s i o na b o u tt h eu p d a t i n go fe - r e s o u r c ee v a l u a t i o na n da l t e r n a t i v e c h o i c eo ft h ea c q u i r e m e n t b yv i r t u eo ft h eg o o dd e a lw i t ht h eq u a l i t a t i v e a n a l y s i sa n dt h ea b i l i 哆t oc h o o s et h es i g n i f i c a n tv a r i a b l e s ,l o g i s t i c r e g r e s s i o ni sf i tf o re - r e s o u r c ee v a l u a t i o n t h ep a p e rm a k e sa ne m p i r i c a l s t u d yw h i c ha p p l i e sl o g i s t i cr e g r e s s i o nm o d e lt oa n a l y z et h ed a t af r o m e - r e s o u r c ee v a l u a t i o nr e p o r t si nf u d a nu n i v e r s i t yl i b r a r y a f t e rf o r m i n g t h el o g i s t i cr e g r e s s i o nm o d e la n du s i n gs p s ss o f t w a r et op r o c e s si t ,t h e r e s u l t ss h o w t h a t ,a m o n gt h ev a r i a b l e sc h o s e ni nt h ep a p e r , t h e r ea r es o m e i m p o r t a n to n e so fg r e a ts i g n i f i c a n c et ot h ef i n a ls u g g e s t i o n r e g a r d i n gt o t h em o d e li t s e l f , t h ea c c u r a t er a t eo ff o r e c a s t i n gw h i c hs u g g e s t st ob u yo r n o tb yl o g i s t i cr e g r e s s i o nc a na c h i e v eah i g hd e g r e e t h ep r o c e s so ft h e 3 l o g i s t i c 回归在电子资源评价中的应用研究 m o d e li ss i m p l ea n do n l yr e q u i r e st h ed e p e n d e n tv a r i a b l eo ft h es a m p l et o b ee x p r e s s e da st w or e s u l t s ,s u c ha sb u yo rn o tt ob u y , a n di tc a na t t a i na n e x a c tf o r e c a s t i n gv a l u e t h ep a p e rt r i e st oa p p l yl o g i s t i cr e g r e s s i o nt o t h ed e c i s i o no fe - r e s o u r c ee v a l u a t i o n ,w h i c hi sa d e s c r i p t i o na n d e x p l a n a t i o nt ot h ep r a c t i c a lw o r ka n dd i r e c t st h ee v a l u a t i o nw o r ki nt h e f u t u r e a n dt h ee x p a n s i o no ft h em o d e ls t i l ln e e d st ob ef u r t h e rs t u d i e d k e yw o r d s :l o g i s t i cr e g r e s s i o ne - r e s o u r c ee v a l u a t i o ns p s s 4 1 1 研究目的 第一章绪论 随着网络和计算机技术的发展,近年来,图书馆采购的电子资源日益增多, 在馆藏建设中所占比例逐步增大,电子资源在馆藏建设的发展中已经逐渐占据了 重要的位置。在选择电子资源的过程中,会涉及到一些决策,而决策的依据来自 对某一电子资源的相关评价指标的综合评价。如何对电子资源的相关指标进行综 合评价? 如何通过电子资源的综合评价使得电子资源建设合理和科学,从而提高 其效率和效益? 这些问题都已经成为当今图书馆界重视与研究的课题。事实上, 影响电子资源评价的指标众多。本文的研究目的是:在电子资源评价和决策时, 选择相应的评价指标,从中探索哪些重要指标会影响这些决策,为下一步评价工 作提供参考,从而提高评价工作的效率。本文将在分析他人研究成果的基础上, 尝试利用社会统计分析方法,对电子资源评价进行应用研究。以期能为电子资源 评价研究工作提供一条思路,加快电子资源馆藏建设合理化的过程。 1 2 研究意义 从笔者所搜集的文献看,电子资源的评价与选择、电子资源的成本使用效率 比较等已经成为当前电子资源评价的研究热点。从国内外现有的电子资源评价的 各指标体系和标准来看,国内外对电子资源评价指标体系的建立都在逐步完善, 但在应用和对实践的指导方面,国外则更侧重一些。尽管如此,国内外都普遍存 在电子资源评价指标在实际应用中缺乏可操作性与有效性的现象。笔者在研究的 过程当中发现,在电子资源的采访过程中,对电子资源作决策主要发生在三个阶 段,即试用、选择和续订,停订。而这三个阶段对电子资源评价的目的是对电子 资源的建议是否购买、订购与否和续订,停订作出决策。影响决策的因素就是电 子资源评价的各项指标。探索电子资源评价的各项指标对电子资源采访过程中决 策的影响类似于社会生活中人们会涉及到的大量决策,比如是否参加政治选举、 是否加入某个社会团体、是否签订一个合同、是否再生育一个孩子等等。这些行 为、决策都是定性的,有时是在少数类型之间选择,甚至只有是否或正反两种类 型。在社会科学研究中,需探索有哪些重要因素会影响这些决策或行动。相应地, 在图书馆电子资源的评价和决策中,就是探索有哪些重要指标会影响电子资源作 出建议是否购买、订购与否或停订续订的决策。因此,本文在使用社会统计学 l o g i m i c 回归在电子资源评价中的应用研究 分析方法研究电子资源评价决策的过程,是对电子资源评价实际工作的科学描述 和解释,从这个角度讲,具有一定的理论意义。 电子资源评价对我国图书馆馆藏资源建设优化有极为重要的作用。国内研究 者提出了一些评价指标体系和评价模型。有的指标体系已经比较完整,但没有形 成可应用于实际评价工作的模型。有的虽然提出了评价模型,但可操作性较差。 因此,本文结合社会学统计模型的应用研究,探索哪些重要指标会影响电子资源 评价过程中的决策,为下一步评价工作提供参考,从而提高电子资源评价工作的 效率,这对我国电子资源评价可操作性水平的提高具有一定的现实意义。 1 3 研究方法与思路 本文将使用社会学研究方法和理论对影响图书馆电子资源决策的重要评价 指标因素进行探索和研究。研究的过程可划分为五个相互关联的步骤:理论基础 构思阶段( 确定研究课题) ;理论研究准备阶段( 初步探索) :理论模型建立阶段; 实证分析阶段( 抽取样本、收集资料、整理资料) ;总结阶段( 统计分析、验证 解释、撰写报告) 。根据以上思路,本研究流程分下列五个阶段: 理论构思阶段。在评析国内外电子资源评价理论和研究的基础上,将研 究定位在运用t d g i s t i e 回归模型对电子资源评价进行应用研究,并制定了具体的 研究方法和思路。 理论研究准备阶段。首先,分析已有的电子资源评价理论方法和指标体 系,结合复旦大学图书馆的具体情况,对该馆电子资源分析评价样表进行详细说 明。 理论模型建立阶段。将l o g i s t i c 回归理论与电子资源评价相结合,详细 讨论i _ o g i s t i e 回归的推理、假设条件等具体过程,并就电子资源选购建议评价的 升级以及选购建议的多极分类进行必要的讨论。 实证分析阶段。对样本的特殊性进行详细说明,运用s p s s 软件进行 l o g i s t i c 回归,并对结果进行了详细分析。 总结阶段。本阶段对模型和实证分析结果进行总结,同时对未来的研究 方向作了展望。 6 第二章电子资源评价相关理论和研究综述 2 1 电子资源及其评价相关理论概述 2 1 1 电子资源的定义及特点 电子资源,即“c o m m e r c i a l l ya v a i l a b l ee l e c t r o n i cr e s o u r c e s 州u ,是“电子学术 信息资源”的简称,指由出版商或数据库商生产发行的、商业化的正式出版物。 主要包括文摘索引型( a b s t r a c t i n d e x ) 数据库和全文型( f u l l - t e x t ) 数据库,其 中全文型数据库又包括电子期刊( e - j o u r n a l ) 、电子图书( e - b o o k ) 、电子学位论 文( e i ) t ) 等。目前对电子资源和数字资源没有明确的划分。 电子资源的特点包括其类型的多样性、易获取性、共享性、信息时效性、形 式多样性和知识类聚性1 2 】。 ( 1 ) 类型的多样性:电子资源根据不同的划分标准,可以分为不同的类型。 一般而言,可以从资源的载体、资源的文献类型、资源的学科主题来进行划分。 具体见表2 1 。 ( 2 ) 易获取性:电子资源通过计算机和网络,向用户提供检索和传递资料 的服务,因特网穿越时空的优点使读者在任何时候、任何地点都可以通过网络获 取电子资源。电子资源的提供使图书馆的服务在时间和空间上得到了延伸,从而 使信息的获取更为便捷。 ( 3 ) 共享性:与印刷型文献相比,电子资源用户可以在同一时刻共用共享 同一份信息源。印刷型文献,如一册书、一本杂志同一个时间只能给一个人借阅。 而电子资源,如数据库可以被多个用户同时检索,同一篇文章可以被多个读者同 时浏览、下载,体现了电子资源的实时共享性,提高了资源的利用率。 ( 4 ) 信息时效性:在学科发展突飞猛进,知识更新日新月异的当今时代, 信息的时效性显得尤为重要。与印刷型文献的印刷、装订、运输等繁重冗长的环 节相比,网上出版物和数据库通常以日和周为更新周期,其高效的动态更新和快 捷的实时传递,在充分发挥信息的时效价值方面有着印刷型文献无可比拟的优 势。 ( 5 ) 形式多样性:多媒体技术在电子资源中的应用,使文字、声音、图形、 动画、三维图像等相结合,提供丰富多彩、生动逼真的信息,使读者能闻其声、 见其形,有身l 函其境之感。超文本信息技术的运用,改变了传统信息的线性组织 方法,增强了人们对知识的表达能力,大大扩展了信息的获取和传播的范围,使 7 l o g i s t i c 回归在电子资源评价中的应用研究 读者容易理解和接受。 ( 6 ) 知识类聚性:受手工检索工具对文献揭示的不充分性和检索手段烦琐 的限制,印刷型文献中大量的有用知识被隐蔽。而在网络环境下,利用强大的检 索软件,可以使不同类型的相关信息聚集并有序化。 表2 - 1 电子资源的划分 分类方法举例备注 按照载体划分有软盘、硬盘、磁带、主要有两种形式,一种是有型的电 只读光盘( c d r o m ) 、交子资源,即以光盘、磁盘、磁带等 互式光盘( c d i ) 、集成电脱机载体出版的电子资源;另一种 路卡( i c ) 、只读数字光盘是无形的电予资源。即在网络上出 ( d v d r o m ) 、网络等类版的电子资源。 型的电子资源 按照文献类型划可分为电子图书、电其中数据库设计领域广泛,按其内 分子期刊、电子报纸、数据容可划分为三种:参考数据库,包 库等括书目、文摘、索引等二次文献数 据库;全文数据库,提供完整的原 始文献数据,集检索功能与浏览原 文功能于一体:事实数据库,收录 人物、机构、事物等的现象、情况、 过程之类的事实性数据,如机构名 录、大事记等。 按照学科主题划可划分为社会科学、例如,清华同方中国学术期刊全文 分自然科学以及综合三个大数据库为综合类电子资源;社会科 类学引文索引( s s c i ) 为社会科学类 电子资源,农业文摘 ( a g r i c o l a ) 为自然科学类电 子资源。 2 1 2 电子资源的采访过程 为了便于理解电子资源评价过程中涉及的决策问题,在这里对有关电子资源 的采访过程进行概述。电子资源的采访过程包括以下几个阶段: 发现:指电子资源被图书馆员认识的阶段。通常图书馆员接触一种新的电子 资源的途径有:校内教师的购买申请、学科馆员的推荐、广告、论坛信息等。图 书馆员要熟悉一种新的电子资源,必须对该种电子资源的相关信息作充分的了 解。例如了解一种电子期刊的详细编目信息,提供的电子期刊年限范围,包含该 8 l o g i s t i c 回归在电子资源评价中的应用研究 种电子期刊的数据包以及该数据包采用的检索系统或平台的界面状况。 试用:指电子资源被图书馆组织试用的阶段。在通常情况下,图书馆员在决 定购买一种电子资源前往往要求试用该种电子资源。在一段时间范围内,图书馆 为部分读者或全部读者提供电子资源试用。在综合读者反馈意见后,图书馆员作 出建议是否购买的决策。电子资源试用方式如下,首先由图书馆员选定试用范围 ( 包括读者群或者口地址段) ,激活该种电子资源的链接,接着通知读者试用该 种电子资源,最后搜集读者反馈意见。 在试用一种电子资源时,图书馆员还要密切关注一些与该种电子资源有关的 信息。例如,使用该种电子资源在技术支撑方面有哪些要求。图书馆员还需要掌 握一些与网页浏览器和接入兼容性方面的资料,提供浏览器的配置方法,从而实 现在图书馆范围内或者教职员工及校园内等范围使用该种电子资源。图书馆员还 要评估某种检索平台下的电子资源的实用性。因为图书馆员有可能要在包含某种 电子资源的不同平台之间( 这些平台由不同的供应商和数据出版商提供) 进行选 择。当试用结束时,图书馆员要选择出恰当的检索平台,用来分别面向整个校园 或面向不同的院系提供服务。 选择:指选择拟购买的电子资源。一般试用电子资源结束时图书馆员就要作 出是否购买某种电子资源的决策。图书馆员必须谨慎地作出决策,因为如果该种 电子资源在试用期问的点击率非常高,却作出不购买的决策,读者就会对图书馆 员的决策产生质疑。 订购:指购买电子资源。如果图书馆员决定订购某种电子资源,就得经历类 似于印刷型资源订购的过程。但订购电子资源还需要了解更多的信息。比如了解 该种电子资源的使用许可协议、了解该种资源能够服务的读者群等。当图书馆员 要订购包含在某个电子资源集合( 例如:髓s c o ) 中的某个数据包内的电子期 刊时,就需要了解该数据包中包含哪些电子期刊及提供电子期刊的年限。最理想 的情况是,图书馆员可以选择购买某个数据包中的某组数据,或者挑选某个学科 主题的电子资源进行购买。还有一种特殊的情况,就是印刷型资源和电子版同类 资源是捆绑在一起销售的。如果停订印刷型的资源,那么订购的电子版的资源的 使用许可协议也会跟着失效。另外,图书馆员还要妥善使用订购资金,选择最令 读者满意的数据库供应商提供的数据包使用许可协议和检索平台。例如,英国的 图书馆可以通过i e e 检索i n s p e c 数据库的数据,而接入该库并进行检索的平台 又可以是英联邦数据中心提供的诸如e d i n a 或m i m a s ( 使用这种服务需要付 费) 。 接入:指电子资源被读者使用。图书馆员将购买某种电子资源时要特别关注 该资源的接入方式。某种电子资源一旦被订购,图书馆员就要确保该种资源能被 9 h l g i s t i c 回归在电子资源评价中的应用研究 充分地利用。首先要保障读者能够很方便地接入该种资源,如使用从a 圯列表 排列电子资源的方式提供接入;如果该电子资源同其他资源有相关性,从o p a c 接入;从多元检索工具接入;或者通过某个连接服务器接入。还要解决针对特殊 读者群的接入或者远程读者接入( 例如,代理服务器的设置) 的问题。通常在某 电子资源试用阶段,图书馆员就必须联系解决线路维护、供应商地址改变以及是 接入方式改变等问题。 续订停订:指决策某种电子资源续订或停订。图书馆订购的电子资源在购买 合同期满后通常就不能使用了。在合同期的末梢,图书馆员就必须决策是续订该 种资源还是停订该种资源。此时作出决策的依据完全不同于选择阶段作出决策的 依据。决策续订,停订的依据是图书馆员积累的一些反映读者使用该种电子资源 状况的数据,诸如该种资源在使用期内被访次数,检索系统或平台的稳定性,以 及供应商的响应速度等。 这里所指的只是电子资源最简单的采访过程,如图2 - 1 所示: 图2 - 2 采访电子资源时作决策的三个阶段 1 0 l o g i s t i c 回归在电子资源评价中的应用研究 在上述电子资源的采访过程中,可以发现对电子资源进行决策主要发生在三 个阶段:试用阶段中,图书馆员作出建议是否购买的决策;选择阶段中,图书馆 员作出是否购买某种电子资源的决策;续订停订阶段中,图书馆员作出某种电 子资源续订或停订的决策。采访电子资源时要作决策的三个主要阶段见图2 - 2 。 2 1 3 电子资源评价指标体系及评价方式 电子资源的构成较复杂,涉及的因素较多,电子资源评价研究的首要工作是 建立科学的评价指标体系。电子资源评价指标体系的建立是根据评价任务与目标 的需要,选择能够全面系统地反映某一特定评价对象的一系列较为完整的、相互 之间存在有机联系的指标。这些指标包括定量指标、半定量指标和定性指标。在 构建电子资源评价指标体系时,必须明确电子资源评价指标体系中每个指标的含 义。 就电子资源的评价方式来看,目前对于电子资源的评价大体有两种方式,一 种是对于两个及其以上的电子资源进行具体的比较,例如中文电子图书比较研 究网,从系统的基本情况、书目内容、检索界面、浏览器功能、电子图书制作 质量、服务功能等几个方面对国内几种电子图书数据库进行了具体比较,涉及到 数据库网址、服务商、提供年代、浏览器、电子图书数量、学科范围、分类标准、 检索界面、制作质量等项目的比较。清华同方( c n k i ) 与重庆维普( v 坤) 网 络版中文期刊全文数据库的比较研究 4 1 对两种期刊数据库的基本检索方式、检 索测试结果、浏览器与效果三个方面进行了比较。这种比较基本上是一种个案式 的比较。另一种评价方式是建立更具一般意义的评估比较方法和指标。电子资 源评价指标体系的建立初探【5 】提出了一套比较系统的评价方法和指标,给出了 电子资源内容、检索系统及功能、使用情况、价值与成本核算、出版商数据商服 务、存档6 个方面的评价内容和指标。在价值与成本核算部分,给出了数据库价 格、数据库价格上涨幅度、检索成本、全文下载成本和登录成本等指标。数字 资源评估指标体系研究【6 】提出的指标体系更具有普遍的适用性。 第一种方式基本上是一种个案式的比较,由于数据库的差异性,比较的项目 和方面在不同的数据库差别较大。同时,这种比较一般只侧重于系统和软件的比 较,对于资源的学术质量及其使用效益注意较少。而第二种比较方式更具普适性。 本文采用的是第二种评价方式。 2 1 4 电子资源评价研究的意义 电子资源的出现及其在图书馆的大规模普及利用,前后不到2 0 年的时间。现 1 1 h 喀蜥c 回归在电子资源评价中的应用研究 在,电子资源已经深刻改变了并将继续改变图书馆文献信息资源数量、质量和结 构、服务模式、服务手段等等。但是,面对不断出现的种类繁多的电子资源,面 对相对紧缺的资源建设经费,图书馆如何选择经济适用、使用价值高的电子资源 显得十分重要,同时电子资源的使用效益问题也日益引起了重视。因此开展电子 资源的评价研究具有非常重要的意义。 ( 1 ) 有利于科学地选择电子资源,提高资金使用效益 进行电子资源评价目的之一就是辅助电子资源采购,以及电予资源的续订 停订等工作。面对种类繁多的电子资源,图书馆受经费制约不可能将所需资源全 部购置,这就面临一个选择问题。多数图书馆在采购电子资源之前要进行试用和 资源评价分析,如同济大学图书馆数字资源建设管理办法( 征求意见稿) 第7 条规定:“试用结束后5 个工作日内,各部门应向信息咨询部递交使用情况汇总报 告及订购建议。其中,采访部负责接洽数据提供商( 或单位) ,请其提供试用期间 的资源使用情况;情报教学和读者辅导部提供宣传、培训实施情况和读者反馈信 息;图书情报数字化部提供主页上该资源的点击率以及网上反馈信息;期刊部提 供资源查重信息;信息咨询部提供资源数据质量、检索功能、与学校专业覆盖面、 与其它同类资源比较的评估信息;涉及医学方面的数字资源,由医学情报部负责 提供资源数据质量、检索功能、与我校专业覆盖面、与其它同类资源比较的评估 信息。”川 ( 2 ) 促进电子资源的整体优化建设 研究电子资源评价,有利于调整电子资源的学科分布,调整参考数据库、全 文数据库、事实数据库、电子期刊、电子图书的比例,使其结构逐步优化,更大 程度地符合用户需求。 ( 3 ) 提高电子资源的利用率 通过对电子资源结构的调整和使用情况的分析,促进检索服务、咨询服务、 培训讲座的开展,使电子资源及其服务更符合用户需求,从而提高其利用率,降 低资源使用成本。 ( 4 ) 使传统出版物的建设得到合理调整 通过电子资源的评价,订购电子期刊等,调整传统文献和电子文献的馆藏结 构,使传统文献与电子资源的建设逐步结合,更科学、合理地发展馆藏。 ( 5 ) 有助于图书馆的评估 电子资源作为图书馆的重要组成资源,其评价是图书馆的整体评估的重要组 成部分,没有对电子资源评价的图书馆的评估是不完善的。通过对电子资源的有 效评价,可以有助于对图书馆的整体评估更加科学、完善。 ( 6 ) 建立主要电子资源评价指数表 i , g i s a e ! n f a 在电子资源评价中的应用研究 电子资源评价过程中,可以选择若干有代表性的图书馆,就若干主要电子资 源的指标值进行适当的数学处理,建立主要电子资源评估指数表,通过这个指数 表为更多的图书馆和电子资源厂商提供最具一般性的资源评价参考依据。 2 2 国内外电子资源评价研究现状及比较 2 2 1 国外电子资源评价研究现状 网上p i 有资料列出了6 5 篇关于信息资源特别是互联网信息资源评价标准的 文献,这些文献从定性的角度提出了对互联网信息资源的评价标准。国外数字 图书馆绩效评估研究述评 9 1 介绍了2 0 世纪9 0 年代中期以来国外已经和正在开 展的电子资源评估的主要研究项目。其中主要对电子资源评价指标体系进行研究 的包括:1 、c e n t r a ll a n c a s h i r e 大学开展的电子图书馆的管理信息系统和绩效评 估:电子图书馆支持性研究【”l ,该项目提出的评估体系包括5 个方面:整体、 服务质量,用户满意度、传递、效率、经济。除此之外,它还制定了一些电子资 源服务的评估指标;2 、欧洲委员会资助的e q u n o x 项目i n ,该项目组制定了 一系列强调信息获取、传递、费用和用户满意度的电子资源绩效指标;3 、英国 的图书馆网络服务影响测度体系是基于公共图书馆背景的绩效评估体系研究 1 1 4 ;4 、美国图书馆和信息资源委员会委托j u d yl u t h e r 负责的电子期刊利用统计 的白皮书【1 ,综述了当前收集的电子统计指标和它们如何被收集,以及图书馆 员在接受和熟悉其统计收集过程之前需要解决的问题:5 、由美国博物馆和图书 馆服务研究所资助的网络化环境下国家公共图书馆统计和绩效测度项目 1 1 4 1 5 i “,该项茸的目的是制定一套核心的能够用以描述公共图书网络化资源和 服务使用情况的统计和绩效指标,其重要成果是公共图书馆网络化服务统计和 绩效测度手册。在资源评价指标体系基础上侧重于对电子资源评价从统计计 量和数学模型方面研究的包括:1 、美国研究图书馆协会电子计量项目 1 7 l i ”1 1 1 9 , 该项目的总目标是为美国研究图书馆成员制定描述电子信息服务和资源的统计 指标和绩效测度,项目分为三个阶段,并在第三个阶段生成了一个网络统计和绩 效测度数据收集手册;2 、由英国高等教育资助委员会资助的电子图书馆发展评 估模型【2 。j f 2 l j ,目标是为电子图书馆评估生成一个通用模型,并提供电子图书馆 评估的培训和推广;3 ,启动于1 9 9 8 年的数字图书馆计量项目1 2 2 1 ,目的是制定 一套统一的分布式环境中数字图书馆和相关技术( 利用) 效果的测度;4 、由美 国博物馆和图书馆服务研究所授权和资助的公共图书馆网络统计和绩效测度的 国家数据收集模型口j 【,该项目试图为公共图书馆的统计和绩效测度设计一个 可靠和及时的数据收集、分析和报告系统。除此之外,还有一些国际会议和学术 t z g i s t i c 回归在电子资源评价中的应用研究 讨论关注到与电子资源评价相关的主题,例如近年来的n o r t h u m b r i a 国际绩效评 估研讨会,i f l a 大会等。 在文献的搜集过程中,可以看出国外对评价指标体系的建立及其有关标准的 制订比较完善,在进行理论研究的同时,侧重于应用和对实践的指导,对于评价 指标的获取、统计分析和验证研究较为深入具体。但目前还是存在电子资源评价 指标在实际应用中缺乏可操作性与有效性的问题。例如,美国耶鲁大学图书馆电 子资源评价指标体系。美国耶鲁大学图书馆网站上的电子资源管理专栏闭早已 引起图书馆界的注意。该网站上的耶鲁大学图书馆电子资源评价表是他们数字资 源委员会( c o m m i t t e ef o rd i g i t a lg e n e r a lr e s o u r c e s ,c o d g e r ) 的研究成果,该评 价指标体系分:有关内容的评价要素、有关揭示的评价要素、技术相关的评价要 素、使用许可与商务相关评价要素、服务相关的评价要素,五大类评价要素,共 由1 5 2 个指标要素组成。该指标体系一般由二、三层等级组成,也有大到四层等 级的。电子资源选择评价指标内容比较具体、专指度较高,例如:涉及打印、下 载、电子邮件功能的内容专指为页面、页面的部分、完整的文档的打印、下载、 电子邮件功能。但在实际应用中没有一个参照系,没有量化的评价指标。 2 2 2 国内电子资源评价研究现状 国内研究者对电子资源的评价进行了积极的研究。在建立电子资源评价指标 体系方面如刘锦山、肖珑和张宇红、盛小平等,具体如下: 刘锦山在e 线图情提出数字资源评价指标体系评析洲,刘锦山是参照 i s o l l 6 2 0 信息与文献一图书馆技校指标以及补充本1 :补充指标【2 7 】,对电 子资源的服务绩效提出了一套评价指标。主要思想是依据电子资源的利用率和电 子资源的购买与管理成本来反映其质量。列举的1 5 个指标,已能较全面地评价 某种电子资源的利用情况,这些指标可被用来评价处于续订停订阶段的电子资 源。但仅从利用率和购买、管理与服务成本分析评价一种资源的质量是不够全面 的;其次,1 5 个指标中部分指标所反映的情况有所重复;第三,没有考虑图书 馆之间的差异。 相比较而言,肖珑和张宇红提出的“电子资源评价指标体系”【捌较为全面科 学。文中对评价的作用与意义、评价的原则与方法、评价的内容等方面进行了论 述,给出了电子资源内容、检索系统及功能、使用情况、价值与成本核算、出版 商数据商服务、存档6 个方面的评价内容和指标。文中论述的基本思路也是电 子资源利用率与成本核算。但最终并未形成系统的评价指标体系。 盛小平“数字图书馆馆藏评价”提出评价指标体系评析【2 9 】,主要反映了某种 数据库资源内容的质量和服务系统情况,偏重于质量因素分析和定性评价,实际 1 4 l d g i 鲥c 回归在电子资源评价中的应用研究 可操作性不够强。 此外,据全国工科1 2 所高校图书馆第六次馆长会议纪要刚报道,在这 次会议上,清华大学图书馆薛芳渝馆长报告了所承担的高校图书馆数字资源评 估指标项目的建设思想和主要内容,并向与会代表提交了 高校图书馆数字资 源评估指标征求意见稿。徐革【3 1 1 3 2 、张李义 3 3 1 等都在电子资源评价指标体系 建设方面做了一定的研究。 在对电子资源进行综合分析评价模型方面,有利用层次分析法构建综合评价 模型、层次分析法和模糊综合评价法建立的电子资源模糊评价模型、电子资源计 量等。 ,那么认为日_ 1 ,否则认为h _ 2 ( 3 2 ) 这里w i c ( 1 一c ) 在公式( 3 2 ) 中,p ( h - t l x ) p f h 一2 区) 被称为几率比。c ( w ) 值的选择依 赖于实际问题中的损失结构。通常情况下,决策规则可能发生错误:一个建议购 买的电子资源可能被误认为建议不购买或者相反。如果这两类错误的相对成本可 以确定,就可以确定c ( w ) 值的适当值。假设两类失误成本相等,那么c - 1 2 ,即 w l 。 4 1 3l o g i s t i c 回归的基本假设 一般l o g i s t i c 回归方法中的最基本假设是:似然比的自然对数是线性的,即 l n h xj q ) “z 1 日:) ) - a + , e 7 z 0 3 ) , e o ,户7 一( 屈以) 7 是做判别时的系数,也就是进行评分时各项的权重。 i - g i s a e 回归在电子资源评价中的应用研究 因此,确切的来说,这里所说的l o g i s t i c 回归应该是线性l o g i s t i c 回归。但 由于二次l o g i s t i c 回归在本文对电子资源评价中将不被采用,所以,文中l o g i s t i c 回归即是指线性的。 公式( 3 3 ) 在l o g i s t i c 回归中具有重要的意义。首先,它给出了后验概率的 一种简单形式: p 日l i x ) 一e x p ( 芦 0 + t n k + p 7 工) ( 1 + e x p ( f l o + l n k + 卢k ) ) 0 4 ) 其中假设也o - 1 ,2 ) 是电子资源类别皿中的样本点数在总样本中的比例, r 那么k - 詈。一旦p 0 ,卢和k 被估计出来,则此概率就只取决于线性函数 v 2 反+ i i i k + 芦t x 。其次,不管变量z 是连续型的、离散型的抑或两者兼有,对卢 的估计方法均是一样的。而且,在( 3 3 ) 式的基础之上,芦的估计也不需要对样 本做任何进一步的分布假设,因此,l o g i s t i c 判别也是一种部分分布方法。 所谓部分分布方法是多种统计判别方法中的一种,按照其分布假设的水平可 以把统计判别方法分成三类,即完全分布、部分分布和分布无关假设。如果对样 本的分布有十足的把握,那么显然完全分布( 或称参数方法) 方法可以充分利用 信息,效果也就是最好的了;但是如果对于样本的分布不能确定或是没有把握的 时候,在分布无关方法( 或称非参数方法) 下,可以保证得到的结果相当稳健。 而部分分布的方法在一定程度上将两种方法结合起来,既能够比较充分地利用样 本的分布信息,同时还能保证结果有一定的稳健性【4 2 l 。 4 1 4l o g i s t i c 回归的抽样方法 用来估计芦的数据是由抽样设计来完成,一般有三种方法1 4 3 1 :( 1 ) 混合抽样; ( 2 ) 关于z 的条件抽样;( 3 ) 对每一种类别日。进行分割抽样。在第1 种情况下, 样本点服从( h ,z ) 的联合分布,该分布的概率函数为l ( a ,x ) ,其中h 取值为h 或2 。这样,来自于类别h 1 的样本点比例就是e 发生的一个很好估计。在第2 种情况下,把z 固定而取一个或更多的样本类型值( - i , 或h 2 ) ,这样的抽样方 法会产生概率为p r ( h x ) 的条件分布日防。在第3 种情况下,抽样后会得到具 有条件分布( z l e ) 和( x i i - i :) 的样本。这两种抽样方法在判别分析中经常采用。 在电子资源评价中,如果首先把资源分析报告中数据按照建议购买和建议不购买 分为两类,然后在每一类中抽样则是分割抽样;如果选取了某些指标作为评价变 量,如资源类型、是否试用、第几次试用、收录资源类型、学科范围、内容的完 整性及连续性、更新周期、收录数据是否延迟、功能评价、访问方式评价、同类 资源比较、试用情况及用户反馈评价、是否提供存档、是否有额外硬软件要求、 是否解决版权问题、购买方式、国内其他图书馆购买情况等方面的信息,将所有 的数据按照其指标归类或者说是若干个点,按照z 点归类后抽样,则是关于z 的 条件抽样;如果不做建议是否购买的分类,也不是在x 处取样,而是把所有的 资源分析数据混合在一起抽样,那么就是混合抽样。 上述三种抽样类型的参数估计是很相似的,虽然在有些问题上会由于抽样方 法不同而导致在处理上有所不同,但其基本的解法都是采用迭代求最大似然估计 法。根据本文的需要,以下仅就关于工的条件抽样情况和混合抽样的情况进行 介绍。 ( 1 ) 关于x 的条件抽样情况设雄表示抽取的样本点数,一。o ) 表示在z 处来 自于日,o - 1 , 2 ) 的样本点。那么在关于x 的条件抽样下,似然函数为: 丘;h p r ( h 1 x ) ) 啡 p r ( h 2 x ) r ( 3 5 ) 其中一o ) 一,h ( 功+ 也o ) 对所有的j 是固定的,从公式( 3 4 ) 可推出: p i ( 啪一篇翳第一日,其中岛- 反他置 从而也可得出:尻 ) - p 西畋l x ) 1 1 + 甑p ( 磊+ 卢7 曲) 由此可见判别函数只取决于线性函数j ( 力一磊+ 芦7 工 这样,似然函数t 为: t - n 识 ) p 艺o ) 广( 3 - 0 从公式( 3 6 ) n - 瞅g ,丘p j ( j o 1 ,p ) 的函数。因此可通过迭代最优化步 骤得出这些参数的最大似然估计。这样,成是可估计的,但要估计; 反风一l n 彘) ,必须使1 己知或可独立估计。 ( 2 ) 混合抽样的情况在该情况下,似然函数为: k 一兀犯。阻) 广 l ( x i - v :) y 2 x ( 3 7 ) 由于o l 皿) 一p 吒也阻,其中 ) 为x 边缘分布。所以, - 叫r i 仁广 由于仍只要求似然比满足公式( 3 3 ) ,而没有做进一步的假设,这样,l ( d 没有包含能反映参数岛的信息因此,岛的最大似然估计也可通过t 来求,与 情况( 1 ) 一样。要注意的是,上述结论适合于任何类型的数据,包括连续型或 离散型,只要其似然比满足( 3 3 ) 。 4 1 5l o g i s t i c 回归的极大似然估计求解 极大似然估计的求解,即是对上部分所述的内容提及的似然函数进行求解。 在实践中,大部分情况下使用迭代求解极大值的方法来完成。 首先,必须要估计出参数磊和卢,以算出后验概率p “皿防) ,s - 1 , 2 。 因此,需要最大化:厶- 兀 p 1 ( 瑚 p 2 ) b 其中p 1 - e x p ( 岛+ 芦k ) 1 + e x p ( p o + 7 功) p 2 - 1 一a o ) 对t 取自然对数并对岛求导得:o l n l 。, o p一;h o ) 一栉 ) p 1 ) k j7 继续求导可得:鬻- - ;” 溉:o 聃 但这种迭代求最优化的步骤要求给出初始值。初始值的不同取值会影响到迭 代过程中收敛。c o x ( 1 9 9 6 ) 建议取a 仁- l 2 ) 的线性近似值并利用加权最小 二乘法来估计反和卢,而实践中,一般采用a n d e 巧【4 5 1 的建议,即对所有的p + 1 个l o g i s t i c 参数的初始值设为0 。而且这种方法在实际中的表现是相当不错的。 4 2 l o g i s t i c 回归中的变量筛选 在回归模型建立之前,一般会有许多属性变量,包括资源类型、是否试用、 第几次试用、收录资源类型、学科范围、内容的完整性及连续性、更新周期、收 录数据是否延迟、功能评价、访问方式评价、同类资源比较、试用情况及用户反 馈评价、是否提供存档、是否有额外硬软件要求、是否解决版权问题、购买方式、 国内其他图书馆购买情况等。但并不是所有的变量都对资源的选购建议有着显著 影响,或者不同变量包含了重复的信息。而且也不是变量越多就表示模型越好。 如果模型把那些根本没有影响或影响很小的变量都包括进来,不但计算量大,而 且估计和预测的精度也会下降。在一些情况下,某些变量观测数据的获得代价较 高,如果这些变量本身与建议是否购买的关系很小或根本没有关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年人力资源行业数字化招聘与人才培养研究报告
- 2025年老年医学诊疗技术单项选择模拟卷答案及解析
- 2025年戒毒医学综合能力测验模拟考试卷答案及解析
- 2025年麻醉科危重病人监护技术模拟考试答案及解析
- 2025山东威海方正外国语学校教师招聘5人笔试备考试题及答案解析
- 2025福建福州捕电科技有限公司招聘12人笔试参考题库附答案解析
- 2025年外科手术技术模拟考试答案及解析
- 2025四川长虹智能机器人公司招聘机械设计工程师等岗位笔试参考题库附答案解析
- 2025年口腔医学模拟口腔疾病诊断答案及解析
- 2025福建南平市公安局建阳分局招聘警务辅助人员16人笔试参考题库附答案解析
- 电动起重机司机装卸司机
- DLT817-2014 立式水轮发电机检修技术规程
- 上海西门妇孺医院研究(1884-1952)
- 劳动创造美好生活课件 第二课 璀璨的星空
- 使用林地可行性研究报告
- (样表)有限空间有毒有害气体检测表
- 公司员工考勤表模板竖版
- 模电ppt课件 第1章绪论
- 水处理项目施工组织方案
- 幼儿园红色故事绘本:《闪闪的红星》 课件
- GA/T 383-2014法庭科学DNA实验室检验规范
评论
0/150
提交评论