建设数字装备技术手册.doc_第1页
建设数字装备技术手册.doc_第2页
建设数字装备技术手册.doc_第3页
建设数字装备技术手册.doc_第4页
建设数字装备技术手册.doc_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

建设部队数字装备技术手册 级 专业 班 学 号 姓 名 摘 要 文章主要论述了信息检索的起源与发展过程、信息系统检索类型、信息检索方式和信息检索技术。逐步阐述了军队信息化建设中装备技术手册如何在文献信息资源建设、服务保障和专业建设队伍等方面顺应时代要求,实现数字装备技术手册建设设计与架构。关键字信息;信息检索;检索工文献检索;数字装备技术手册;个性化1 引言数字装备技术手册建设是一个全新的概念,它的任务应对新的变化对文献资源的建设和服务有了更新的要求,信息技术的发展和网络环境的形成为实现跨越式发展提供了难得的机遇。 “工欲善其事,必先利其器”。无论做什么工作,都需要有科学的理论来指导实践,寻求适当的方法去解决问题。20世纪70年代以来,以信息技术为核心的新技术浪潮,以锐不可当之势猛烈地冲击着人类社会的方方面面,推动着信息化时代的到来,导致了军事领域的深刻变革。我们现在所处的时代,就是以信息技术为代表的科学技术全面融入到军事领域,从而强制地、不以我们的意志为转移地引起军事变革的历史时期。在这场席卷全球的由信息技术带来的新军事变革中,“信息化”无疑是其主题词。在信息技术的冲击之下,从作战样式到指挥理论,从武器装备到人员素质,从编制体制到后勤保障,无不发生着翻天覆地的变化。我们只有积极地适应这种发展和变化,用科学的理论指导军事变革的实践,才能把握这场军事变革的脉搏,站在时代的前列,立于不败之地。2 背景 以信息技术为代表的现代科学技术的飞速发展以及冷战结束后世界战略和安全格局的重大变化,国际竞争的焦点由军备竞赛走向以科技为先导、以经济为中心的综合国力竞争。在综合国力诸多构成因素中,经济实力和科学技术的作用日益重要和突出。科技对综合国力的贡献明显提升。以数字化和网络化为特征的信息技术的飞速发展,使全球经济增长方式发生了根本性的变化。高科技向现实生产力的转化越来越快,高新技术产业在整个经济中的比重不断增加。2.1 新军事变革和信息技术发展对图书情报工作的重要性当今世界,一方面以信息技术为核心的高新技术在军事领域的广泛应用,极大地促进了军事思想的深刻变革和军事技术的迅猛发展,另一方面,冷战结束后,世界战略和安全格局发生了重大变化,世界上一些大国为了争取在新的国际战略格局中占据有利位置,一场由科学技术进步牵引和世界格局的演变驱动,一军事世界从工业时代的机械化形态向信息时代的信息化军事形态全面转型为目标的新军事变革不可避免的发生了。这场意义重大、影响深远的变革已经在世界范围内成为潮流。世界上各主要国家都已各显神通,着手于各自的新军事变革,以争取在心世纪的国际格局重组进程中占据有利的战略地位。我们只有勇于迎接挑战,积极推进中国特色的新军事变革,才能在新的世界格局中立于不败之地,也才能为打赢一场高科技局部战争做好充分准备。新军事变革的竞争,说到底还是人的竞争,尤其是高素质人才的竞争。我军的各类机构、科研单位及院校都承担者重要的历史责任,而为教学和科研提供文献信息保障服务的装备技术手册也在其中起着不可忽视的作用。新军事变革的发生将使部队对培养人才的观念、模式和目标做出调整,信息技术和网络技术在装备技术手册的广泛应用,也将近一步加快装备技术手册由传统型向现代型全面转型的步伐。这必然导致装备技术手册对文献信息资源建设、服务保障方式和干部队伍建设做出相应的调整。2.2 传统装备技术手册和数字装备技术手册的相互结合首先,在网络环境下装备文献信息资源获取方式发生了变化。传统的装备资源主要是以印刷文献为主的实体文献,这类文献一旦入藏,装备技术手册便拥有了对它的所有权和使用权。在网络环境下,装备技术手册还可以通过网络获取大量的网上资源信息。网上数字化文献虽然不是装备技术手册的实体装备,当装备技术手册可以通过合法的程序对它拥有使用权。因此,数字化文献类型的出现,可以使得装备技术手册和出版社及第三方提供授权资源的机构之间实现真正信息的无障碍传递,“资源共享”这一传统装备技术手册环境下困扰无数人的难题,在网络环境下变得容易多了。 网络化得迅猛发展,使装备技术手册赖以生存的信息资源定位在一个更为广阔的信息空间中,装备技术手册的信息资源拓展为两部分,以印刷型文献为主的现实装备和以数字化文献为主的虚拟装备。装备技术手册必须重新考虑装备的文献类型结构,根据不同文献类型特点确定他么在装备中的比例,明确各自的职能,避免相同内容的文献以不同载体形式重复入藏,以达到经费投入的最大效能、在传统的装备文献评价标准中,被评价的对象是文献本身,强调的是装备规模,包括藏书数量、品种、装备结构和重点等。而在网络环境下,一个数字化装备技术手册的藏书规模已不再是衡量其文献资源建设水平的高低的首要标准,而为用户提供文献信息的能力开始成为评价一所装备技术手册文献资源建设的首要标准。这种观念上的突破,将会从根本上改变传统装备技术手册环境下盲目追求藏大而全、小而全的做法,从而促进装备技术手册把注意力放在充分利用现代化网络环境,加大装备信息资源开发力度,不断提高文献资源的保障水平上。2.3 建设特色的部队数字装备技术手册的影响力近两年来,在军事变革的大背景下,为了适应军队现代化建设和我军情报事业发展的需要,作为数字化装备技术手册建设的需要,必须突出特色的专业,贴近一线需要,紧扣科研和充分利用资源的大主题。调整优化文献资源体系,实现由传统向数字化装备技术手册跨越。现代信息技术的飞速发展和广泛应用,使传统装备技术手册正在发生历史性的变革,也是我们的发展目标。为了实现这一目标,必须走“科技兴馆”的道理。以现代化设备装备装备技术手册,完成装备技术手册信息网络系统的升级改造;以现代化知识体系扩充装备技术手册工作人员的头脑;依托全军军事训练信息网以及数据中心,建设部队数字装备技术手册,着力搞好特色信息资源的数字化建设,逐步形成具有鲜明军事训练特色和我军各类特色的资源体系。军队机构对提高官兵素质、培养高素质军事人才以及加强能力和综合化发展的军事趋势,使读者对文献信息需求的内容、特点和利用方式都发生了根本性的变化、随着信息技术特别是数字化技术的快速发展,以军事训练信息网、科研教育网以及英特玩味主干的信息网络在部队信息化建设中已泛连通,为用户构筑了一个全新的信息化服务平台,突破了原有装备和信息实体资源不足以服务手段相对滞后等以往难以解决的技术瓶颈,从而对部队信息化服务提出了新的更高需求。在这样一个大前提下,数字装备技术手册将服务的对象从单一的实体用户转向实体用户和网络用户的集合,并增加倡导个性化数字装备技术手册的使用。服务形式将朝着综合性、个性化方向发展运作模式也将朝着传统与现实、个性与共性、提供与推送相结合的方向发展。3数字装备技术手册的架构设计3.1系统概述数字装备技术手册是基于互联网新技术来做设计架构的资源管理平台系统。基于互联网web应用,引入Web2.0技术,秉承以用户为核心的设计理念,确定了系统的总体结构,实现多种格式海量数据(百万级)的检索、展示和管理。本文档描述的内容包括系统概况、设计约束、设计策略、系统总体结构、系统单元设计、接口以及开发、运行和测试环境。3.2技术方案3.2.1为了要达到高负载能力的网站架构,需要满足如下技术要求:(1)缓解信息拥塞;(2)高系统的访问速度;3.2.2采用的技术方案:(1)大型数据库设计技术,高度优化SQL,更符合Web服务应用;(2)采用分布式服务的架构设计;(3)支持负载均衡的架构设计;(4)使用Ajax技术提高web网站性能;(5)加速检索速度的技术方案;(6)加速页面下载的技术方案;(7)加速文件下载的技术方案;(8)HTML页面静态化技术;(9)缓存技术;(10)镜像(11)采用Web服务器和数据库服务器的优化配置方案;(12)优化程序设计和编码3.2.3大型数据库设计技术(1)采取分表:水平和垂直(2)冗余数据,建立索引(3)库表散列(4)高度优化SQL、存储过程(5)数据库集群3.2.4分布式服务的架构设计可以将数字装备技术手册平台分成几个独立服务:We服务、数据库服务、全文下载服务、全文检索服务以及应用服务;这几个服务可以集中部署,也可以进行分布式部署在多台服务器中,当采用分布式部署时,通过服务的分散,从而提高服务能力。3.2.5 Web服务(可用服务很多,比如微软的iis服务)由Web的应用程序、Web Services等应用程序;3.2.6应用服务部署数字装备技术手册系统后台运行的伺候服务,如邮件、借阅过期处理、用户到期处理等;也可以把一些接口部署在其中;3.2.7数据库部署数字装备技术手册的数据库集群;可以使用SQL Server或Oracle,如果数据量或者用户数量技术很大,服务使用Oracle;根据实际情况需要,数据库也可以进行集群及库表散列等技术;3.2.8全文下载服务部署全文的下载服务集群;3.2.9全文检索服务部署数字装备技术手册的全文检索服务以及管理等功能;3.2.10使用负载均衡技术使用负载均衡是提高系统负载能力有效的途径,也是大型网站系统架构设计常常采用的措施。负载均衡可以分为两种情况,一是不使用专业的负载均衡器构建负载均衡的环境,另外一种是使用专门的负载均衡器来进行负载均衡的网络环境部署,这两种情况均可以在数字装备技术手册系统中使用。3.2.11不使用负载均衡器进行服务集群在这里的负载均衡主要应用了数字装备技术手册系统分布式架构设计思想来完成的,并不对服务器进行负载均衡的配置,应用比较高级一些就是数据库服务可以采用数据库自身的集群技术或者库表散列技术来实现,全文下载服务可以使用散列技术,分散下载服务器的负载。其系统架构如下图所示:数据库可以使用数据库的集群技术,或者根据业务逻辑将数据存储进行库表散列,分布在不同的数据库表,或者在不同的服务器中,从而提供数据库服务能力;而在网站系统中,数据库往往是一个瓶颈。数字装备技术手册还有一个很大的服务就是全文下载服务,全文的下载和在线浏览均直接靠全文服务来完成的,因此全文服务将承受很大的服务压力。可以将全文分布在不同的服务器上,从而分散个体服务器的负载压力,从而提高下载的负载能力。因此在系统设计中要能支持数据库的集群和库表散列,也要能方便的支持将全文可以拆分成不同的FTP下载站点中去。3.2.12使用Ajax技术提高网站性能使用Ajax主要是为了提高用户交互体验,但在此节主要是使用Ajax技术来提高网站的服务性能,提高带宽的使用性能。使用Ajax的最大优点,就是能在不更新整个页面的前提下维护数据。这使得Web应用程序更为迅捷地回应用户动作,可以在以下几个方面能改善网站服务性能:(1)避免页面刷新有大数据量传输,有效利用带宽;(2)拆分处理比较长时间的逻辑为多个处理时间短的逻辑,提高系统并发性能;(3)根据以上的原则,因此在系统设计上时,可以采用如下的一些方案:(4)页面数据优先显示策略,可以将用户常用的、或者必要的信息在页面刷新时同时显示出来,但对那些不常用,或没有必要首先看到的,那么等用户再次选择时使用Ajax技术获取并显示数据,而不用刷新整个网页;如某一个文献或者资源的详细页面就需要适当的采用这种策略,即便牺牲用户的一些方便性;(5)大数据量分块装载策略,分类数据的显示采用Ajax技术来实现,使得分类数据逐级装载;3.2.13使用搜索引擎完成结构化数据检索资源检索是通过数据库来完成,但在资源很多或者数据库良机很大的情况下检索起来就比较耗时和资源,通过搜索引擎技术实现结构化数据检索来提高效率。根据资源检索策略,设计一个检索数据结构化数据结构,然后将此结构的数据载入搜索引擎来完成资源的检索。数据的存储仍然采用数据库来完成,系统增加一个功能,如果需要优化检索性能,则把数据库的数据同步到搜索引擎中建立索引,如果不需要优化检索,则仍然使用数据库进行检索。3.2.14客户端分页技术+XML页面显示技术客户端分页技术指将要查询的数据的主键一次性从服务端下载到客户端,然后使用Ajax技术在客户端进行分页显示,而每次显示的时候,由客户端把要显示的记录的主键传递到服务端请求记录的详细信息的显示,从而完成数据的分页显示,而不是在服务端把分页的数据准备好后发送到客户端。此主键一般选择数据库中整数型的主键,如资源的编号,此类数据传输量也不会很大。由于采用Ajax技术,因此服务端可以把数据以XML格式返回,客户端使用CSS或XSL等技术,直接将XML数据显示在页面上,从而避免使用DOM解析数据再显示的方法,这样既可提高页面显示速度,也可以提高系统的维护性。(注:使用XML网页技术,维护和跨平台资源共享容易的。) 3.2.15优化数据库设计优化数据库设计,减少表、视图间的关联检索;对于数据库的查询检索,多采用优化设计的存储过程,并支持优化的分页算法;适当采用分表、统计表等措施;在数据库设计时需要考虑检索的速度和效率问题。3.2.16使用JavaScript脚本来装载页面中的部分数据在页面设计时,往往有很多信息用户是不需要立即看到,或者有些信息本身用户是不关注的,类似这类在本页面中非核心的内容,可以考虑不要直接部署在页面中,这样会影响整个页面的装载速度,因此可以使用JavaScript等脚本来装载这种数据,从而提高页面核心数据的装载速度。3.2.17页面减肥,是页面达到最小(1)去掉网页中不必要的字符;(2)页面设计技巧应用,如使用css,图像设计等;(3)使用程序算法的方法,减少页面中重复的代码,一般使用一些脚本来完成;3.2.18动态页面数据静态化把某一些动态数据,如果不是适时发生变化的数据,则可以使其变为静态页面或者为XML数据,叶面直接装载这些静态化的数据,从而提高页面的装载速度。静态化这些数据可选择一个设置完成之后,或者由数字装备技术手册的应用服务定期完成更新。3.2.19下载服务器使用负载均衡或多下载站点全文下载服务器可以使用负载均衡来提高全文下载的服务能力。另外,一个文件允许支持多个下载地址,通过从不同的下载地址,也分散服务器的下载压力。3.2.20缓存技术缓存技术主要用在两个方面,一是从设计编码上来考虑,另外是服务器配置;针对Web站点程序上使用缓存,将一些常用、访问频率高的数据缓存在系统中,当再次使用这些数据时,直接从内存中获取,而不从数据库、文件等存储介质中获取,从而提高了系统的访问效率。当然,这是牺牲内存为前提条件的。3.3固若金汤的高安全性网站架构设计(1)防止DNS欺骗和IP欺骗(2)SQL注入3.3.1防止SQL注入技术数字装备技术手册程序编码上进行控制:在编写程序时,需要对用户输入的数据进行合法性验证,以及URL地址的参数等数据有效性的验证。如对数字类型合法性判断,对单引号的处理等。对一些关键字的处理,如SQL SERVER一些存储过程的名称可以作为过滤;主要要注意控制好单引号和一些关键字。站点要提供友好的错误提示页面,不要显示出网站出错的调试错误。3.3.2使用验证码技术在数字装备技术手册站点上需要用户提交数据的地方应该使用验证码技术,如用户登录、提交评论、发布文章等,防止一些恶意的攻击。3.3.3使用Session验证技术页面上要加上Session验证。系统把用户登录时的信息用Session存储起来,当访问到那些页面后,页面中需要对Session进行验证,如果验证不通过,则需要重定向到一个错误处理页面。3.3.4用户密码进行密码存储对密码按一定加密算法加密后存储,防止用户密码泄露或被盗用。因为密码加密,但是要在后台提供系统管理员能够找回密码的功能。3.4用户(读者)权限管理机制此次需要提供用户(读者)访问记录级的权限,对系统的性能上会有很大影响,因此需要从下面几个方面来解决性能问题。(1)设置用户访问资源权限的操作方法;(2)检索资源和展示资源的效率;3.4.1用户权限管理模型用户权限模型 = 用户角色 + 用户一个用户可以隶属于多个角色,但角色之间不支持隶属关系;读者用户和系统管理员用户均使用这个模型。 3.5 以人为本、随心所欲的检索技术 (设计检索是整个数字装备技术手册里最核心的模块)3.5.1信息检索的研究内容、研究方法与作用信息检索是一门新兴的边缘性交叉学科,仅有几十年的历史,但是信息量的激增、社会对信息的急迫需求,尤其是计算机、网络通信技术、超媒体技术、智能技术等的快速发展,已经使得信息检索的研究内容大为丰富。(1)检索理论研究 是在检索活动中总结出来的系统化的知识。其研究内容包括信息与信息资源的定义、信息检索的定义、类型、特点、作用、研究对象、方法、内容、理论基础、术语规范、原理与原则、相关学科等的研究。(2)检索语言研究 是从自然语言精选出来,并以简练形式表示文献、信息的受控语言的集合,现指受控语言和自然语言。其研究内容包括关键词、主题词、词表编制、分类表编制、概念分析、规范档、代码标识等的研究。当前普遍对网络数据中的不同检索语言的转换、自动分类、自动标引、网络搜索工具等的研究是流行的趋势。搜索与浏览检索的整合研究。(3)数据库研究 由于数据库是多个相互关联的数据的集合,是信息检索系统中必不可少的组成部分。其研究内容包括数据库建设规范与协调共享、收录信息与文献的帅选、文档结构、维护与更新、版权、市场、效果评价、数据库跨库检索等的研究。目前最流行的趋势是对异构数据库系统信息资源一体化整合和检索、知识库、数据仓库的研究。(4)著录发研究 是对信息与文献形式特征和内容特征进行分析、选择和记录的方法。其研究内容包括国内外著录标准与规则、格式、各种信息与文献著录方法。CN-MARC、UNI-MARC、US-MARC、Dublin Core元数据、Xml等的研究,当今最值得关注的就是电子行文献与网络信息的著录研究。(5)检索系统研究 是有序化的信息资源、设备、检索方法和策略等组成的集合体。包括系统设计、运行和评价。目前应用广泛的是对计算机检索系统软硬件配置、设计与评价、智能化应用等的研究。(6)检索策略研究 是在分析信息需求提问时确定的检索途径与检索用词,并明确各词之间逻辑关系和查找步骤的安排。其研究内容包括对用户需求提出分析。检索表达式、检索符号的设置与应用、步骤优化等的研究。目前应用广泛的是对检索策略自动调节和修改的研究。(7)检索服务研究 是根据用户需求,由专门人员帮助查找信息,并将结果提供给用户的工作。其内容包括对服务手段、服务方式、用户培训、定题服务、检索效果评价等的研究。当前在web2.0时代最流行的是针对个性化的信息服务。随着计算机技术、网络技术、人们信息需求等的迅速发展,信息检索领域不断出现新的分支和内容,对基于内容的多媒体(multimedia)信息检索、多语种、跨语种信息检索和交互性信息检索等。基于内容的多媒体信息检索实在克服基于描述的多媒体信息检索不足的情况下发展起来的。基于描述的多媒体信息检索只是对画家名、音乐作品类型、出版年份等形式信息的描述,不能很准确地揭示多媒体内容的特点。而基于内容的多媒体信息检索可以把图像的颜色、形状和纹理;音乐的音频、响度和音高等内容特征揭示出来,通过比较检索提问和检索系统的多媒体信息之间的相似度,决定检索结果。检索提问可以随时制作,也可以在已经有的多媒体信息中选择一个相近的例子,因此,基于内容的多媒体信息检索法也被称为“例子检索”(search by example)法。该法除包括图像检索、音乐检索外,还有语言和录像的检索。多语种、跨语种信息检索是指检索提问和检索结果使用同一种语言,但是用的数据库包括多个语种的信息。而跨语种检索除与多语种检索具有相同的多语种数据库外,其检索提问和检索结果也采用不同的语种。如检索提问是中文,检索的结果为英文。机器自动翻译检索提问和检索结果,多种叙词表的编制是该检索的重要研究内容。交互性信息检索是指用户与检索系统之间有互动过程。目前得以开发和支持的交互性检索技术包括交互性提问、检索框面积扩增、实时检索帮助和相关反馈等。交互性提问是指用户在构成检索提问时,通过与系统的互动回答做出最后的选择:检索框面积扩增是指由系统根据用户在检索过程中遇到的问题,有针对性地提供实时的检索帮助,以提高检索效率和准确性,相关反馈是系统根据检索的情况,自动限制或扩大检索条件,以提高检索效果的技术,完全由机器自动完成。检索是为了使读者能够通过简单的操作而快速准确地找到所需要的资源,能够提供检索的内容有元数据、分类、索引、目录、全文、关键词等,在Web2.0时代,也提供了Tag,也是一种检索方式。从功能上来看数字装备技术手册可建立简单检索、高级检索、全文检索、分类检索和夸库检索等功能。3.5.2.信息文献内容特征检索途径信息文献的内容特征是从文献所记载的知识信息中隐含的、肩负的特征,比如分类、主题等。以文献的外部特征作为检索途径适宜用于查找一直文献题名、著者姓名或序号的文献,而以文献的内容特征作为检索途径更适宜用来检索为止检索的文献。(1)分类途径 是一种按照文献资料所属学科(专业)属性(类别)进行检索的途径。分类途是以课题的学科属性为出半点,按学科分类体系来查找文献信息,以分类作为检索点,主要利用学科分类表、分类目录、分类索引按学科体系编排的检索工具来查找有关某一学科或相关领域的文献信息。它能较好地满足族性检索的要求,使同一学科的有关文献集中在一起,使相邻学科的文献相对集中。(2)主题途径 是一种按照文献的内容主题进行检索的途径。即将文献主题用语词表达并按语词字顺序检索文献的途径。主题途径就是以主题的内容为出发点。按关键词、主题词、叙词、标题词等来查找文献。以主题作为检索点,主要利用主题词表、主题目录、主题索引等按主题词的字顺编排的索引工具来查找有关某一主题或某一事物的文献信息。它能够比较好的满足特征检索的要求,使讨论某一事物或主题的不同学科文献集中在一起。主题途径适合查找比较具体的课题,能较好地满足检索要求。(3)分类主题途径 是分类途径与主题途径的结合。它比分类体系更具体,无明显的学术层次划分,比主题法更概括,但保留了主题体系按字顺排序一边准确检索的特点。综上所述,分类途径和主题途径是文献检索的常用途径。两者各有特点,前者以学科体系为基础,按分类编排,学科系统性好,适合族性检索。而后者直接用文字表达主题,概念准确、灵活,直接性较好,适合特征检索。3.5.3信息检索方法信息检索的方法多种多样,分别适用于不同的检索目的和检索要求。在信息检索过程中,具体选用哪种检索方法,由于客观情况和条件的限制不尽相同。但常用的信息检索方法有常规检索法、回溯检索法和循环检索法。1.常规检索法 常规检索又成为常用检索法、工具检索法。它是一主题、分类、著者等为检索点,利用检索工具获得信息资源的方法。使用此方法首先要明确检索目的和检索范围,熟悉主要的检索工具的编排体例和作用。根据检索方式,常规检索法又可为直接检索法和间接检索法:根据检索要求,常规检索法又为顺查法、倒查法和抽查法。(1)直接检索法 是指直接利用检索工具进行信息检索的方法。直接检索法所使用的多为便捷性的工具,其中的信息是经过高度浓缩的知识产品,从学科上又可分为综合性和专业性。对所收的信息按主题概念的大小构成条目,如以中文的壁画、笔形、汉语拼音、外文字顺等构成的各种字典、手册、年鉴、图录、百科全书等,才使用其书后的内容索引,再进入工具书的主题部分,获取所需信息资源。这种方法多用于查检一些内容概念较稳定或较成熟、有定论可依的知识性问题的答案,即可解决事实性的检索和数据性的检索(2)间接检索法 是指利用检索工具间接检索信息资源的方法。根据不同的课题要求、不同的设备条件,可以选择最适当的方案来实施检索,其内容包含检索课题的分析、检索策略的制定、检索技术的应用等方面。(3)顺查法 是一种根据检索课题的起始年代,利用所选定的检索工具,按照从旧到新、由远及近、由过去到现在的顺时序逐年查找,直至满足课题要求为止的检索方法。此方法也是一种掌握某课题全面发展情况的大规模的文献检索方法。顺查法由于是逐年查找,漏检较少,捡全率高,在检索过程中不断筛选,提出参考价值较小的文献,又由于对准需求口径,误捡的可能性较少。这种方法的优点是查全率高,适用于围绕某一主题普查一定时期内的全部文献信息,或者说,适用于那些主题较复杂,研究范围比较大的,研究时间比较长的科研课题。因是逐年、逐种、逐卷的检索,检索的工作量大、费时、费力。次法常用于事实性检索和文献信息检索。(4)倒查法 倒查法与顺查法相反,是利用所选定的检索工具,按照由新到旧、又近及远、由现在到过去的逆时序逐年前推查找,直至满足课题要求为止的查检方法。这种方法多用于新课题,新观点、新理论、新技术的检索,检索的重点在近期信息上,只需查到基本满足需要时为止。倒查法的目的是要获取某学科或研究课题最新或近期一定时间内发表的文献或研究进展情况。此方法省时、查得到的信息由较高的新颖性、但查全效率不高。(5)抽查法 是一种利用检索工具进行重点抽查检索的方法。它是针对某学科的发展重点和发展阶段,抓住该学科发展较快、文献信息发表较多的年代,拟定出一定时间范围,进行逐年检索的一种方法。这种方法的检索效果较好、检索效率较高,但检漏的可能性较大,因此使用此法时必须熟悉学科的发展特点。2回溯检索法 又称为回溯法、引文法、引证法,是一种跟踪查找的方式。即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。通过回溯法所获得文献有助于对课题的主题背景和立法依据等内容有更深刻的理解。此方法获得文献针对性强、数量多,在没有检索工具或检索工具不齐备的情况下,用力此法能够获得一些所需要的文献资料。但由于引证文献见关系的模糊性和非相关性引起“噪声”,查全率往往不高,而且往前回溯年代越远,所获取的文献越陈旧。3 循环检索法 又成为交替法、综合法、分段法。即交替使用回溯法和常规法来进行文献检索的综合检索方法。检索时,先利用检索工具从分类、主题、著者、提名等入手,查处一批文献信息,然后通过竞选,选择出与检索课题针对性较强的文献,再按其后所附的参考文献回溯查找,不断扩大检索线索,分期分段地交替进行,循环下去,直到满足检索要求为止。同时,为了提高检索效率,需要根据参考文献的特点,对五年之内的重要文献一般都会引用,所以,可以采用跳过利用的五年,然后用检索工具再找出一批文件进行回溯,循环交替知道满足检索需要为止。它兼有常规检索法和回溯检索法的优点,可以得到较高的查全率和查准率,尤其适用于那些过去年代内文献较少的课题。在实际检索中,应该根据检索条件、检索要求和检索背景等因素确定。检索条件是指是否有充分的检索工具利用,在没有检索工具的情况下,可以采用回溯法为主体的检索方法。检索要求是指准、快、全。这三者之间相互制约,难以兼得。故此,若要求以“全”为主,则爱用顺查法或循环法;若以“准”为主,则应该采用倒查法,若要求以“快”为主,则应采用抽查法。3.5.4信息检索途径 信息检索工具是把众多的各类信息资源进行分析加工后,按照一定的特征标识、排检、组织而形成的信息集合体。信息检索就是分析一些既定标识从信息集合中选取信息。因此,减速途径是文献信息的特征和检索标识相关的。根据文献的外部特征和内容特征,现在流行的趋势是将信息途径分为两大类型。 文献外部特征检索途径 是从检索载体的外表上标记的课件的特征,如题目(刊号、书名、篇名)、责任者(著者、编者、译者、专利权人、出版机构等)、号码(标准号、专利号、报告号、索取号等)。(1) 提名途径 以书刊名称或论文篇名变成的索引作为文献信息检索的一种途径。如果已知书名、刊名、篇名,可以作为此检索点,利用书刊名录、篇名索引等按提名编排的检索工具进行检索,查处所有特定名称的文献。题名途径多用于查找图书、期刊、单片文献。检索工具中的书名索引、会议名称所以、书目索引、刊名索引等都提供了通过题名检索文献的途径。(2)责任者途径 根据已知文献责任者的名称来检索文献的途径。文献的责任者包括个人责任者、团体责任者、专利发明人、专利权人、合同户和学术会议主办单位等。责任者途径的特点在于:专业研究人员一般各有所长,尤其是某些领域的知名学者、专家,他们发表的作品具有相当的水平或代表该领域发展的方向,通过著者线索,可以系统地发现和掌握他们研究的发展状况,可以查找某一捉着的最新论著。在使用责任者途径检索文献时,要了解著者索引编排的规则并熟悉著者姓名的一般知识,如欧美国家的习惯是名在前、姓在后。(3)号码途径 根据文献信息出版时所编的号码来检索文献信息的途径。如果已知某一文献的特定编号,如技术标准的标准号,专利说明书的专利号,科技报告的报告号和合同号、任务号,文献收藏单位编的装备号、索取号、排架号,可以作为索引点,利用各种号码索引和目录直接索引用到这一特定的文献。(4)元数据检索 以元数据项为检索点进行检索,用户选择要检索的字段,输入关键词进行检索。是最基本的检索方式。(5)分类检索 分类检索的功能比较明确。此次主要需要在分类检索支持功能和操作方式上加以改进。可以很方便的为资源增加一个新分类;分类展示方式多样化,除以传统树型展示方式以外,还应该增加以列表、分组列表等方式进行展示。并且各中展示方式在某一程度可以进行一些配置。(6)目录检索 目录检索能检索到目录的某一具体项,并且能显示该目录项所对应全文页的片段,还可以通过该目录项直接链接到该书的全文页,实现在线浏览该页。目录检索还包括在资源的详细页面中,显示目录信息,并且点击该目录项能直接跳转到该书的页。(7)关键词链接 关键词链接分为两种方式,一种是根据某个元数据字段的值进行链接,另外一种是通过关键词词库提供的关键词在文本中显示关键词链接。在资源详细页面展示中,关键词显示出链接,从而根据此链接完成全文检索。关键词使用关键词词库完成,该词库可以由用户自己定义,或者由Apabi中心站点提供关键词词库服务。关键词链接可以实现在资源库中范围内检索,也可以实现跨资源库检索,如果是跨库检索,则需要在后台进行检索字段的匹配关系设置;在UI上如何区分关键词链接在本库中检索还是进行跨库检索,则可以通过UI设计技巧完成,如可以在关键词旁边显示两个小图标,一个标识在本资源库中检索,另一个标识跨库检索,并且鼠标移动到图标上时,有明确的提示信息。鼠标选中某个图标点击,便可完成关键词检索。(8)索引检索 索引检索是从已有的记录数据中提炼出一种供检索的技术。当资源入库后,需要在后台创建检索。索引内容提供按作者、出版社、出版年份(最好是建立索引的字段能够由用户任意选择),并且可以为索引本身建立字母索引,如英文的首字母、汉字拼音的首字母为索引建立索引,从而可以快速的导航到索引。(9)标签应该 标签应该是可以出现在多个地方,比如资源的详细页面中的热门标签,标签应该还有一个简单的首页:提供推荐标签、标签查询等功能; 3.6 良好伸缩性的系统架构设计1. 系统架构设计目标(1)完全组件化设计 系统基于组件化思想设计,各组件之间实现松耦合,组件可以有自身的版本管理,并且可以向前兼容,从而减少维护的代价,在任何时候,只要维护一个最新版本即可。(2)多语种支持 数据存储支持多语种的存储管理,因此数据库设计、配置文件、以及所用到的XML文件均以UTF-8为格式;比如数字装备技术手册平台可支持简体中文、繁体中文和英文三种语种,并且可以实现即时切换。(3)跨数据库支持 例如系统平台能同时支持SQL SERVER2000/2005、Oracle数据库管理系统等。(4)支持二次开发的开发架构 系统能提供一些二次开发接口,便于用户能在此基础行完成对数字装备技术手册一些访问控制的功能,如用户接口、数据访问接口等。(5)部署和维护方便 系统安装部署容易,如一些简单的维护可以通过远程、或自动完成,如一些安全补丁的在线安装。(6)多种应用版本支持 数字装备技术手册可根据不同的要求来做不同版本的定制,做到很容易的进行版本的组装,而不需要平台构架和花大量的开发精力来进行版本管理。(7)可配置功能设计系统尽可能提供更多的可配置功能,功能模块、各模块的一些功能细节、展示方式等可配置。(8)统一友好的错误机制 提供统一的错误码;提供事件查看器功能;运行时的错误跟踪记录。2. 关键技术与算法(1)大型数据库设计方法 采用横向分表、纵向分表、字段冗余等方案来设计数据库,提高检索效率;通过编写高度优化的SQL语句、存储过程来实现高效率的数据访问。针对数据量大的表,如用户信息表、资源流通表,可采用分表的策略来提高检索效率。横向分表:Userinfo表中记录了所有用户的信息,设计一个表Userinfo1,将近一个月未登录的用户信息转移到Userinfo1。使用用户信息时先从Userinfo表中获取,如果没有再从Userinfo1中获取。DigitResOrder表中保存资源的流通信息,当流通完成后,将流通信息转存到DigitResOrderHistory表中。纵向分表:Userinfo表中的信息较多,将与登录、权限无关的字段,拆分到表CommunicationUser表中,登录、判断权限等操作的时候使用Userinfo表,展示个人详细信息的时候使用CommunicationUser表。冗余:为了提高检索效率,需要将一些字段进行冗余,以避免过多的关联影响检索效率。在NewInertDigitRes中冗余元数据公有信息字段。编写高度优化的SQL语句,尽量减少数据表之间的关联查询。在从数据库中获取记录时,只查询需要的当前页的数据集,方法如下:SELECT TOP 10 * FROM(SELECT TOP 50 * FROM sampletable ORDER BY Id ASC) AS table1ORDER BY Id DESC另外,将一些比较复杂的SQL语句写成存储过程来调用,存储过程是编译好的,相比SQL语句减少了编译的时间,而且存储过程直接存在服务器上,减少了数据的传输过程。(2)跨数据库设计的技术方案采用工厂模式,对数据库访问层进行封装,如用户数据访问层的类图如下:示意代码:public class UserDALFactory public static UserDAL Create(int nType) if(nType = 0) return new SqlUserDAL(); else if(nType = 1) return new OracleUserDAL(); else return null; public class UserDALpublic class SqlUserData: UserDALpublic class OracleUserData: UserDAL public class UserManagerprotected UserDALFactory _objUserDAL; public void Initialize() _objUserDAL = UserDataFactory.Create(0); (3)采用分布式服务的架构设计将数字装备技术手册服务平台分成几个独立服务:Web服务、数据库服务、全文下载服务、全文检索服务以及应用服务;这几个服务可以集中部署,也可以进行分布式部署在多台服务器中,当采用分布式部署时,通过服务的分散,从而提高服务能力。Web服务:例如用微软IIS提供的ASP.NET应用程序;应用服务:部署数字装备技术手册后台运行的服务,如邮件、借阅过期处理、用户到期处理等; 数据库:部署数字装备技术手册的数据库集群;根据实际情况需要,数据库也可以进行集群及库表散列等技术;全文服务:部署全文的下载服务集群;全文检索服务:部署数字装备技术手册的全文检索服务以及管理等功能;3.7 接口的设计 与其它服务站点资源共享例如通过请求完整的URL:/service/data.aspx?type=tag&from=2005-06-18T03:09:23Z&to=2007-06-18T03:09:23Z/service/data.aspx? Resumptiontoken=tag|2005-06-18T03:09:23Z| 2007-06-18T03:09:23Z|56返回结果示例: /service/data.aspx?type=tag 2007-06-18T03:09:23Z 毛泽东 25316 林彪 18977 周恩来 15897 3.8 个性化装备技术手册社区以及打造属于自己的个人装备技术手册社区功能模块包括社区基本信息、我的装备技术手册、论坛3个组成部分的实现。社区是网上特有的一种虚拟社会,社区主要通过把具有共同兴趣的访问者集中到一个虚拟空间,达到成员相互沟通的目的。社区基本信息 包括“浏览最新上架图书”、“浏览最新书评”、“浏览热点标签及资源”,“浏览本馆推荐图书”、“浏览特色个人装备技术手册”、 “浏览并访问热门社区”和“浏览热门帖子” 七个部分我的装备技术手册 包括“维护我的借阅历史”、“维护我的借阅历史信息”、“维护我的预约信息”、“维护我的书评”、“维护我的收藏书架”、“维护我的圈子信息”和“管理我的留言”七个主要组成部分论坛 信件讨论区 这是BBS最主要的功能之一。是虚拟网络社区的主要形式,大量的信息交流都是通过BBS完成的,用户通过张贴信息或者回复信息达到互相沟通的目的。包括各类的学术专题讨论区,疑难问题解答区和闲聊区等等。4数字装备技术手册主要的功能模块搭建4.1.用户模块功能结构(1)用户注册在后台管理可以设置“用户注册功能是否开放”,在系统配置中进行管理。在用户注册时需要录入用户名、密码、单位/学校、专业、身份、真实姓名、E_mail、出生日期、身份证件类型(1身份证,2军官证,3学生证)、证件号码。其中应该限制对于同一个证件只允许注册一个用户。用户名必须唯一。在维护个人信息中,密码、专业、身份、出生日期、身份证件类型、证件号码可以允许用户修改。用户可以从后台管理中成批导入,对于注册时间要求“对自己注册的用户为提交注册信息的日期,对系统生成的用户,为首次登陆的日期”。完成注册的用户放入到默认的有密码用户组中,注册信息中的账户启用和失效日期是否根据用户组的启用和截至日期来限制。(2)登录流程如下:判断是否为首次登录时首先判断用户是否是首次登录,如果是首次登录,则将从用户所在用户组中读取限制的首次登录时间,与当前时间进行比较,当前时间晚于首次登录截至日期则不允许登录。有密码用户登录登录流程如下:(3)用户管理限制同一帐号同时在不同机器上登录。用户登录时记录登录时间,如果其他机器上使用同一帐号进行登录,则将当前时间和系统记录的登录时间进行比较,用户类型有2种,分别是:有密码用户;IP用户有密码用户登录时需要使用用户名和密码,具有在线阅读和借阅功能,借阅时占用复本数,借阅时间受后台设置的归还天数限制。IP用户须指定IP范围,具有在线阅读和借阅功能,借阅时占用复本数,借阅时间受后台设置的归还天数限制。(4)用户组管理用户组包含信息有用户组ID、用户组名、用户类型标志、用户数上限、在线阅读数上限、帐户启用日期、帐户失效日期、用户组创建日期、授权资源借期、第一次登录截至日期、可借复本数、删除状态标志、备注。一个用户组对应于唯一的一种用户类型,但多个用户组可以为同一个用户类型。可进行的操作有添加用户组信息,修改用户组信息,维护用户组中用户,删除用户组。IP范围IP范围包含信息有IP范围ID、IP范围名、IP范围、使用此IP范围用户组。可以对IP范围组进行添加、修改、删除操作。4.2资源检索接口功能模块结构 4.2.1检索输入框支持简单的检索语法运算,并提供检索策略设计功能,由于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论