标段一工作说明书内容.doc_第1页
标段一工作说明书内容.doc_第2页
标段一工作说明书内容.doc_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 系统整体结构1.1 系统功能结构图系统整体结构如上图所示:资源门户及统一搜索系统,分为七个功能模块,分别为:1)分类体系管理分类体系是有信息存入采集库中。其中的图片、文件附件等资源数据存入资源存储系统中。2)1.2 功能性需求分类功能模块功能编码子功能分类体系管理A-001存储分类管理存储分类是由领域专家管理的,是否需要审核?存储数据标准?A-002展示分类查看及与存储分类的关系元数据管理B-001数据类型管理B-002属性管理B-003属性值管理数据标准管理C-001存储数据标准维护C-002存储数据标准查看C-003展示分类申请C-004展示分类审核C-005展示数据标准查看审核通过后,如果对其进行变更领域专家D-001申请成为领域专家D-002领域专家审核D-003领域专家管理标签库E-001对外接口资源中心F-001对外接口系统管理G-001用户管理G-002角色管理G-003操作日志2 网页爬虫2.1 网站站点配置网站站点配置功能用于设定爬虫需要采集的站点,包括网站入口地址,网站分类、采集深度、采集优先级、内容模板等等。数据库索引,用于从采集库中的数据,读取后创建索引到索引库中。对于采集库中的标准库数据,可以直接映射创建索引库。对于采集库中的非标准库数据,需要根据搜索的业务需要对数据进行标准化,再创建索引。在索引过程中,还可能需要对数据进行加工和处理。5.5 文件索引文件索引主要实现将存储资源库中的文件进行解析和创建索引。支持对本地文件、网络文件目录、FTP目录、NFS文件目录进行遍历、采集和更新。支持的文件类型近300余种,包括常见的Txt、HTML、Xml、Office文档、Pdf、Rar文件等等。此外也可以自定义文件扩展名和解析器。用户也可以通过开发插件方式来解析其他的文件格式内容。支持多媒体信息、各种格式文档、及其它应用系统中的文档采集。包括JPEG、BMP、GIF、TIFF、PCX、AVI、WAV等二十多种图像声音动画格式;可支持多国语系(英文、繁简体中文、日文、西欧语系等)混合的文件;可支持藏文、维文等少数民族语言,文件编码支持Big5、GBK、Unicode、UTF-8等。5.6 定时采集任务通过设置定时的采集任务,系统可以定时地从采集库,或是文件资源中读取数据,创建索引,用于提供检索服务。6 资源中心门户6.1 资源分类与管理建立统一的分类目录,实现资源统一揭示;建立逻辑分类目录,实现资源多维度揭示。包括资源关联、资源聚合等功能。6.2资源在线浏览针对资源库中存储的各种资源类型,包括各种文本资源、音频、视频、图片、教学课件等,提供在线阅读和播放查看功能,以方便用户高效快速和直观的利用。6.3 与学校公共平台对接通过接口与学校统一身份认证系统的信息集成,实现知识资源中心的用户与权限管理;知识资源中心与各应用间前台展示功能:如在线展示,目录展示等;与短信、通讯、用户通讯信息等相关信息通过浙江大学公共通讯平台对接获取;师生基本信息数据通过与浙江大学数据中心对接获取。7 统一搜索模块7.1 全文检索(1)提供全方位检索手段,包括外部特征与正文内容的各种逻辑组合检索、位置检索、二次检索、渐进检索、模糊检索、历史检索、词根检索、大小写敏感检索、概念检索、对检索结果按与检索表达式的相关性程度排序等。实现精确计算,报告准确的检索记录数。8.2 OpenUrl接口OpenURL即“开放链接”,一种解决不同的数字资源系统互操作、进行资源整合

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论