【毕业学位论文】(Word原稿)人教出版文献智能检索与管理系统的设计与实现-软件工程_第1页
【毕业学位论文】(Word原稿)人教出版文献智能检索与管理系统的设计与实现-软件工程_第2页
【毕业学位论文】(Word原稿)人教出版文献智能检索与管理系统的设计与实现-软件工程_第3页
【毕业学位论文】(Word原稿)人教出版文献智能检索与管理系统的设计与实现-软件工程_第4页
【毕业学位论文】(Word原稿)人教出版文献智能检索与管理系统的设计与实现-软件工程_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中图分类号: 学校代码: 10055 密级: 硕 士 专 业 学 位 论 文 人教出版文献智能检索与管理系统的设计与实现 of 文作者 X X 指导教师 X X 教授 申请学位 工程硕士 培养单 位 软件 学院 学科专业 软件工程 研究方向 金融信息化 答辩委员会主席 评 阅 人 南开大学研究生院 二一 三 年 五 月 南开大学学位论文使用授权书 根据南开大学关于研究生学位论文收藏和利用管理办法,我校的博士、硕士学位获得者均须向南开大学提交本人的学位论文纸质本及相应电子版。 本人完全了解南开大学有关研究生学位论文收藏和利用的管理规定。南开大 学拥有在著作权法规定范围内的学位论文使用权,即: (1)学位获得者必须按规定提交学位论文 (包括纸质印刷本及电子版 ),学校可以采用影印、缩印或其他复制手段保存研究生学位论文,并编入南开大学博硕士学位论文全文数据库; (2)为教学和科研目的,学校可以将公开的学位论文作为资料在图书馆等场所提供校内师生阅读,在校园网上提供论文目录检索、文摘以及论文全文浏览、下载等免费信息服务; (3)根据教育部有关规定,南开大学向教育部指定单位提交公开的学位论文; (4)学位论文作者授权学校向中国科技信息研究所及其万方数据电子出版 社和中国学术期刊 (光盘 )电子出版社提交规定范围的学位论文及其电子版并收入相应学位论文数据库,通过其相关网站对外进行信息服务。同时本人保留在其他媒体发表论文的权利。 非公开学位论文,保密期限内不向外提交和提供服务,解密后提交和服务同公开论文。 论文电子版提交至 校图书馆网站: 。 本人承诺:本人的学位论文是在南开大学学习期间创作完成的作品,并已通过论文答辩;提交的学位论文电子版与纸质本论文的内容一致,如因不同造成不良后果由本人自负。 本人同意 遵守上述规定。本授权书签署一式两份,由研究生院和图书馆留存。 作者暨授权人签字: 20 年 月 日 南开大学研究生学位论文作者信息 论文题目 人教出版文献智能检索与管理系统的设计与实现 姓 名 学号 2220101264 答辩日期 论文类别 博士 学历硕士 硕士专业学位 高校教师 同等学力硕士 院 /系 /所 软件学院 专业 软件工程 联系电话信地址 (邮编 ): 北京市朝阳区东柏街 9 号院天之骄子小区 2注: 是否批准为非公开论文 否 注:本授权书适用我校授予的所有博士、硕士的学位论文。由作者填写 (一式两份 )签字后交校图书馆,非公开学位论文须附南开大学研究生申请非公开学位论文审批表。 南开大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下进行研究工作所取得的 研究 成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的作品的内 容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。 学位论文作者签名: 年 月 日 非公开学位论文标注 说明 (本页 表 中填写内容须打印 ) 根据南开大学有关规定,非公开学位论文须经 指导教师同意 、作者本人申请和相关部门批准方能标注。未经批准的均为公开学位论文,公开学位论文本说明为空白。 论文题目 申请密级 限制 ( 2 年 ) 秘密 ( 10 年 ) 机密 ( 20 年 ) 保密期限 20 年 月 日至 20 年 月 日 审批表编号 批准日期 20 年 月 日 南开大学学位 评定委员会 办公室盖章 (有效 ) 注: 限制 2 年 (可少于 2 年 );秘密 10 年 (可少于 10 年 );机密 20 年 (可少于 20 年 )摘 要 I 摘 要 随着计算机技术 和互联网技术 的普及,文献 信息与管理系统 已成为人们信息资源获取的一种手段,随着文献 资料 出版 数量 的 增加和 使用 者对文献资料 使用 方式的 不断 变化,社会对文献 资料检索和管理 的方式提出了新的要求 。 传统出版模式存在印刷成本高、销售效率低、增值服务难等显著不足。 因此,亟需通过数字化手段改变出版的营销方式、产品发布和服务模式,从而提升出版社的盈利能力。 本文系统设计致力于研究解决传统人工管理文献方式的弊端,基于人民教育出版社(以下简称人教社)的 文献在线服务的需求,设计并实现了数字出版文献智能检索与管理系统,解决文献管理人员数据信息处理工作量大、服务效率低下的问题。通过设计一个高质量的文献检索与管理工具来管理与检索海量的 文献信息,使用户进行高效、便捷的检索功能,并采用目前流行的 B/S 模式进行系统设计与开 发。本文所设计的文献智能检索与管理系统实现以下主要功能: 1) 系统登录模块:对用户身份进行鉴别。 2) 用户信息管理模块:对注册用户进行增、删、改、查的功能。 3) 文献管理模块:实现管理员对文献类别以及文献档案的增、删、改功能。 4) 文献检索模块:基于编目和关键字的文献快速检索、基于支付功能的文献下载与阅览权限管理、并提供支付功能保证人教社的盈利能力。 5) 系统查询模块:记录下每次用户 的 操作信息,为用户主动推荐文献,为用户提供热门文献的统计信息等。 本项研究是信息科学与知识工程的交叉与渗透,它运用计算机与网络 技术实现文献知识的有效管理,有利于促进并深化信息系统的知识化、智能化的应用研究。 关键字 :文献智能检索与管理系统 B/S 结构 概念匹配度模型I of a to of to in of on of to to so as to In is to of on of a to of to of of a ) 2) of 3) of of 4) on on of 5) a of is of it is of to of of to B / S 目 录 录 摘 要 . I . 录 . 一章 绪论 . 1 第一节 论文背景 .二节 问题提出 .三节 研究现状 . 国内文献管理现状 . 3 外 文献管理现状 . 3 第四节 研究内容 .五节 论文的组织结构 .二章 相关技术 . 6 第 一 节 文献检索原理 . 二 节 开发环境和工具 . 架 . 7 面向 开发工具 C# . 7 B/S 模式与 C/S 模式 . 8 005 数据库 . 10 第 三 节本章小结 .三章 系统需求分析 . 11 第一节 系统概述 .二节 业务范围和用户类型 .三节 用例分析 . 系统登陆 . 14 用户信息管理 . 15 文献管理 . 15 文献检索 . 17 系统查询 . 17 第四节 业务分析 . 录 五 节 本章小结 .四章 系统设计 . 22 第一节 系统架构设计 . 系统运行环境 . 23 第二节 系统模块设计 . 用户信息管理 . 25 文献管理 . 28 文献检索 . 32 系统查询管理 . 34 第三节 检索算法 . 构建频繁检索集 . 36 建立概念格 . 36 概念匹配度模型 . 37 文献算法 . 39 第四节 数据库设计 . 数据库设计描述 . 39 建立数据库表 . 43 第五节 本章小结 .五章 系统实现 . 49 第一节 系统登录模块 .二节 用户信息管理模块 . 用户信息的新增子模块 . 50 户信息的修改子模块 . 52 户密码修改子模块 . 52 第三节 文献管理模块 . 文献上传子模块功能描述 . 54 献下载子模块功能描述 . 54 献删除子模块功能描述 . 54 第四节 文献检索模块 . 文献检索子模块 . 57 第五节 系统查询模块 . 浏览记录查询子模块 . 59 献档案查询子模块 . 59 第六节 本章小结 .六章 结论与展望 . 62 参考文献 . 63 目 录 V 附录 A . 65 致谢 . 67 个人简历 在学期间发表的学术论文与研究成果 . 68 第一章 绪论 1 第一章 绪论 第一节 论文背景 随着 计算机和通信技术的 飞速 发展, 世界上大多数的国家和地区 已经 进 入信息化社会。信息技术成为一种社会 必须 的基本生产资料,因此,迫切需要我们 技术人员 为 社会的 各行各业开发出符合其需要的信息管理系统 1。 二十一世纪已经进入到了 知识经济与信 息化的时代,信息产业在新世纪 逐渐成为代表 着先进 科学技术水平、代表 着 改革创 新 能力 的第一生产力,出版业的发展也同样有 着 信息化和网络化的发展需求, 其中一项重要工作就是 如何 利用 现代先进的 信息技术 来 改造 和创新 出版业 的服务和业务 ,加快 出版业的 信息化建设。 为 了 满足文献管理 的 信息化要求 , 国内外 多家 软件 开发企业已经开发 出 很多 商业 化 的文献管理软件, 但 是这些商业软件 从 其具有的 业务功能来说, 目前均不能 满足人教 社对 自身文献管理的需 求 ,这就 迫切 需要 我们 研制 出一套操作简单, 性能卓越的文献管理系统 , 使得 文献 业务人员 通过使用 它 , 提升 文献 信息 的查询、检索、采集、存储 的工作效率 ,并 相应 提 升 商业 效益 。 第二节 问题提出 出版业运营的基础是对于出版业的海量文献数据的管理。一方面,高效、迅捷的文献检索与管理模式不仅有利于管理员进行文献管理,使工作系统高效、便捷,而且还可以方便用户进行文献的检索与查阅,对出版业的发展具有重要的意义。另一方面,信息技术的发展需要对知识成果进行全球范围内的交流和共享, 那么如何管理大量的文献,并使用户体验到最为高效、便捷的检索功能,这就成为大家关心的问题。 在这样的形势下,急需一个有效的文献检索与管理工具来保证高质量的工作和 学术 交流的展开,否则管理员和用户所具有的智慧和能力也就难以得到充分地 发挥。 在日常的科技生活中,通过 浏览 、 查询和检索 文献 资料 作为人们获取 知识的 途径 ,随着 科技的飞速进步,文献资料的数量成倍增加,特别是进入互联网时代, 使用者对文献资料 的 使用 方式 产生了极大的 变化, 同时 对文献管理 2的 手第一章 绪论 2 段 和模式也 提出了新的要求。 我国有着几千年的文明史,期间出现了无以计数的古代典籍,再加上近现代大量的国外经典译著的 不断 涌现, 使目前 出版文献的检索与管理 工作 存在 着 很大 的困难。 比如像文献 资料 的保存、检索以及维护等工作 。 出版业 界 如果还是采 用传统手工的文献管理方式,已经远远不能满足当今社会 发展 的需要 。 而如果采用智能管理系统的方式,让用户 通过网络 在 文献 数据库中进行相关的检索和查询,就会大大的节约查询时间,提高效率,并大量节约人力成本。另外随着计算机技术的飞速发展,尤其是近十年来 互联网的快速发展,人们的日常阅读习惯已经 发生了天翻地覆的改变,纸质阅读大有被电子阅读的方式所取代的趋势。 各种电子阅读产品层出不穷,电脑、手机、电子书等新型阅读终端等已经遍布人们生活的角落,基于互联网的文献管理系统 已经成为了发展的 必需 结果 。 由于文献是学术知识的一种表现形式, 所以 对文献 档案 的管理 就 是 对 知识的 一种 管理,这种管理应当以“有利于文献的检索和利用”为原则,以“有利于文献知识的发现和便于管理者和用户操作”为目标, 而如何能够让这些浩如烟海的文献资料以一种方便人们查询和检索、并能得到快速的下载服务的 在线 管理系统就成为当前 出版业界 的当务之急。 本文就针对文献的管理 方式 展开研究,设计并实现了数字出版文献智能检索与管理系统,旨在为海量文献的管理与检索提供一个方便 、 快捷的平台,并通过实际应用验证 了本 系统的科学性和有效性。本系统采用基于面向对象方式的服务器端应用程序开发技术 用 C#语言进行 相应程序 开发并采用据库进行数据管理,开发了一个文献智能检索与管理系统。 下面笔者 就 通过对 本 文献 系统 所使用 的开发技术 及环境 、 系统需求分析 、系统模块设计 与 系统 实现 等几个方面来阐述 完成该系统的 所有 环节和步骤 。 本文献管理系统不仅能够为文献管理者提供充足的信息和方便快捷的管理手段,而且也能够为用户 文献 查询 和检索提供全方位的 服务。 第三节 研究现状 国内 文献管理 现状 我国文献信息管理系统的开发现状和实施规模,相比 而言 发展 是 比较 缓 慢的 , 但是 最近几年 有了 一个 质 上 的飞 跃 , 目前已经有 了 几家 专门从事文献管理第一章 绪论 3 系统 开发的 软件 公司 。他们当前 开发出来的现有 的商业 软件大多功能 比较 完善,但是 对于 文献管理 操作人员的技术要求 却 相对较高 。 而对于 国内很多中小型的文献出版社 而言,由于 操作 人员 的 素质和 操作人员的 数量 均 不能满足 其 要求,因此 这些商业 文献管理 软件 显得并不符合文献管理企业的要求 ,所以 从 应用效果 上来看 也并 不是很好 3。目前,很多文献 管理 企业都在大力推广文献管理的数字化、网络化和智能化 , 因此文献企业 信息化建设 成为文献管理系统的一个重要发展方向 。 国外文献管理 现状 由于信息化程度 的比较先进, 西方国家对文献 信息的 采 集、 收藏 、保护 等管理 工作 十分 重视 4。 西方国家 的文献 管理系统 发展 已经 相当 成熟。 美国文献界代表人物玛格丽特海兹乔 姆说 :“ 当今 文献 文 件管理人员的工作重点已由纸质文件的实体保管转变成对所有存在于计算机网络 中的文件进行远距离操控 的时代 ,这将导致 一种 全面的 全新创造文件 5。 ” 目前国外对于文献资料的 全文检索技术已经 发展得 十分 成熟 和系统, 也 涌现了 一大 批 颇具影响 力的 全文检索工具,如 ,这些系统 均 收集了 互联网上数以 亿计 的网页 和文档信息 , 并针 对它们建立 了 全文检索索引库,使用户能快速 检索并 找到自己所需的信息。 基于关键字的信息检索是一项重要的数据处理技术,在各类信息系统中 均得到了 广泛 的应用和发展 。人们对关键字 检索 6发明 出了许多经典算法,例如著名的 。在支持检索的数据管理方面,设计了基于列存储的据库,如 ,提升海量数据的存储和检索效率。针对全文检索, 件基金会提出了 文检索工具包,对索引、查询优化等问题 提供良好的支持。 现 今 在 用服务 中普遍采取 B/S(浏览器 /服务器)的方式,而 开发 和支持这些服务内容的操作系统 一般采用 类 者 统 平台 7。 第四节 研究内容 本文基于人教社出版文献在线服务的 需求,设计并实现数字出版文献智能检索与管理系统,采用了当前 流行的 B/S 模式进行系统架构设计 , 并 对出版业第一章 绪论 4 常规文献管理情况进行 了广泛的 调查和研究 ,分析 了 几种当前流行的 文献管理系统 的 业务处理方法,最终确立了本系统的 业务 流程 。在数据库系统的搭建过程中, 使用 种数据库开发工具 ,全名 为 来进行数据库系统的数据 创建 工作 。为了确保 数据的安全性, 我们 采取了以 C# 编程代码 与 005 相配合完成数据库管理功能。 C#语言具有代码 易读、易懂且可维护性良好 , 用户 面设计 快 捷、便利 , 代码执行 效率高等 的优势 , 因此使用它作为开发本系统的重要 开发工具 。本文所设计的文献 智能检索与管理系统实现了基于编目和关键字的文献快速检索以及 文献的业务管理等多项 功能。 为了保证上述功能的顺利实现,本项目开展以下几项功能的研发 工作 : (1) 基于编目和 关键字的文献快速检索 在网络文献浏览中, 一般 用户通常按照编目或者关键字的方式对文献进行检索。在基于编目的检索中,用户通过编目导航逐级细化 其 搜索 的 范围,直到发现感兴趣的文献选择阅览。基于关键字的文献检索 则 是指用户输入一系列 的关键字(如 作品 “ 海燕 ” 、 作者 “ 高尔基 ” 等 ) 信息 及其 信息之间的 逻辑关系,系统为其在后台自动匹配相关的文献 资料 并按照 一定的 排序规则推荐给用户(例如阅读或者检索的频度) 。基于编目和关键字的检索需在实时完成处理 操作并将 操作 结果推送给用户。 (2) 基于支付功能的文献下载与阅览权限管理 为了保证出版 社在线文献服务的盈利能力,需要在系统中实现用户的支付与计费功能 ,因此在本系统中让 用户可以通过支付宝等 网上支付系统的 接口对用户的 资金帐户进行充值 操作 。在用户获得付费文献的阅览与下载权限时,系统将执行金额验证和计费 的功能并记录其订单信息 。同时,还需要对用户获取的阅读权限进行统一管理 , 并支持 其获得 高性能访问 的能力 。 (3)为用户提供热门文献的统计信息 对文献的阅读及点击进行基于特定时间窗( 如以天、周为 周期 单位)以及文献分类(如历史、文学)的综合统计,得到用户普遍关注的热点文献。将热点文献以排行 情况 和个性化 定制 推 荐的形式推荐给用户。 (4) 用户与文献出版的业务管理 系统为出版社内部管理员提供用户(系统管理)与出版业务(业务管理)的管理功能。在系统管理方面,支持 管理员 针对用户 账户信息的增 、 删 、 改 、第一章 绪论 5 查和信息提示等功能、权限 设置功能、计费管理与监控功能等。在业务管理方面,系统支持编目遍历 功能、文献的 上传、 添加与删除功能,并对添加的文献进行智能自动标注 索引 。 同时附上主要的参考文献 ,请参见本论文附录内容。 第五节 论文的组织结构 本论文 共分为六个章节进行阐述: 首先 作者在第一章中 对 本论文的 研究背景进行介绍,同时提出问题 ,介绍为何要开发本系统,通过国内外研究现状来阐述开发本系统的意义所在。 其次 作者在第二章中 介绍 了本论文 在设计中选用的 B/S 三层架构, C#开发技术, 005 等相关技术以及对这些内容的诠释,并对所需开发环境和工具进行重点介绍。 再次作者在第三章中重点介绍了本论文 如何对出版文献检索与管理系统的需求进行分析 的内容 。 然后作者在第四、五章节中重点介绍了 完成本系统的 系统设计过程和 详细设计 内容,主要包括 本系统的架构设计、模块设计以及数据库设计,并指出 其中采用了那些 关键技术和核心算法。完善系统的测 试和运行状态,并附带主要的程序代码以及 部分系统 界面。 最后作者对所设计的系统进行归纳总结,并对将所设计 系统应用到实际 工作 当中 去 所 能 带来的 工作 改变进行展望。 文章的最后是 作者 对 在 本次 系统 设计 中曾经 给予 过 帮助的所有人 进行的 致谢,并给出了本次设计中采用的 主要参考文献 的详细 资料信息 。 第 二 章 相关技术 6 第 二 章 相关技术 本文 研制开发的 是 一种文献智能检索与管理系统,因此首先 简单介绍一下文献 和文献检索的 概念 内容。 文献是 人类知识 与 知识 记录的载体, 是 指 用文字、符号、图形、声频、视频等技术手段来保存人类知识的一切物质载体,文献 存在的方 式 不仅包括出版的图书 资料,还包括一切会议文献、专利报告、学术论文、科技报告等种种 形式。 原始的 文献 资料往往是 不能直接进行 智能 检索 的 , 我们 需要从这些原始 文献中提 取 相关的一些 标识信息 内容来帮助我们进行 智 能 信息检索, 下一小节中本文将对 文献信息检索 的原理 进行详细 介绍。 第 一 节 文献检索原理 文献检索 9是 指按照 一定的方法将 文献 信息 内容进行 组织和存储,并根据用户的 实际 需要 分析出检索条件并 直到找到所需要文献 的过程 。文献信息 的 检索过程 包含文献信息 的 储存和文献信息 的 检索 这 两个过程。文献信息的存储和检索的全过程可用 下 图 示: 文 献信 息检 索课 题文 献信 息特 征检 索提 问信 息检 索语 言和名 称规 范文 献 信 息标 识( 检 索 点 )检 索 提 问标 识( 检 索 词 )检 索系 统( 标 识分 配 )检索结果分 析分 析标 引著 录选 用形 成形 成输 入检 索输 出存 储 过 程检 索 过 程图 献检索的原理示意图 综上示意图 所示,文献检索的原理 就 是:由 文献系统的管理人员按照 文献或文献描述体 的 详细 内容抽象出 一定的 文献库 检索条件 , 并按照 一定的逻辑 方式 对抽象出来的检索内容进行 有序化组织,然后将这些 组织 内容进行存第 二 章 相关技术 7 储 处理(一般是存储到数据库中) 。 当用户 前来 检索 文献 时, 管理系统 把 会把用户提交的检索条件输入 并进行 压缩转换为检索 标识 (检索 关键 词 ), 管理系统再 以此 检索标识 与 存储在 文献 信息 数据库 中的文献标识进行对比,做出文献是否符合检索关键词 的判断即文献 检索的过程。因此 文献检索的过 程 就是 检索关键词 与文献标识的比对过程 。 第 二 节 开发环境和工具 架 微软公司( 司 ) 研发 的一种 应用 程序的 开发平台。微软 公司 定义了 公用语言子集 (22。 一了 程的 各种 类库,并对 进行了 完全支持 23。由于 流行的操作系统 出同 门, 从某种角度上来看,可以将两种应用程序 运行库 并 称为一个也是 被 允许和认可 的 24。 使用 原因主要有以下几方面: ( 1)可以大幅度提高 计算机的功能。 使用者, 由于系统的基础类库的支持 可以不受 所使用系统硬件的限制,自由访问互联网 。 ( 2) 微软 公

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论