软件需求说明书.doc_第1页
软件需求说明书.doc_第2页
软件需求说明书.doc_第3页
软件需求说明书.doc_第4页
软件需求说明书.doc_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

桂林理工大学毕业生就业信息检索服务系统软件需求规格说明书项目团队:何超(3110717224)、曾驿钦(3110717225)班级:计算机科学与技术2011-2班编写日期:2014年12月18日桂林理工大学云项目组1引言 “就业是民生之本”大学生就业是我国就业问题中带有战略性的核心问题。用多维视角和发展观的思维审视目前大学生就业难的现象,不难看出现象的背后有很多令人深思的问题,而这些问题多是发展中、前进中出现的。清醒地分析、科学地把握会找到多渠道解决的方案。因此,为现代大学毕业生建立就业信息检索服务系统非常必要,系统数据来源于全国各大高校毕业生就业网,并通过数据审核员进行审批操作后发布,具有可靠的来源和安全的服务;以高度的实时周期及精准的检索方式,为大学毕业生提供快捷的就业岗位数据服务和官方就业指导服务。所有的应届毕业生获得共同的就业相关信息,使得毕业生站在同一平台,以能力见高低,平等竞争,找到适合自身的职业岗位。1.1编写目的为了开发出真正满足用户需求的软件产品,在软件定义时期的最后阶段,得出“系统需要做什么”。对目标系统提出完整、准确、清晰、具体的要求,并明确开发这个软件产品的意义、作用、以及最终要达到的期望。通过这份软件需求规格说明书,准确描述软件需求,从而对软件产品进行精准定义。1.2背景 本项目将开发毕业生就业信息检索服务系统,基于互联网的共享性特征,采集全国各大高校的毕业生就业网信息,并对信息进行解析、分类、去重等操作后,存储在数据库系统中,然后利用全文检索工具进行数据分词、语义识别处理,建立索引。毕业生可以通过系统平台进行模糊查询和精确查询,获得最新的就业岗位信息或指导信息。系统将以传统软件工程的喷泉模式和迭代模式进行开发。 本系统是基于操作系统之上的应用程序,系统划分为两大子系统,数据采集子系统为数据处理子系统提供原始数据支持,并决定了整个系统的更新周期,以及服务用户的范围;而数据处理子系统决定了用户查询的效率。 本项目任务提出者:广西教育部就业发展计划中心; 项目开发者:桂林理工大学云项目组进行研究和开发; 最终用户:数据审核人员、广大应届毕业生。1.3定义Ajax:术语Ajax用来描述一组技术,它使浏览器可以为用户提供更为自然的浏览体验。在Ajax之前,Web站点强制用户进入提交/等待/重新显示范例,用户的动作总是与服务器的“思考时间”同步。Ajax提供与服务器异步通信的能力,从而使用户从请求/响应的循环中解脱出来。 B/S(Browser/Server,浏览器/服务器模式),是WEB兴起后的一种网络结构模式,WEB浏览器是客户端最主要的应用软件。这种模式统一了客户端,将系统功能实现的核心部分集中到服务器上,简化了系统的开发、维护和使用。客户机上只要安装一个浏览器,服务器安装数据库。浏览器通过Web Server同数据库进行数据交互。JSP(Java Server Pages),中文名叫java服务器页面,其根本是一个简化的Servlet设计 。JSP将网页逻辑与网页设计的显示分离,支持可重用的基于组件的设计,使基于Web的应用程序的开发变得迅速和容易。是一种动态页面技术,它的主要目的是将表示逻辑从Servlet中分离出来。HTTP(Hypertext transfer protocol),超文本传送协议定义了浏览器(即万维网客户进程)怎样向万维网服务器请求万维网文档,以及服务器怎样把文档传送给浏览器。从层次的角度看,HTTP是面向(transaction-oriented)应用层协议,它是万维网上能够可靠地交换文件(包括文本、声音、图像等各种多媒体文件)的重要基础。W3C:是对网络标准制定的一个非赢利组织,像HTML、XHTML、CSS、XML的标准就是由W3C来定制。W3C会员(大约500名会员)包括生产技术产品及服务的厂商、内容供应商、团体用户、研究实验室、标准制定机构和政府部门,一起协同工作,致力在万维网发展方向上达成共识。Servlet,在服务器上运行的小程序。这个词是在Java-applet的环境中创造的,Java applet是一种当作单独文件跟网页一起发送的小程序,它通常用于在客户端运行,结果得到为用户进行运算或者根据用户互作用定位图形等服务。Lucene,apache软件基金会的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。 SSH,集成SSH框架的系统从职责上分为四层:表示层、业务逻辑层、数据持久层和域模块层,以帮助开发人员在短期内搭建结构清晰、可复用性好、维护方便的Web应用程序。其中使用Struts作为系统的整体基础架构,负责MVC的分离,在Struts框架的模型部分,控制业务跳转,利用Hibernate框架对持久层提供支持,Spring做管理,管理struts和hibernate。1.4参考资料1) 软件工程导论清华大学出版社;2) 软件设计模式概述国防科技大学出版社;3) Java Web编程技术电子工程出版社;4) Java编程思想机械工程出版社;5) 自己动手写爬虫清华大学出版社;6) 搜索引擎概述清华大学出版社;7) Lucene全文检索工具电子工程出版社;8) 软件测试导论机械工程出版社。2任务概述2.1目标 本系统将实现两个子系统模块。数据采集子系统为数据处理子系统提供基础数据,采集子系统决定数据正确性和安全性,处理子系统决定用户的体验及响应的效率,系统之间是密不可分的。 DCS数据采集子系统,从高校毕业生就业网链接地址数据库获取相关的URL,利用HttpClient对目标进行Get方式访问,当访问受限制时,可从用户登陆数据库中获取相关登陆账户进行Post方式模拟登陆,获得网页数据后,进行数据信息提取及浅层的分类,达到区分信息属于指导信息或岗位信息;数据采集子系统,还完成对非文本内容的采集,如,图片、文档、视频。 DPS数据处理子系统,对采集子系统获得的原始数据,进行解析,得到层次信息,然后识别每个层次的内容相关性进行精确分类,将得到的基础服务数据提交给数据审核员进行审核,审核通过后将数据存入服务数据库;通过全文检索工具进行对数据库内容分词并建立索引,将索引文件保存到指定目录;用户提交查询事务时,对查询的语句进行分词,然后在索引文件中找到索引,并通过标识符访问相关就业信息。 系统框架图如下:2.2用户的特点 大学毕业生,他们对互联网信息比较敏感,具备较强的好奇心态、冲动心态;特别是应届毕业大学生对社会常识不够了解,对求职的方向也并明确,当求职失败时,容易产生气馁、自负。数据审核员,必须是本科学历以上,并且熟悉互联网的信息搜索,并具有责任心,认真仔细对数据进行核查。维护人员,需要熟悉网络工程,可以自行完成搭建网络,并熟悉关系型数据库的管理,可以完成数据库备份和恢复;具备工作责任心,以服务人民为己任。2.3假定和约束1) 假定(1) 熟练掌握Java面向对象编程开发C/S及B/S系统技术;(2) 熟练掌握爬虫原理和采集技术;(3) 熟练掌握对HTML文件的解析和分类;(4) 熟悉掌握Mysql数据的增删改查等操作;(5) 对语义识别和正则表达式有一定的了解;(6) 熟悉搜索引擎的基本原理;(7) 熟悉掌握Lucene全文检索工具的使用和二次开发。2) 约束(1) 各大高校的毕业生就业网结构的多样性,不同的高校需要开发对应就业网的数据解析接口;(2) 当访问受限时,需要模拟登陆,而登陆时存在验证码问题,需要开发对应的图片识别接口。(3)软件在线运行后,用户量增长过快,受服务器性能限制,无法为用户提供正常服务。3需求规定3.1对功能的规定 毕业生就业信息检索服务系统功能模块设计: (1)高校信息管理;高校信息查询、添加、修改、删除。对于用户操作事务,系统进行权限验证,并检测操作的安全性。如,用户输入查询高校的组合条件,系统接收到用户的请求,并将请求信息进行封装,其次构建查询SQL提交到数据库引擎,最后将得到的结果集进行封装成List列表,利用数据格式转换算法将列表对象转化为JSON格式数据,客户端收到响应的数据后,利用JavaScript引擎对数据进行封装,并动态显示在用户界面。 高校基础分类:综合类、理工类、文科类、医药类、农林类、师范类; (2)用人单位信息管理;用人单位信息查询、添加、修改、删除。用人单位信息包括用人单位企业文字简介、图片浏览、视频浏览,用人单位信息必须包括详细的公司地址和联系电话,并有相应的营业执照和公司核心人员简介。用户可以操作事务,并接收权限验证后获得操作权利,数据更改后提交到数据审核员进入审核等待,当审核成功后,信息将公开到平台之上。 企业分类:合资、独资、国有、私营、全民所有制、集体所有制、股份制。 (3)毕业生信息管理;毕业生信息查询、添加、修改、删除。毕业生账户信息管理,毕业生可以填写自己的个人信息,并选择自己喜欢的模板自动生成个人简历。毕业生可以将简历进行保存,待找到相应的职位后,利用邮件服务系统将简历投递出去。也可以进行在线预览简历或打印简历。 (4)简历管理;简历上传、下载、删除。简历不仅可以自动生成,也可以通过本地上传.doc格式的个人简历,并实现在线预览及文件编辑等操作。 (5)个人收藏管理;对高校、用人单位、职位信息进行加入收藏夹或移出收藏夹。收藏夹是用户体验的产品,系统会根据用户收藏的院校、用人单位、职位信息,进行数据挖掘分析,将用户喜好的内容推送给用户。 (6)审核管理;数据审核员有权利对发布进行审核,有通过、不通过、非法信息三种模式。数据审核员或超级管理员有权利进行审核,若存在非法的信息我们会将信息自动生成举报信函投递到互联网安全管理中心。 (7)职位信息管理;对用人单位发布的职位信息进行查询、添加、修改、删除。职位信息来源于各大高校毕业生就业网,需要对数据信息字段划分,如,职位、相关专业、薪资、应聘条件、招聘人数、招聘地点、时间安排、招聘流程、投递简历方式等。 (8)就业指导信息管理;包含多类指导信息,如笔试指导、面试指导、简历指导等。采集法律知识,提供法律咨询,为大学毕业生创造一个优美的就业环境。 (9)系统配置管理;配置系统关键变量,系统数据采集周期参数,系统用户信息修改,访问控制模块。3.2对性能的规定3.2.1精度 用户的事务输入必须携带操作类型、操作对象、操作内容,如用户进行职位查询时,必须选择一个条件,或者可以进行条件组合操作。系统响应必须将相关信息列举,并通过价值衡量值进行排序和分页显示,每页数据不能超过20条。 对于用户的操作系统不可以让用户进行长时间的等待,如系统出现异常时,需通知用户并跳转页面信息,带系统恢复时再响应给用户。并且用户操作不允许界面进行刷新,需采用无刷新方式进行处理。3.2.2性能要求1) 支持全国重点高校的就业网信息;2) 支持万人并发在线访问;3) 关键字查询响应时间小于等于5秒;4) 语义识别正确率在百分之九十以上;5) 数据采集时间小于等于5分钟;6) 数据处理时间小于等于10分钟;7) 组合查询响应时间小于等于3秒。8) 数据更新周期3小时。3.2.3灵活性系统可以支持跨平台,并且在移动端浏览器上有较好的兼容性。系统根据用户环境的变量进行自动调整,如分辨率,用户事件;系统建立登陆拦截器,未登陆的用户访问指定权限的页面时,自动跳转到登陆页面;系统建立异常拦截器,将各种异常,数据类型转换异常、空异常、数据库异常,进行拦截,并跳转到友好界面给用户。系统采用搜索引擎部分理论,对接口变化时,系统会自动进行机器学习,并更改系统参数适应接口的变化。系统开发采用迭代式模型,所以开发过程中可以根据更新的需求进行系统修复,采用面向对象的观察者模型,不会影响到其他的用户接口。3.3输入输出要求本系统提供强大的数据处理分析能力,所以用户的输入及输出都非常明确。如,应届毕业生可选择性的输入职位名称、公司名称、薪资要求、相关专业、期望工作地点,系统可以根据用户的输入数据进行分词和分类,并将条件进行组合。然后生成数据库查询语句,同时提取索引文件,最后提交查询语句给数据库服务器引擎,返回结果集后对其进行封装和格式化,得到最终的输出数据。3.4数据管理能力要求 系统采用Mysql开源关系型数据库进行开发,对于处理百万甚至千万条数据记录戳戳有余,但为加快检索速度,我们会对数据表进行建立一定数量的索引,并进行分区分块存储数据文件;若随数据量的增加,Mysql无法满足系统的需求时,我们可以修改数据层接口,进行数据管理能力的扩充。3.5故障处理要求我们针对不可避免自然灾害,进行了一系列的预防措施,为减少发生故障时造成的经济损失,我们将采取数据冗余的方法进行存储数据。4运行环境规定4.1设备需求名称详细要求服务器操作系统Windows Server 2008版本软件编译环境MyEclipse 10.7版本数据库运行环境MYSQL 5

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论