北京市共建科研项目训练结题报告书.doc_第1页
北京市共建科研项目训练结题报告书.doc_第2页
北京市共建科研项目训练结题报告书.doc_第3页
北京市共建科研项目训练结题报告书.doc_第4页
北京市共建科研项目训练结题报告书.doc_第5页
免费预览已结束,剩余3页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

北京市共建大学生科研训练项目结 题 报 告 书项目名称:word文档信息识别的研究设计 项目编号:BG201507研究期限:一年项目负责人:陈祺系 别:计算机科学与技术系学 号:20142125联系电话子邮件:导师姓名:徐日填写日期:2017-3-26大学生科学技术协会制表填写说明及注意事项一、结题报告书由正文和附件两部分组成,正文部分请按表格要求逐项认真填写,填写内容必须实事求是,并可根据需要加页,表达要明确严谨。项目执行过程中的进展或研究成果、计划调整情况等,须在报告中如实反映。二、指导老师认真评审,签署意见后,按时将结题报告书(一式二份)报送大学生科学技术协会(团委),同时提交电子文档。三、需签字部分由相关人员以黑色钢笔或签字笔签名。均用A4纸双面打印,于左侧装订成册。一、项目基本情况项目名称word文档信息识别的研究设计成果形式PC端应用程序立项时间2014.3.10完成时间2017.3.12项目组成员(负责人填于第一行)姓名性别出生年月所在系学号签字陈祺男1995.8计算机科学与技术系20142125薛致遥男1995.12计算机科学与技术系20142205王永相男1995.4计算机科学与技术系20142117郭凯男1995.9计算机科学与技术系20142114指导教师姓名职称职务所在部门电话E-mail徐日讲师计算机科学与技术系136836687214978368二、研究过程简介现如今word文档在各领域内被广泛运用,文档中包含许多复杂信息,而面对大量的word文档,想要获取文档的概要信息,将消耗大量的时间与精力,加重工作的时间成本和从业人员的工作负担。根据这一形势,本小组就计划开发一款word信息识别软件,通过它可以实现高效快捷的从海量word文档中提取文档的概要信息。通过调研,我们发现这款软件在党政机关拥有非常好的应用前景。在党政机关中,各个部门每天会收到大量请示、批复、公告、通知、意见等形式的公文。这些公文经接收后不经分类全部混淆在一起,通过人工依次进行识别、分类、归档显然会消耗大量的精力。而通过信息识别软件,我们就可以快速的生成文档的概要信息,包括标题、摘要、文档链接等,方便工作人员进行文档的划分、归类,减轻工作负担,节省办公资源,提高党政机关工作效率。同时该技术还可以应用于信息安全领域,通过对比文档的概要信息分析文档是否被篡改。通过应用此软件,可以填补党政机关处理大量文档能力的空白,特别是在以办公自动化为基础的高效办公的今天,推行文档信息识别势在必行。本项目主要研究word文档信息识别,具有较强的创新性。项目研究目标准确,瞄准工作中现实存在的问题,有实用价值。本小组在徐日老师的带领下,通过初期的需求分析,确立了一个基本方案。主体研究word文档信息识别,研究word文档格式,通过可视化程序语言设计软件,使软件具备自动识别word文档内指定信息的能力,减少文档处理的时间,提高处理效率。建立用户视图进行各类数据提取与显示,方便用户简单直观的观察各项数据。通过上述的基本方案,我们确立了以下的研究工作思路。在项目初期,进行word软件和程序语言的系统性学习,充分了解软件的功能和实现方式,熟练掌握程序语言的书写,为后续工作做基础。项目中期,完善思路和功能设想,通过编写代码实现功能,并且测试功能是否完备。项目后期,进一步研究软件功能,优化界面布局,调整软件逻辑结构,加强软件运行牢固性。项目末期,对所有的研究成果进行检验和试用,进一步完备功能,完善系统,完成结题报告。我们计划把项目分成两个部分,第一部分是通过软件实现对文档中重要信息的识别和提取,第二部分是通过数据库,对原始文档进行备份,并且可以实现文档的校验过程,保证文档的原始性和完整性,防止在传输和使用过程中文档被篡改。确定了以上的研究思路后,本小组成员根据自己的特长及优势进行了分工,由陈祺负责项目整体规划和设计实现,郭凯负责具体的项目方案,参与完成具体设计实施,王永相负责项目的监管及调试运行,薛致遥负责项目具体事务管理。在第一阶段,我们学习了视窗编程技术,进一步学习研究word文档格式;第二阶段,我们完善设计思想,进行代码编写与测试;第三阶段,我们学习了OlE自动化知识,完成整体架构构建,测试系统进行改进;第四阶段,完成项目,提交项目成果。在研究过程中,我们遇到了一些问题,这时就需要小组全体成员聚集起来对问题进行研究、分析、拆解,通过阅读书籍查询资料攻克难题。可以说研究过程虽然历经艰辛,但也乐趣十足。在经费执行的问题上,本小组一直秉承着实际实用的原则使用经费,绝不购买报销与项目无关的物品,在一年的时间里先后完成五次报销,均为购买书籍的费用,报销的费用占总费用的比例在四成左右,没有出现虚报漏报错报等情况。经过近一年的努力,本项目有了初步的研究成果。本软件可通过批量添加word文档,进行标题、作者、文档修改时间、页数等信息的统计,并且可以添加关键字,进行关键字检索,还可以将分析结果导出至所选目录。本软件基本完成了最初的设计构想,一些功能还未完全实现,还需要在日后逐步完善,使软件功能更加强大。三、研究总结报告首先,就我们的项目而言,其目的是对大量的word文档进行批量处理,通过分析显示出文件夹中每一个文档的名称、关键字、标题、主题、作者、创建时间等,从而可以选中符合条件的文档进行批量操作,比如复印、筛选出符合某一些特定条件的进行文件的整理、分类等日常常用的操作,这是很具有现实意义的。此外,我们学校(北京电子科技学院)是以培养合格的机要人员为目的的,这对我们以后的工作有很大的帮助。就项目选题而言,我们首先研究了所要完成项目的目的,结合我们学校的毕业生的实际情况,在和老师进行了多次研究讨论之后,我们小组选定了word批量分析处理这个主题(命名为Word Recognition)。在时间安排上,我们小组的人员前期以学习编程语言为主,在选定了Java语言之后,我们小组在接下来的日子里,每个星期都会进行一次会议讨论,互相监督,保证项目的稳定推进的同时,还会在周末的下午进行集体编程,相互学习,相互提高。在软件完成的后期,我们小组也采取了较多数量的实例分析,找出文件中存在的不足或可能导致软件出错的bug,并记录了各次更新日志。而在多次修改后,我们的软件也基本实现了我们的预期,能够对word文档进行各种分析与操作。在整个过程中,我们定期的找指导老师汇报我们的项目研究及完成进度,并且针对下一步的实践过程,寻求老师的意见,这也为我们之后的编程研究工作指明了方向,避免了很多弯路。在编程方面,是没有相类似的分析程序可以借鉴学习的,这就需要对VB语言中与word分析有关的语句进行仔细学习,从而实现各种预期的功能。整个实践过程中也不可避免的出现了一些问题,在询问老师、借阅图书馆资料以及网上查阅之后,大家齐心协力,解决了出现的各种问题。通过研究并完成这次项目,我们小组的成员都收获颇多,因为这个项目持续了很久,大家也在一次次共同的编程中相互学习,友谊也随着时间越来越深,成了志同道合的伙伴。而就知识方面,经过长时间的编程学习,大家的逻辑思维都有了很大的提高,对VB编程语言也有了很深的了解与认识,作为计算机科学与技术系的同学,这对我们以后的工作生活也有很大的帮助。当然项目中也存在一些不足,比如软件的界面设计还不够

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论