档案管理工作中的汉字识别技术的应用浅析_第1页
档案管理工作中的汉字识别技术的应用浅析_第2页
档案管理工作中的汉字识别技术的应用浅析_第3页
档案管理工作中的汉字识别技术的应用浅析_第4页
档案管理工作中的汉字识别技术的应用浅析_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-精选财经经济类资料- -最新财经经济资料-感谢阅读- 1 档案管理工作中的汉字识别技术的 应用浅析 摘 要汉字识别技术,所涉及到 的专业范围非常广泛,尤其是在当前人 工智能愈加发达的情况下,人工智能的 研究和汉字识别之间的联系也变的更加 紧密,在当前的档案管理工作当中,由 于各种现代化技术的不断发展,汉字识 别技术也开始更加大范围的应用到档案 管理工作当中,而在这个过程中也随之 出现一些情况需要工作人员注意,本文 先是简要的分析档案管理工作当中使用 汉字识别技术改变录入工作,其次,举 出几个在档案管理工作当中应用汉字识 别技术的例子,并在最后提出识别完成 后所出现的文本数据性质。 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 2 中国论文网 /1/view-12826399.htm 关键词 档案管理工作;汉字识 别技术;应用浅析 中图分类号:G270.7 文献标识 码:A 文章编号:1009-914X(2018) 25-0341-01 汉字识别技术在当前的应用过程 中已经不再简单的是为了某一个专业所 提供服务,在使用汉字识别技术的过程 中,在和人工智能保持密切联系的过程 中,它和数字信号处理技术、图像处理 技术、信息论以及计算机科学等各种现 代化科学技术都已经产生密不可分的联 系,首先汉字识别在开展更加深入的研 究工作过程中,各个学科的发展都可以 给汉字识别技术提供帮助,其次,其它 学科也可以因为汉字识别技术的进步而 获得更加快速的发展和研究上的全新突 破,双方互惠互利。在当前的档案管理 工作当中,汉字识别技术已经和档案管 理密不可分。 一、 档案管理工作当中应用汉 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 3 字识别技术的录入工作 传统的档案都是纸质档案,众所 周知,纸质档案上面的信息都是非常固 定的,在找寻相关信息阶段需要不断的 翻找,极大的浪费工作人员的时间,并 且工作效率也非常低下,而利用汉字识 别技术,可以将这些固定信息,变成可 以通过计算机检索的信息,从而让数据 源的数量能够达到文本数据管理技术的 要求。在当前的时代背景下,开始将大 量开发和利用原始档案,而在这个过程 中也就对汉字识别技术的技术水平提出 更高的要求。我国当前现有的档案当中, 大多数直至档案都记录着我国自从建国 以来的重要历史事件和党派领袖所提出 的相关指导性话语,在一定程度上对我 过的现代化事业发展起着非常重要的作 用,而在建O 我国居民精神文明和物 质文明的过程中也有着非同一般的意义, 这部分档案由于年代问题,很多都没有 相应的文本数据,即便有数据也只是在 纸质档案上的固定信息,虽然档案管理 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 4 工作的相关工作人员一直在将这部分内 容扫描之后存储到计算机当中,但是如 果想检索也需要花费大量的时间,在利 用阶段经常会出现供给出现问题的状况, 另外,随着办公条件受到现代化的影响, 当前的档案数量非常庞大,导致很多档 案都没有足够的时间进行文本数据化, 尤其是一些红头文件和其它单位的文件 等。通过汉字识别技术能够有效的将这 些信息从固定信息转化为可以迅速检索 的信息,从而提供更加强大的数据化支 撑,更加高效的利用,建设现代化相关 事业1。 在档案目录数据的录入方式上, 汉字识别技术也提供全新的思路,随着 计算机的普及,虽然经过很长时间的发 展,但是在录入汉字的过程中依然没有 脱离键盘录入的方式,即便当前的汉字 键盘录入方式出现多种变化,并且多数 人都已经熟练掌握,但是毕竟还有这诸 多的局限,对于录入人员的反应速度, 手指灵活度等都有着要求,并且在录入 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 5 过程中也有着诸多规则和技巧需要录入 人员熟练掌握,很多档案管理工作人员 的年龄都已经进入中老年阶段,导致很 难跟上时代发展的速度,这也是当前大 多数档案录入部分的工作效率没有得到 有效提升的主要原因之一,随着汉字识 别技术的不断进步,能够有效解决这一 问题,利用拖拉的方式,将各项数据直 接剪切到相应的位置,这种方式虽然简 单,但是也有着一定的缺陷,就是速度 不快,并且在这个过程中不能缺少扫描 和调用图像数据操作,仅仅使用这种方 式录入,很容易影响录入速度,好在录 入方式较为新颖,可以和数字识别技术 当中的其它功能结合,改变档案信息数 据库的性质,在文件目录和图像以及文 本的录入中,效果更为明显2。 二、 档案管理工作当中如何更 好的应用汉字识别技术 当前的汉字识别技术在应用过程 中主要是给建国以来的大多数档案内容 所服务,随着不断的进步,应用范围也 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 6 得到一定的提升,当前汉字识别技术在 应用方式上主要包括以下八个小点:第 一,就是将纸质档案熟练掌握之后,将 其中有利用价值的部分使用汉字识别技 术进行扫描,或者是将格式统一的摘录 打印出来,也可以直接复制粘贴,就能 够让档案的作用实现最大化;第二,在 输入档案目录的过程中,可以利用汉字 识别技术加快信息数据库的建设速度, 也能够最大化利用档案信息工作人员的 人力资源,但是成本也会随之上升;第 三,将扫描出的图像保存下来并加以利 用,在利用过程中具有更强的针对性, 只为所需要的图像内容提供服务;第四, 可以在已有文件目录的条件下建立相关 的文本数据库;第五,可以将目录输入 到计算机当中,将图像保存;第六,通 过目录的输入保存建立完善的文本数据 库;第七,将图像保存到计算机当中, 建立相应的文本数据;第八,通过将目 录输入,并保存图像来建立文本数据库 3。 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 7 三、 汉字识别技术识别后的文 本数据性质 在档案信息被汉字识别技术识别 之后,文本数据性质主要包括三个方面, 首先就是原始性质,其次就是只是性质, 最后就是在识别之后会产生两种完全不 同的属性。原始性质是最为基本的性质, 主要是本源信息在经过识别之后加工处 理,档案信息在经过各种工序之后也会 逐渐失去自身的原始性质;而知识性质 则是一种多数档案当中都带有的属性, 在汉字识别完成之后,如果文本数据忽 略人工校对工序就会出现一定的误差, 在内容上和原始文件没有过多的差距, 这就是知识性的一种体现;最后就是两 种完全不同的属性,一种是汇编类档案 编研成果的属性,另一种属性则是常见 的基本属性4。 结束语 综上所述,在汉字识

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论