文字识别 PPT.ppt_第1页
文字识别 PPT.ppt_第2页
文字识别 PPT.ppt_第3页
文字识别 PPT.ppt_第4页
文字识别 PPT.ppt_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

图像工程 文字识别技术 简介 文字识别一般包括文字信息的采集 信息的分析与处理 信息的分类判别等几个部分 信息采集将纸面上的文字灰度变换成电信号 输入到计算机中去 信息采集由文字识别机中的送纸机构和光电变换装置来实现 有飞点扫描 摄像机 光敏元件和激光扫描等光电变换装置 信息分析和处理对变换后的电信号消除各种由于印刷质量 纸质 均匀性 污点等 或书写工具等因素所造成的噪音和干扰 进行大小 偏转 浓淡 粗细等各种正规化处理 信息的分类判别对去掉噪声并正规化后的文字信息进行分类判别 以输出识别结果 识别方法 模板匹配法将输入的文字与给定的各类别标准文字 模板 进行相关匹配 计算输入文字与各模板之间的相似性程度 取相似度最大的类别作为识别结果 这种方法的缺点是当被识别类别数增加时 标准文字模板的数量也随之增加 这一方面会增加机器的存储容量 另一方面也会降低识别的正确率 所以这种方式适用于识别固定字型的印刷体文字 这种方法的优点是用整个文字进行相似度计算 所以对文字的缺损 边缘噪声等具有较强的适应能力 几何特征抽取法抽取文字的一些几何特征 如文字的端点 分叉点 凹凸部分以及水平 垂直 倾斜等各方向的线段 闭合环路等 根据这些特征的位置和相互关系进行逻辑组合判断 获得识别结果 这种识别方式由于利用结构信息 也适用于手写体文字那样变型较大的文字 模板匹配的流程 建立标准模板库文字识别文字分割特征提取相似度比较模板比较和识别方法遇到未知字符则更新模板库 标准模板库 确定标准图像待识别图像的比较分辨率100 120 文字读入与分割 1 读入图像并转换为灰度图将灰度图进行二值化 文字读入与分割 2 对列求和 若为0则可以作为分割线横向求和 去除上下的黑边 文字读入与分割 3 执行了分割对分割后图片使用matlab内置的imresize函数进行标准化 模板比较和识别 将输入图像与标准模板异或操作每个像素点的分量相加结果越小则匹配相似度越高 模板库的更新 异或结果均得到较大值时经过一定实验得到了一个经验值4000如果和所有模板的结果都超过4000 则认为匹配失败 需要更新 运行结果1 输入了8个字母 其中X不在模板库之中 运行结果2 X没有识别出来 添加X的模板之后重新识别 能够识别出来 局限性与不足 笔画太细会造成无法识别有偏角和过于潦草的字无法识别相似度太大的字母无法识

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论