全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
vol121 ,no13mar1 ,2004第 21 卷第 3 期2004 年 3 月计算机应用与软件computer applications and software身份证识别的文字定位算法研究沈瑛范俊波( 西南交通大学计算机与通信工程学院 成都 610031)( 浙江工业大学信息工程学院 杭州 310014)摘 要本文阐述了身份证识别的一般流程 ,针对身份证识别的特殊性 ,其中调整了文字定位策略的执行顺序 。主要探讨身份证图像的文字定位策略 ,提出了灰度图像下的行分割方法和基于最大宽度回溯算法的单字分割算法 ,从而实现了字符的精确定位 。关键词身份证识别 行分割 字分割 算法研究al go rithm researc h of c haracter locatio n in id card reco gnitio nshen ying( school of inf ormation engineering , zhejiang university of technology , hangzhou 310014)fan j unbo( department of computer & communication , southwest jiaotong university , chengdu 610031)abstractin this thesis ,the process of id card recognition is presented. to fit for this special character recognition , sequence is adjusted as linesegmentation ,preprocess and character segmentation. after investigated into the strategies of getting the characters accurate position ,we provide theline segmentation under gray level image and the character segmentation based on the biggest width backtracking algorithm.key words id card recognition line segmentation character segmentation algorithm research字识别 ,不仅开销大 ,且背景干扰也比较严重 。故改为先对灰度图像进行行分割 ,然后对文字行进行预处理 。行分割后得到的 是个人信息 (姓名 、民族 、性别 、出生 、住址) 和编号行子图像 ,此1引言身份证记载了持有人的基本信息和一个唯一的编号 ,在众多涉及人员的管理中具有重要作用 。目前身份证登记通常采用 人工方式 : 手工填写或人工录入 ,工作效率低 ,且编号数字误输入可能性比较大 。而利用计算机进行身份证自动识别录入已成 为可能 。身份证自动识别系统可广泛用于服务性行业 、交通系 统和公安系统等需要身份证检验的部门 ,节省大量的人力物力 ,因而具有广阔的应用前景 。身份证识别中 ,如何从图像中对有 效信息 (文字) 定位是关键环节 ,本文主要研究身份证图像的行分割和字分割方法 。后只对这些子图像进行处理 。图像预处理部分主要包括平滑 、锐化和二值化操作 ,得到文字行二值图像 。字分割操作从图像中进一步分割出每个文字的边界 。识别预处理对每个文字图像先进行去毛刺 、空 洞 等 修 饰 , 再 规 范 化 为 24 24 象 素 的 图 像 。提取每个文字图像的特征后 ,运用相关的模式识别方法 ,识别出文字 。为了提高识别正确率 ,还将根据某些先验知识对识别结 果进行判断 、校正 ,这些工作由识别后处理部分完成 。识别结果 以字符串方式保存到数据库 。3行分割2身份证识别的一般流程311 普通行分割算法普通的 文 本 识 别 往 往 先 把 扫 描得到的灰度图像整体二值化 ,用普通 行分割算法1 ,2 进行文字行定位 。该 方法从上到下逐行扫描二值图像 ,计在身份证识别系统中 ,身份证扫描后以图像的形式进入系统 ,经过一系列处理后 ,获得个人信息和编号字符串 ,存入数据 库 ,以便后续处理 。图 1 描述了身份证图像的识别流程 。图 2 根据水平投影间隙进行行分割算每一行的黑象素个数 ,取得水平投影 。利用行间隔造成的水平投影空隙 ,将文字行分割开 ,如图 2 所示 。该方法简单易行 ,但当噪声较大 (如行粘连) 时 ,分割困难 。312 身份证行分割算法普通行分割算法适用于灰度差异较大的普通文本图像和二分预 图 1 识别流程本系统把身份证图像格式统一规定为 256 灰度级 bmp 图 片 。由于图像中有较多的识别干扰信息 ,如背景网格 ,防伪标识 等 ,如按通常方式对整幅图像预处理 ,得到二值图像后再进行文收稿日期 :2003 - 01 - 16 。沈瑛 ,硕士 ,主研领域 :信息安全 。结果 输 出识别特征 提 取识别后处理识别处 理字分割图像预处理行 割身份 证图像置 ,通过经验值的方式给出 :如果分别以整幅图像的宽和高为单位 1 ,左上角为原点 ,则编号行一般位于以 ( 014 ,0185) 为左上角 坐标 ,宽 015 ,高 0115 的矩形内 ,在这个矩形内精确定位编号行 的上下左右四边界 ,其它行类似 。分析发现 ,文字象素一般比背景网格和防伪标志处的象素 灰度值小 ,故文字行象素的灰度平均值小于背景 ,以此区分文字和背景 ,从而确定行边界 。同时背景中网格节点比网格线颜色深 ,背景中的相邻两行灰度均值也可能有较小差异 。为避免把 这种情况误认为边界 ,我们设定一个比例系数 coef ,判定边界时 要求该行象 素 均 值 小 于 相 邻 行 平 均 值 与 coef 的 乘 积 ( 差 异 较 大) 。我们还根据文字跨越多行象素的特性 (设文字行高度超过3 个象素) ,降低了小噪声点的影响 。 在普通行分割算法的基础上 ,笔者给出身份证灰度图像下的行分割算法 :step1 根据经验设定每一文字行区域的大致位置 ( 如左上 角坐标 ,高 、宽) 及比例系数 coef 。还有左右分离字 、宽窄字等情况 。最大宽度回溯算法2 是一种典型的单字分割算法 。笔者根 据以下思路修改该算法 ,得出身份证字分割算法 。首先 ,根据身 份证各行字体不同的特点 ,为每行文字设置标准字宽 (依据文字 行的高度或竖直投影) 。其次 ,由于文字有不同宽度 ,如“月”比 “街”和“路”窄 “, 1”比“5”窄 ,分割时允许文字的宽度为标准字宽的邻近区域中的值 。第三 ,对二值化后文字可能存在的断笔 、粘连 、部首间分离 ,有相应的拆分和合并策略 。第四 ,编号行位数 固定为 15 或 18 位 ,分割后给出有效性判断 。由于行内文字可 能存在上下浮动 ,在确定每个文字的左右边界后 ,再重新确定上 下界 。身份证单字分割的算法如下 :设 f (i ,j) 为文字行 (单行) 图像 ,宽度为 width ,高度为 n ,point 为当前列号 ,初值为 0 。设该行文字的标准字宽为 w ,宽度上限 为 w up ,下限为 w down ,部首宽度上限为 bs up ,部首间距上限 bsin up 。j 表示文字序号 ,初值为 0 ; 第 j 字的左边界位置为step2值 h avgi在每一文字行区域中 ,求出每一行象素灰度的平均。i = 1 ,2 , ,l ,i 为当前行号 ,l 为区域内的总行数 。 判断上下界 ,从上向下检测如第 i 行全部满足下列ja ,右边界为 jb 。nstep1 从当前位置开始寻找第一个有黑象素的列 : f (i ,step3i = 1point) 0 ,记为 ja ,point = ja + 1 ,若 width - ja w down ,则已到行末 ,转 step8n条件 ,则判为文字行的上边界 :hh havgi havgi - 1 3 coefavgi - 1 3 coefavgi - 1 3 coefavgi + 1 havgi + 2 hstep2 从当前位置开始寻找第一个 f (i ,point) = 0 的列 ,i = 1设为 jb 。step3 若 w down jb - ja w up ,转 step6如第 i 行全部满足下列条件 ,判定为下边界 :hh havgi havgi h avgi havgi + 1 3 coef avgi + 2 3 coefavgi + 3 3 coefstep4 若 jb - ja w up , 则 有 粘 连 , 需 回 溯 : 在 j a + wnstep4 对每一文字行求区域内每一列象素灰度的平均值 vavgi , 其中 i = 1 ,2 , ,l ,i 为当前行号 ,l 为该块内的总行数 。step5 判断左边界 ,从左向右检测 ,如第 i 行全部满足下列down ,j + w up 间寻找 f (i ,point) 的最小值点 ,记为 j 。abi = 1step6 若 jb - ja bs up , (j - 1) b - (j - 1) a bs up ,ja - (j条件 ,则判为文字行的左边界 :- 1) b bsin up ,则合并 ,令 (j - 1) b = jb ,point = jb + 1 ; 否则 j = j+ 1 。avgi - 1 3 coefvv vavgi vavgi + 1 vavgi + 2 w down ,转 step1step8 对每 个 文 字 用 类 似 行 分 割 的 方 法 , 分 别 从 首 行 向下 、末行向上求出文字的上下边界 。step9 若不是编号行 ,则结束单字 分割 ;否则判断 j 是否为 15 或 18 ,若是 ,保存 j 后退出 ,否则提示出错并退出 。step6 判断右边界时从右往左检测 ,如第 i 行全部满足下列条件 ,则判为该文字行的右边界 :vv vavgi vavgi + 1 3 coefavgi + 1 3 coefavgi + 1 3 coefavgi - 1 vavgi - 2 v图 4 字分割结果82计算机应用与软件2004 年为对图 3 图像预处理后进行字分割的结果 。参 考 文 献吴佑寿 、丁晓青 ,汉字识别原理方法与实现m, 北京 :高等教育出版社 ,19921张 中 ,汉字识别技术m, 北京 : 清华大学出版社 ,南宁 : 广西科学 技术出版社 ,19921沈瑛 “, 身份证识别系统研究d ”,成都 : 西南交通大学硕士研究生 学位论文,20021胡正平 “, 卡片自动录入系统算法的研究d ”,秦皇岛: 燕山大学硕 士研究生学位论文,1999115 结束语文字定位是身份证识别的一个重要环节 ,本文给出了利用 身份证文字区位的先验知识先分割后处理的行分割算法 ,以及 允许字宽浮动和部首处理的最大宽度回溯字分割算法 ,从而较 好地实现了身份证识别系统的定位功能 。234(上接第 9 页) checked out :copy &arrow1 person ! some definition omitted - -从上面的 xsl 样式表文件的定义方法可以看出 , xsl 样式 表为每一个 xml 结构中存在的结构定义了方法 ,并描述了相应 的 html 代码 。这样 ,web browser 就可以根据这个 xsl 将 xml 文档转化成所期望的 html 文件 ,从而显示出来 。 ( dom checkedout) &up available = stock part ( dom checkedout) &up available = &empty / ax2 axiomout checked out &include lastcheckediom part ! some definition omitted -5结论 ! some definition omitted -本文的第一个贡献是使用最近的 java/ xml/ xsl 技术 ,实现了形式化方法规格说明 z 在 web 环境下的提交和发布 。第 二个贡献是我们将 z 规格说明放在 web 的思想能够很容易地 被其他的形式化方法采用 ( 如 : vdm/ vdm + ) 。而对 z 规格说 明进行词法与语法检查 ,由于需要复杂的推理与校验 ,并且需要与用户交互 ,所以在本系统中没有加入此项功能 。而在本课题组研发的 z userstudio 工具中完成了此项功能10 ,这样用户就可 以用该工具保证 z 规格说明语法的正确 ,然后用本系统将它提 交与发布出去 。参 考 文 献413 用 xsl 实现 xml 文件的显示到现在为止 ,由上面的过程得到的仍然是 xml 文件 ,而当xml 文件作为页面显示的时候是纯文本格式的 。为了显示它 , 必须专门定义与多个不同的元素和属性相关的字体尺寸和颜色 值的显示信息 。对 xml 文件 进 行 样 式 格 式 化 的 应 用 结 构 被 称 作 样 式 表 。 xsl 是一个特别为 xml 而设计的样式表技术 。xsl 文件同时也 是 xml 格式 ,它能够完成各种转换的功能 ,如 : xml 转向 html , 一种 xml 转向另一种 xml ,一种 xsl 转向另一种 xsl 等等 。浏览器通过 xml 解析器对已存在的 xml 文件进行解析 ,得到相应 xml 文件的一棵解析树 ,而后根据 xsl 样式表 ,浏览 器内部的处理机从树的根节点开始 ,用样式表对树进行模式匹 配 。一个 xsl 样 式 表 由 模 板 组 成 , 这 些 模 板 使 用 模 式 确 定 对 xml 文件的那一部分进行怎样的格式化 。xsl 处理机分析这些 模板和与它们相关的模式来处理解析树的不同部分 。当出现了 匹配 ,树匹配的部分传递给样式表中的模板进行处理 。这样处 理机按照模板规则将一棵 xml 树转化成另一棵带有 html 信息的 xml 树 。下面便是针对 schema box 模式的部分 xsl 样式1 j . woodcock and j . davies ,using z : specification , refinement ,and proof . prentice - hall international ,1996 .j . m. spivey , the z notation : a reference manual . international series incomputer science ,prentice2hall ,2nd edition ,1992 . 缪淮扣 、李刚 、朱关铭 ,软件工程语言 - z , 上海科学技术文献出版 社 ,19991d. carrington , d. duke , duke , p. king , g. rose and smith , object 2z : an object2oriented extension to z. in s. buong ,editor ,formal description tech2 niques.r. duke and g. rose , formal object oriented specification using object 2z. cornerstones of computing. macmillan ,march 2000 .g. smith ,the object 2z specification language . advances in formal
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 七年级下册英语 Unit 7 Its raining!教案4
- 2026广东江门市新会国誉陈皮健康产业有限公司招聘2人笔试历年参考题库附带答案详解
- 2026安徽合肥海恒控股集团有限公司招聘笔试历年参考题库附带答案详解
- 2026四川长虹电子控股集团有限公司招聘税务主管岗位1人笔试历年参考题库附带答案详解
- 2026北京首发集团“优培”拟聘人员笔试历年参考题库附带答案详解
- 2026云南临沧双江兴顺和投资运营集团有限责任公司招聘工作人员3人笔试历年参考题库附带答案详解
- 2026中国石化销售股份有限公司贵州黔南石油分公司招聘2人笔试历年参考题库附带答案详解
- 2025贵州三赢劳务公司招聘笔试历年参考题库附带答案详解
- 2025湖北荆门市钟祥市国有企业招聘拟聘用人员笔试历年参考题库附带答案详解
- 2025河北成安县城市建设投资有限公司招聘13人笔试历年参考题库附带答案详解
- 新建雄安新区至忻州环境影响报告书
- GB/T 8492-2024一般用途耐热钢及合金铸件
- GB/T 754-2024发电用汽轮机参数系列
- 齐鲁医药学院2023医学影像技术专升本《人体影像解剖学》复习题2及参考答案
- 产钳助产术完
- 第12课+近代西方民族国家与国际法的发展+高中历史统编版(2019)选择性必修一
- 大数据背景下的个人信息保护法律研究论文设计
- 煤粉自燃爆炸的原因分析及预防措施
- 质量管理办法
- 一级注册建筑师建筑技术设计(作图题)考试题库(含答案)
- DL-T 5182-2021 火力发电厂仪表与控制就地设备安装、管路、电缆设计规程
评论
0/150
提交评论