已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
毕毕业业设设计计 论论文文 中中期期报报告告 题题 目 目 病例识别系统实现病例识别系统实现 院院 系 系 计算机科学与技术学院 专专 业业 计算机科学与技术 学学 生生 林陶然 学学 号号 1120310609 班班 号号 1203106 指导教师指导教师 张英涛 中期报告日期中期报告日期 2016 年 4 月 25 日 哈尔滨工业大学教务处制哈尔滨工业大学教务处制 20162016 年年 4 4 月月 目录目录 1 1 工作完成情况工作完成情况 1 1 2 2 已完成的研究工作及结果已完成的研究工作及结果 1 1 三 目前存在的问题及解决方法三 目前存在的问题及解决方法 5 5 四 后期拟完成的研究工作及进度安排四 后期拟完成的研究工作及进度安排 5 5 五 参考文献五 参考文献 6 6 0 一 工作完成情况一 工作完成情况 经过为期一个多月的学习研究以及不断的寻求解决问题的办法 我很好地处理了通过手机拍 摄的医疗表单图像 完成了对于图像的灰度处理 二值化处理 倾斜校正 去除杂质处理之后 终于将其中的关键数据分行分列的从图片中分割出来 最后将分好的每一个小块部分进行处理 获得了单个的字符 以便我以后将要进行的字符识别工作 2 已完成的研究工作及结果已完成的研究工作及结果 1 1 对图像的预处理过程对图像的预处理过程 对图像的预处理过程包括图像增强 灰度化 和二值化过程 中值滤波 倾斜校正等等 在图像进行灰度化处理之前 由于光线环境等等问题 首先对图片进行一次自动增强操作 调用了 autoenhance 函数 根据预先设定的效果范围来调整图像的亮度 颜色和对比度 对图像的灰度化处理则直接使用 matlab 中现有的灰度图转化函数 rgb2gray 即可 关于这 个函数的具体内容在此就不再赘述 可以在 matlab 中查看 而二值化方法的选择就显得尤为要 很大程度上影响了后续的分行分列的字符提取效果 这 里我一开始采用的迭代二值化的处理方法 并发现了一些问题 由于拍照的光线不均 决定以后 将采用自适应阈值法 1 1 中值滤波中值滤波 Matlab 中有现成的 medfilt2 中值滤波函数可供调用 在此简述一下他的实现过程和作用 中值滤波的基本原理就是把一点的值用规定的该点对应的一个邻域中各点值的中值来代 替 本人所采用的是 3 3 的窗口大小 1 将模板中心与像素点重合 2 读取模板中各对应像素的值 3 将这些灰度值由小至大排列 4 取中值代替该像素点的值 中值滤波对孤立的噪声像素即椒盐噪声 脉冲噪声具有良好的滤波效果 对于本系统来 说 它消除杂点有很好的效果 1 2 1 迭代二值化方法的实现过程迭代二值化方法的实现过程 1 选择一个初始的阈值 T T 的取值方法很简单 整张图片的最高灰度值和最低灰度值之和 的一半 2 将新的阈值 TT 赋值为 0 并设置一个范围为 allow d T TT 3 遍历整张图片 将灰度值大于 T 的点的灰度值作和并除以个数得到平均值 T0 同理 将 灰度值小于 T 的点作处理得到 T1 将 T0 与 T1 作平均得到 TT d T TT 将 TT 的值赋给 T 4 如果 d 的值大于等于预先设置的范围 allow 就重复进行 3 的过程直至最后得到一个新 的迭代阈值 T 根据这个 T 将图片二值化 1 2 2 迭代二值化方法的处理结果与分析迭代二值化方法的处理结果与分析 1 处理结果 1 可以看到这种二值化的整体效果很好 但是部分文字有笔画丢失的现象 而且对于光照不均 的图像将会产生很多的误差点 如下图 2 产生误差的原因 迭代化的二值化方法是对整张图像的所有像素点的像素值都基于设定的 范围作了平均化操作 然而对于光照不均的图像 每一个区域的阈值的 allow 值都应该有所不同 而迭代化二值化方法无法做到所以产生了误差 而且对于不同的图片要自己选取合适的 allow 值 不够智能 1 3 对图像的倾斜校正对图像的倾斜校正 通过对图像的倾斜校正可以使二值化之后的图像极方便地就能获得后续的水平和垂直投 影 进而使对整个图像的分块和每块中单个字符的分割变得准确而又简单 1 3 1 倾斜校正的实现过程倾斜校正的实现过程 1 设定参数 并以此参数对二值化后的图像进行膨胀过程 2 对膨胀后的图像进行数学形态学运算 bwmorph BW thin Inf 其中 thin 表示操作为细化 Inf 则表示将一直对图像作同样的形态学处理直至不再发生变化 通过这步操作可以将图像缩 成连通线 3 通过霍夫函数拟合出细化图片中的直线 并计算这条直线的斜率 转化为旋转角 对图 片进行旋转 即得到了倾斜校正之后的图像 1 3 2 倾斜校正的结果与分析倾斜校正的结果与分析 2 可以看到通过倾斜校正 图片变成了我们熟悉的文档格式 有着水平的行和垂直的列 下面 将通过水平和垂直的投影 来将每一行每一列的信息分割出来 1 4 开运算排除干扰点开运算排除干扰点 倾斜校正之后的图像我们可以看到还有很多的干扰点 通过开运算函数 bwareaopen 可以排 除图像中的干扰点使分割处理更加准确 下图为开运算的处理效果 2 2 对图像的分割处理对图像的分割处理 由于医疗表单数据通常都是行列分明而且有着统一的格式 字与字之间都是对齐而且有间距 的 通过行分割与列分割 将图像分为对应的小块 再将每一块中的字符进行识别 就可以直接 将行与列的信息与以后要输出的 excel 表格关联起来 很便捷 2 12 1 对图像的行分割与列分割对图像的行分割与列分割 在进行行分割与列分割 先要对图片的水平和垂直分量进行投影操作 通过观察投影的波形 图 我们可以清楚地看到每行每列的位置与投影的波谷的对应关系 2 1 12 1 1 水平与垂直投影过程与效果水平与垂直投影过程与效果 水平 垂直 投影的获取过程很简单 先获取图像的纵 横 坐标范围 在这个大小范围内 对每一行 列 的像素值进行累加 可以看到 上图有 13 行 而水平投影曲线中有 13 个零点 是互相对应的 3 2 2 2 对图像的分块操作对图像的分块操作 下面将以行分割为例 介绍图像分块的过程 数组 H J 分别用于保存一行的起点与结束点 对于 x 坐标由 i 到图像的高度 M 遍历 如果有水平投影值由 0 变为非 0 则将 i 的值赋给一 个起始点 H j 如果有水平投影值由非 0 变为 0 则将 i 的值赋给一个结束点 J j 并且执 行 j 1 表示一对起点终点已经成功记录 即 j 表示第 j 个起始点与第 j 个结束点 于是就可以得到行切割矩阵 rect i 0 H i N J i H i 即宽度不变 将每个行起点到行终点的 部分截取下来 获得逐行的图像 切割的结果如下 4 可以看到结果是非常成功的 同理 对于分割出来的每一行和之前得到的垂直投影 可以将每一行中的每一列分割出来 这样就得到了一块一块的图像 结果如下 2 2 对每块图像的字符分割对每块图像的字符分割 只要对之前的代码稍作修改 从对整张图变作对每一块进行一次垂直投影 并进行列分割 重复这个过程 直到全部的块都分割完毕 我们就得到了一个一个字符的图片 在这个过程中 还可以对分好的小块进行筛选 通过设置一个阈值 limit 来筛掉没有字符的块 下图是对上图例子中第九块分块的处理结果 可以看到一个一个的字符已经被分割出来 3 目前存在的问题及解决方法目前存在的问题及解决方法 1 首先是我采用的迭代二值化的方法还不足以应付所有条件下拍摄的照片 在面对部分效 果不好的照片时 会有很多的干扰和误差 解决方法解决方法 学习自适应阈值的二值化方法来对图 像进行二值化 代替目前所有的二值化方法 2 在开运算去除杂点之后 有些数据的小数点也被过滤掉了 解决方法解决方法 在后面识别数据 并进行导出时 如果同一块内两个数字之间的留空太大 则说明此处原有小数点 应该补上 3 分割出来的每个字符在水平上还有很多的空间没有切割 解决方法解决方法 对每一块使用之前 的行分割过程去掉多余的部分来让字符匹配更加快速且准确 4 由于医疗数据格式的不规律性 分割出来的块中有很多是没有信息的无效块 解决方法解决方法 加入一个筛选过程 筛掉有效像素点百分比在 h 以下的点 就可以留下只有信息的点 四 后期拟完成的研究工作及进度安排四 后期拟完成的研究工作及进度安排 5 1 后期工作内容后期工作内容 学习字符识别算法 将分割出来的字符分割图片最终转化为文档中的文字 预计的方法是先对每个字符的图片进行细化还原 再统一化为与模板统一的格式 与模板进 行匹配对比 得到正确的文字 数字和字母以及字符的识别部分准备在中期答辩之后自己独立完 成 研究已有的算法加以改进并实现 汉字的部分过于复杂 也会进行一定的尝试 如果时间不 够的话可能会采用现已有的优秀方法进行识别 在成功识别出字符之后 会根据之前对图片中蕴含的数据所进行的分行分列操作 将这些文 字输出到 excel 表格中的对应的位置 根据对大量的医疗图片进行试验所得到的结果进行准确性与效率的调整 优化代码 使整个 系统的实用性提高 同时保证提取出来的数据的准确性和有效性 附加工作 因为这个系统最后是要应用于手机之上的 撰写完毕业论文之后的时间会用来改 进代码 并将之转化为 C 语音程序 用于手机上 JAVA 语言的调用 2 进度安排进度安排 中期 2016 05 15 两周多一点的时间用来完成字符的匹配与识别 2016 05 15 2016 05 31 做更多的实验 遇到问题及时纠正 算法及代码的优化和改 进 同时开始毕业论文的撰写 2012 06 01 结题 完成毕业论文的撰写 总结项目中的经验和教训 空余时间 尝试代码的移植 4 参考文献参考文献 1 车牌识别系统中字符分割的研究与实现 马婉婕 复旦大学 计算机系统结构 2009 硕士 2 利用 Hough 变换和先验知识的车牌字符分割算法 张云刚 张长水 计算机学报 Chinese Journal of Computers 2004 年 01 期 3 几种文本图像二值化方法的对比分析 童立靖 张艳 舒巍 占国亮 钱垚 北方工业大 学学报 Journal of North China University of Technology 2011 年 01 期 4 不均匀光照文本图像的二值化 贺志明 上海工程技术大学学报 Journal of Shanghai University of Engineering Science 2011 年 02 期 5 车牌识别系统中的牌照定位及倾斜校正技术研究 贡丽霞 中北大学 应用数学 2010 硕士 6 基于 Hough 变换的列车客运票图像倾斜校正 梁添才 皮佑国 彭晶 朱朝华华 南理 工大学学报 自然科学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大学社团内部规章制度
- 奉贤区合同内部控制制度
- 服装企业内部审计制度
- 村两委内部管理制度
- 村级内部财务控制制度
- 残联单位内部考核制度
- 法律尽职调查内部制度
- 法院内部法警调用制度
- 甘肃电投内部审计制度
- 电器公司内部控制制度
- 2026年春冀教版(新教材)小学数学二年级下册教学计划及进度表
- 2026年春季苏教版小学数学三年级下册教学计划含进度表
- 2026及未来5年中国核辐射物位仪表行业市场运行态势及发展趋向研判报告
- 新版部编人教版七年级下册道德与法治全册教案(完整版)教学设计含教学反思
- 广东科学技术职业学院珠海校区物业服务采购项目用户需求书
- 成都理工大学2026年选聘教辅工作人员(30人)笔试模拟试题及答案解析
- (一模)2026届大湾区高三普通高中毕业年级联合模拟考试(一)生物试卷(含答案)
- 保险代理销售佣金分成合同
- 空气能热泵系统安装施工方案
- 水利工程危大工程安全监理实施细则
- 抚育林施工方案(3篇)
评论
0/150
提交评论