论文0913.pdf

上传人：s*** IP属地：河南上传时间：2020-01-18 格式：PDF 页数：26 大小：3.37MB 积分：20 举报 版权申诉

已阅读5页，还剩21页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2013 高教社杯全国大学生数学建模竞赛高教社杯全国大学生数学建模竞赛承承诺诺书书我们仔细阅读了全国大学生数学建模竞赛章程和全国大学生数学建模竞赛参赛规则以下简称为竞赛章程和参赛规则可从全国大学生数学建模竞赛网站下载我们完全明白在竞赛开始后参赛队员不能以任何方式包括电话电子邮件网上咨询等与队外的任何人包括指导教师研究讨论与赛题有关的问题我们知道抄袭别人的成果是违反竞赛章程和参赛规则的如果引用别人的成果或其他公开的资料包括网上查到的资料必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出我们郑重承诺严格遵守竞赛章程和参赛规则以保证竞赛的公正公平性如有违反竞赛章程和参赛规则的行为我们将受到严肃处理我们授权全国大学生数学建模竞赛组委会可将我们的论文以任何形式进行公开展示包括进行网上公示在书籍期刊和其他媒体进行正式或非正式发表等我们参赛选择的题号是从 A B C D 中选择一项填写 B 我们的参赛报名号为如果赛区设置报名号的话 J0420 所属学校请填写完整的全名西安电子科技大学参赛队员打印并签名 1 汤敬浩 2 陈柯宇 3 张珊指导教师或指导教师组负责人打印并签名教练组日期 2013 年 09 月 15 日赛区评阅编号由赛区组委会评阅前进行编号 2013 高教社杯全国大学生数学建模竞赛高教社杯全国大学生数学建模竞赛编编号号专专用用页页赛区评阅编号由赛区组委会评阅前进行编号赛区评阅记录可供赛区评阅时使用评阅人评分备注全国统一编号由赛区组委会送交全国前编号全国评阅编号由全国组委会评阅前进行编号 1 碎纸片的拼接复原摘要本文针对单面纵切横纵切和双面横纵切三种情况下碎纸片拼接复原的问题建立边缘特征匹配模型采用模拟退火算法给出拼接后的复原结果图及序号表针对问题一建立纵切图像拼接中的边缘特征匹配模型即模型一首先提取了碎纸片图像的边缘像素点矩阵根据汉字和英文的结构特点在边缘像素点矩阵中合理地选取了边缘特征点然后构造了匹配值公式并以 19 条碎纸片排列顺序为决策变量构造了匹配值目标函数最后采用模拟退火算法求解人工将开头碎纸片置首得到了汉字和英文的碎纸片序号排列表分别见文中表 2 表 4 复原结果图分别见附录 1 图 6 图 8 针对问题二对模型一进行改进得到模型二首先基于图像中文字高度的特征计算出图像间的相似度筛选出每行的图像序号筛选过程中需要人工干预其次对每行的图像采用模型一和模拟退火算法求解人工将每行图像的开头碎纸片置首后得到了每行拼接好的图像然后通过对行间距的控制实现每行图像的上下拼接最后得到了汉字和英文的碎纸片序号排列表分别见文中表 6 表 7 复原结果图分别见附录 1 图 9 图 10 针对问题三对模型二进行改进得到模型三首先分析得到每组图像两面的文字高度是一致的单面即可表达双面的高度特征因此我们仅采用一面进行相似度筛选筛选出每行的图像序号筛选过程中需要人工干预其次对每行的正反面图像采用模型一和模拟退火算法求解人工将每行图像的开头碎纸片置首后得到了每行拼接好的图像然后仍然通过对行间距的控制实现了每行图像的上下拼接最后得到了碎纸片序号排列表见文中表 9 表 10 复原结果图见附录 1 图 11 12 最后对模型的优缺点进行了评价并给出模型的推广关键词数字图像处理图像拼接边缘特征模拟退火图像相似度 2 1 问题重述 1 1 问题背景破碎文件的拼接复原在司法物证复原历史文献修复以及军事情报获取等领域都有着重要的应用传统上拼接复原工作需由人工完成准确率较高但效率很低特别是当碎片数量巨大人工拼接很难在短时间内完成任务随着计算机技术的发展人们试图开发碎纸片的自动拼接技术以提高拼接复原效率 1 2 问题要求数据文件说明 1 纵切碎片数据每页纸被切为 19 条碎片横切碎片数据每页纸被切为 11 条碎片 2 正反两面数据两面分别对应文件 000a 000b 3 附件 1 2 为纵切数据附件 3 4 为横纵切数据附件 5 为横纵切双面数据结果表达格式 1 复原得到的图像放入附录中 2 碎片排列序号放在表格中放在论文结果中 1 3 问题提出问题一对于给定的来自同一页印刷文字文件的碎纸机破碎纸片仅纵切建立碎纸片拼接复原模型和算法并针对附件 1 附件 2 给出的中英文各一页文件的碎片数据进行拼接复原如果复原过程需要人工干预请写出干预方式及干预的时间节点问题二对于碎纸机既纵切又横切的情形请设计碎纸片拼接复原模型和算法并针对附件 3 附件 4 给出的中英文各一页文件的碎片数据进行拼接复原如果复原过程需要人工干预请写出干预方式及干预的时间节点问题三上述所给碎片数据均为单面打印文件从现实情形出发还可能有双面打印文件的碎纸片拼接复原问题需要解决附件 5 给出的是一页英文印刷文字双面打印文件的碎片数据请尝试设计相应的碎纸片拼接复原模型与算法并就附件 5 的碎片数据给出拼接复原结果 2 问题分析碎纸片的拼接复原过程需要考虑文字类型行间距等多种因素的影响为了建立合理的模型和算法求解复原图像问题分析如下首先为了便于计算机对图像信息进行处理对碎纸片图像进行数字化处理对于问题一为了研究图像边缘的拼接问题应先提取图像左右两侧的边缘信息通过图像之间的边缘信息关系来确定图像之间是否匹配由于汉字和英文的结构特点不同还需要对于不同的字体进行不同的边缘信息分析最终制定了汉字英文两种匹配值问题二在问题一的基础上增加了横切的图像为了使模型一适用性较高我们研究了图像之间的相似度用以反映图像中文字所处高度的相似程度通过相似度分析可以得到属于同一行的图像序号这样问题二的求解转化成了问题一的求解但将每行图像复原后还需要将图像上下拼接因此除了提取左右两侧的边缘信息还需要考虑上下的边缘分析发现上下边缘无法用问题一中的匹配值匹配因此我们另外加入了对行 3 间距的考虑问题三在问题二的基础上增加了正反两面的情况但对于我们的模型和制定的匹配值可通过模拟退火算法自动排除图像之间为反面的情况因此沿用问题二的模型与算法此外我们发现对于每组图像的正反面图像中文字所处的高度是完全一致的因此在进行图像之间的相似度分析时可只选择其中一面进行相似度分析 3 模型假设 1 假设忽略图像噪声的干扰 2 假设忽略图像在文本截取时极小部分信息的丢失 4 符号说明符号符号说明 Match 两张图像的匹配值 r 相似度 R 相似度矩阵 D 行间距接受度注其它未注明符号均在文中有详细解释 5 模型建立与求解 5 1 模型准备为了便于计算机对图像信息进行处理对碎纸片图像进行数字化处理图像数字化是将连续色调的图像经采样量化后转换成数字信息的过程其主要过程是首先对图像每个像素点的信息进行采集然后将采集到的信息进行量化对于黑白图来说常用的量化指标是灰度值即将黑色定义为 0 白色定义为 255 0 255 之间的值为黑色与白色之间的渐变色最后将量化后的灰度值以像素点矩阵的形式存储以方便计算机处理 Matlab 软件的图像工具箱提供了便捷的图像数字化处理的函数 imread 函数运用此函数对题目中提供的碎纸片图像进行数字化处理结果为仅纵切的碎纸片图像生成 1980 72 的像素点矩阵横纵切的碎纸片图像生成 180 72 的像素点矩阵 5 2 问题一 5 2 1 纵切图像拼接中边缘特征匹配模型模型一对于题目中给出的纵切碎纸片图像拼接问题需要考虑的第一个问题是直接根据图像的像素点矩阵拼接碎纸片并不可行其复杂度等同于直接利用图像的几何特征拼接提取合理的特征点尤为重要另一个问题是图像特征点提取后当两个图像满足何种关系时可以认定为可拼接故匹配值的制定尤为重要 1 边缘特征点所谓边缘特征点在本文中指的是针对不同的文字种类对图像边缘信息提取的特征 4 点选取题目中给出的汉字和英文两种文字种类作为模型建立的基础考虑到在纵切图像的拼接过程中图像左右边缘的匹配程度即可作为是否可拼接的依据首先提取图像左右边缘的像素点矩阵称之为边缘像素点矩阵根据这一思想分别提取汉字和英文的边缘像素点矩阵汉字和英文两种文字种类的像素点矩阵均为 1980 72 的矩阵均提取像素点矩阵的第 1 列和第 72 列作为边缘像素点矩阵边缘信息提取后边缘特征点的提取则是因字体类型而异的对题目中的汉字类型和英文类型特征点提取方式如下 1 汉字特征点根据汉字的结构特点 1 汉字的平均笔画为 10 75 画结构较复杂每个汉字在同一高度笔画相似程度很低可通过选取图像右边缘中未收笔的笔画作为特征点与需拼接图像的左边缘等高度的边缘像素点匹配达到选出拼接图像的目的未收笔的笔画是指只有部分未完成的笔画在图像中显示为黑色未变灰对应边缘像素点矩阵该点像素值为 0 因此汉字边缘特征点即为图像右边缘像素点矩阵中为 0 的像素点 2 英文特征点相较汉字的结构特点英文字体结构较为简单若采用与汉字相同的特征点会出现如下情况图 1 英文字母拼接中出行的问题即字母 c e 拼接中虽然拼接结果不正确但 e 能够和 c 中的边缘特征点进行拼接考虑到还有很多字母间在拼接中存在上述状况因此不采用与汉字相同的特征点选取方式而采用将边缘所有像素点作为特征点的方式根据这种思想在两张图像拼接中不仅考虑了左侧图像右边缘的匹配程度还同时考虑了右侧图像的左边缘的匹配程度对于英文这种结构简单的文字类型较为适合因此英文边缘特征点即为图像左右边缘的所有像素点 2 匹配值所谓匹配值在本文中指的是两张图像需拼接的边缘特征点灰度值的绝对值距离之和当匹配值较小时说明两张图像色调变化缓和可拼接度高根据匹配值的概念其通用公式可表达为 ii Matchleftright 1 其中 Match 为两张图像匹配值 lefti为拼接后右侧图像的左边缘中第 i 个特征点的灰度值 righti为拼接后左侧图像的右边缘中第 i 个特征点的灰度值两种文字类型结构特点的不同以及特征点选取的方式不同致使其匹配值计算也不尽相同在匹配值通用公式下两种文字类型的匹配值具体计算方式如下 1 汉字类型根据汉字笔画大全 2 收录的所有汉字笔画汉字笔画的走势一般有上扬水平和下降三种情况具体形式如下 5 图 2 汉字笔画走势情况对于情况一设该特征点高度为 h 即边缘像素点矩阵的行数若某特征点属于该匹配情况那么拼接后左侧图像右侧边缘高为 h 的像素点应与右侧图像左侧边缘高位 h 1 的像素点匹配此时匹配值计算公式应为 1hh matchleftright 同理可得情况二匹配值计算公式为 hh matchleftright 情况三匹配值计算公式应为 1hh matchleftright 事实上图像拼接中某特征点匹配情况是未知的根据匹配值的概念匹配值越小则匹配程度越高则某特征点应属于三种情况下匹配值最小的的匹配情况因此汉字类型匹配值计算公式为 11 min hhhhhh i matchleftrightleftrightleftright 2 其中 h 为第 i 个边缘特征点的高度 2 英文类型相较汉字类型英文类型并无典型的笔画走势且英文类型的边缘特征点为左右边缘所有的像素点并无需要特殊考虑的情况利用匹配值的通用公式 1 即可在实际求解过程中需要对 19 条碎纸片的排列顺序进行决策使得拼接完成后的图像拼接处匹配值之和越小越好设向量 1231819 Yy yyyy 为决策向量表示 19 条碎纸片的排列方案目标函数如下 min MMatch Y 3 其中函数 Match 返回的是输入为 Y 时拼接完成后的图像拼接处匹配值 5 2 2 算法描述为了求得上述目标函数的最小值采用了模拟退火算法该算法是源于对热力学中固体退火过程的模拟在某一给定初温下通过缓慢下降温度参数使算法能够在多项式时间内给出一个近似最优解且搜索效率较高模拟退火算法基本步骤如下 Step1 随机生成初始解 yi 令初始温度 T T0 计算目标函数 M yi Step2 根据 yi进行扰动产生一个新解 yj 其中为了使得满足拼接过程中单个和多个拼接块的移动采用了以下三种扰动产生一个新解的方式分别为 1 二变换随机产生 1 19 中的两个数 ind1 和 ind2 将 ind1 和 ind2 在解中对应位置的值互换 2 三变换随机产生 1 19 中的三个数 ind1 ind2 和 ind3 ind1 在解中对应位置的值换到 ind3 在解中对应位置 ind3 在解中对应位置的值换到 ind2 在解中对应位置 ind2 在解中对应位置的值换到 ind1 在解中对应位置 6 3 块变换随机产生 1 19 中的三个数 ind1 ind2 和 ind3 将 ind1 和 ind2 在解中对应位置之间的值换到 ind3 在解中对应位置之后其中 ind1 ind2 31 2indind ind 否则重新产生新的随机数 Step3 计算 ji MM yM y 根据 Metropolis 接受准则选择是否接受新解 Metropolis 准则 3 为以新解与当前解的目标函数差定义接受概率 P 即 10 exp0 M P M T 4 Step4 检查是否达到迭代次数如果不是转入 Step2 Step5 检查是否满足终止条件如果不是转入 Step2 否则程序结束返回最优解 5 2 3 模型求解对于上面建立的纵切图像拼接中边缘特征匹配模型我们利用了方便实用的 Matlab 图像处理工具箱分别对汉字和英文两种文字类型进行了求解对于汉字类型首先按照汉字类型边缘特征点选取规则将边缘灰度值 0 进行了筛选然后根据汉字类型匹配值的计算方法求得了两图像拼接时的匹配值最后根据目标函数利用 Matlab 软件进行求解得到了 19 个碎片序号的排列如下表表 1 人工干预前汉字图像复原结果编号 1 2 3 4 5 6 7 8 9 10 序号 003 010 029 016 001 004 005 009 013 018 编号 11 12 13 14 15 16 17 18 19 序号 011 007 017 000 006 008 014 012 015 汉字复原图见附录 1 图 5 由图 1 很容易发现该复原图有偏差这主要是由于开头和结尾未固定因此我们人工干预将开头的图像 008 置首由此得到了正确的 19 个碎片序号的排列顺序如下表表 2 人工干预后汉字图像复原结果编号 1 2 3 4 5 6 7 8 9 10 序号 008 014 012 015 003 010 029 016 001 004 编号 11 12 13 14 15 16 17 18 19 序号 005 009 013 018 011 007 017 000 006 汉字正确复原图见附录 1 图 6 对于英文类型首先根据英文类型匹配值的计算方法得到两图像拼接时的匹配值然后根据目标函数利用 Matlab 软件进行求解得到了 19 个碎片序号的排列如下表表 3 人工干预前英文图像复原结果编号 1 2 3 4 5 6 7 8 9 10 序号 014 017 016 004 003 006 002 007 015 018 编号 11 12 13 14 15 16 17 18 19 序号 011 000 005 001 009 013 010 008 012 英文复原图见附录 1 图 7 由图 1 很容易发现该复原图有偏差这主要是由于开头和结尾未固定因此我们 7 人工干预将开头的图像 003 置首由此得到了正确的 19 个碎片序号的排列顺序如下表表 4 人工干预后英文图像复原结果编号 1 2 3 4 5 6 7 8 9 10 序号 003 006 002 007 015 018 011 000 005 001 编号 11 12 13 14 15 16 17 18 19 序号 009 013 010 008 012 014 017 016 004 英文正确复原图见附录 1 图 8 5 2 4 结果分析根据模型求解中的结果分析得到人工干预主要出现在计算机拼接完成后对开头碎纸片置首这个过程出现该现象的原因很有可能是计算机拼接时只考虑匹配值的最优无法考虑到文章内容相关问题而对于手工拼接工作者来说很容易就会发现计算机拼接出来的图像文章内容是读不通的很快能调整出正确的拼接结果因此模型一不仅快速的解决了该问题也减轻了手工拼接工作者的工作量 5 3 问题二 5 3 1 横纵切图像拼接中边缘特征匹配模型模型二 1 模型一适用性分析模型一在纵切图像拼接中有较好的适用性但当图像中含有纵切横切图像时需要考虑的因素除了左右边缘的匹配值还有上下边缘的匹配值观察图像的左右边缘与问题一中的左右边缘情况相似在问题二左右边缘拼接时可延用模型一观察图像的上下边缘容易发现其中空白的比例较大这使得模型一中匹配值的计算方法出现了较大的误差这种计算方法会主动增加空白之间的拼接但事实情况并不是如此空白只是文章中的行间的空白即行间距因此对于问题二中横纵切图像拼接的问题中需要考虑的第一个问题是模型一可以解决同一行中 19 个碎纸片的拼接不在同一行则无法解决如何将经横切后处在同一行的 19 个碎纸片筛选出来另一个问题是 11 行碎纸片拼接完成后利用行间距这个指标拼接出完整的复原图 2 横纵切图像拼接中边缘特征匹配 1 相似度筛选相似度筛选是指通过图像间的相似度筛选出属于同一类的图像集合在本文中是指通过图像间的相似度筛选出属于同一行的 19 个碎纸片这是基于问题二中所给中英文图像中不同图像中每一行文字对应的高度不同致使其不可能拼接在复原图中的同一行上首先给出任意两图像间相似度的计算方法步骤如下 1 无关信息弱化处理考虑到我们是根据不同图像中每行文字对应的高度不同筛选出同一行图像只需计算图像中每行文字高度的相似度通过对图像像素点二维矩阵每行所有元素求和得到该图像的一维矩阵该矩阵可有效的说明该图像中每行文字所处的高度巧妙地忽略文字信息不同对相似度的影响称之为高度信息矩阵因此构造高度信息矩阵可去除无关信息的干扰提高相似度的可信度 2 相似度计算 Matlab 中有直接计算图像相似度的函数 corr2 其原理如下 8 首先对任意两图像的高度信息矩阵 A B 作如下操作 A B AAmean BBmean 5 其中 meanA 和 meanB分别表示 A B 矩阵的平均值然后得到相似度 r 其计算公式如下 T TT sum A B r sum A Asum B B 6 其中 sum 函数返回的是矩阵中所有元素的和 AT表示矩阵 A 的转置最后根据公式 6 便可得到对于中英文 209 张图像的相似度矩阵为 111209 2091209 209 rr R rr 其中 rij表示第 i 张图像与第 j 张图像的相似度 3 相似度筛选根据相似度矩阵按如下过程筛选出处于同一行的图像 Step1 从第一张图像开始找出与该图像相似度最高的 18 张图像对这 19 张图像利用模型一求解 Step2 如果 19 张图像不能拼接出正确图像则人工干预加入剩余图像中相似度较高的图像转入 Step1 如果可拼接则转入 Step3 Step3 在相似度矩阵中删除已拼接的图像的相似度信息查找下一张图像的分类情况如果矩阵为空则拼接完成得到每行的图像后还需要对图像进行上下拼接我们引入了行间距控制 2 行间距控制考虑到行间距是一个相对固定的值在像素点矩阵中约为 27 行因此我们将拼接后的行间距 ver 作为行与行之间拼接的指标当 ver 规定阈值本文设定为 2 行内时接受这两张图像可拼接接受度 D 表示为 125 29 0 ver D else 7 5 3 2 模型求解对于上述建立的模型二首先利用 Matlab 软件求出相似度矩阵然后对相似度筛选过程进行求解以英文序号为 000 图像为例演示筛选的过程如下找出与 000 相似度较高 25 张图像具体信息如下表表 5 英文 000 图像筛选结果图像序号与图像 000 的相似度 000 1 131 0 991495 072 0 988669 048 0 985181 193 0 984996 115 0 984819 052 0 984745 9 081 0 984712 089 0 984368 077 0 984292 124 0 984031 087 0 983488 012 0 983348 177 0 98309 140 0 981274 102 0 98122 200 0 979275 125 0 979042 128 0 974672 031 0 949296 085 0 94718 187 0 946041 001 0 944866 063 0 931933 203 0 931101 找出其中最高的 18 张图像利用模型一求解发现这 19 张图像属于同一行同理分别求得汉字与英文 11 条碎纸片拼接后的序号排列见附录 1 表 10 表 11 最后根据行间距阈值的控制分别得到汉字与英文已拼接完成 11 条碎纸片拼接顺序具体排序见下表表 6 问题二人工干预后汉字复原结果 049 054 065 143 186 002 057 192 178 118 190 095 011 022 129 028 091 188 141 061 019 078 067 069 099 162 096 131 079 063 116 163 072 006 177 020 052 036 168 100 076 062 142 030 041 023 147 191 050 179 120 086 195 026 001 087 018 038 148 046 161 024 035 081 189 122 103 130 193 088 167 025 008 009 105 074 071 156 083 132 200 017 080 033 202 198 015 133 170 205 085 152 165 027 060 014 128 003 159 082 199 135 012 073 160 203 169 134 039 031 051 107 115 176 094 034 084 183 090 047 121 042 124 144 077 112 149 097 136 164 127 058 043 125 013 182 109 197 016 184 110 187 066 106 150 021 173 157 181 204 139 145 029 064 111 201 005 092 180 048 037 075 055 044 206 010 104 098 172 171 059 007 208 138 158 126 068 175 045 174 000 137 053 056 093 153 070 166 032 196 089 146 102 154 114 040 151 207 155 140 185 108 117 004 101 113 194 119 123 10 表 7 问题二人工干预后英文复原结果 208 021 007 049 061 119 033 142 168 062 169 054 192 133 118 189 162 197 112 081 077 128 200 131 052 125 140 193 087 089 048 072 012 177 124 000 102 115 159 139 001 129 063 138 153 053 038 123 120 175 085 050 160 187 097 203 031 020 041 108 116 136 073 036 207 135 015 076 043 199 045 173 079 161 179 143 201 148 170 196 198 094 113 164 078 103 091 080 101 026 100 006 017 028 146 086 051 107 029 040 158 186 098 024 117 150 005 059 058 092 030 037 046 127 171 042 066 205 010 157 074 145 083 134 055 018 056 035 016 009 183 152 044 019 194 093 141 088 121 126 105 155 114 176 182 151 022 057 202 071 165 082 132 181 095 069 167 163 166 188 111 144 206 003 130 034 013 110 025 027 178 070 084 060 014 068 174 137 195 008 047 172 156 096 023 099 122 090 185 109 191 075 011 154 190 184 002 104 180 064 106 004 149 032 204 065 039 067 147 正确复原图见附录 1 图 9 图 10 5 3 3 结果分析与问题一中的模型一比较人工干预的过程增加了即在筛选过程中可能要加入人工干预但在算法实际运行中汉字几乎不需要人工干预英文则只需 7 8 次人工干预在一定程度上也较快速地解决了该问题减轻了手工拼接工作者的工作量 5 4 问题三 5 4 1 双面横纵切图像拼接中边缘特征匹配模型模型三 1 模型二适用性分析模型二在单面横纵切图像拼接的问题中有较好的适用性相似度筛选能较好的筛选出属于同一类的图像其筛选的依据主要为图像间文字高度的相似度而且之前对于汉字英文的结构分析出的匹配值公式可通过模拟退火算法自动排除图像之间为反面的情况因此正反面图像的拼接得到了处理 2 双面横纵切图像拼接中边缘特征匹配模型对于双面横纵切的图像来说由于正反两面图像中每行文字的高度特征是一致的单面即可表达双面的高度特征因此模型二中的筛选原则同样适用于双面情况下的同一类图像的筛选由上述分析单面即可表达双面的高度特征所以在进行相似度筛选前每个图像正反面中只选取一面进行筛选本文中选取的序号为 a 的图像进行筛选 5 4 2 模型求解对于上述建立的模型三首先利用 Matlab 软件求解相似度矩阵根据相似度矩阵选出属于同一类的图像以序号为 000a 为例演示筛选的过程如下 11 找出与 000a 相似度较高 25 张图像具体信息如下表表 8 双面 000a 图像筛选结果图像序号与图像 000a 的相似度 030a 0 986265 032a 0 98473 176a 0 984506 027a 0 983344 105a 0 982977 121a 0 981978 077a 0 981421 138a 0 981284 004a 0 979972 153a 0 979284 098a 0 978257 185a 0 97797 141a 0 976846 038a 0 975762 007a 0 973389 074a 0 970246 069a 0 96781 148a 0 966987 045a 0 962483 003a 0 961407 085a 0 959455 126a 0 923813 204a 0 923093 135a 0 922607 200a 0 918412 找出其中最高的 18 张图像利用模型一求解发现不属于同一类图像需要进行人工干预作出筛选个数与相似度的曲线如下图图 3 筛选个数与相似度的曲线在第一个相似度下降较快的点即筛选个数为 21 时我们人工干预添加新增的两个图像利用模型一求解发现依旧不属于同一个类进行第二次人工干预在第二个相似度下降较快的点即筛选个数为 38 时我们人工干预添加新增的 17 张图像利用 0 8 0 82 0 84 0 86 0 88 0 9 0 92 0 94 0 96 0 98 1 1357911 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 12 模型一求解发现其中 19 个属于同一行取出这 19 个中的 000a 和为未分类 19 个中的 187a 如下图图 4 碎纸片图像发现它们的高度特征很相似我们猜想筛选出的 38 张图为高度特征相似的两行所以对剩余的 19 张图像利用模型一验证发现他们确实属于同一行同理得到了剩余 9 行的拼接结果然后根据行间距阈值的控制得到已拼接完成 11 条碎纸片拼接顺序正反面的排序见下表表 9 问题三正面复原结果 078b 111b 125a 140a 155a 150a 183b 174b 110a 066a 108a 018b 029a 189b 081b 164b 020a 047a 136b 089a 010b 036a 076b 178a 044a 025b 192a 124b 022a 120b 144a 079a 014a 059a 060b 147a 152a 005a 186b 153a 084b 042b 030a 038a 121a 098a 094b 061b 137b 045a 138a 056b 131b 187b 086b 200b 143b 199b 011b 161a 169b 194b 173b 206b 156a 034a 181b 198b 087a 132b 093a 072b 175a 097a 039b 083a 088b 107a 149b 180a 037b 191a 065b 115b 166b 001b 151b 170b 041a 070b 139b 002a 162b 203b 090a 114a 184b 179b 116b 207a 058a 158a 197a 154b 028b 012a 017b 102b 064b 208a 142a 057a 024a 013a 146a 171b 031a 201a 050a 190b 092b 019b 016b 177b 053b 202a 021b 130a 163a 193b 073b 159a 035a 165b 195a 128a 157a 168a 046a 067a 063b 075b 167a 117b 008b 068b 188a 127a 040a 182b 122a 172a 003b 007b 085b 148b 077a 004a 069a 032a 074b 126b 176a 185a 000b 080b 027a 135b 141a 204b 105a 023b 133a 048a 051b 095a 160b 119a 033b 071b 052a 062a 129b 118b 101a 015b 205a 082b 145a 009b 099a 043a 096b 109a 123a 006a 104a 134a 113a 026b 049b 091a 106b 100b 055b 103a 112a 196b 054b 13 表 10 问题三反面复原结果 136a 047b 020b 164a 081a 189a 029b 018a 108b 066b 110b 174a 183a 150b 155b 140b 125b 111a 078a 005b 152b 147b 060a 059b 014b 079b 144b 120a 022b 124a 192b 025a 044b 178b 076a 036b 010a 089b 143a 200a 086a 187a 131a 056a 138b 045b 137a 061a 094a 098b 121b 038b 030b 042a 084a 153b 186a 083b 039a 097b 175b 072a 093b 132a 087b 198a 181a 034b 156b 206a 173a 194a 169a 161b 011a 199a 090b 203a 162a 002b 139a 070a 041b 170a 151a 001a 166a 115a 065a 191b 037a 180b 149a 107b 088a 013b 024b 057b 142b 208b 064a 102a 017a 012b 028a 154a 197b 158b 058b 207b 116a 179a 184a 114b 035b 159b 073a 193a 163b 130b 021a 202b 053a 177a 016a 019a 092a 190a 050b 201b 031b 171a 146b 172b 122b 182a 040b 127b 188b 068a 008a 117a 167b 075a 063a 067b 046b 168b 157b 128b 195b 165a 105b 204a 141b 135a 027b 080a 000a 185b 176b 126a 074a 032b 069b 004b 077b 148a 085a 007a 003a 009a 145b 082a 205b 015a 101b 118a 129a 062b 052b 071a 033a 119b 160a 095b 051a 048b 133b 023a 054a 196a 112b 103b 055a 100a 106a 091b 049a 026a 113b 134b 104b 006b 123b 109b 096a 043b 099b 正确复原图见附录 1 图 11 图 12 5 4 3 结果分析与问题二中的模型二比较相似度筛选过程中人工干预次数增加了这只要是由于问题三中高度特征相似的行较多 6 模型推广与评价本文针对碎纸片图像复原问题建立了三个模型分别解决了仅纵切碎纸片拼接复原横纵切碎纸片拼接复原和双面横纵切碎纸片拼接复原三个问题在一定人工干预下得到满意的结果对各模型具体分析如下模型一主要是解决了仅纵切碎纸片拼接复原的问题在解决过程中首先提出了边缘特征点和匹配值等概念然后分别对汉字和英文两种文字类型进行了讨论给出不同的边缘特征点提取方案和匹配值计算方法最后利用模拟退火算法求解了最优拼接方案由以上分析可知此模型最大的优点为对于不同文字类型进行分类考虑且模拟退火算法能够较快得到最优解精度也较高主要缺点是仅考虑了纵切时的拼接情况不能较好的适应问题二三中横纵切和双面的拼接问题模型二三主要是解决加入横切情况后碎纸片拼接复原的问题在解决过程中提出了筛选和行间距等概念分别解决了行元素选择和行拼接的问题模型的主要优点是精确筛选规则得到了很好的结果使得模拟退火算法得到最优解的精确度行间距在解决行拼接问题中达到了快速准确的效果主要缺点是虽然能较好的适应题目中给出的碎纸片拼接复原的问题在解决手写碎纸片拼接中由于手写文字的每一行不一定在同一水平线上行间距不固定受到了较大的限制本文中建立的模型一二和三均为解决碎纸片拼接复原的模型能够广泛地应用于很多领域中比如在医学领域中通过图像拼接技术提高图像的精确度在遥感领域中 14 通过利用图像拼接技术可以对一组有重叠区域遥感图像进行拼接得到完整的遥感图像方便进一步遥感图像分析 4 7 文献参考 1 百度文库 2 汉字特点与结构年 9 月 15 日 2 百度文库汉字笔画大全年 9 月 15 日 3 卓金武 MATLAB 在数学建模中的应用北京北京航空航天大学出版社 2011 4 李新葛晓燕基于 SIFT 的低空遥感图像拼接制造业自动化 35 3 2013 8 附录附录 1 15 图 5 人工干预前汉字复原结果 16 图 6 人工干预后汉字复原结果 17 图 7 人工干预前英文复原结果 18 图 8 人工干预后英文复原结果 19 表 11 问题二人工干预前汉字复原结果 007 208 138 158 126 068 175 045 174 000 137

人人文库> 全部分类> 生活休闲 > 科普知识

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

论文0913.pdf

文档简介

温馨提示

最新文档

评论

论文0913.pdf

文档简介

温馨提示

最新文档

评论

相关文档