英文翻译.doc

【FY261】一种视频文字字符多方位分割的新方法【PDF+WORD】【中文6100字】

收藏

压缩包内文档预览:
预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图
编号:826918    类型:共享资源    大小:713.95KB    格式:RAR    上传时间:2016-10-06 上传人:棒*** IP属地:湖北
12
积分
关 键 词:
fy261 一种 视频 文字 字符 多方位 分割 新方法 pdf word 中文
资源描述:
更多课题/
该资料由棒哥毕业设计工作室整理上传,购买之前,请仔细阅读预览,满意后注册帐号,充值下载即可得到源文件。

      棒哥设计工作室专职于数控编程、夹具设计、模具设计、机械设计、减速器设计、三维造型设计[UG、PROE、SW等]。拥有万份成品毕业设计资料,如若资料库中没有您想要的课题,我们支持量身定做,量身定做,保证通过!咨询QQ:29467473

     我们拥有一支经验丰富、技术过硬、具有社会责任感的专业团队,有10余名主要技术主干,30余名兼职技术人员,所有技术人员均从事技术5-10年及以上在职工程师及大学教师,充分保证定做设计质量。

     我们永远诚心接待每一位来访的有缘人,同时也欢迎有能力、有技术、有经验、有责任心的数控、机械、模具、机电一体化等方面的人才加入我们的团队,共同组建更专业、更效率、更强大的队伍。

     我们始终以诚信经营、优质服务、完美售后的服务宗旨为广大客户提供海量的参考资料,五年来得到了无数客户的肯定。本工作室所有资料,均已通过检查,均根据大纲要求编写的完完整的设计资料,可以放心选购。

常用文件格式介绍

资料中【.doc】格式的文件为WORD文档

资料中【.dwg】格式的文件为AUTO CAD二维图纸文件

资料中【.prt】格式的文件为UG三维图文件

其余文件请看资料上的备注。

注意事项

1.下载成功后,如遇资料文件打不开,请加QQ29467473联系。

2.下载时请不要使用迅雷软件下载,如若电脑已安装,请先卸载后再进行下载。

3.该资料仅供学习参考使用,下载后切勿直接交稿,需将资料按照学校要求进行修改后再交稿。尤其是需要查重的学校,更要进行修改。

4.题目最前面的【XX001】之类的序号并非课题型号,而系本工作室按照资料收集的顺序进行排序所设置的序号,与课题无关。

XXX
内容简介:
1 一种视频文字字符多方位分割的新方法 摘要: 本文提出了一种多方位视频字符分割的方法的两个阶段。文字从视频文本行的分段,考虑当前工作中的字符分割。文字可以包含隔离或非接触字符,以及感人的字符。因此,字符分割问题可以被视为一个两阶段的问题。在焦虑阶段中,文本群集是识别和孤立 (非接触 ) 字符被分割。方向每个单词的计算和分割路径被找到方向垂直的方向。计算使用顶部的距离 候选人分割点是用来少有之间的分割路径考虑到背景群集的字符。在第二阶段,分割结果的核查和执行检查以确定是否单词组件包含动人的字符或不。组件的平均 宽度是少有的感人的字符组件的习惯。感人的字符的分割,分割点,然后就可以使用平均找到描边宽度信息以及顶部和底部的距离简介。提出的方法在一个大型数据集上进行了测试和被评估的角度精密、召回和 现有方法的比较研究表明所提出的方法的优越性。 1 简介 基于内容的索引和检索的视频变得更加重要,由于多媒体数据库的规模日益扩大。本视频戏剧中的文本视频索引和检索和 视频 文本中的重要作用已分成两组 ,即现场文本(如车辆、商品、建筑物、道路等告示牌上文本)和图形文本或标题文本 (新闻视频体育视频等)。因此这两种类型的文本可以 是极为有益的有效索引和检索的视频。文本信息提取面临的主要挑战视频分辨率低、复杂或者非均匀背景模糊、难提取。虽然文本提取步骤段文本区域,但它仍可能含有相当量的非文本部分,因此阻碍了正确光学字符识 (尽量减少非文本的效果背景极有可能在提高 果。因此,词和字符分割的目的是向改善的实际文本区域通过减少非文本背景。分词实际上划分文本行 /地区成较小的地区 ,这反过来降低了背景噪声与互动。而字符分割成较小地区进一步减少了字组成的单个字符,从而进一步减少非文本部分。分段的字符然后发送到识别的 擎。这一问题 变得更具挑战性的词是在视频中多面向的时候。因此在此文件中,从多面向字符分2 割的新方法视频的话被建议。从多方向和水平中提取出来的词从视频的直线被用于实验。 由凯西和 绍了字符分割技术的全面调查。三个主要途径在调查中提到,即解剖基础、基于识别和整体分割。最近已报告几种技术的视频帧字符分割技术在文献 7 9 8。有人提议梯度矢量流 (于技术的视频字符分割。作者使用的 的候选人和裱的字符分割作为最低的识别成本路径探究问题。输入的图像被考虑作为一个图形位置像素为单位) 被认为是 连接到其相邻像素的顶点。 特流 9用于傅立叶矩特征提取的词和字符从视频文本行。作者依赖该功能所进行的文本在字符边界列高度差小于其他列,但同样可能不是真的在或情况下文本倾斜的斜体。 8更于部分字符,字符也用相同的构想但作者使用 类获得的基于梯度的功能文本集群。 触摸分辨率太差、模糊和背景干扰字符的存在是在字符分割和 视频文本的主要瓶颈。因此,两个阶段的办法提议,其中期,孤立或非接触字符被分割,并随后第二阶段集中的字符分割。灵感来自哪里 7,在报告的工作作为一个最小的成本路径探索的问题 ,制定了字符分割我们建议的指线性分割线 (使用字符分割算法在这两个阶段。在使用的距离 能期估计的候选分割点。距离 能和描边的宽度和字符的平均宽度都习惯确定触摸分割点的候选人。所提出的方法的主要优点是它不只允许曲线的分割路径时但也不会不需要 (如果是多方向和感人的字符)需要任何阈值分类字符的差距。与 7的地方不同成本函数用来指导的分割路径、文本和非文本集群被用作参考线在拟议方法中,这是 算上比便宜成本函数的使用。 在目前的工作中,候选人分割点是发现,而不是试图中存在一个固定的间隔, 7中提出的分割路径。固定向少有的分割路径中 7字符之间的间隔的使用导致更多的虚假阳性结果,从而在创建专用的假阳性的开销消除一步。鉴于所提出的方法在误报很少发生在阶段 剩下的纸被组织,如下所示。拟议的字符分割方法是在一节中详细介绍二三部分介绍的实验结果,比较研究现有的方法和取得的成果,以及失败个案探讨。第四部分结论世界报提供的范围为今后的工作打下基础。 3 2 拟议的字符分割方法 使用建议 4中的文本分割方法分段词从视频文本行检测使用 5。所生成的像是拟议的特性输入之三分割方法。所提出的方法,包括两个阶段的是分两节讨论下面给出。描述为候选人文本群集选择方法在部分国际投资协定。候选分割点的选择和中子描述字符分割技术第 。感人字符的详细的说明分割和假积极消除技术鉴于在分节独立调查委员会。拟议的高级别概述方法是在图 1中所示的流量图表中提出的。 所选的候选人文本群集输入的字图像是有一个非彩色图像均匀的背景噪音。因此,有必要对识别的文本和非文本的像素。为了超过具有非均匀背景差异问题高斯滤 波器被应用删除低频率背景。执行文本 /非文本聚类使用最小 。最小值和最大值灰度值为最小最大聚类计算。一次发现最低 (最大(集 ,文本群集然后是识别。它是普遍认为 ,像素在图像边界附近或外最小值边界框的词属于背景群集。因此,像素小边界属于最小的数目和大边界到最大群集的计算考虑到边境的行和列的单词图像。如果小边界大于大边界,然后最小被考虑作为背景群集别的最大考虑作为背景群集。一旦文本群集发现连接的组件应用分析 (并且非常小的组件删除它们通常代表的背景噪音。的显示样本文本图像 和识别文本集群在图 2 中。这两组用来分割中的字符后面的步骤的方法。 图 2 拟议的字符分割的工艺流程图 阶段 非接触字符分割 :我所提出的方法集中于分割非接触的字符。非文本和集群识别被用作指南向少有分段线性分割字符之间的线。以下是部分的步骤孤立的字符。 4 ( 1)候选分割点的选择:到少有的顺序候选分割点,文字的方向群集是先发制人估计其次的估计顶部的距离轮廓。这个词的方向被计算使用基于 方法 6。为了计算简便起见,有方向小于阈值的词 T 二甘醇(派生根据经验和考虑作 为 15)被认为是为横排否则为多方向。多面向的字正考虑 选人分割点的发现的方向垂直方向词,而不是旋转 像,使它水平。为了避免旋转和其弊端的一个额外操作多面向的词都在他们原始的形式进行处理。在中多面向的单词,边界框的最小的情况是审议和距离 算的方向垂直于其方向。 考虑横向 例,为每个列在 图像中,顶部的距离是之间的距离最顶部的像素和先发制人的文本像素的列中。示例顶部的距离 (a)所示。它可以是见图包含很多本地的山峰,其中一些表示字符之间的明显 差距,因为距离是平等对词的高度。在倾斜或斜体的词它是不可能向少有距离峰值也就等于这个词的高度。在这种情况下的距离小于但有的高度是两个字符之间的高峰。图 2 (c)所示的顶部的距离简介说明非水平和倾斜的词语的应用场景。顶部的一次计算距离简介,本地的山峰如图 2 所示,被发现和被考虑作为候选人分割点。 (2)字符分割:候选分割发现点用来分割字符使用一条明显的线性分割线。所提出的方法是在第十名,由字符的分割问题所在作为一个最小的成本路径探究问题制定。使用成本函数和每个实例在成本计算是昂贵的,因此非文本集群被认为是在拟议的方法 。从候选点,开始方法尝试走向其他边界的词图像使用的非文本 (集。如果的方向这个词是水平的相邻的像素作为底部五大显示在图 2 (b)即像素 p1(x+1,y), p2(x+1,y1), p3(x+1,y+1), p4(x,y1)和 p5(x,y+1)被认为是向少有分段线性线。在案件的前提下的所有像素属于文本群集,而路径被标记为阻止。如果找到一个邻居像素,则属于非文本的群集,则像素将被标记为一个起始像素和更新操作将重复执行。例如,让 Ps(x,y)是属于非文本的起始像素 (集和 Pn(x,y)是属于集的相邻 像素 p3,这也属于非文本群集。让 i,j)将候选分割行向量。 5 图 2 阶段中的字符分割的示例 如果 后 更新与 将添加到i,j+1)=何处 j 是中的一个像素我 样的规则应用于新像素(到对面,重复该过程和这个词的边界到达(标记为成功 )或路径标记为阻止作为路径未能到达在边界对面。对应的 相邻像素到这个词的方向垂直方向是认为多面向的单词。 指使用的一个重要特征线性线是它产生直线分割线而不是曲线 7中提出的路径。在水平的单词这不倾斜, 几乎垂直的而在倾斜或多面向的词,曲线时所需。上述过程应用于所有的候选人分割点,并在相应的成功分割路径以及被阻止的路径都是注意到。 图 3 触摸字符分割数据流程图 6 触摸字符分割 :感应的字符的存在是一个更具有挑战性处理从视频单词字符分割的问题。因此,一种新技术在此建议以分段感应视频帧中的字符。流量图同样是由于在图 3 中。 第一,触摸组件是使用平均识别宽度 (字符。平均宽度发现文本的总数除以宽度的词组件。有宽度的文本组件多个 标记为接触组件和审议感人的字符分割方法。近似数感人字符 (据估计除以通过触摸组件的宽度此,总计预期的分割行数应是 (1。经过仔细检查的感人的组件,它是发现可能存在两个字符之间的感人的部分在字符 边界的任何位置。但的长度感人的部分是通常小于描边宽度的字符。描边宽度使用计算中提出的方法。因此,沿描边宽度用的顶部和底部的距离简介部分感人的字符。 触摸组件的顶部轮廓计算中相同的方式在舞台中讨论。底部轮廓是也计算在一个相似的方式。顶部和底部简介触摸字符样本的图 4 中显示。在这里底部轮廓也是因为接触部件可以在字符边界的任何部分存在。最高从顶部和底部所选峰的数量简介,被考虑作为候选人的触摸字符分割。从一名候选人开始点,在文本群集,可能分割外放找到路径,如下所示: p1(x+1, y), p2(x+1, y1)和 p3(x+1, y+1)通过文本群集单独直到到达一个群集背景像素。请注意在相应的距离才能到达的背景像素 区别。 于 认为是通过文本群集的路径作为触摸组件分割路径。示例同样是在图 4 中所示。 予以取消。下列标准用于假积极消除。 (i) 考虑先发制人分割点的距离左边的界的距离约等于 于几乎相等的距离 先发制人分割点,等等。 (将上述规则应用到的顶部和底部轮廓成功的候选人触摸点。如果这两个顶部和底部轮廓候选人满足条件,考虑顶部作为首要的轮廓候选分割线。 7 (的多触摸的字符,如果顶部和底部候选点部分满足先发制人的标准,然后考虑轮廓候选点的组合。例如 ,如果在一个感人的组件,有三个字符从顶部轮廓先发制人候选人跟随先发制人标准和其他候选人不这样做。而第二名候选点从底部轮廓线就先发制人的规则候选点从顶尖的轮廓,然后它被考虑作为第二的感应分割点。插图图显示了 触摸字符分割技术。 (a)它可以清楚地看出 动人的字符串,因此计算每个距离简介如图表中所示。由于有三个字符中的字符串,需要部分人两个 底部距离轮廓这两个地方最高峰标为红色。中底部轮廓这两个高峰期是在距离近等于W 在相应的山峰顶部轮廓有一个距离大于 W 们之间。在这两个简介先发制人峰是几乎在同一列中和正确的段 P 和 a,但第二高峰在顶部轮廓不会满足这两个 准。因此它是被丢弃。而第二个高峰期在底部轮廓线两个标准和成功部分的 a 和 v。图 4 (b)中的其他示例是触摸的 示例斜斜的分割路径中找到的字符文本群集。通过文本的垂直分割路径群集的顶级 记在暗黄色,并不满足描边宽度的规则。因此中方向斜斜的路径的 行了探讨。该路径的方向 循的描边宽度规则和被视为从顶部的距离轮廓峰值的感人分割路径 ,其中成功分割的 P 和 a。无峰在底部轮廓的图 4 (b) 因而被丢弃。 示例 1 使用垂直路径分割 8 示例 2 使用倾斜的路径分割 图 4 摸第二阶段中的字符 分割的示例 3 实验结果 作者使用了相同的数据集比较的想法为我们实验。数据集组成的 700 字(3527 个字符 ) 被划分了分为四个子集 :英语水平( 200 图像),非英语水平( 100图像),中文水平( 200 图像)和非中国水平( 100 图像)。该数据集包括各种类型的多方向图像,与各种级别的背景噪音。下面讨论的详细的结果。 图 5 示例的一些分割结果 些样品分割结果 9 先发制人列显示了一些原始图像的两个英语和汉语词和第二列显示获得的建议的字符分割的结果方法。它可以 看到,即使焦虑和第四次图像患有模糊和分辨率低,建议方法正确分段的所有字符。而在中第三个图像它错过的 割作为凡以斜体(写时尚的手)书面词所有连接三个字符的感人的部分,近描边宽度相同的字符。的第七届图像是中文和英文的组合字符,与低分辨率和强相互作用与背景。所提出的方法行之有效和分段所有的字符。它可以在看到该示例的图像, 试使用垂直直线部分字符而且它还使用曲线时所需。 割精度和比较研究 作为使用了 )、 )和 )际的 C)、真实 C)和虚假 C)7中详细说明。基于性能的措施7,如下所示 R= C ( 1) P= C) ( 2) F= (2R)/(P+R) ( 3) 我们建议的方法与比较拟议的工作来自 7和8。先发制人两个表中的行和第二显示的性能提出的方法对英语水平和非水平并分别横向和非水平的中文词语。而最后两行显示性能报告 7和 8,分别对相同的数据集。建议方法实现更高的召回率和 f 度量值比 7中所示的两个的结果 8中英文数据集第二阶段。此 议的方法部分有关字符相当好。为达到的精度英语水平数据集是有点小于 7,但是仍可比,因为精度实现对于所有其他数据集是比 7所取得的精度高和 8 模糊和噪声有混乱在估计中的接触部分对于一些图像(请参阅图 6)在第二阶段。这导致的召回率下降阶段 英语水平和非水平数据集。中国水平数据集上的性能报告表二显示了较高的精度和 f 措施是实现。而回收的比率是相 同 7通过实现。两中国人为实现更高的精度水平和非水平数据集显示, 文非水平数据集字符之间的间距可能有时不是统一作为英语和单个组件有很多的子组件。因此,该算法获取相混淆导致较
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
提示  人人文库网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:【FY261】一种视频文字字符多方位分割的新方法【PDF+WORD】【中文6100字】
链接地址:https://www.renrendoc.com/p-826918.html

官方联系方式

2:不支持迅雷下载,请使用浏览器下载   
3:不支持QQ浏览器下载,请用其他浏览器   
4:下载后的文档和图纸-无水印   
5:文档经过压缩,下载后原文更清晰   
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

网站客服QQ:2881952447     

copyright@ 2020-2025  renrendoc.com 人人文库版权所有   联系电话:400-852-1180

备案号:蜀ICP备2022000484号-2       经营许可证: 川B2-20220663       公网安备川公网安备: 51019002004831号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知人人文库网,我们立即给予删除!