联机藏文手写识别概述ppt课件_第1页
联机藏文手写识别概述ppt课件_第2页
联机藏文手写识别概述ppt课件_第3页
联机藏文手写识别概述ppt课件_第4页
联机藏文手写识别概述ppt课件_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、n预备任务n手写识别过程n联机藏文手写识别的预处置n联机藏文手写识别特征提取n聚类n实验方法和结果n藏文文字的组成n藏文的字符集编码规范nGB/T 16959-2019nGB/T 20542-2019字母字丁字符音节词句子n藏文字丁的书写特点n根本处置单元的选择n藏文文字的构造特点n相关国家规范n识别编码范围n和在内的910多个字丁,剔出掉了不常用的梵文字符n联机藏文手写识别的研讨根底n参考构造文字的联机特征提取方案还是拼音文字的联机特征提取方案?n藏文识别相对于汉字识别的特点n宽高比1:2n笔画方向性n圈、弧状构造n藏文手写识别难点n易混淆字过多n印刷体类似字n手写体类似字n识别根本流程n预

2、处置了n对手写输入的字符在字形上进展修正,减少同类字符输入样本间字形上的变异。是保证特征提取和识别算法的有效性的前提。n特征提取n根据经过预处置后的联机手写字符,提取出相对于位移、大小、旋转、变形等具有不变形的方式特征。 预处置特征提取分割分类后处置语料库wordn预处置主要操作n线性归一化,减少字符大小的变异。n参与虚拟点,使字的每个笔画的点密度一样。n非线性归一化,减少笔划外形的变异笔画太长、太短,笔画太集中等。n重采样,减少点的间距的变异以及笔划上点的数目的变异。n点的平滑,去除笔画上的噪点。n线性归一化操作的选取n公式及宽高比确定n进一步改良, , 0,0yxyxHWrrhwyy rx

3、x rxWyH12, , if 4, , if 1, , else, 0,0yxyxyxyxyxHhrrrhwWwrrrwhHWrrhwyy rxx rxWyHn非线性归一化方案的选取n基于线密度n基于交叉间隔n基于点密度方案1:“初始方案,运用基于点密度的非线性归一化操作;方案2:基于线密度的非线性归一化操作。方案3:基于基交叉间隔的线密度非线性归一化操作。方案4:改良后的基于点密度的非线性归一化操作。n对基于点密度的非线性归一化方案的改良n笔画断裂、笔画间不延续的缘由n直方图投影变化猛烈n处理方案n笔画等间隔采样和平滑n根本作用都是为了消除噪音。n运用在非线性归一化操作之后,除了能消除手写

4、字符本身由于抖动带来的噪音以外,还可以消除由于预处置阶段中前续处置带来的附加噪音。n等间隔采样 平滑NewOld1111, 1iW, 1j 2时:添加了大差别的影响力而减弱了小差别的影响力。n实验结果n欧氏间隔:96.0646%。n不计算平方根:96.0992%,有微小提高。n指数 = 1:90.3861%,识别率迅速下降,阐明减小大差别的影响不利于识别效果。n指数 = 3:96.8843%,比欧氏间隔提高了0.8个百分点。 2221212121122kkdaaaaaanHard Clusteringn每个方式只能属于一个类nFuzzy Clusteringn每个方式可以属于多个类n由Hard

5、 Clustering改为Fuzzy Clustering,识别率由97.146%提高到97.2151%。n实验数据n运用自建的藏文手写字库。n用的样本集是编码在0 xF3000 xF3FF之间的256个字符,每个字符平均包含80套样本,共20259个联机藏文手写样本数据。n分类学习方法n聚类:模糊的K均分n间隔测度:改良的欧氏间隔n实验结果nTop-N结果候选集是指与测试集中的字丁最类似的前N个字丁。n开放测试中,训练集中包含15094个字,测试集包含5165个字。99.9951%1202581099.9654%720252599.5409%9320196297.2111%565196941识别率识别率错误字数错误字数正确字数正确字数Top-N98.819%6151042097.6379%12250431094.5402%2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论