甲骨文字形动态描述库及其字形生成技术研究_第1页
甲骨文字形动态描述库及其字形生成技术研究_第2页
甲骨文字形动态描述库及其字形生成技术研究_第3页
甲骨文字形动态描述库及其字形生成技术研究_第4页
甲骨文字形动态描述库及其字形生成技术研究_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、甲骨文字形动态描述库及其字甲骨文字形动态描述库及其字形生成技术研究形生成技术研究2012.11.4安阳师范学院安阳师范学院栗青生 甲骨文数字化工作简介甲骨文缀合甲骨文缀合图像处理图像处理 (中美联合智能信息处理实验室)(中美联合智能信息处理实验室)甲骨文编码甲骨文编码字形描述库字形描述库 (数字化甲骨文工程(数字化甲骨文工程 技术研究中心)技术研究中心)甲骨文考释甲骨文考释图文资料库图文资料库 (中文信息处理实验室)(中文信息处理实验室) 甲骨文数字化工作简介主要内容1、甲骨文数字化问题2、甲骨文字形动态描述库3、字形生成技术4、应用展望1、甲骨文数字化问题甲骨文数字化问题 多年来,在甲骨文数

2、字化过程多年来,在甲骨文数字化过程中,一直存在两个难以解决的中,一直存在两个难以解决的问题:一是甲骨文难以定形,问题:一是甲骨文难以定形,即甲骨文不像现代汉字,很难即甲骨文不像现代汉字,很难确定每一个甲骨文字的字形结确定每一个甲骨文字的字形结构和类型;二是甲骨文字难以构和类型;二是甲骨文字难以输入计算机输入计算机 。 由于过度由于过度“规范化规范化”,其中很,其中很多字形已经脱离了原始字形所多字形已经脱离了原始字形所表达的意义,有的还存在着部表达的意义,有的还存在着部件结构和位置的错误件结构和位置的错误 2、甲骨文字形动态描述库例如:甲骨文合集中的第例如:甲骨文合集中的第29529和和2766

3、7片,如果片,如果不利用拼合区的两个残字来缀合,很难说明这两片不利用拼合区的两个残字来缀合,很难说明这两片原来是在一起的。原来是在一起的。举举 例例3、利用汉字字形描述库进行残字缀合和识别字形描述库的由来 源于对我国古代文化的深入研究。三千多年前,商朝人就知道借助动物的骨头(龟甲)来计算(占卜)未来,到了周朝,演绎出了举世闻名的“易经”。 龟甲本身不能计算未来,但通过人工在甲骨上进行凿洞和灼烧的方法使龟甲产生不同的纹理,可以判断未来的天气状况,我外星人的数学悖论惊人相似。 数学悖论:悖论的故事说,外星人可以只在铁棍上划一道痕,就可以记录全人类的知识信息怎么做到的呢?理论上可以用【无理数】来进行

4、无限的数据存储。 划痕的长度比例是一个无理数:0.21873619876538173591873561835由于无理数的小数点后数位容量是无限的,故可以用于编码存储无限量的信息。关于字形描述库 字形描述库是根据文字计算的需求,按照文字的表征特性,对文字特征进行可行性编辑和编码后形成的新的数据表,从而依据新的数据表对字形进行一系列计算的过程。 目前,我们已经建立了甲骨文字形动态描述库、小篆字形动态描述库和部分现代汉字的动态描述库和汉字字库的区别(以甲骨文为例) 甲骨文拓片字库制作系统字库字库编码方案字形采集轮廓轮廓提取提取字形编辑 字模生成 文字编码字形字形输入输入甲骨文拓片特征提取算法字形采集

5、骨架骨架抽取抽取ddljcr字库特征库特征库字形字形生生成成 字库的形成及使用 字形描述库的形成及使用 甲骨文字形动态描述库 是我们最早建立的动态描述库 使用这一描述库我们开发了甲骨文图文编辑系统,开发了甲骨文特征输入方法,并生成了刀体甲骨文,软件笔体甲骨文和曲线体甲骨文等数十种字形,三体甲骨文三体甲骨文 刀体 软笔体 曲线体 甲骨文字形描述库的建立汉字字形描述库的建立规则:汉字字形描述库的建立规则: (1)汉字描述库由汉字向量组成。 (2)库中的每一个字向量由点集和关系组成,其中:字、点集和关系的表达式是: 字:= 其中: p(i)表示特征点元向量集,汉字笔画的起始、交叉、拐点等都可以成为特

6、征点元向量 q表示特征点元向量集之间的关系,特征点关系有两种,一是包含(b),二是连接(j)。 笔段笔段:当且仅当p(i)非空,且特征点元向量之间是包含特征点元向量之间是包含关系关系. 笔元笔元:当且仅当p(i)非空,且特征点元向量之间是连接特征点元向量之间是连接关系。特别地,关系。特别地,i=2时时 笔元是特殊笔元,称孤立笔元。笔元是特殊笔元,称孤立笔元。举 例如图所示的前两个笔元 第一个笔元:特征点元向量集为 p1,p2 ,p3,p4,p5, b,有四个笔段。 第二个笔元:特征点元向量集为p6, p7, p8, p9, p10, b有四个笔段。 p1p2p3p4p5p6p7p8p9p10笔元的逆向工程笔元的逆向工程笔画的再生笔画的再生 由笔画抽象成笔元从而生成的字形描述库,在应由笔画抽象成笔元从而生成的字形描述库,在应用过程中可以通过笔画的再生动态生成汉字库、用过程中可以通过笔画的再生动态生成汉字库、错字库和其它字形库。错字库和其它字形库。 甲骨文笔元的再生过程示意图甲骨文笔元的再生过程示意图4、应用展望使用字形描述库对甲骨文字进行建模从而实现甲骨文字形的缀合字形动态描述残字特征分析、特征匹配、分类、识别输出残字字形建模系统应用一: 甲骨文字形查询系统 输入残字的特征

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论