《汉字点阵字库的建立与提取》技术指导书.doc

收藏

预览图
编号:40946357    类型:共享资源    大小:68KB    格式:DOC    上传时间:2020-01-06 上传人:带**** IP属地:江西
15
积分
关 键 词:
汉字点阵字库的建立与提取 汉字 点阵 字库 建立 提取 技术 指导书
资源描述:
《汉字点阵字库的建立与提取》 技术指导书 基本知识: 1、汉字输出码 1、 汉字无论字形如何变化、笔划多少都可以写在方块中 2、 一个方块可以看作m行n列的矩阵,称为点阵,汉字的点阵字形在计算机中称为字模 3、 汉字经过点阵的数字化转换成数字,称为汉字的输出码 4、 一个字节有8bit,m*n点阵的阵列可以用m*n/8个字节表示 5、 存储空间根据选择点阵的不同而不同,点阵的行列数越多汉字越精细,但存储空间越多 2、GB2312编码 1、GB2312是一个简体中文字符集的中国国家标准,由中国国家标准总局发布,1981年5月1日实施。 GB 2312通行于大陆、新加坡等地。几乎所有的中文系统和国际化的软件都支持GB 2312。 它是一个简化字的编码规范,当然也包括其他的符号、字母、日文假名等,共7445个图形字符,其中汉字占6763个。我们平时说6768个汉字,实际上里边有5个编码为空白,所以总共有6763个汉字 2、 GB2312规定“对任意一个图形字符都采用两个字节表示,每个字节均采用七位编码表示”,习惯上称第一个字节为“高字节”,第二个字节为“低字节”。 3、 GB2312将代码表分为94个区 ,对应第一字节 ;每个区94个位,对应第二字节。 4、 GB2312字符集构成一个94行、94列的二维表,行号称为区号,列号称为位号,每一个汉字或符号在码表中的位置用它所在的区号和位号来表示。 5、 为了处理与存储的方便,每个汉字的区号和位号在计算机内部分别用一个字节来表示。例如,“学”字的区号为49,位号为07,它的区位码即为4907,用2个字节的二进制数表示为: 00110001 00000111 用十六进制数表示即为3107H 6、 区位码无法用于汉字通信,因为它可能与通信使用的控制码(00H~1FH)(即0~31)发生冲突。ISO2022规定每个汉字的区号和位号必须分别加上32(即二进制数00100000),经过这样的处理而得的代码称为国标交换码,简称交换码,因此,“学”字的国标交换码计算为: 00110001 00000111 +00100000 +00100000 ------------------------------- 01010001 00100111 用十六进制数表示即为5127H 7、 由于文本中通常混合使用汉字和西文字符,汉字信息如果不予以特别标识,就会与单字节的ASCII码混淆。此问题的解决方法之一是将一个汉字看成是两个扩展ASCII码,使表示GB2312汉字的两个字节的最高位都为1。这种高位为1的双字节汉字编码即为GB2312汉字的机内码,简称为内码。 因此,“学”字的机内码为: 11010001 10100111 用16进制表示即为D1A7H 3、汉字点阵编码定位公式 (C1-0xa1)*94 + (C2-0xa1) ,其中C1为机内码高位字节,C2为机内码低位字节 4、常用函数 6、 字体创建函数CreateFont 7、 字符显示函数TextOut 8、 屏幕行扫描函数GetPixel 三、设计要求 1、尽量使用C语言,源程序要有适当的注释,使程序容易阅读; 2、要有用户界面。要求至少采用文本菜单界面;鼓励采用图形菜单界面; 3、使用文件保存数据; 基本参考模版: 通过本课程设计,巩固C语言软件编程能力,熟悉掌握C语言开发工具,了解软件任务项目的开发过程。本课程要求设计一个转换工具,能够把WINDOWS中的多种汉字矢量字库(宋体,楷体,黑体等)转换成方块点阵字库。 一. 课程内容 1、 程序必须可以方便的选择不同的WINDOWS矢量字库; 2、 文件生成的方块点阵字库必须以二进制的文件格式进行存储; 3、 目标文件按照GB 2312格式存储; 4、 文件生成的不同尺寸(16, 20,24,32,48)大小的目标方块点阵必须能够通过程序进行来选择; 5、 程序可以调整生成的汉字字库的汉字字数; 6、 程序在字模转换提取的过程必须能同时显示同一个字的矢量字模与点阵字模的效果; 7、 程序必须显示版本内容,包括论文作者、学号及编译日期 8、 鼓励自行增加新功能,比如增加文本输入,点阵字模放大处理等等; 三.设计要求 1、尽量使用C语言,源程序要有适当的注释,使程序容易阅读; 2、要有用户界面。要求至少采用文本菜单界面;鼓励采用图形菜单界面; 3、使用文件保存数据; 4、写实验报告(要求正规打印,A4幅面),内容包括: l 题目 l 系统功能模块结构图 l 数据结构设计及用法说明 l 程序结构(画流程图) l 各模块的功能 l 体会 l 参考文献 l 附录:程序清单及源程序软盘 5、凡发现抄袭,抄袭者与被抄袭者皆以零分计入本课程设计成绩并向学院报告。凡发现实验报告或源程序雷同,涉及的全部人员皆以零分计入本课程设计成绩并向学院报告。 四.参考书目 • 《C语言程序设计》谭浩强等编,清华大学出版社 • 《C程序设计上机指导》谭浩强主编,清华大学出版社 • 《C语言贯通教程》,史斌星,清华大学出版社 • 《软件课程设计》指导书,自编实验手册 • 《Turbo C 使用大全》第一册、第二册 徐金梧等编译 • GB 2312编码规则 五、时间安排 分三个阶段检查: 1、前期:交电子档的实验报告,说明任务完成的各项情况与问题及其解决的办法; 2、前期:交电子档的实验报告,交中期的程序代码; 3、终期:交电子档的实验报告,交电子档的程序源代码。 终期结束时,抽查部分同学进行面试检查,检查内容仅限课程设计的内容要求。 六.评分 1、两次中期报告及检查(50%); 2、终期报告(10%); 3、程序符合所有功能要求(40%); 4、独立与创新性(15%)
内容简介:
-
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
提示  人人文库网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:《汉字点阵字库的建立与提取》技术指导书.doc
链接地址:https://www.renrendoc.com/p-40946357.html

官方联系方式

2:不支持迅雷下载,请使用浏览器下载   
3:不支持QQ浏览器下载,请用其他浏览器   
4:下载后的文档和图纸-无水印   
5:文档经过压缩,下载后原文更清晰   
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

网站客服QQ:2881952447     

copyright@ 2020-2025  renrendoc.com 人人文库版权所有   联系电话:400-852-1180

备案号:蜀ICP备2022000484号-2       经营许可证: 川B2-20220663       公网安备川公网安备: 51019002004831号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知人人文库网,我们立即给予删除!