构建GB2312汉字库的unicode码表.doc_第1页
构建GB2312汉字库的unicode码表.doc_第2页
构建GB2312汉字库的unicode码表.doc_第3页
构建GB2312汉字库的unicode码表.doc_第4页
构建GB2312汉字库的unicode码表.doc_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

构建 GB2312 汉字库的 unicode 码表作者:乾坤一笑下载源代码构建 GB2312 汉字库的 unicode 码表嵌入式系统总离不了处理汉字。一般汉字的处理方法是(以手机接受短信为例):比如你收到了一封短信,该短信解码后是按照 UTF-16 表示的,那么我们需要根据每一个汉字的unicode 码找到它在 GB2312 库中的位置,然后再用对应的点阵数据在屏幕上显示出来。于是乎,必须有一种手段将 unicode 码和汉字字模的数据对应起来。最常用的手段是做一个 unicode 码表,在该数组中查找到匹配的 unicode 码后,用匹配的 index(数组索引)值在另外一个由该 index 值对应的字模记录的数组中的数据去显示。+-+ 查表 +-+ 同index +-+| 汉字的unicode码 | = | unicode码表数组 | = | 汉字字模数据数组 | = 显示输出+-+ +-+ +-+本文简要介绍一下如何生成 unicode 码表,其它相关的汉字处理技术不在本文的讨论范围之内。:)用下面两个函数可以把 unicode 码表构造出来(*注1): void UnicodeToGB2312(unsigned char* pOut,unsigned short uData) WideCharToMultiByte(CP_ACP,NULL,&uData,1,pOut,sizeof(unsigned short),NULL,NULL); return; void Gb2312ToUnicode(unsigned short* pOut,unsigned char *gbBuffer) MultiByteToWideChar(CP_ACP,MB_PRECOMPOSED,gbBuffer,2,pOut,1); return;一个简单的例子如下(随手写的一段代码,只是演示一下构造数组的过程,不要挑刺儿啊! _ ): /*-*| GB2312 unicode table constructor | author: Spark Song | file : build_uni_table.c | date : 2005-11-18 |*-*/#include #include void UnicodeToGB2312(unsigned char* pOut,unsigned short uData);void Gb2312ToUnicode(unsigned short* pOut,unsigned char *gbBuffer);void construct_unicode_table();int main(int argc, char *argv)construct_unicode_table();return 0;void construct_unicode_table() #define GB2312_MATRIX (94) #define DELTA (0xA0) #define FONT_ROW_BEGIN (16 + DELTA) #define FONT_ROW_END (87 + DELTA) #define FONT_COL_BEGIN (1 + DELTA) #define FONT_COL_END (GB2312_MATRIX + DELTA) #define FONT_TOTAL (72 * GB2312_MATRIX) int i, j; unsigned char chr2; unsigned short uni; unsigned short dataFONT_TOTAL = 0; int index = 0; unsigned short buf; /生成unicode码表 for (i=FONT_ROW_BEGIN; i=FONT_ROW_END; i+) for(j=FONT_COL_BEGIN; j=FONT_COL_END; j+) chr0 = i; chr1 = j; Gb2312ToUnicode(&uni, chr); dataindex = uni; index+; /排个序,以后检索的时候就可以用binary-search了 for (i=0;iindex-1; i+) for(j=i+1; jdataj) buf = datai; datai = dataj; dataj = buf; /输出到STD_OUT printf(const unsigned short uni_table=n); for (i=0; i Row:%.2d Col:%.2d */n, uni, i=index-1? :, chr0, chr1, chr0 - DELTA, chr1 - DELTA ); printf(;n); return ;void UnicodeToGB2312(unsigned char* pOut,unsigned short uData) WideCharToMultiByte(CP_ACP,NULL,&uData,1,pOut,sizeof(unsigned short),NULL,NULL); return; void Gb2312ToUnicode(unsigned short* pOut,unsigned char *gbBuffer) MultiByteToWideChar(CP_ACP,MB_PRECOMPOSED,gbBuffer,2,pOut,1); return; 用 VC 编译后,在 DOS 中执行:build_uni_table.exe report.txt可以得到如下的txt文件: const unsigned short uni_table= 0x4E00, /* GB2312 Code: 0xD2BB = Row:50 Col:27 */ 0x4E01, /* GB2312 Code: 0xB6A1 = Row:22 Col:01 */ 0x4E03, /* GB2312 Code: 0xC6DF = Row:38 Col:63 */ 0x4E07, /* GB2312 Code: 0xCDF2 = Row:45 Col:82 */. . 0x9F9F, /* GB2312 Code: 0xB9EA = Row:25 Col:74 */ 0x9FA0, /* GB2312 Code: 0xD9DF = Row:57 Col:63 */ 0xE810, /* GB2312 Code: 0xD7FA = Row:55 Col:90 */ 0xE811, /* GB2312 Code: 0xD7FB = Row:55 Col:91 */ 0xE812, /* GB2312 Code: 0xD7FC = Row:55 Col:92 */ 0xE813, /* GB2312 Code: 0xD7FD = Row:55 Col:93 */ 0xE814 /* GB2312 Code: 0xD7FE = Row:55 Col:94 */;然后把这个生成的数组copy到项目代码

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论