汉字编码(10.29)ppt课件_第1页
汉字编码(10.29)ppt课件_第2页
汉字编码(10.29)ppt课件_第3页
汉字编码(10.29)ppt课件_第4页
汉字编码(10.29)ppt课件_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

汉字编码,小组:李冠禧李奕伯,何为汉字编码?,汉字编码(Chinesecharacterencoding)为汉字设计的一种便于输入计算机的代码。,目前汉字输入的途径?,机器自动识别汉字(难度大)通过语音识别输入(难度大)通过汉字编码输入(比较现实),为何难汉字编码实现困难?,数量庞大;字形复杂;存在大量一音多字和一字多音的现象。,汉字编码的分类(计算机中汉字的表示也是用二进制编码),外码(输入码)交换码(国标码)内码汉字的字形码,根据应用目的的不同分类,外码(输入码):将汉字输入到计算机中的一组键盘符号;交换码(国标码):计算机内部处理的信息,都是用二进制代码表示的,汉字也不例外。而二进制代码使用起来是不方便的,于是需要采用信息交换码。内码:根据国标码的规定,每一个汉字都有了确定的二进制代码,在微机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码。汉字的字形码:字形码是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。通常用1616点阵来显示汉字。,内码?,内码就是汉字在计算机上存储时的编码,比如我们写一个文本文件,内容为节日快乐,用16进制编辑器打开它,其内容为BDDAC8D5BFECC0D6这里的bdda就是第一个汉字节的内码,点阵代码,内码举例,标0的位置涂黑(背景色),标1的位置涂白(前景色),汉字编码的标准,1981年,国家标准局公布了汉字标准交换码,共分两级,一级3755个字,二级3008个字,共6763个字。这种汉字标准交换码是计算机的内部码,可以为各种输入输出设备的设计提供统一的标准,使各种系统之间的信息交换有共同一致性,从而使信息资源的共享得以保证。,编码的输入方式,一)整字输入法二)字形分解法三)字形为主、字音为辅的编码法四)全拼音输入法五)拼音为主、字形为辅的编码法,汉字编码的双轨迹?,汉字信息处理领域中,音码和形码的并存并用,同样是一种双轨制,即汉字和汉语拼音文字并存并用。,优点:会普通话的人可按音输入,方音重的人可按形输入。(互补),汉字编码字符集,注:字符集(Characterset)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集例:GB2312-80字符集,中文名国家标准字符集(GB=GuBio国标)。收入汉字6763个,符号715个,总计7478个字符,这是大陆普遍使用的简体字字符集。Big-5字符集,中文名大五码,是台湾繁体字的字符集,收入13060个繁体汉字,808个符号,总计13868个字符

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论