现代汉字的信息处理了解汉字信息处.ppt_第1页
现代汉字的信息处理了解汉字信息处.ppt_第2页
现代汉字的信息处理了解汉字信息处.ppt_第3页
现代汉字的信息处理了解汉字信息处.ppt_第4页
现代汉字的信息处理了解汉字信息处.ppt_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,第七节 现代汉字的信息处理 学习要点 1.了解汉字信息处理的输入方式、汉字键盘输入的方法、几类汉字编码的优缺点。 2.熟悉汉字处理对汉字规范化的要求。,一、信息处理 语言信息处理:用计算机对自然语言的音形义等信息进行处理。 汉字信息处理:利用计算机对汉字符号系统进行处理的一项科学技术。是中文信息处理的关键和基础部分。 汉字信息处理的过程:汉字的信息输入、汉字的信息处理、汉字信息的输出。,二、汉字的信息输入 三种方式:键盘输入、字形识别输入、语音识别输入。 (一)汉字的键盘输入 1.整字输入(一字一键) 2.编码输入(一字一码)编码方案逾500种,实现的近百种,推入市场的有几十种,较成功的有十几种。 编码方法:音码、形码、音形码结合。,二、汉字的信息输入 (1)音码 全拼法:每个字母都要击键。 双拼法:声母、韵母分配给每个键。一般一个汉字击键2次,最多4次。例如: 双(shuangud)拼(pinpn)法(fafa),智能拼音法,(2)形码 将汉字形体分解为若干字元(笔画、部件、偏旁、部首),进行编码。 笔形编码:李金铠八笔编码。 部件编码:王永明五笔字型码。,部首编码:王安的三角编码。 四角编码:王云五的四角编码。,(3)音形结合码 字形为主字音为辅 字音为主字形为辅,(4)汉字编码的标准化 GB码: 是国标编码。就是中华人民共和国信息交换汉字编码标准(GB231280),在此标准中制定了每一个汉字及非汉字符号的编码。 B1G5码: 大5码:繁体字符编码。,3.汉语拼音输入法的优越性 (1)不需要编码规则。 (2)体现以词为单位的特点 (3)输入与思维同步进行 (4)有利于学习普通话和汉语拼音 (5)有利于国际间的交流,4.汉字编码字符集 (1)根据汉字位置编制地址码,方便信息处理。 两个字节:区+位 如GB码规定将汉字字符分为87个区,每个区有94个汉字(94位),因此共制定了87x948178个汉字、字符。 如中国的“中”字位于54区48位。 (2)国家标准字符集 国际码 大五码 强制性国际标准 国际标准字符集,(二)汉字的字型识别输入 图形匹配法 结构分析法 输入:印刷体 手写体 (三)汉字的语音识别输入 语音传输、语音分析(语音规则、语义规则、语法规则)转换为汉字,二、汉字信息的处理 拼音文字 输入码输出码 不用交换 汉字输入 输入码输出码 需要交换 国家标准: 1981年国家标准局公布的信息交换用汉字编码字符集基本集(GB2312-80) 通用汉字6763个,字符682,三、汉字信息的输出 汉字信息输入:将汉字的外部编码转换成可供计算机处理系统识别的内部编码。 汉字信息输出:将汉字的内部编码还原为外部

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论