字符编码简介.ppt_第1页
字符编码简介.ppt_第2页
字符编码简介.ppt_第3页
字符编码简介.ppt_第4页
字符编码简介.ppt_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

字符编码简介 1 BCD码 仅针对数字进行编码 2 ASCII码 最原始的编码方式 针对英语字符及数字的编码也是计算机最初设计使用编码表 3 GB2313 为适用中文所制作 使用两个字节表示 4 GBK 在GB2313的基础上扩容制作 5 GB18030 在GBK基础上扩容制作 6 BIG 5 普遍使用于台湾 香港等地 7 unicode 又称万国码 收录了几乎世界上所有语言字符 满足跨语言跨平台文本转换 一 BCD码 BCD码 Binary CodedDecimal 亦称二进码十进数或二 十进制代码 用4位二进制数来表示1位十进制数中的0 9这10个数码 是一种二进制的数字编码形式 用二进制编码的十进制代码 BCD码这种编码形式利用了四个位元来储存一个十进制的数码 使二进制和十进制之间的转换得以快捷的进行 BCD码可分为有权码和无权码两类 有权BCD码有8421码 2421码 5421码 其中8421码是最常用的 无权BCD码有余3码等 8421码 5421码 2421码 余3码 余3循环码之间的区别 特点 8421编码直观 好理解 5421码和2421码中大于5的数字都是高位为1 5以下的高位为0 余3码是8421码加上3 有上溢出和下溢出的空间 格雷码相邻2个数有三位相同 只有一位不同 BCD码运算法则 BCD码是十进制数 而运算器对数据做加减运算时 都是按二进制运算规则进行处理的 当将BCD码传送给运算器进行运算时 其结果需要修正 修正的规则是 当两个BCD码相加 如果和等于或小于1001 即十进制数9 不需要修正 如果相加之和在1010到1111 即十六进制数0AH 0FH 之间 则需加6进行修正 如果相加时 本位产生了进位 也需加6进行修正 这样做的原因是 机器按二进制相加 所以4位二进制数相加时 是按 逢十六进一 的原则进行运算的 而实质上是2个十进制数相加 应该按 逢十进一 的原则相加 16与10相差6 所以当和超过9或有进位时 都要加6进行修正 例 计算5 8 解 1 将5和8以8421BCD输入机器 则运算如下 0101 10001101结果大于9 0110加6修正10011即13的BCD码结果是0011 即十进制数3 还产生了进位 5 8 13 结论正确 ASCII码 ASCII AmericanStandardCodeforInformationInterchange 美国标准信息交换代码 是基于拉丁字母的一套电脑编码系统 主要用于显示现代英语和其他西欧语言 ASCII码出现背景 在计算机中 所有的数据在存储和运算时都要使用二进制数表示 因为计算机用高电平和低电平分别表示1和0 例如 像a b c d这样的52个字母 包括大写 以及0 1等数字还有一些常用的符号 例如 等 在计算机中存储时也要使用二进制数来表示 而具体用哪些二进制数字表示哪个符号 当然每个人都可以约定自己的一套 这就叫编码 而大家如果要想互相通信而不造成混乱 那么大家就必须使用相同的编码规则 于是美国有关的标准化组织就出台了ASCII编码 统一规定了上述常用符号用哪些二进制数来表示 表述方式 ASCII码使用指定的7位或8位二进制数组合来表示128或256种可能的字符 标准ASCII码也叫基础ASCII码 使用7位二进制数来表示所有的大写和小写字母 数字0到9 标点符号 以及在美式英语中使用的特殊控制字符 0 31及127 共33个 是控制字符或通信专用字符 其余为可显示字符 如控制符 LF 换行 CR 回车 FF 换页 DEL 删除 BS 退格 BEL 响铃 等 通信专用字符 SOH 文头 EOT 文尾 ACK 确认 等 ASCII值为8 9 10和13分别转换为退格 制表 换行和回车字符 它们并没有特定的图形显示 但会依不同的应用程序 而对文本显示有不同的影响 32 126 共95个 是字符 32是空格 其中48 57为0到9十个阿拉伯数字 65 90为26个大写英文字母 97 122号为26个小写英文字母 其余为一些标点符号 运算符号等 GB2313码 GB2313字符集 收入汉字6763个 符号715个 总计7478个字符 这是大陆普遍使用的简体字符集 楷体 GB2313 仿宋 GB2313 华文行楷等市面上绝大多数字体支持显示这个字符集 亦是大多数输入法所采用的字符集 GIB 5码 又称为大五码或者五大码 是通行于台湾 香港地区的一个繁体字编码方案 地区标准号为 CNS11643收入1306个繁体汉字 808个符号 共计13868个字符 GBK码 在GB2323的基础上扩容 其内码空间为0 x8140 0 xFEFE 去除第二字节的0 x7F 192个码位 总共23940个码位 它收录了GB13000 1 1993的全部20902个CJK统一汉字 包括GB2312的全部6763个汉字 此外 它增补编码了52个汉字 13个汉字结构符 在ISO IEC10646 1 2000中称为表意文字描述符 和一些常用部首与汉字部件 在GBK的内码系统中 GB2312汉字所在码位保持不便 这样 保证了GBK对GB2312的完全兼容 同时 GBK内码与GB13000 1代码一一对应 为GBK向GB13000 1的转换提供了解决办法 GB18030码 我国继GB2312 1980和GB13000 1 1993之后最重要的汉字编码标准 是我国计算机系统必须遵循的基础性标准之一 GB18030有两个版本 GB18030 2000和GB18030 2005 GB18030 2000是GBK的取代版本 它的主要特点是在GBK基础上增加了CJK统一汉字扩充A的汉字 GB18030 2005的主要特点是在GB18030 2000基础上增加了CJK统一汉字扩充B的汉字 unicode码 Unicode码扩展自ASCII字元集Unicode 统一码 万国码 单一码 是一种在计算机上使用的字符编码 Unicode是为了解决传统的字符编码方案的局限而产生的 它为每种语言中的每个字符设定了统一并且唯一的二进制编码 以满足跨语言 跨平台进行文本转换 处理的要求 1990年开始研发 1994年正式公布 编码实现 Unicode是国际组织制

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论