第2章信息编码技术概述_第1页
第2章信息编码技术概述_第2页
第2章信息编码技术概述_第3页
第2章信息编码技术概述_第4页
第2章信息编码技术概述_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第2章章 信息编码技术概述信息编码技术概述本章主要内容本章主要内容p 进制及其相互转换p 信息单位及信息编码2.1 进制及其相互转换进制及其相互转换42.1 2.1 进制及其相互转换进制及其相互转换 数值 十二进制转换 西文 ASCII 码 汉字 输入码机内码转换 声音、图像 模数转换 二十进制转换 西文字形码 汉字字形码 数模转换 内存 输入设备 输出设备 数值 西文 汉字 声音、图像 o 计算机内部所有的数据都采用二进制编码。 原因:容易实现,运算规则简单。52.1.1 2.1.1 进进制的概念制的概念 如果用如果用R个基本符号(例如个基本符号(例如0,1,2,r- -1)来表示数目,则

2、称)来表示数目,则称其为其为R R进制。进制。R R称为该数制的称为该数制的基数基数,R Ri i称为权。称为权。67834 6 107 108 103 104 1021012. 基数权数码6进制规则基数数符权二进制逢2进120,12i八进制逢8进180,1,2,3,4,5,6,78i十进制逢10进1100,1,2,3,4,5,6,7,8,910i十六进制逢16进1160,1,9,A,B,C,D,E,F16i常见进制特点对比常见进制特点对比7十进制二进制八进制十六进制0000112231133445101556110667111771089100111910101012A15111117F16

3、2010常见进制数的对比常见进制数的对比练习练习:利用:利用8421法则,法则,求与二进制数11011101、11101110、10111011相等的十进制数?82.1.2 2.1.2 进制的相互转换进制的相互转换进制表示符号进制表示符号B 二进制二进制O 八进制八进制D 十进制十进制H 十六进制十六进制1. r 进制转化成十进制方法:各位按权展开相加。例:10101B B=24+22+1=21D D101.11B B=22+1+2-1+2-2=5.75D D101O O=82+1=65D D71O O=78+1=57D D101AH H=163+16+104122D D练习:练习:求与二进制

4、数110110.101110110.101相等的十进制数?9100D=144O=64H例例 100.345D=1100100.01011B2 1.040.690 0.7601.3800.3452 2 21.520 2 八进制八进制100408128184101001664616十六进制十六进制1002502252122623210001001122. 十进制转化成 r 进制n整数部分:连续除以基数 r倒取余数,直到商为0为止。n小数部分:连续乘以基数 r顺取整数,直到积为整数为止。2.1.2 2.1.2 进进制的相互转换制的相互转换练习:练习:求与十进制数52.7552.75相等的二进制数、八

5、进制数、十六进制数?102.1.2 2.1.2 进进制的相互转换制的相互转换3. 八进制、十六进制转化成二进制数n一位八进制数对应三位三位二进制数,不足添064H=0110 0100B 6 4144O=001 100 100B 1 4 4001 101 101 110.110 101B= 1556.65O 1 5 5 6 6 50011 0110 1110.1101 0100B=36E.D4H 3 6 E D 4练习:练习:求与二进制数110110.11110110.11相等的八进数、十六进制数?4. 二进制转化成八(十六)进制n从小数点开始,整数部分从右向左,小数部分从左向右,按三三( (四

6、四) )位进行分组,不足补零n一位十六进制数对应四位四位二进制数, ,不足添0112.22.2 信息单位及信息编码信息单位及信息编码2.2.1 2.2.1 信息单位信息单位o 最小的数据单位:位位(bit)o 最基本的存储容量单位:字节字节(Byte)o 其它存储容量单位:KBKB、MBMB、GBGB、TBTB1B=8bit1KB=1024B1MB=1024KB1GB=1024MB1TB=1024GB字节(字节(ByteByte)7 6 5 4 3 2 1 0位(位(BitBit)o 字长:字长是指CPU在一次操作中能够处理的最大二进制位数122.2.2 2.2.2 数值信息数值信息的处理的处

7、理o 符号数的表示:用最高位表示数的符号,其中:“0 0”表示正,“1 1”表示负,其它各位表示数的大小。o 定点整数定点整数n正整数:以原码(即本身的二进制代码)形式存储。n负整数:以补码形式存储。 o 符号数-44的原码: +44的原码:符号位 “0”表示正 、 “1”表示负10101100符号位00101100132.2.2 2.2.2 数值信息数值信息的处理的处理o 补码的求法补码的求法n负整数负整数先将负整数转换成二进制符号数(原码)再将原码中除符号位外的其他位按位取反,得到反码将反码加1 。 如:-01000 0000(原码)1111 1111(反码)1111 1111+10000

8、 0000(补码)。 如:+00000 0000(原码)n正整数的补码与原码相同。o 使用补码的好处:n解决+0和-0编码的唯一。n将减法运算变成了加法运算,符号位也参与运算。练习:练习:求十进制数-12-12的原码、反码、补码?练习:练习:求十进制数-127-127的原码、反码、补码?142. 定点数定点数(表示数的范围较小,精度较高)(表示数的范围较小,精度较高)(1)定点整数)定点整数S小数点无符号位2.2.2 2.2.2 数值信息数值信息的处理的处理S小数点(2)定点小数)定点小数 15110.011 B=0.1100112+11阶码尾符阶符尾数1100110011N= 尾数2阶码尾数

9、尾数的位数决定数的精度数的精度,一般用定点小数表示,一般用定点小数表示阶码阶码的位数决定数的范围数的范围 ,一般用定点整数表示一般用定点整数表示尾数的绝对值大于等于0.1并且小于1,从而惟一地规定了小数点的位置。 2. 浮点数浮点数(以(以指数指数形式存储,表示数的范围较大)形式存储,表示数的范围较大)2.2.2 2.2.2 数值信息数值信息的处理的处理162.2.3 2.2.3 非数值信息非数值信息的处理的处理1. 1. 西文字符编码(西文字符编码(ASCIIASCII码码)n采用1个字节(8位)中的前7位编码(最高位为0),来表示一个西文字符,可表示128( 0-127)个字符。例如:“a

10、”字符的编码为1100001,对应的十进制数是97。n控制字符3434个:032,127n普通字符9494个n常用字符的ASCII码值o空格空格 20H20H 3232o 0 09 9 30H30H39H 39H 48485757o A AZ 41HZ 41H5AH 5AH 65659090o a az 61Hz 61H7AH 7AH 9797122122172.2.3 2.2.3 非数值信息非数值信息的处理的处理2. 2. 中文字符(汉字)编码中文字符(汉字)编码n汉字国标码汉字国标码GB2312GB23128080o 用2 2个字节个字节表示一个汉字;每个字节采用7 7位位编码,最高位为0

11、;o 每个字节的7位编码中,去掉与ASCII码中34个控制字符相同的编码,剩下94个编码。前一个字节表示汉字分为94个区,前一个字节表示每个区有94个汉字。o 国标码中包括6763个汉字,其中一级汉字3755个,二级汉字3008个。o 汉字输入中的十进制区位码与国标码之间的相互转换: 区位码转换区位码转换成成1616进制进制数数+ +20H20H国际码国际码182.2.3 2.2.3 非数值信息非数值信息的处理的处理2. 2. 中文字符(汉字)编码中文字符(汉字)编码n汉字内码汉字内码o 汉字内码是计算机中真正使用的汉字编码。因为国标码中规定的编码原则与ASCII码相同,计算机容易混淆。o 汉

12、字机内码汉字机内码将汉字国标码两个字节的最高位最高位设为1 1nGBKGBK码码又称GB扩展编码或GB13000o GBK码中不再要求汉字低字节一定是大于127的内码,只要求第一个字节大于127。o GBK码兼容GB2312-80,共收录汉字21003个,符号883个,并提供1894个造字码位,将简、繁体字融于一库。o GBK码中加入几千个少数民族的字,又扩展成为GB18030GB18030。192.2.3 2.2.3 非数值信息非数值信息的处理的处理n汉字输入码汉字输入码o 微软拼音、智能ABC、 五笔字型输入法等 。n汉字字形码汉字字形码o一般采用点阵点阵方案来表示汉字的字形。o常用的汉字

13、点阵有:1616、2424、 3232、4848点阵等。o存储一个汉字的字形需要的字节数=点阵乘积/8 o所有汉字的字形码就构成了汉字库。202.2.3 2.2.3 非数值信息非数值信息的处理的处理2. 2. 中文字符(汉字)编码中文字符(汉字)编码n汉字地址码汉字地址码o 每个汉字字形码在汉字字库中的相对位移地址。o 地址码和机内码之间有简明的对应转换关系。 汉字编码之间的关系 输入码 国标码 字形码 机内码 地址码 汉字输出 汉字输入 212.2.3 2.2.3 非数值信息非数值信息的处理的处理3. 其它编码nBIG5编码 BIG5码是中国台湾计算机界实行的汉字编码字符集。它包含了420个图形符号和13070个汉字,但不包括简化汉字。 nUnicode码 Unicode码是统一编码组织于上世纪90年代制定的一种16位字符编码标准,它以两个字节两个字节表示1个字符,几乎世界上所有的书面语言都可以这种编码来惟一表示,其中也包括中文。nUTF-8UTF-8UTF-8是互联网上广泛使用的一种Unicode的实现方式。UTF-8是一种变长的编码,它可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论