




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、信息编码与数据表示信息编码与数据表示第第2章章 信息编码与数据表示信息编码与数据表示信息的编码信息的编码计算机的基本功能:数据运算和处理计算机的基本功能:数据运算和处理计算机只能存储和处理二进制数表示的数据计算机只能存储和处理二进制数表示的数据现实世界中不同类型的数据:现实世界中不同类型的数据:l数值数值l字符字符l汉字汉字l图像信息图像信息l音频信息音频信息l视频信息视频信息本章介绍不同本章介绍不同类型数据信息类型数据信息的二进制编码的二进制编码的思想和方法的思想和方法第第2章章 信息编码与数据表示信息编码与数据表示编码与解码编码与解码计算机内部:二进制表示计算机内部:二进制表示人们输入输出
2、数据:拼音、五笔人们输入输出数据:拼音、五笔 数据输入时要转换为二进制代码,输出时要还原成其数据输入时要转换为二进制代码,输出时要还原成其 原来的形式原来的形式将一般形式的数据信息转换为二进制代码形式的过程将一般形式的数据信息转换为二进制代码形式的过程称为信息的称为信息的编码编码反之称为反之称为解码解码(或称为译码或称为译码)不同类型的数据信息的编码方法不同不同类型的数据信息的编码方法不同第第2章章 信息编码与数据表示信息编码与数据表示图示图示 编码编码解码解码原始数据形式原始数据形式不同类型数据不同类型数据第第2章章 信息编码与数据表示信息编码与数据表示主要内容主要内容常用数制及其相互转换常
3、用数制及其相互转换二进制数的运算二进制数的运算数值数据在计算机中的表示数值数据在计算机中的表示西文字符与中文信息编码西文字符与中文信息编码多媒体信息编码(略)第第2章章 信息编码与数据表示信息编码与数据表示计算机中采用二进制的原因计算机中采用二进制的原因物理上容易实现,并使电路简单物理上容易实现,并使电路简单运算简单运算简单便于实现逻辑运算和程序中的逻辑判断便于实现逻辑运算和程序中的逻辑判断第第2章章 信息编码与数据表示信息编码与数据表示数制的意义数制的意义按进位的原则进行计数称为按进位的原则进行计数称为进位计数制进位计数制,简称,简称“数制数制”数制的三要素及意义数制的三要素及意义l进位基数
4、:逢N进一l数码:使用哪些字符表示数l位权:一个数字在某个固定位置时的值第第2章章 信息编码与数据表示信息编码与数据表示常用数制常用数制计算机技术中常用的数制计算机技术中常用的数制l十进制数(Decimal)l二进制数(Binary)l八进制数(Octal)l十六进制数(Hexadecimal)第第2章章 信息编码与数据表示信息编码与数据表示常用数制的基本要素和表示方法常用数制的基本要素和表示方法数制数制基数基数进位规则进位规则位权位权数数 码码表示表示十进制十进制1010逢十进一逢十进一10i0,1,2,3,4,5,6,7,8,9D二进制二进制2 2逢二进一逢二进一2i0,1B八进制八进制8
5、 8逢八进一逢八进一8i0,1,2,3,4,5,6,7O十六进制十六进制1616逢十六进一逢十六进一16i0,1,2,8,9,A,B,C,D,E,FH第第2章章 信息编码与数据表示信息编码与数据表示数的展开式数的展开式数的按权展开:数的按权展开: Nn-1Nn-2N1N0.N-1N-m K进制数进制数mjjjniiiKNKND1111Ni-1和Nj表示第i-1位和第j位上的数码;Ki-1和Kj表示该数码的权,K是基数 第第2章章 信息编码与数据表示信息编码与数据表示十进制数的特点(十进制数的特点(D简记)简记)数码:数码:0-9进位基数:进位基数:逢十进一的进位原则,进位基数是逢十进一的进位原
6、则,进位基数是10位权:位权:各数位的各数位的“权权”是以是以10为底的幂为底的幂123456.123 1*105 +2*104 +3*103 +4*102 +5*101+6*100 +1*101 +2*102 +3*103第第2章章 信息编码与数据表示信息编码与数据表示二进制数的特点(二进制数的特点(B简记)简记) 数码:数码:0和和1 进位基数:逢进位基数:逢2进进1,进位基数是,进位基数是2 位权:各数位的位权:各数位的“权权”是以是以2为底的幂为底的幂 例如:例如: (10110.1)2 可表示为可表示为 10110.1B 12 4 02 3 12 2 +12 1 02 0 121第第
7、2章章 信息编码与数据表示信息编码与数据表示二进制数的位权值二进制数的位权值第第N位位N位的数权值位的数权值第第N位位N位的数权值位的数权值01712812825624951238101024 1K416201M532301G664401T例:例:7位二进制代码可表位二进制代码可表示的最大数是多少示的最大数是多少?第第2章章 信息编码与数据表示信息编码与数据表示十六进制数的特点(十六进制数的特点(H简记)简记)采用十六个不同的记数符号,即数码:采用十六个不同的记数符号,即数码:09及及A-F A表示十进制数表示十进制数10,B表示表示11,C表示表示12,D表示表示13,E表示表示14,F表示
8、表示15 采用逢十六进一的进位原则,进位基数是采用逢十六进一的进位原则,进位基数是16 各位数的各位数的“权权”是以是以16为底数的幂为底数的幂 例如:例如: 可表示为可表示为 2AF.B2H (2AF.B2)16 216 2A16 1F16 0 + B16 -1216 -2 第第2章章 信息编码与数据表示信息编码与数据表示八进制数的特点(八进制数的特点(O简记)简记) 采用八个不同的记数符号,即数码:采用八个不同的记数符号,即数码:07 采用逢八进一的进位原则。进位基数是采用逢八进一的进位原则。进位基数是8 各位数的各位数的“权权”是以是以8为底数的幂为底数的幂 例如:例如: (456.45
9、)8 48 258 168 0481582 可表示为可表示为 456.45O 第第2章章 信息编码与数据表示信息编码与数据表示不同进制数值对照表不同进制数值对照表 十十 进进 制制 数数 二二 进进 制制 数数 八八 进进 制制 数数 十十 六六 进进 制制 数数 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 2 2 1 10 0 2 2 2 2 3 3 1 11 1 3 3 3 3 4 4 1 10 00 0 4 4 4 4 5 5 1 10 01 1 5 5 5 5 6 6 1 11 10 0 6 6 6 6 7 7 1 11 11 1 7 7 7 7 8 8 1 10
10、00 00 0 1 10 0 8 8 9 9 1 10 00 01 1 1 11 1 9 9 1 10 0 1 10 01 10 0 1 12 2 A A 1 11 1 1 10 01 11 1 1 13 3 B B 1 12 2 1 11 10 00 0 1 14 4 C C 1 13 3 1 11 10 01 1 1 15 5 D D 1 14 4 1 11 11 10 0 1 16 6 E E 1 15 5 1 11 11 11 1 1 17 7 F F 第第2章章 信息编码与数据表示信息编码与数据表示数制之间的转换数制之间的转换计算机中采用二进制计算机中采用二进制日常生活中习惯使用十进
11、制日常生活中习惯使用十进制八、十六进制用来书写数据、指令八、十六进制用来书写数据、指令 转换是必然的转换是必然的转换的过程完全由计算机自行完成转换的过程完全由计算机自行完成l二、八、十六二、八、十六 十十l十十 二二l二二 、八、十六相互转换、八、十六相互转换第第2章章 信息编码与数据表示信息编码与数据表示由于是整数,用由于是整数,用除除2取余法取余法,即,即用整数部分不断去除用整数部分不断去除2,并记下,并记下每次的余数,直到商为每次的余数,直到商为0为止。为止。余数余数从下至上从下至上即为转换结果。即为转换结果。(83)10=(1010011)2第第2章章 信息编码与数据表示信息编码与数据
12、表示 例:将十进制数0.8125转换为二进制数 相乘相乘(0.8125)10=(0. 10 )2第第2章章 信息编码与数据表示信息编码与数据表示 例: 将0.335转换为二进制小数(精确到0.001)第第2章章 信息编码与数据表示信息编码与数据表示2、16、8相互转换的例相互转换的例11011.01101B16进制进制:l0001 1011.0110 1000 1 B . 6 8 H8进制进制:l011 011.011 010 3 3 . 3 2 O第第2章章 信息编码与数据表示信息编码与数据表示2、16、8相互转换的例相互转换的例7AF.14H 0111 1010 1111.0001 010
13、0B 3657.05O 11 110 101 111.000 101B 第第2章章 信息编码与数据表示信息编码与数据表示 数值转换图示十进制数二进制数八进制数十六进制数整数:除整数:除2逆向取余逆向取余小数:乘小数:乘2取整取整按权展开相加按权展开相加三位幷一位三位幷一位一位拆三位一位拆三位四位幷一位四位幷一位一位拆四位一位拆四位按权展开相加按权展开相加按权展开相加按权展开相加第第2章章 信息编码与数据表示信息编码与数据表示二进制数的常用单位一个二进制位称为一个二进制位称为1比特(比特(bit);是计算机中数据处是计算机中数据处理的最小单位理的最小单位8个二进制位组成个二进制位组成1字节(字节
14、(Byte;B),),是数据处理和是数据处理和存储容量的基本单位;存储容量的基本单位;1KB=1024B =210B1MB=1024KB=10241024B=220B1GB=1024MB= 10241024 1024B =230B1TB=1024GB= 10241024 10241024B=240B第第2章章 信息编码与数据表示信息编码与数据表示 二进制数的运算规则算术运算加0+0=0 1+0=0+1=1 1+1=10(有进位)减0-0=0 1-0=1 1-1=0 0-1=1(有借位)乘0*0=0*1=1*0=0 1*1=1除0/1=0 1/1=1逻辑运算与00=0 01=0 10=0 11=
15、1或00=0 01=1 10=1 11=1非非0为1 非1为0无进位无进位无借位无借位第第2章章 信息编码与数据表示信息编码与数据表示二进制数算术运算举例例1: 101. 01 +110. 01 1011. 10 例2: 101. 111 + 11. 011 1001. 010 第第2章章 信息编码与数据表示信息编码与数据表示二进制数算术运算举例1 0 1 1例例:计算:计算100100011011 1 0 0 1 0 0 0 11 0 1 11 1 1 011 0 1 11 1 0 11 0 1 11 00110 0 0 0例:例:计算计算11011001 1 1 0 1 1 0 0 11
16、1 0 10 0 0 01 1 0 1+1 1 1 0 1 0 1第第2章章 信息编码与数据表示信息编码与数据表示二进制数逻辑运算举例例如:a = 1100,b = 0110 进行运算:ab、ab、 a 1100 1100 1100 0110 0110 逻辑非为: 1110 0100 0011要点:逻辑运算按位进行,不同位之间不存在任何联系,不象算术运算中位之间可能有进位或借位。第第2章章 信息编码与数据表示信息编码与数据表示主要内容主要内容常用数制及其相互转换常用数制及其相互转换二进制数的运算二进制数的运算数值数据在计算机中的表示数值数据在计算机中的表示西文字符与中文信息编码西文字符与中文信
17、息编码多媒体信息编码(略)第第2章章 信息编码与数据表示信息编码与数据表示数值数据在计算机中的表示数值数据在计算机中的表示现实世界中的数值型数据:现实世界中的数值型数据:128,3.14,-67在计算机中表示和处理数值涉及两个问题在计算机中表示和处理数值涉及两个问题:l正数与负数问题l小数点问题数值在计算机中的表示形式数值在计算机中的表示形式l原码、反码、补码补码l定点数、浮点数表示法第第2章章 信息编码与数据表示信息编码与数据表示机器数与真值机器数与真值在计算机中,数值的正号和负号也是用二进制数码来在计算机中,数值的正号和负号也是用二进制数码来表示的表示的通常把一个数的通常把一个数的最高位定
18、义为符号位最高位定义为符号位,用,用0表示正,表示正,1表示负,称为数符。表示负,称为数符。其余位表示数值其余位表示数值 (0000 1011)2(11)10在机器内存放的正、负号数码化的数称为在机器内存放的正、负号数码化的数称为机器数机器数把机器外部由把机器外部由“+”、“-”号表示的数称为号表示的数称为真值真值 (1000 1011)2(11)10 机器数机器数 真值真值第第2章章 信息编码与数据表示信息编码与数据表示机器数的问题讨论机器数的问题讨论直接使用机器数进行运算时,会遇到一些问题直接使用机器数进行运算时,会遇到一些问题l同号数值相减l异号数值相加例例: (+36)+(-45) 0
19、 0100100 +) 1 0101101 1 1010001 结果是结果是 (-81) -这个结果显然是错误的!这个结果显然是错误的!第第2章章 信息编码与数据表示信息编码与数据表示 机器数有三种编码方法:原码、反码和补码,以解决机器数有三种编码方法:原码、反码和补码,以解决计算中出现的问题计算中出现的问题原码、反码与原码、反码与补码补码第第2章章 信息编码与数据表示信息编码与数据表示原码、反码与原码、反码与补码补码第第2章章 信息编码与数据表示信息编码与数据表示原码、反码和补码之间的转换图示 X反 数值位 X真值 X原 数值位 X补数值位不变数值位不变+,0,1符号位不变符号位不变符号位不
20、变符号位不变不变不变 (符号位为(符号位为0)取反加取反加1(符号位为(符号位为1)不变不变 (符号位为(符号位为0)取反取反 (符号位为(符号位为1)第第2章章 信息编码与数据表示信息编码与数据表示原码反码补码举例(以原码反码补码举例(以8位字长为例)位字长为例)N位位2进制数的表示范围:原码?反码?补码?进制数的表示范围:原码?反码?补码?第第2章章 信息编码与数据表示信息编码与数据表示补码运算补码运算l符号位和数值位一样参与运算符号位和数值位一样参与运算l运算结果也是补码的形式;然后再将补码形式的结果转换为运算结果也是补码的形式;然后再将补码形式的结果转换为原码,即为所求原码,即为所求运
21、算规则:运算规则: X+Y = X +Y X-Y= X +-Y第第2章章 信息编码与数据表示信息编码与数据表示补码运算举例补码运算举例73-73=(01001001)补补 +(10110111)补补=(00000000)补补例例73-127=(01001001)补补 +(10000001)补补=(11001010)补补=(10110110)原原= -(25+24+22+21)10=-54例例第第2章章 信息编码与数据表示信息编码与数据表示补码转换为原码补码转换为原码若补码的最高位为0,该补码为某正数的补码,且与原码相同,无需转换若补码的最高位为1,则该补码为某负数的补码l负数的补码转换为原码:
22、负数的补码转换为原码: 除符号位除符号位取反末取反末位加位加1。l例如:(例如:(11001010)补补 =(10110110)原原 = -(25+24+22+21)10=-54第第2章章 信息编码与数据表示信息编码与数据表示数的定点表示与浮点表示数的定点表示与浮点表示约定小数点隐含地固定在某一位置不变,这种表示方约定小数点隐含地固定在某一位置不变,这种表示方法称为法称为定点表示法定点表示法,用定点表示法表示的数叫,用定点表示法表示的数叫定点数定点数。包括定点整数和定点小数两类;小数点的位置一般在包括定点整数和定点小数两类;小数点的位置一般在应用程序中约定。应用程序中约定。l定点整数定点整数
23、小数点隐含固定在数值的最右端小数点隐含固定在数值的最右端 定点整数存储格式定点整数存储格式 例如例如0110-+110 只能存储只能存储纯整数纯整数数符Sf尾数S (隐含小数点) . 第第2章章 信息编码与数据表示信息编码与数据表示数的定点表示与浮点表示数的定点表示与浮点表示l定点小数定点小数 小数点隐含固定在数值位之前、符号位小数点隐含固定在数值位之前、符号位之后之后 定点小数存储格式定点小数存储格式 例如例如0110-+0.11 只能存储只能存储纯小数纯小数 定点小数表示法主要用在早期的计算机中定点小数表示法主要用在早期的计算机中 数符Sf.(隐含小数点) 尾数S 第第2章章 信息编码与数
24、据表示信息编码与数据表示数的定点表示与浮点表示数的定点表示与浮点表示浮点表示:浮点表示:表示带小数点的实型数表示带小数点的实型数任何实数可以表示为:任何实数可以表示为:N=S2P 其中,其中,S是是N的有效数字部分,称为的有效数字部分,称为N的的尾数尾数,尾数为尾数为纯小数(原码)纯小数(原码);P是指数,称为是指数,称为N的的阶码阶码,阶码为,阶码为整数(补码)整数(补码)。 数的小数点的实际位置由数的小数点的实际位置由P确定,所以称为浮确定,所以称为浮点表示法,表示的数称为浮点数点表示法,表示的数称为浮点数例如,数例如,数1101.101可表示为可表示为 N=1101.101=0.1101
25、10124第第2章章 信息编码与数据表示信息编码与数据表示浮点表示法浮点表示法浮点数在计算机中的存储格式为在计算机中一般用4B存储一个单精度实型数,其中1B存储阶码,3B存储尾数例如:浮点数N=1101.101=0.110110124的存储格式 阶符阶符Pf阶码阶码P数符数符Sf尾数尾数S313029282726252423220000001000110110100阶阶符符阶码部分(阶码部分(补码补码定点整数)定点整数)数数符符尾数部分(尾数部分(原码原码定点小数)定点小数)第第2章章 信息编码与数据表示信息编码与数据表示数的表示范围及溢出数的表示范围及溢出 无论是带符号数还是无符号数,当其运
26、算结果超出无论是带符号数还是无符号数,当其运算结果超出了计算机所能表示的范围,就会产生不正确的结果,了计算机所能表示的范围,就会产生不正确的结果,称之为称之为溢出溢出 n位二进制位表示数的范围位二进制位表示数的范围 可以通过扩大数的表示范围防止溢出可以通过扩大数的表示范围防止溢出 带符号数(带符号数(补码补码) 无符号数无符号数 n=8-128+127 0255 n=16-32 768+32 767 065 535 n-2n-1 +2n-1-1 02n-1 第第2章章 信息编码与数据表示信息编码与数据表示浮点数的表示范围浮点数的表示范围单精度浮点数(单精度浮点数(4字节)表示数的范围是:字节)
27、表示数的范围是:-2128(2-2-23) N2128(2-2-23)大约是大约是-3.410383.41038双精度浮点数(双精度浮点数(8字节)表示数的范围是:字节)表示数的范围是: -1.7103081.710308同样的字长,浮点表示法比定点表示法表示的同样的字长,浮点表示法比定点表示法表示的数的范围大、精度高。浮点运算时可以不考虑数的范围大、精度高。浮点运算时可以不考虑溢出,但运算复杂。溢出,但运算复杂。第第2章章 信息编码与数据表示信息编码与数据表示主要内容主要内容常用数制及其相互转换常用数制及其相互转换二进制数的运算二进制数的运算数值数据在计算机中的表示数值数据在计算机中的表示西
28、文字符与中文信息编码西文字符与中文信息编码多媒体信息编码(略)第第2章章 信息编码与数据表示信息编码与数据表示信息编码的概念信息编码的概念所谓信息编码,就是采用少量基本符号(数码)和一所谓信息编码,就是采用少量基本符号(数码)和一定的组合规则来区别和表示信息定的组合规则来区别和表示信息例:例:l用用09的组合表示数值的组合表示数值l用用09的组合表示身份证号、学号的组合表示身份证号、学号l用用26个英文字母的不同组合表示英文单词个英文字母的不同组合表示英文单词l。第第2章章 信息编码与数据表示信息编码与数据表示信息编码的概念信息编码的概念例:某大学学生学号规定用例:某大学学生学号规定用7位十进
29、制数进行编码,其位十进制数进行编码,其格式为:前两位表示入学年份,接着的两位表示专业格式为:前两位表示入学年份,接着的两位表示专业号,后三位表示学生在某专业中的序号。号,后三位表示学生在某专业中的序号。l如某学生学号为:如某学生学号为:10 01 099,则表示该学生,则表示该学生2010年入学,专业年入学,专业编号为编号为01,在本专业中的序号为,在本专业中的序号为99请问该学校最多可以设置多少个专业?每个专业最多请问该学校最多可以设置多少个专业?每个专业最多可以招多少个学生?可以招多少个学生? 学号编码学号编码1001099是一个代码,用来唯一地表示一个学是一个代码,用来唯一地表示一个学生
30、,没有值的概念生,没有值的概念学号编码规则应该成为学校的一个标准,供校内共同学号编码规则应该成为学校的一个标准,供校内共同遵守遵守第第2章章 信息编码与数据表示信息编码与数据表示信息编码的概念信息编码的概念前面介绍的计算机中前面介绍的计算机中数值数据数值数据的各种编码的各种编码l带符号数的编码方法:原码、反码和补码带符号数的编码方法:原码、反码和补码l整数和实数的编码方法:定点和浮点表示法整数和实数的编码方法:定点和浮点表示法都具有值的含义,可以在计算机中进行运算都具有值的含义,可以在计算机中进行运算 下面介绍西文下面介绍西文字符编码字符编码和汉字字符编码和汉字字符编码第第2章章 信息编码与数
31、据表示信息编码与数据表示(西文西文)字符编码字符编码常用西文字符:英文字母,数字字符、标点符号和控常用西文字符:英文字母,数字字符、标点符号和控制字符等,共制字符等,共128个字符个字符在计算机中,要为每个字符指定一个确定的二进制代在计算机中,要为每个字符指定一个确定的二进制代 码,作为识别与使用这些字符的依据码,作为识别与使用这些字符的依据由于西文字符与二进制整数之间没有什么必然的联系,由于西文字符与二进制整数之间没有什么必然的联系,某一个字符究竟对应哪个整数完全可以人为地规定某一个字符究竟对应哪个整数完全可以人为地规定 由于编码是一个涉及世界范围内有关信息由于编码是一个涉及世界范围内有关信
32、息表示表示、交换交换、处理处理、存储存储的基本问题,因此都以国家标准或国际标的基本问题,因此都以国家标准或国际标准的形式颁布施行准的形式颁布施行字符编码有多种,应用最广泛的是字符编码有多种,应用最广泛的是ASCII码码第第2章章 信息编码与数据表示信息编码与数据表示ASCIIAmerican Standard Code For Information Interchange美国标准信息交换码。这一编码最初是由美国美国标准信息交换码。这一编码最初是由美国制订的,后来由国际标准化组织(制订的,后来由国际标准化组织(ISO)确定确定为国际标准字符编码为国际标准字符编码为了和国际标准兼容,我国根据它制
33、定了相应为了和国际标准兼容,我国根据它制定了相应的国家标准,即的国家标准,即 GB1988第第2章章 信息编码与数据表示信息编码与数据表示ASCII码的编码规则码的编码规则用一个字节用一个字节(8位二进制数位二进制数)表表示一个字符的编码示一个字符的编码0余下的余下的7位可给出位可给出128个二进制编码个二进制编码即即0000 0000-0111 1111可以表示可以表示128个字符个字符最高位取最高位取“0”第第2章章 信息编码与数据表示信息编码与数据表示ASCII码的编码规则码的编码规则规定:规定:每个字符用每个字符用7位二进制数来表示,位二进制数来表示,7位二进制共位二进制共有有128种
34、状态种状态(27= 128 ),可表示,可表示128个字符;即个字符;即7位编码位编码的取值范围为的取值范围为00000001111111在计算机内在计算机内,每个字符的,每个字符的ASCII码用码用1个字节个字节( 8位位)来存来存放,字节的最高位放,字节的最高位( d7)为校验位,通常用为校验位,通常用“0”来填充,来填充,后后7位位(d6d5d4d3d2d1d0)为编码值为编码值7位编码的位编码的ASCII码字符集包括了码字符集包括了128个字符,称为标准个字符,称为标准的的ASCII码字符集码字符集第第2章章 信息编码与数据表示信息编码与数据表示ASCII码表码表编码编码字符字符第第0
35、到到31 控制字符(控制字符(32个)个)第第48到到5709的的10个数字符号个数字符号第第65到到9026个英语大写字母个英语大写字母 第第97到到12226个英语小写字母个英语小写字母 其余其余 标点符号、运算符号等标点符号、运算符号等 第第127 控制字符(控制字符(1个)个)第第2章章 信息编码与数据表示信息编码与数据表示 b7b6b5b4b3b2b1b0 0000 00010010001101000101011001110000NULDLESP0Pp0001SOHDC1!1AQaq0010STXDC2“2BRbr0011ETXDC3#3CScs0100EOTDC4$4DTdt010
36、1ENQANK%5EUeu0110ACKSYN&6FVfv0111BELETB7GWgw1000BSCAN(8HXhx1001HTEM)9IYiy1010LFSUB*:JZjz1011VTESC+;Kk1100FFFS,Nn1111SIUS/?O_oDELASCII字符与编码对照表字符与编码对照表第第2章章 信息编码与数据表示信息编码与数据表示例例已知字符已知字符“X”的的ASCII码为码为 0101 1000求字符求字符“s” 的的ASCII码码l0101 1000 的的10进制数为进制数为88(64+16+8)l88+32-5=115l转换为转换为2进制数为进制数为 0111 00
37、11第第2章章 信息编码与数据表示信息编码与数据表示 汉字编码汉字编码 (自学)(自学)包括:包括:l信息交换码(国标码)l区位码l内码l输入码和输出码输入码国标码内码字形码汉字输入汉字输出各种代码之间的关系第第2章章 信息编码与数据表示信息编码与数据表示汉字的二进制编码汉字的二进制编码用用ASCII码不能完整表示汉字码不能完整表示汉字常用汉字约有常用汉字约有5000个个汉字和汉字字符是一个庞大集合汉字和汉字字符是一个庞大集合汉字及汉字字符的编码由国家定义,以汉字及汉字字符的编码由国家定义,以GB强强制性发布执行制性发布执行第第2章章 信息编码与数据表示信息编码与数据表示汉字的二进制编码规则汉
38、字的二进制编码规则用两个字节表示一个汉字字符,可定义用两个字节表示一个汉字字符,可定义255*255个汉字个汉字或汉字字符或汉字字符考虑到与考虑到与ASCII码的兼容和统一、留出控制字符等因素码的兼容和统一、留出控制字符等因素l每个字节的最高位取每个字节的最高位取0l预留出预留出0到到32号和号和127号的控制字符(共号的控制字符(共34个)个)l确定字节的有效取值为确定字节的有效取值为 33126(对应的十六进制数对应的十六进制数为为21H7EH)可可“独立独立”表示表示 94*94=8836 个汉字字符个汉字字符00216=65536, 214=16384第第2章章 信息编码与数据表示信息
39、编码与数据表示图示图示第第2章章 信息编码与数据表示信息编码与数据表示国标国标GB-2312-80称为信息交换码;又称为称为信息交换码;又称为国标码国标码共收录共收录7445个汉字及图形符号:个汉字及图形符号: 一般符号:一般符号: 202个;个; 序列号:序列号: 60个个 数字:数字: 22个;英文字母个;英文字母52个、日文假名个、日文假名169个个 希腊字母希腊字母48个、俄文字母个、俄文字母66个个 汉字汉字6763个:一级汉字字符个:一级汉字字符3755(以汉语拼音索引)(以汉语拼音索引)二级汉字字符二级汉字字符3008(以偏旁部首索引)(以偏旁部首索引)第第2章章 信息编码与数据
40、表示信息编码与数据表示高八位高八位低八位低八位与与ASCII码兼容的控制字符区码兼容的控制字符区第第2章章 信息编码与数据表示信息编码与数据表示区位码区位码汉字国标码实际上是一个汉字国标码实际上是一个94 94的二维字符集,编码规的二维字符集,编码规则是用两个字节即则是用两个字节即16个个二进制二进制位进行编码的,其中一位进行编码的,其中一个字节表示行号,一个字节表示列号,将行号和列号个字节表示行号,一个字节表示列号,将行号和列号组合起来就构成了组合起来就构成了汉字国标码汉字国标码区位码区位码:用两位:用两位十进制数十进制数对行号进行编码,用另两位对行号进行编码,用另两位十进制数对列号进行编码
41、,将行号和列号组合起来就十进制数对列号进行编码,将行号和列号组合起来就构成了用构成了用4位十进制数编码的汉字位十进制数编码的汉字区位码区位码。l区号就是行号,位号就是列号区号就是行号,位号就是列号l如:汉字如:汉字“啊啊”在编码表中第在编码表中第16行、第行、第1 列,区位码就是列,区位码就是1601。区号和位号的范围都是从区号和位号的范围都是从194。区位码只是汉字编码的一种外部表现形式,并不是汉区位码只是汉字编码的一种外部表现形式,并不是汉字在计算机内的编码。可以作为一种输入码。字在计算机内的编码。可以作为一种输入码。 第第2章章 信息编码与数据表示信息编码与数据表示第第2章章 信息编码与
42、数据表示信息编码与数据表示汉字内码汉字内码为汉字及汉字字符编码的目的之一是可以为汉字及汉字字符编码的目的之一是可以在计算机中实现存储在计算机中实现存储存储中产生混乱:存储中产生混乱: “鞍鞍”的信息交换码为的信息交换码为 00110000 00110000 对应的对应的16进制数为进制数为 3030H 字符字符0的的ASCII码为码为 30H -易造成易造成鞍鞍与与00的混乱的混乱!汉字字符在计算机内部存储的二进制形式代码成汉字字符在计算机内部存储的二进制形式代码成为为“机内码机内码”,也称,也称“内码内码”将信息交换码两个字节的最高位取将信息交换码两个字节的最高位取“1”第第2章章 信息编码
43、与数据表示信息编码与数据表示汉字各编码方式间的关系汉字各编码方式间的关系内码与信息交换码的关系为:内码与信息交换码的关系为: 信息交换码信息交换码=内码内码-8080H 内码内码=信息交换码信息交换码+8080H 将信息交换码的两字节分别减去将信息交换码的两字节分别减去20H或或32,得到区位码得到区位码信息交换码和内码用信息交换码和内码用16进制数表示、区位码用进制数表示、区位码用10进制数表示进制数表示第第2章章 信息编码与数据表示信息编码与数据表示汉字编码的例汉字编码的例啊:啊:l信息交换码;信息交换码;0011 0000 0010 0001;3021Hl区位码:区位码:1601 (30
44、H-20H=48-32=16) (21H-20H=33-32=01)l内码:内码: 1011 0000 1010 0001;B0A1H (3021H+8080H=B0A1H) 第第2章章 信息编码与数据表示信息编码与数据表示汉字编码的例汉字编码的例汉字汉字“导导”的区位码为的区位码为 2128,求出该汉字的,求出该汉字的国标码和机内码国标码和机内码再次提示:区位码是以再次提示:区位码是以10进制数表示;国标进制数表示;国标码和内码均以码和内码均以16进制表示进制表示l21转换为转换为15H; 15H+20H=35Hl28转换为转换为1CH;1CH+20H=3CHl国标码为国标码为353CH21
45、+32=53 转换为转换为16进制为:进制为:35H28+32=60转换为转换为16进制为:进制为: 3CH国标码为:国标码为:353CH353CH+8080H=B5BCH 机内码为机内码为B5BCH 第第2章章 信息编码与数据表示信息编码与数据表示汉字输入码汉字输入码汉字由于数量大,字形复杂,字音多变 ,无法直接使用西文标准键盘进行输入必须为汉字设计基于西文键盘的输入编码方法当用户从键盘上输入汉字的输入码后,再由相应的输入法应用程序完成从输入码到内码的转换过程 外码不必具有公众约定性和标准化,允许各自“独立”第第2章章 信息编码与数据表示信息编码与数据表示汉字输入码汉字输入码例如汉字“舞”,它的五笔字型编码为rlgh,拼音编码为wu,区位码为4672但是无论用户使用rlgh、wu、4672中哪一个输入码,相应的输入法应用程序都会自动地把这些输入码转换为“舞”字的内码CEE8H。第第
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论