2计算机中信息的表示.ppt_第1页
2计算机中信息的表示.ppt_第2页
2计算机中信息的表示.ppt_第3页
2计算机中信息的表示.ppt_第4页
2计算机中信息的表示.ppt_第5页
已阅读5页,还剩138页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第2章 计算机中信息的表示,常用数制 数制间的转换 二进制数的运算 数值型数据的表示及处理 文字的表示和处理,2,2.1 常用数制,十进制(Decimal) 二进制(Binary) 八进制(Octal) 十六进制(Hexadecimal),输入/输出,书写、阅读、记忆,计算机内部,后缀表示例:123D,1011B,137O,35A2H,3,1.十进制数 特点:基数10,数值用09表示,逢十进一。,所代表的实际值:,s10=a n10 n-1 +. . . +a1100 +a -1 10 -1+ . . . +a -m 10 -m,整数部分,n为整数部分位数,小数部分,m为小数部分位数,20

2、3.4921020101310041019102,4,2.二进制数 特点 :基数2, 0 或 1, 逢二进一。,一般表示形式: s2 = an 2 n-1 +. . . +a120 +a-12-1 + + a-m2-m,例如:,(1)2(1)2,(10)2,(11)2(1)2,(100)2 不等于12,(101.01)2122021120021122 (5.25)10,5,3.八进制 特点:基数8,数字为07,逢八进一。,一般表示形式: s8 = an8 n-1 + . . . + a18 0 + a-18-1+a-m8-m,(7)8(1)8,(10)8 而不等于8,(365.2)8= 382

3、681580 281 = (245.25)10,例如:,(6)8(5)8,(13)8,6,S16=an16 n-1 + . . . + a1160 + a-116-1+. . . + a-m16-m,(9)16(A)16,4.十六进制 (逢十六进一) 特点:每位可取数字09和英文字母A-F。 A(10)、B(11)、C(12)、D(13)、E(14)、F(15)。,(13)16,(F)16(1)16,(10)16,(F5.4)16=1516151604161 = (245.25)10,例如:,任意(R)进制数 l 每种进位制都有固定的数码基数 l 按基数进位或借位逢R进一 l 用位权值来计数

4、位权值: 在任何进位计数制中,数码所处的位置不同,代表的数值大小也不同。对每一个数位赋予的位值,在数学上叫做“权”。 位权与基数的关系:位权的值等于基数的若干次幂。 (anan1 . a1. a1a2 . am)R =anRn-1an1Rn2. a1R0 a1R1a2R2+amRm,进位制的对应表,1. 二进制转换成十进制,2.2 数制间的转换,例 将二进制小数(11010.101)2转换成十进制数 (11010.101)2,=124123+121+ 12-1 12-3,= 16820.5+0.125 = (26.625)10,方法:按位权展开,各项相加。,(熟记2的整数次幂),10,方法:

5、十进制数转换成二进制数时,将整数和纯小数部分分开转换为相应的二进制,然后再将二进制数的整数和小数部分连接起来。 整数部分: “除2倒取余” 纯小数部分: “乘2顺取整”,2、十进制数转换成二进制数,11,(a)纯整数部分的转换:“除2倒取余”直到商为0,例1:将(307)10转换为二进制数。,例:将(307.8125)10转换成二进制数。,故:(307)10(100110011)2,低位,高位,12,例: 将(0.8125)10转换为二进制数。 0.8125,故:(0.8125)10(0.1101)2,(2) 纯小数部分的转换: “乘2顺取整” 直到小数部分为或取近似值(乘不尽时), 2,低位

6、,高位,13,因为: (307)10(100110011)2,例:将(307.8125)10转换为二进制数。,(0.8125)10(0.1101)2,(307.8125)10(100110011.1101)2,只需将十进制数中的整数部分和小数部分两部分连接起来即可。,故:,2、十进制数转换成二进制数,14,并非所有的十进制小数都能用有限位的二进制小数来表示。,注意:,故取近似值:(0.63)10(0.1010)2,小数部分乘2会无限循环下去,例:将(0.63)10转换为二进制。,15,例:将(0.63)10转换为二进制。,0.63,2,1. 26,2,0. 52,2,1 . 04,2,0 .

7、08,(高位),(低位),因为,小数部分乘以2 最后一位 会无限循环下去,故取近似值,(0.63)10(0.1010)2,(近似值),16,十进制数与二进制数的转换,(1)二进制 = 十进制 计算按位权展开式的和 (2)十进制= 二进制 整数:“除2倒取余”直到商为0 小数:“乘2顺取整”直到小数部分为0或取近似值。,17,( 011 110 111 . 100 010 101 )2 .,3.二进制与八进制或十六进制的转换,(1)二进制数转换为八进制数,方法:,以小数点为中心,向两边分组,两端补“0”,将二进制数的整数与小数部分分别补足为3的倍数位,再将三位二进制数用一位等值的八进制数表示。,

8、3,6,7,4,2,5,小数部分从高位向低位,整数部分从低位向高位,(367.425)8,例3:将(11110111.100010101)2转换成八进制数。,18,( 1 6 . 3 2 7 )8,(2) 八进制数转换为二进制数,方法:,一位八进制用三位二进制数表示,例4:将(16.327)8转换为二进制数。,= (001 110 . 011 010 111)2,19,八进制数与二进制数的转换,计算机中的信息表示,转换表 八进制数 二进制数 八进制数 二进制数 0 000 4 100 1 001 5 101 2 010 6 110 3 011 7 111,20,思考: 怎样实现二进制与十六进制

9、转换? 怎样实现八进制、十六进制与十进制之间的相互转换?,21,(3) 二进制与十六进制间的转换,二进制转换为十六进制: 方法: 自小数点开始,四位分组,不足位数,两端补0,然后依次分别将四位二进制数用十六进制表示。,例5: 将(111001011010.1011101)2转换为十六进制数。 (1110 0101 1010 . 1011 1010)2 E 5 A . B A (E5A.BA)16,22,( 4 C . 2 E )16,(3) 二进制与十六进制间的转换,十六进制转换成二进制,方法:每一位十六进制数用四位二进制数表示。,例2. 将(4C.2E) 16转换为二进制数。,( 0100

10、1100 . 0010 1110 )2,23,十六进制数与二进制数的转换,转换表 十六进制数 二进制数 十六进制数 二进制数0 0000 8 1000 1 0001 9 10012 0010 A 10103 0011 B 10114 0100 C 1100 5 0101 D 1101 6 0110 E 1110 7 0111 F 1111,24,和十进制与二进制转换类似 八、十六进制十进制 按位权展开 十进制八进制 除8倒取余和乘8顺取整 十进制十六进制 除16倒取余和乘16顺取整,4. 十进制与八进制或十六进制间的转换,25,4、十进制与八进制或十六进制间的转换,(1) 八进制或十六进制转换

11、为十进制 按位权展开,相加即可。 例1. 将(16A.B)16转换为十进制数。 (16A.B)16(1162616110160 1116-1)10 (25696100.69)10 (362.69)10,26,(2)十进制转换为八进制或十六进制,例1. 将(273)10转换为八进制数。 (余数) (低位) 8 273 8 34 - 1 8 4- 2 0 - 4 故:(273)10(421)8 (高位),整数:“除8倒取余”或“除16倒取余” 小数:“乘8顺取整”或“乘 16顺取整”,27,(2)十进制转换为八进制或十六进制,例2. 将十进制数(0.71875) 10转换为八进制数 。 0. 71

12、875 8 5. 75000 8 6. 00000 故:(0.71875)10(0.56)8,高位,低位,二、八、十六进制 十进制,十进制 二、八、十六进制,二进制 八进制、十六进制,数制转换小结,计算位权展开式的和,整数:除2或8或16倒取余,小数:乘2或8或16顺取整,以小数点为中心三位或四位分组,两端补0,每一位8或16进制数用三位或四位二进制表示,29,二进制数运算:算术运算和逻辑运算 1. 算术运算: 两个一位数的加法和减法的基本运算规则是: 加法 0 0 1 1 0 1 0 1 0 1 1 10 (向高位进1/逢二进一),2.3 二进制数的运算,减法 0 10 1 1 0 1 0

13、1 0 1 1 0 (借一当二),说明: 多位二进制数的加、减法从低位到高位按上述规则进行,考虑进位和借位的处理,1011 11011 + 1110 - 1110 11001 1101,32,2. 逻辑运算 (1)逻辑数据的表示 “真”“假”、“是”“非”、 “对”“错”、“有”“无” (2)逻辑运算 逻辑非 逻辑与 逻辑或,逻辑非 0=1 1=0 逻辑与(逻辑乘)AND、 运算规则:两个均为1时,结果为1。 01=0 1 0=0 0 0=0 1 1=1,逻辑或(逻辑加)OR、+、 运算规则:只要有一个为1时,结果为1。 0 1=1 10=1 11=1 00=0,35,说明:两个多位二进制数进

14、行逻辑运算时,按位独立进行,相邻位之间没有关系。,36,1.执行下列二进制逻辑乘运算(即逻辑与运算) 0101100110100111 其运算结果是: A. 00000000 B. 11111111 C. 00000001 D. 11111110 2.执行下列二进制算术加运算 11001001十00100111 其运算结果是: A. 11101111 B. 11110000 C. 00000001D. 10100010,二进制运算举例,37,2.4 数值型数据的表示及处理,2.4.1 整数(定点数)的表示,2.4.2 实数(浮点数)的表示,38,无符号整数:45,172整数 数值型数据 有符号

15、整数: +43,-56 实数:123.4,-5.43,数值型数据的分类,(浮点表示),(定点表示),39,数值数据的机内表示,1. 任何数值数据在计算机内都采用二进制表示 2. 数值数据有正负、大小之分,为了解决数值数据运算中的正、负问题,引入数据的原码、反码、补码表示。 为了解决数值数据的表示范围问题, 引入 数据的定点表示(整数)和浮点表示(实数)。,40,2.4.1整数(定点数)的表示,定点表示: 在计算机中,用隐含规定小数点的位置来表示数据的方法。 定点整数:小数点在有效数字的最右端。 定点纯小数:小数点在有效数字的最左端。,41,(1)定点整数。小数点隐含固定在整个数值的最右端,(2

16、) 定点纯小数。通常将小数点固定在最高数据位的左边,无符号数据定点表示的两种形式:,42,例如: 无符号定点整数:01001010 表示: 01001010 无符号定点小数: 01001010 表示:0.01001010,无符号数据定点表示的两种形式:,43,(1)定点整数。小数点隐含固定在整个数值的最右端,(2) 定点纯小数。通常将小数点固定在最高数据位的左边,有符号数据定点表示的两种形式:,44,整数(定点数)的定点表示: 整数不使用小数点,或者说小数点始终隐含在个位数的右面,所以整数也叫做“定点数”。,2.4.1整数(定点数)的表示,45,整数的表示:,2.4.1 整数(定点数)的表示,

17、无符号整数(unsigned integer),一定是正整数。 如: 00001111表示15,46,无符号整数表示范围: 8位 16位 32位 0281 02161 02321 (0255) (065535),47,有符号整数(signed integer), 既可表示正整数,又可表示负整数。,有符号整数的表示:,符号位: 使用最高位(最左面的一位)作为符号位。 “0” “”(正数) “1” “”(负数),如:00101011 表示正数 10101011 表示负数,48,整数的三种码制原码、反码和补码,有符号整数可采用不同码制表示: 原码 反码 补码,49,原码表示,表示方法规定: 1.最高

18、位作为符号位 若符号位为0,则表示正数。 若符号位为1,则表示负数 。 2.其余各位代表数值本身的绝对值(以二进制表示) 如: 00101011 表示+43 10101011 表示-43,例1:假设用一个字节来表示一个数,求+7和-7的原码。,解:根据原码的定义:,(7 )原00000111,(7 )原10000111,+1原= -1原= +127原= -127原=,00000001,10000001,01111111,11111111,结论:绝对值相同的正数和负数,它们除了符号位不 同外,其他各位都相同。,例:假设用一个字节来表示一个数,求0的原码。,解:根据原码的定义:,+0原= 0000

19、0000,- 0原= 10000000,结论:0的原码不唯一,分析:当由数轴的左端趋向0时,我们记为 -0 当由数轴的右端趋向0时,我们记为+0,+0,-0,53,假设用一个字节(8位)表示一个数 用原码表示的最小值为: -127 ,其原码为11111111 用原码表示的最大值为: +127 ,其原码为01111111,原码的表示范围:,所以,原码的表示范围为: 127 + 127 -(27-1) +(27-1),54,反码表示,表示方法规定: 1.一个数如果值为正,则它的反码与原码相同。 2.一个数如果值为负,则将其符号位置为1,其余各位为 对原码的相应数据位取反。,取反:,1取反 = 0

20、0取反= 1,例1:假设用一个字节来表示一个数,求+7和-7的反码。,解:根据反码的定义:,(7 )反 00000111,(7 )反11111000,解: 0 反 0 反,例2 假设只用一个字节来表示一个整数,求0和0的反码表示,0的反码不唯一,00000000,11111111,57,假设用一个字节表示一个数。 用反码表示的最小值为: -127 ,其反码为10000000 用反码表示的最大值为: +127 ,其反码为01111111 所以,反码的表示范围为: 127 + 127,反码的表示范围,(与原码是一致的),58,*计算机中使用补码的原因:,在加减法运算中,解决参与运算的数符号正负的判

21、断问题。,目前, 计算机中一般是以补码形式存放数值数据的。,补码表示,用原码表示数简单、直观、与真值之间转换方便。 不适合于直接对两个同号数相减或两个异号数相加。 例如: +36+(-45)=-9,例 (+36)原= 00100100,+(45)原= 10101101,11010001,=(81),数值数据的补码表示,*补码的原理: ( 即为什么用补码可以实现减法按加法处理?) *时钟原理 *补数的概念 9-5=4 9+7=16 16-12=4 (12称为模数,5和7为互补数) 模:实质上是计量系统产生“溢出”的量。 在计量系统中表示不出来的数,只能表示模的余数。,9,4,n位的计算机的计量范

22、围是:02n-1,模 2n,8位计算机,所能表示的最大数为: 11111111 若再加1为: 100000000 (“溢出”) 最高位自然丢失,回到00000000。,模,在计算机中,以一个有限长度的二进制作为模数。 如果用一个字节表示一个数,1字节为8位, 则28 (即256)为模数。,62,X为负数时 x补= x反+1,补码表示方法规定 1、正数的补码、反码、原码相同. 2、负数的补码:将其最高位置 1,其余各位为对原码的相应数据位取反,然后再对整个数加1.,例1:假设用一个字节来表示一个数,求+7和-7的补码。,解:根据补码的定义:,+7补 00000111,-7反11111000,-7

23、补11111000 + 1 11111001,例2:假设用一个字节来表示一个数, 求0的补码。,解:根据补码的定义:,+0补00000000,-0反11111111,-0补11111111 + 1 100000000,进位舍去,-0补 00000000,0的补码是唯一的。,65,注意:用补码减法问题就可以化成加法问题。 减一个数时,利用加上这个数的补码,即加上负数的补码,就会得到运算结果的补码表示。,例3: 假设只用一个字节来表示一个整数, 求7-6的值。 解 : 7 补00000111 6 补11111010,00000111 + 11111010,100000001,进位自然舍去,7 补+

24、 6 补 00000001,(+36)补 = 00100100,(45)补 = 11010011,+36补+-45补= 00100100 + 11010011,11110111,=-9补,例4: +36-45= -9,-9原=10001001 -9反=11110110 -9补=11110111,68,假设用一个字节表示一个数。 用补码表示的最大值:+127,其补码为:01111111。 用补码表示的最小值:-128,其补码为:10000000。 所以,用补码表示的数的范围是:-128+127,补码的表示范围,注意:用补码表示的数的范围比原码和反码多一个数。 为什么?,在补码表示中,多出一个编码

25、10000000, 最高位为1既看作符号位,又看做数值位, 其值为-128。扩展一个数据。,补充:由补码求原码 对补码再求一次补,会得到该数的原码。 ( -128 补不适合此规律),11111010 10000101 + 1 10000110 (-6)原,如:已知补码为11111010,求原码。,三种整数的比较,- 2727-1 - 215215-1 - 231231-1,原码、反码、补码的表示范围,原码,反码,补码,8位 16位 32位,- (27-1)27-1 - (215-1)215-1 - (231-1)231-1) - (27-1)27-1 - (215-1)215-1 - (231

26、-1)231-1,72,BCD码,BCD码(Binary Coded Decimal)称为“二进制编码 的十进制整数”,使用4个二进位表示1个十进制数字, 最高位仍为符号位。 常用的是8421BCD码。 例如: (51)BCD 1 0101 0001 (32767)BCD 0 0011 0010 0111 0110 0111,73,2.4.2 实数(浮点数)的表示,浮点数: 小数点位置不固定的数。 它既有整数部分也有小数部分。,74,在一定字长下,整数数值的表示范围有限 实际的数据往往有整数部分又有小数部分 实际数据有的特别大 ,有的特别小,数值型数据可以写成如下形式 4.32E-2 表示 4

27、.32 10 -2 =0.0432 0.432E-1 表示 0.432 10 -1 =0.0432,计算机实数采用浮点数表示,基数(R):通常隐含为2 尾数(M):必须是二进制定点纯小数 尾数的位数决定数的精度 阶码(E): 必须是二进制定点整数。 阶码的位数决定数的范围,在一般数据的浮点表示法中,一个数可表示成:,N M RE,76,在给定的字长情况下,如果给出阶码和尾数的位数,则可表示一个浮点数。,阶码:定点整数(小数点在最右端),尾数:定点纯小数(小数点在符号位后),例:假设某机器字长为16位,规定前6位表示阶码(包括阶码符号),后10位表示尾数(包括尾数符号),则:0001011110

28、101000表示的浮点数是:,= -(26.5)10,0 00101 1 110101000,阶码,尾数,-(0.110101)22 (101) 2,= (-11010.1)2,78,实数(浮点数)的表示范围和类型,浮点数的长度可以是32位、64位或更长。一般说来,位数越多,可表示的数的范围越大(阶码),精度越高(尾数) 浮点数(实数)分类: 短浮点数、浮点数、长浮点数、高精度浮点数,79,实数(浮点数)的分类和使用,Pentium处理器中有三种不同类型的浮点数: 单精度浮点数(32位) 双精度浮点数(64位) 扩充精度浮点数(80位) 增强精度浮点数(128位),80,不同类型的浮点数可表示

29、的数值范围和精度各不相同,解算实际问题时要根据精度要求和计算过程中可能的数值范围来选用所需的浮点数类型,以便取得最佳的效果。,实数(浮点数)的分类和使用,81,计算机中的信息表示,常用数制(二、十、八、十六) 数制间的转换 二进制数的运算(算术、逻辑) 数值型数据的表示及处理 文字的表示和处理,小结,82,十进制数与二进制数的转换,(1)二进制 = 十进制 计算按位权展开式的和 (2)十进制= 二进制 整数:“除2倒取余”直到商为0 小数:“乘2顺取整”直到小数部分为0或取近似值。,二、八、十六进制 十进制,十进制 二、八、十六进制,二进制 八进制、十六进制,数制转换小结,计算位权展开式的和,

30、整数:除2或8或16倒取余,小数:乘2或8或16顺取整,以小数点为中心三位或四位分组,两端补0,每一位8或16进制数用三位或四位二进制表示,84,二进制数的运算(算术、逻辑) 算术 (进位、借位) 加、减 逻辑运算(不产生进位、借位) 逻辑非 逻辑与 逻辑或,85,数值数据的机内表示,1. 任何数值数据在计算机内都采用二进制表示 2. 数值数据有正负、大小之分,为了解决数值数据运算中的正、负问题,引入数据的原码、反码、补码表示。 为了解决数值数据的表示范围问题, 引入 数据的定点表示和浮点表示。,86,数值数据的机内表示,整数: 定点表示 实数: 浮点表示,87,整数(定点表示): 无符号整数

31、 有符号整数 (注意符号位),整数的定点表示,原码: 最高位作为符号位,其余各位代表数值本身的绝对值。反码: 1.一个数如果值为正,则它的反码与原码相同。 2.一个数如果值为负,则将其符号位置为1,其余各位为 对原码的相应数据位取反。 补码: 1、正数的补码、反码、原码相同. 2、负数的补码:将其最高位置 1,其余各位为对原码的相应数据位取反,然后再对整个数加1.,原码、反码和补码,89,无符号整数表示范围: 8位 16位 32位 0281 02161 02321,- 2727-1 - 215215-1 - 231231-1,原码、反码、补码的表示范围,原码,反码,补码,8位 16位 32位,

32、- (27-1)27-1 - (215-1)215-1 - (231-1)231-1) - (27-1)27-1 - (215-1)215-1 - (231-1)231-1,基数(R):通常隐含为2 尾数(M):必须是二进制定点纯小数 尾数的位数决定数的精度 阶码(E): 必须是二进制定点整数。 阶码的位数决定数的范围,在一般数据的浮点表示法中,一个数可表示成:,N M RE,实数(浮点数)表示,92,在给定的字长情况下,如果给出阶码和尾数的位数,则可表示一个浮点数。,阶码:定点整数(小数点在最右端),尾数:定点纯小数(小数点在符号位后),93,一、西文字符编码二、汉字编码三、汉字的输入和输出

33、四、文本处理,2.5 文字的表示及处理,94,一、西文字符的编码 ASCII码 (重点) EBCDIC码,95,1. ASCII码 ASCII码,即美国标准信息交换码(American Standard Code for Information Interchange),使用7个二进位对字符进行编码。,一、西文字符编码,96,基本的ASCII字符集共有128个字符 95个可打印字符(常用字母、数字、标点符号) 33个控制字符(不可直接显示或打印) 特殊字符的ASCII码 空格(32)、A(65)、a(97)、0(48) 回车CR(13),(见P33表2-8),97,每个字符用标准规定的7位二进

34、制数表示,在机内占一个字节(最高位为0)。 如: 字符“A”的ASCII码为: (01000001)2 或(65)10 字符“0”的ASCII码为: (00110000)2 或(48)10,98,要求: 1.会比较ASCII字符的大小(按其ASCII码值) 空格09A Z az 同一字母的大小写ASCII相差32 如:A(65),a(97) 2.会推算同组字符ASCII码值 如A的ASCII值(十进制)为65,则B、C 的ASCII值分别为66、67,99,用8位二进制数位表示一个字符的扩充 二-十进制 交换码. 特点: 每个字符对应一个字节,共256种 说明: 有很多编码没有使用,保留做为扩

35、充,2.EBCDIC码,100,二、汉字编码,1981年,国家标准局颁布了信息交换用汉字编码字符集-基本集(GB2312-80) (国标码)。,1.GB2312-80汉字编码(重点),汉字共6763个 其他字符:682个,101,组成: (1)第一部分: 字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个(统称为GB2312图形符号) (2)第二部分:一级常用汉字,共3755个, (按汉语拼音排列) (3)第三部分:二级常用汉字,共3008个, (按偏旁部首排列),102,区位码: GB2312-80是一个二维代码表,有94行、94列, 汉字在代码表中

36、的位置用它所处的行号、列号表示。,1、GB2312-80汉字编码,区位码是25 90,例如: “国”字的区号25,位号90,,103,GB2312-80汉字编码,104,国标交换码: 问题:信息通信中,汉字的区位码与通信使用的控制码(00H1FH)发生冲突。 解决方案:为了避免汉字区位码与通信控制码的冲突,每个汉字的区号和位号必须分别加上32。得到的代码称为汉字的“国标交换码”,GB2312-80汉字编码,105,例如: “国”字的区号25,位号90 区位码:25 90 (十进制) 国标交换码:57 122 (区号+32、位号+32) 双七位二进制表示为: 0111001B 1111010B,

37、GB2312-80汉字国标码,106,机内码: 问题:文本中的汉字与西文字符经常是混合在一起使用的,汉字信息如不予以特别的标识,它与单字节的标准ASCII码就会混淆不清。 解决方法:表示GB2312汉字的两个字节的最高位(b7)都置为“1”。这种汉字编码,称为GB2312汉字的“机内码”。,GB2312-80汉字编码,0111001B 1111010B,1,1,如:“国”,(各+128),(双字节编码),107,汉字区位码:汉字在代码表中的区号(行号)、位号(列号) 汉字国标码:区号、位号各增加32(十进制) 每个汉字的国标码可用双7位二进制位表示。 汉字机内码:把两个字节国标码的最高位置为“

38、1”, 可得到 该汉字的“机内码”,在计算机中占两个字节。,区位码、国标码、机内码之间的转换,区位码 + 32 = 国标码 国标码+128 = 机内码,(十进制),108,区位码: 25 90 国标码: 57 122 (十进制) 0111001B 1111010B (二进制) 39H 7AH (十六进制) 机内码: 185 250 (十进制) 10111001B 11111010B (二进制) B9H FAH (十六进制),区位码 + 32 = 国标码 国标码+128 = 机内码,如“国”:,109,区位码、国标码、机内码之间的转换,区位码 + 32 = 国标码 国标码+128 = 机内码,(

39、十进制),区位码 + 20H = 国标码 国标码+ 80H = 机内码,区位码 + 160 = 机内码,区位码 + A0H = 机内码,(十六进制),110,如“国”: 区位码: 19H 5AH (十六进制) 国标码: 39H 7AH (十六进制 +20H) 0111001B 1111010B (二进制) 机内码: B9H FAH (十六进制 +80H) 10111001B 11111010B (二进制),25 90 (区位码-十进制),111,说明:,在上述汉字的编码中: 区位码用于汉字的输入 机内码用于汉字的存取与处理 国标码用于不同汉字系统之间汉字的传输与交换,112,(全国信息技术标准

40、化技术委员会1995年12月1日颁布) GBK每一个字符都采用双字节表示。 (第一个字节最高位为1, 第二个字节最高位不一定为1), 码位23940个。 GBK编码区分三个部分: 汉字区(21003个汉字,兼容GB2312) 图形符号区(883个) 用户自定义区 中文Windows中采用GBK编码。,2、GBK汉字内码扩充规范,113,目的:统一的多文本处理环境,实现全世界所有字符在同一字符集中统一编码。 编码: UCS:ISO/IEC 10646 (通用多8位编码字符集)Unicode:统一码或联合码,与UCS完全等同的工业 标准 (微软、IBM等) 优点:编码空间极大(4个字节),能容纳足

41、够多的各种字符集(13亿字符),3.UCS/Unicode汉字编码,114,缺点:4字节的字符编码使存储空间浪费严重 克服: UCS-2是双字节编码(UCS的子集),共有字符49194个。 其中包括: 欧洲及中东地区使用的拉丁字母、音节文字 各种标点符号、数学符号、技术符号、几何形状、箭头及其他符号 中、日、韩(CJK)统一编码的汉字,115,UCS/Unicode与GB2312和GBK汉字编码不兼容。 为了向UCS/Unicode编码过渡并兼容GB2312和GBK汉字编码。我国2000年颁布了GB18030-2000编码标准。,4.GB18030-2000编码,116,GB18030-200

42、0编码标准在GB2312和GBK编码标准的基础上进行了扩充,采用单字节、双字节和四字节三种方式对字符编码,码位数达160多万个。 该标准的汉字有27000多个。包括全部中、日、韩统一字符集和CJK汉字扩充的所有字符。,4.GB18030-2000编码,117,BIG5码是台湾、香港等地使用的汉字繁体的编码标准,它用双字节进行编码。BIG5收录了13461个汉字和符号。,5.BIG5编码,118,几种汉字编码的对比,文字的表示及处理,119,人工输入:通过键盘、手写笔或语音输入方式输入字符 自动输入:将纸介质上的文本通过识别技术自动转换为文字的编码,三、汉字的输入输出,1.汉字输入,120,12

43、1,键盘输入编码 : 汉字字数很多,无法与键盘上的键一一对应,因此必须使用一个或几个键来表示汉字,这就需要对汉字进行编码。,(1)键盘输入,122,汉字输入编码的分类 拼音编码:如:智能ABC, 紫光拼音 缺点:同音字引起的重码多,需增加选择操 作。 字形编码:将汉字的字形分解归类而给出的编码方法,重码少、输入速度较快, 如:五笔字形法和表形码等 缺点: 编码规则不易掌握,123,联机手写汉字识别系统构成 识别软件 专用的书写板和笔,(2)联机手写汉字识别(笔输入),124,目的:使计算机具有人的听觉,是模式识别的分支 语音识别的分类: 孤立词/连接词/连续语音识别 小词汇量/中词汇/大词汇量

44、语音识别 特定人/限定人/非特定人语音识别 最高目标:非特定人大词汇量的连续语音识别技术,(3)汉字语音识别(了解),125,脱机文字识别: 对已经印刷或写完的文字进行识别, 自动输入计算机并转换为数字文本形式的一种技术,也叫做汉字OCR(Optical Character Recognition)。 分类: 印刷体OCR 和手写体OCR,(4)脱机文字识别(了解),126,汉字的输出过程: 输出机器内部的汉字编码,需要根据汉字编码对应的汉字字型码进行解释,生成映像,最后再传送到显示器或打印机输出。 机内码字型码打印输出 (显示器/打印机),2.汉字输出,127,作用: 用于汉字在显示器或者打印机上输出. 汉字字型码表示形式分类: 点阵表示形式 矢量表示形式,汉字字型码 (重点),128,汉字字型表示形式: 点阵表示 汉字字型点阵 如:16*16(占32个字节)、 24*24、48*48等 汉字矢量表示 存储描述汉字轮廓特征的信息。 如:Windows中TrueType技术即为该表示形式。,点阵描述,轮廓描述,129,字型库:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论