计算机中的信息表示和编码方法_第1页
计算机中的信息表示和编码方法_第2页
计算机中的信息表示和编码方法_第3页
计算机中的信息表示和编码方法_第4页
计算机中的信息表示和编码方法_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计算机中的信息表示和编码方法本章学习重点l 熟悉二进制的基本概念及二进制的运算l 掌握各种进制的相互转换l 了解计算机中数据的表示和编码方法 计算机中处理的数据是多种多样的,如数值、文字、图像、声音等等,根据冯诺依曼原理,在计算机内部这些信息都是以二进制表示的。 计算机中的数据 为什么计算机要采用二进制: (1)二进制只有两个状态,稳定、可靠、便于区分。 (2)硬件容易实现。具有两个稳定状态的物理器件很多,如:电压的高低、电流的有无、开关的闭合等。(3)运算规则简单,便于实现逻辑 运算。 111110002.1 进制与进制转换 数是客观事物的抽象的符号化表示。用一组固定的数字符合和一套统一的规

2、则来表示数的方法称为数制。 数制是数的表示和计数方法。计算机中常用二进制、十进制、八进制、十六进制。 进制是按照进位方式计数的数制系统。进位方式计数含有基数和各数位的位权。 基数指该进制中允许使用的基本数码的个数,如十进制有0、1、29。一个数码处在不同的位置其代表的值不同,每个数码代表的数值等于该数码乘以与其位置相关的一个常数,该常数称为位权,位权的大小是以基数为底、数码所在位置的序号为指数的整数次幂,如100 、101 、102、103等。 2.1.1 进制.十进制的表示(采用位权表示法)1102 + 2101 + 3100 + 410-1 +510-2总结出以下原则:十进制有0、1、29

3、 共10个数字符号, 每个符号表示0之间的十个不同的值; 由十个符号组成的序列来表示任意数值,写成如下形式: (X)10=KnKn-1K1K0.K-1K-2K-m KI 0,1,29 (X)10 = Kn10n+Kn-110n-1+K1101+K0100+K -110-1+K -m10-m10I称为第i位的权,10为基。(按权展开式) 逢十进一 ,借一当十。由此推广到任意进制计数方法 (R进制表示):R进制有0、1、2R-1共R个数字符号,每个数字符号各代表0R-1之间一个固定的值;由R个符号组成的序列来表示数值,写成如下形式:X=KnKn-1K1K0.K-1K-2K-m K 0,1,2R-1

4、表示的值是(采用位权表示法) : X = KnRn+Kn-1Rn-1+K1R1+K0R0+K -1R-1+ -m-m每一位代表的值要由该符号所代表的值乘一个与符号位置相关的常数Ri来确定,Ri称为位权,R称为计数系统的基。逢R进一,借一当R。 进位计数制的要素:1、数码的个数 2、进位的基数计算机中常用的几种数制数制基数基本数符进位原则位权十进制100 1 2 3 4 5 6 7 8 9逢十进一10 I二进制20 1逢二进一2 I八进制80 1 2 3 4 5 6 7逢八进一8 I十六进制160 1 2 3 4 5 6 7 8 9 A B C D E F逢十六进一16 I(2).二进制二进制数

5、的数码有两个符号0、1,由这两个符号组成的序列可以表示任意数值,进位规则为“逢二进一,借一当二”。如:二进制数可以写成如下形式; (101010.101)2 =125 +024 +123 +022 +121 +020 +12-1 +02-2 +12-3 = (42.625)10 由于二进制的位权最小,所以表示同一个值的时候,符号序列较长。如:(255)10=(11111111)2 。 为了表示的方便,计算机中常采用八进制和十六进制。(3).八进制 八进制数的数码为0、1、2、3、4、5、6、7共八个,进位规则为“逢八进一,借一当八”。如:(327)8=382+281+780=192+16+7=

6、(215)10 (4).十六进制 十六进制数的数码为0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F共十六个,其中数码A、B、C、D、E、F分别代表十进制数中的10、11、12、13、14、15,进位规则为逢十六进一,借一当十六。如:(327)16 = 3162 + 2161 + 7160 = 768 + 32 + 7 =(807)10 (15)10=(1111)2=(17)8=(F)1615D=1111B=17O=FH(5). 不同进制的表示后缀法:下标法:2.1.2 不同进位计数制之间的转换(1). 2/8/16进制转换为十进制 任意进制数转换为十进制数采用“按位权展开求和”

7、的方法即可。10101B = 124 + 023 + 122 + 021 + 120 = 21DB = 122 + 021 + 120 + 12-1 + 12-2 101O= 182 + 081 + 180 = 65D101AH=116 3 + 016 2 + 116 1 + 10 16 0 4106D(2). 十进制转换为2/8/16进制原则:整数部分:除以基取余数,直到商为0,余数从右到左排列。小数部分:乘以基取整数,整数从左到右排列。例 100.345(D)=1100100.01011(B)100(D)=144(O)=64(H)100(D)=144(O)=64(H)=1100100(B)

8、“试权法”:215D=11010111B01002502 252122623210001011100812818044110016604616 0.7600.34520.69021.3802 2 1.520 2 1.04(3).二进制与八进制之间的转化64O: 6 4 110 100B (A) 八进制转换成二进制(每一位八进制数与三位二进制数相对应) 转换原则: 一分为三27.461O : 2 7 . 4 6 1 010 111 .100 110 001B (B) 二进制转化成八进制 原则:三位一组,从小数点开始, 整数部分:从右向左进行分组; 小数部分:从左向右进行分组,不足3位补零。 11

9、0 101 111 . 010 10 B=657.24O 6 5 7 2 4后边补一个零 1000 (B) 二进制转化成十六进制 原则:四位一组,从小数点开始, 整数部分:从右向左进行分组; 小数部分:从左向右进行分组,不足4位补零。 11 0110 1110 . 1101 01 3 6 E D 464H: 6 4 0110 0100B(4) 二进制与十六进制之间的转化 (A) 十六进制转换成二进制 原则: 一分为四每一个十六进制数对应二进制的四位。2C1DH : 2 C 1 D 0010 1100 0001 1101B 后边补两个零 01000016以内的各种进制对照表十进制(D) 二进制(

10、B) 八进制(O) 十六进制(H) 0 1 2 3 4 5 6 7 8 91011121314150000000100100011010001010110011110001001101010111100110111101111 0 1 2 3 4 5 6 71011121314151617 0 1 2 3 4 5 6 7 8 9 A B C D E F2.1.3 二进制数据的运算(1).二进制的算术运算加法: 0+0=0 1+0=1 0+1=1 1+1=10(进位)减法: 0-0=0 1-0=1 1-0=1 0-1=1(借位)乘法: 0X0=0 0X1=0 1X0=0 1X1=1除法: 0/0

11、=0 0/1=0 1/1=1例:00101101 + 01011011 = 1 0 0 0 1 0 0 0 0 0 1 0 1 1 0 1 + 0 1 0 1 1 0 1 1 1 0 0 0 1 0 0 0(2).二进制的逻辑运算 具有逻辑性的变量称为逻辑变量,逻辑变量之间的运算就是逻辑运算。用二进制的“1”与“0”代表逻辑关系的真与假。以下是三种基本的逻辑运算:逻辑“与”运算(AND) 01=0 10=0 00=0 11=1 sw1 sw2 sw1.AND.sw2 0 0 0 0 1 0 1 0 0 1 1 1逻辑“或”运算(OR) 00=0 01=1 10=1 11=1 sw1 sw2 s

12、w1.OR.sw2 0 0 0 0 1 1 1 0 1 1 1 1逻辑“非”运算(NOT)_ _0=1 1=0 sw .NOT.sw 0 1 1 0二进制的相关概念一位二进制称为一个比特(bit);八位二进制构成一个字节(Byte)。字节是存储的基本单元,是计算机对数据操作的最小单位。地址相关的概念:b7b6b5b4b3b2b1b0地址线的位数决定了可以访问内存单元的个数。每一根地址线对应一位二进制。10根地址线,可访问的单元数是: 210=1024103=1K20根地址线,可访问的单元数是: 220=1024K106=1M30根地址线,可访问的单元数是: 230=1024M109=1G32根

13、地址线可以访问多大内存?“4GB”1K=1024B , 1M=1024K, 1G=1024M, 1T=1024G2.2.1 数值数据的表示 计算机处理的数据分为数值型数据和非数值型数据。数值型数据用于表示数量特征;而非数值数据用于表示特定的信息,如文字、图形、图像等。 计算机只能使用二进制,因此在计算机中,正号、负号、数值、字符和文字、图形等都必须用0和1的组合来实现,把利用0和1的各种组合来表示信息的方法统称为编码。 数值型数据的表示需要描述三点:数值的绝对值、小数点、符号(正负号)。 计算机中数据的表示数值的精度和范围 计算机是有模运算,即用有限的二进制位来表示数值,超出有限的二进制位数最

14、大值系统归零重新计数。 2.无符号整数的表示 数值型数据分为有符号型和无符号型。无符号整数指的是计数系统中只有大于等于0的数,没有负数 ,因此,不需要表示符号。如用8位二进制表示一个无符号整数,其范围是二进制从0000 0000到1111 1111,对应的十进制数从0到255。3.有符号整数的表示 符号位数值位 对于有符号型的数值数据中有正、负数和零,则必须通过编码的方式表示符号,在计算机中,通常在二进制数据的绝对值前面加上一位二进制位作为符号位,符号位为0代表此数为正数;符号位为1代表此数为负数;从而形成了数值型数据的机内表示形式。 为了方便运算,对有符号数常采用三种表示形式,即原码、反码、

15、补码。(1)原码 正数的符号位为0,负数的符号位为1,其它位用此数的绝对值表示,得到的即为此数的原码。正数: 55D的8位二进制表示为:00110111, 其原码表示为:00110111。负数: -55D的绝对值是:00110111, 其原码表示为:10110111。 (2)反码 正数的反码与原码相同,负数的反码的符号位为1,其余各位对原码按位取反,得到的即为此数的反码。 66D的反码为:01000010。 -66D的反码为:10111101。 原码的0:存在两个0 00000000B、1000000B 在运算时需要判断符号。(3)补码 有模计数系统当计数值超过系统的“模”时系统重新开始计数。

16、 补码是利用有模运算表示数据的一种方式。 X补 = 2n +X( -2n-1 X 2n-1 ) 28 (1 00000000 )就是8位二进制计数系统的模。 有模计数系统有如下性质:如:时钟从5点调整到2点有两种方法:5-3=25+9=12+2 12为计数系统的模,3,9互为补数。 有模计数系统可以将减一个数转化成加该数的补数。也就是可以将减法运算转化成加法运算。如果用八位二进制表示一个数,系统的模是28。100000000=00000000例1:(+102)D, 其原码=01100110; 其反码=01100110;其补码=01100110。 (-102)D, 其原码=11100110; 其

17、反码=10011001;其补码=10011010。例2:(102 25)补 =(102)补+(-25)补 =01100110 + 11100111 =01001101 =(77)补 =(77)D 正数的补码与原码相同;负数的补码的符号位为1,其余各位为反码并在最低位加1,得到的即为此数的补码。计算机采用补码编码,从而简化运算。补码有如下性质: X+Y 补 = X补+Y补 X-Y 补 = X补+-Y补0在补码系统中唯一。3.浮点数的表示 如果数据有整数部分和小数部分,那么就必须表示小数点。现在计算机采用的是浮点数表示方法。 一个数的浮点数表示为:E = M2N M是二进制表示的纯小数,称为尾数,

18、N是二进制表示的纯整数,称为阶码。 单精度浮点数的标准规定用32位二进制表示浮点数,其中尾数M占23位,阶码N占8位。 32位二进制的最高位b31表示数符,即尾数的符号,也就是整个数的符号;b30到b23一共8位采用补码方式表示阶码;b22到b0表示尾数。2.2.2 非数值数据表示 计算机处理的信息包括数值、文字、符号、语音、图形、图象。在计算机内部各种信息都必须以数字化的二进制编码形式传送、存储和加工,因此,所有的信息都应转化为二进制编码。编码是以少量的二进制位,通过一定的组合规则,表示出大量复杂多样的信息。1. 英文信息的编码 (ASCII码) 英文是符号文字,只要通过二进制编码表示其基本

19、元素(如字母),即可实现英文文字的数字化表示。 目前,国际上使用的字母、数字和符号的信息编码系统是采用美国国家信息交换标准字符码(American Standard Code for Information Interchange),简称为ASCII码。例如:大写字母 A: A=(1 0 0 0 0 0 1)ASC=65 w7 w6w5 w4w3 w2w1 小写字母 a: a= ( 1 1 0 0 0 0 1)ASC=97 w7 w6w5 w4w3w2 w1 Hello!的机内表示:010010000110010101101100011011000110111100100001 空格 0010

20、0000 20H 32 09 00110000 00111001 30H39H 4857 AZ 01000001 01011010 41H5AH 6590 a z 01100001 01111010 61H7AH 97122字符 二进制表示 十六进制表示 十进制表示 ASCII码包括10个十进制数码、52个英文大小写字母、一些符号(如$、%、&、#等)和32个控制符号,共计128个字符。编码采用一个字节,8位二进制。标准的ASCII码只用了其中7位,最高一位为0。 随着信息技术的发展和全球化的需要,新的Unicode编码标准随之产生。其编码采用两个字节,16位二进制,可表示216个符号,也就是

21、65536个符号,几乎可以涵盖世界上的各种文字和符号,该编码标准已经逐渐推广应用。 2中文信息的编码 键盘管理输入码汉字处理汉字库内码打印模块显示模块字型码 汉字的特点是象形文字、单字单音。由于汉字本身的特点,且汉字的输入输出必须利用现有的设备,它在输入、输出、存储和处理过程中所使用的汉字代码是不相同的,主要有用于信息交换的国标码,用于计算机内部处理的内码,输入时的输入码和输出时的字形码等。(1)汉字信息交换码(国标码) 我国颁布了信息交换用汉字编码字符集基本集,即GB2312-80,简称国标码。该标准收入了6763个常用汉字(其中一级汉字3755个,二级汉字3008个),以及英、俄、日文字母

22、与其他符号687个,共7000多个符号。 国标码的编码规则是:每个汉字由一个2字节(16位二进制)编码组成,每个字节的最高位置“0”,其余7位用于组成各种不同的码值。为了不与ASCII码的控制字符相同,每个字节剔除了34个ASCII码的控制字符,每个字节还剩94个编码。两个字节组成一个二维结构,前一个字节称“区”,后一个字节称“位”,所以国标码也称为区位码,一共可以表示9494个即8836个汉字以及其他符号。汉字分区,每个区94个汉字。 区号区中位置汉字 国标码 沪 2706(00011011 00000110) 久 3035(00011110 00100011) (2)汉字机内码机内码是计算

23、机内部存储和加工汉字时所用的代码。不管用何种汉字输入码将汉字输入计算机,为存储和处理方便,都需将各种输入码转换成长度一致的汉字内部码。 计算机既要处理汉字,也要处理西文。为了实现中、西文兼容,通常利用字节的最高位来区分某个码值是代表汉字或ASCII码字符。若最高位为“1”视为汉字符,为“0”视为ASCII字符。所以,汉字机内码在国标码的基础上,把2个字节的最高位一律由“0”改“1”构成。 汉字 内码 沪 10011011 10000110B 久 10011110 10100011B每个汉字占两个字节,国标码最高位为0,机内码最高位为1。(3)汉字输入码汉字主要是利用现有的输入设备(如键盘)来实

24、现输入,由键盘输入汉字时是输入汉字的输入码,每个汉字都对应一种汉字输入方法的一个输入码。 汉字的输入方法种类繁多,输入方法不同,同一汉字的输入码也不同。常用的汉字输入法有:拼音法,五笔字形输入法,智能ABC法,自然码等等。 在计算机中存入的是汉字的机内码,与所采用的输入法无关。不管使用何种输入法,在输入码与机内码之间总是存在着一一对应的关系,通过“键盘输入管理程序”把输入码转换为机内码。zhong 1.中2.重3.种4.钟5.肿“中”的输入码是:zhong1汉字输入方法音码拼音型码五笔字型音型码汉字编码方案音码:根据汉字的发音规律对汉字进行编码。 采用音码编码的输入法常见的有:智能拼 音、全拼

25、拼音、全拼双音、双拼双音等。形码:根据汉字的字形结构特征对汉字进 行编码。 采用形码编码的输入法常见的有: 五笔字形。混合码:综合汉字的发音及字形结构对汉字 进行编码。 常见的有阴阳码等输入法。(4)汉字字形码 汉字显示、打印输出的是汉字的字形,显示、打印是将汉字的字形分解成由点阵组成的图形,也称为字形码。字形码和内码之间也存在一一对应的关系,通过汉字系统的“输出处理程序”根据内码从汉字库找到对应的汉字点阵输出。 汉字的字形称为字模,以一点阵表示。点阵中的点对应存储器中的一位二进制 ,如果该点覆盖了笔画则对应的二进制位是1,否则是0。对于1616点阵的汉字,共有256个点,占用32 字节存储空间。点阵数越大,分辨率越高,字形越美观,但占用的存储空间越多。常用的有1616、2424、4848点阵字库。一个点阵汉字所占字节数=横向点数纵向点数8字型码汉字显示、打印的图形编码点阵字库纵向点数横向点数矢量字库笔划由多个有向线段组成。记录笔划的坐标然后填充,放大后不失真。2.3 多媒体信息的编码 多媒体信息包括各种声音、文本、图形、图像和视频等媒体信息,同样不能直接为计算机所识别,因此也必须对其编码。计算机通过采样和编码将其数字化,并通过数字化的方法将其转化为二进制的序列串,进而实现在计算机中的存储、处理和显示

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论