计算机中数据的表示与信息编码

上传人：精*** IP属地：广东上传时间：2020-04-13 格式：DOC 页数：9 大小：179.27KB 积分：20 举报 版权申诉

已阅读5页，还剩4页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

精品文档计算机中数据的表示与信息编码计算机最主要的功能是处理信息，如处理文字、声音、图形和图像等信息。在计算机内部，各种信息都必须经过数字化编码后才能被传送、存储和处理。因此要了解计算机工作的原理，还必须了解计算机中信息的表现形式。1.2.1 计算机使用的数制 1计算机内部是一个二进制数字世界计算机内部采用二进制来保存数据和信息。无论是指令还是数据，若想存入计算机中，都必须采用二进制数编码形式，即使是图形、图像、声音等信息，也必须转换成二进制，才能存入计算机中。为什么在计算机中必须使用二进制数，而不使用人们习惯的十进制数？原因在于：易于物理实现：因为具有两种稳定状态的物理器件很多，例如，电路的导通与截止、电压的高与低、磁性材料的正向极化与反向极化等。它们恰好对应表示1和0两个符号。机器可靠性高：由于电压的高低、电流的有无等都是一种跃变，两种状态分明，所以0和1两个数的传输和处理抗干扰性强，不易出错，鉴别信息的可靠性好。运算规则简单：二进制数的运算法则比较简单，例如，二进制数的四则运算法则分别只有三条。由于二进制数运算法则少，使计算机运算器的硬件结构大大简化，控制也就简单多了。虽然在计算机内部都使用二进制数来表示各种信息，但计算机仍采用人们熟悉和便于阅读的形式与外部联系，如十进制、八进制、十六进制数据，文字和图形信息等，由计算机系统将各种形式的信息转化为二进制的形式并储存在计算机的内部。 2进位计数制数制，也称计数制，是指用一组固定的符号和统一的规则来表示数值的方法。数制可分为非进位计数制和进位计数制两种。非进位计数制的数码表示的数值大小与它在数中的位置无关；而进位计数制的数码所表示的数值大小则与它在数中所处的位置有关。而我们在这里讨论的数制指的都是进位计数制。进制是进位计数制的简称，是目前世界上使用最广泛的一种计数方法，它有基数和位权两个要素。基数：在采用进位计数制的系统中，如果只用r个基本符号（例如0，1，2，r-1）表示数值，则称其为r数制（Radix-r Number System），r称为该数制的基数（Radix）。如日常生活中常用的十进制，就是r=10，即基本符号为0，1，2，9。如取r=2，即基本符号为0和1，则为二进制数。位权：每个数字符号在固定位置上的计数单位称为位权。位权实际就是处在某一位上的1所表示的数值大小。如在十位制中，个位的位权是100，十位的位权是101，；向右依次是10-1，10-2，。而二进制整数右数第2位的位权为2，第3位的位权为4，第4位的位权为8。一般情况下，对于r进制数，整数部分右数第i位的位权为ri-1，而小数部分左数第i位的位权为r-i。各种进制的共同点是：每一种数制都有固定的符号集。如十进制数制，其符号有十个：0，1，2，9，二进制数制，其符号只有两个：0和1。需要指出的是，16进制数基数为16，所以有16个基本符号，分别为，1，2，，8，9，A，B，C，D，E，F。表 1-3列出了计算机中常用的几种进制。采用位置表示法，用位权来计数。即处于不同位置的数符所代表的值不同，与它所在位置的权值有关。例如：十进制的1358.74可表示为： 1358.74=1103+3102+5101+8100+710-1+410-2可以看出，各种进位制中的位权的值恰好是基数的某次幂。因此，对于任何一个进位计数制表示的数都可以写出按其权值展开的各项式之和，称为“按权展开式”。任意一个n位整数和m位小数的r进制数D可表示为：n位整数m位数 Dn-1 Dn-2D2 D1 D0. Dm Dm-1 Dm-2D2 D1 按基数来进位和借位（逢r进一，借一当r）。现列举二进制的算术运算如下：从这里我们能够体会到二进制的运算的确能够起到简化硬件的作用加法：减法：（借位）（进位）乘法：除法：0 表 1-3 计算机中常用的几种进位数制进位制二进制八进制十进制十六进制规则逢二进一逢八进一逢十进一逢十六进一基数r=2r=8r=10r=16数符0,10,1,2,70,1,2,90,1,2,9,A,B,C,D,E,F权2i8i10i16i表示符号BODH1.2.2 数制间的相互转换 1非十进制数转换十进制数r进制转换为十进制数，采用r进制数的位权展开法，即将r进制数按“位权”展开形成多项式并求和，得到的结果就是转换结果。【例1.1】【例1.1】把 (11011.101)2转换成十进制数解：(11011.101)2 = 1524 + 1523 + 0522 + 1521 + 1520 + 152-1 + 052-2 + 152-3 = 16 + 8 + 0 + 2 + 1 + 0.5 + 0 +0.125 = (27.625)10 2十进制数转换非十进制数转换规则：整数部分采用“逐次除以基数取余”法，直到商为0；小数部分采用“逐次乘以基数取整”法，直到小数部分为0或取到有效数位。十进制数转换成二进制数：整数部分采用“除2取余”法; 小数部分采用“乘2取整”法【例1.2】把 (157.6875)10转换成二进制数余数十进制整数部分余余余余 2余余余余 (157)10=( 10011101)210011101第一个余数是最低位最高位0.6875 21.3750整数1 20.7500整数0 21.5000整数1 21.0000整数1十进制小数部分10111 0 1 111 1最低位注:十进制小数不一定能转换成完全等值的二进制小数,有时要取近似值。（0.6875)10 = (1011) 2 结果：(157.6875)10 = (10011101.1011)2 用同样的方法，可将十进制数转换成八进制数和十六进制数，分别采用“除8取余，乘8取整”和“除16取余，乘16取整”法。3. 非十进制数之间的转换通常两个非十进制数之间的转换方法是采用上述两种方法的组合，即先将被转换数转换为相应的十进制数，然后再将十进制数转换为其他进制数。由于二进制、八进制和十六进制之间存在着特殊关系，即81=23，161=24，因此转换方法就比较容易，如表1-4所示。二进制、八进制数之间的转换。由于1位八进制数相当于3位二进制数，因此，二进制数转换成八进制数，只需以小数点为界，整数部分按照由右至左（由低位向高位）、小数部分按照从左至右（由高位向低位）的顺序每三位划分为一组，最后不足3位二进制数时用零补足。按表1-4，每三位二进制数分别用与其对应的八进制数码来取代，即可完成转换。而将八进制转换成二进制的过程正好相反。【例1.3】将 (11001110.01010111)2 转换成八进制数。（）（ 5 ）【例1.4】将 (574.623)8 转换成二进制数。（）（）二进制、十六进制数之间的转换由于十六进制的1位数相当于二进制的4位数，因此二进制同十六进制之间的转换就如同二进制同八进制之间的转换一样，只是4位一组，不足补零。【例1.5】将 (11011 1110 0011 . 1001 011)2 转换成十六进制数。（）2 （）16表 1-4 二进制、八进制和十六进制之间的关系二进制八进制二进制十六进制二进制十六进制00000000010008001100011100190102001021010A0113001131011B1004010041100C1015010151101D1106011061110E1117011171111F总之，数在机器中是用二进制表示的，但是，二进制数书写起来太冗长，容易出错，而且目前大部分微型机的字长是4位、8位、16位、32位和64位的，都是4的整数倍，故在书写时可用十六进制表示。一个字节（8位）可用两位十六位进制数表示，两个字节（16位）可用4位十六进制表示等，书写方便且不容易出错。1.2.3 二进制数在计算机内的表示计算机中的数据包括数值型和非数值型两大类。数值型数据指可以参加算术运算的数据，例如 (123)10、(1001.101)2等。非数值型数据不参与算术运算。例如字符串“电话号码：2519603”、“4的3倍等于12”等都是非数值数据。注意这两个例子中均含有数字，如2519603、4、3、12 ，但它们不能也不需要参加算术运算，故仍属非数值数据。下面讨论数值型的二进制数的表示形式：1. 机器数在计算机中，因为只有“0”和“1”两种形式，所以数的正负，也必须以“0”和“1”表示。通常把一个数的最高位定义为符号位，用0表示正，1表示负，称为数符，其余位仍表示数值。把在机器内存放的正、负号数码化的作为一个整体来处理的二进数串称为机器数（或机器字），而把机器外部由正、负表示的数称为真值数。例：真值为 (+1010011) B的机器数为 01010011，存放在机器中，等效于+83。需注意的是，机器数表示的范围受到字长和数据的类型的限制。字长和数据类型定了，机器数能表示的数值范围也就定了。例如，若表示一个整数，字长为8位，则最大的正数为01111111，最高位为符号位，即最大值为127。若数值超出127，就要“溢出”。2. 数的定点表示和浮点表示当计算机所需处理的数含有小数部分时，又出现了如何表示小数点的问题。计算机中并不单独利用某一个二进制位来表示小数点，而是隐含规定小数点的位置。根据小数点位置是否固定，计算机中的数可分为定点数和浮点数两种。定点表示法：所谓定点表示法就是小数点在数中的位置固定不变，它总是隐含在预定位置上。通常，对于整型数，小数点固定在数值部分的右端，即在数的最低位之后，其格式如图1-2所示；对于小数，小数点固定在数值部分左端，即在数的符号位之后、最高数位之前，其格式如图1-3所示。sdn-1dn-2d0图1-2 定点整数的存储格式sdn-1dn-2d0图1-3 定点小数的存储格式数值部分符号位小数点位置数值部分符号位小数点位置例如：定点整数120用8位二进制数可表示为01111000，其中最高位0表示符号为正。根据计算机字长不同，如果用n个二进制位存放一个定点整数，那么它的表示范围为：-2n-12n-1-1。说明:上面表示的整数的范围是以补码形式表示的，有关补码的知识在后面介绍。定点小数-0.125用8位二进制数可表示为10010000，其中最高位1表示号为负。根据计算机字长不同，如果用n个二进制位存放一个定点小数（纯小数），其表示范围为：-1(2- (n-1)。数的浮点表示定点数用来表示整数或纯小数。如果，一个数既有整数部分，又有小数部分，采用定点格式就会引起一些麻烦和困难。因此，计算机中使用浮点表示方法。浮点表示法对应于科学（指数）计数法，如数110.011可表示为N=110.011=1.100112+10 =11001.12-10 =0.1100112+11浮点表示法中的小数点在数中的位置不是固定不变的，是浮动的。任何浮点数都由阶码和尾数两部分组成，阶码是指数，尾数是纯小数。其存储格式如图1-4所示。其中，数符和阶符都各占一位，数符是尾数（纯小数）部分的符号位；而阶符为阶码（指数部分）的符号位。阶码的位数随数值的表示的范围而定，尾数的位数则依数的精度而定。当一个数的阶码大于机器所能表示的最大阶码或小于机器所能表示的最小阶码时会产生“溢出”。阶符Em-1Em-2E0数符d n-1d n-2d 0图1-4 浮点数存储格式阶码尾数尾数小数点位置阶码小数点位置例如，设尾数为4位，阶码为2位，则二进制数N=10111011的浮点数表示形式为 01101011 阶符阶码数符尾数应当注意的是：浮点数的正负是由尾数的数符确定的，而阶码的正、负只决定小数点的位置，即决定浮点数的绝对值的大小。当浮点数的尾数为零或阶码为最小值时，机器通常规定，把该数看作零，称为机器零。3. 带符号数的表示在计算机中，带符号数可以用不同方法表示，常用的有原码、反码和补码。原码 X 0 X2n-1-1 2n-1 +X -(2n-1-1)X0X原=数X的原码记作 X原，如果机器字长为n ，由则原码的定义如下： X 0 X2n-1 2n -X -(2n-1-1)X原= 例: X1 ,X2的真值为 X1=+1010110 X2=-1001010 , 原码表示为 X1原=+1010110原=01010110 X2原=-1001010原=11001010由此可以看出，原码的最高位为符号位，正数为0，负数为1，其余n-1位表示数的真值的绝对值。其中，0的原码表示有两种，+0原=00000000 -0原=10000000 采用原码的优点是简单易懂，与真值转换方便，用于乘除法运算十分方便。但是对于加减法运算就麻烦了，因为当两个同号数相减或两个异号数相加时，必须判断两个数的绝对值哪个大，用绝对值大的数减去绝对值小的数，而运算结果的符号则应取与绝对值大的数相同符号。要完成这些操作相当麻烦，还会增加运算器的复杂性。为了克服原码的缺点，引进了数的补码表示方法。补码数X的补码记作 X补，如果机器字长为n ，则补码的定义如下： X 0 X2n-1-1 2n -X -2n-1X0X补= 正数的补码等于其原码本身；而负数的补码等于2n减去它的绝对值，即等于对它的原码（符号位除外）各位取反，并在末位加1而得到的数。例: X1 ,X2的真值为 X1=+1010110 X2=-1001010 , 补码表示为 X1补=01010110 X2补=10110110 在补码中，0有唯一的编码： +0补=-0补=00000000 补码可以将减法运算转化为加法运算，即实现类似代数中的x-y = x+(-y)的运算。如补码的加减法运算规则：X+Y补=X补+Y补 X-Y补=X补+-Y 补反码反码是对负数原码除符号位外逐位取反所得的数，正数的反码则与其原码形式相同。例：X1 ,X2的真值为 X1=+1010110 X2=-1001010 , 反码表示为 X1反=01010110 X2反=10110101同样，反码表示方式中，0有两种表示方法：+0反=00000000 -0反=111111111.2.4 数字化信息编码数字化信息编码是把少量二进制符号（代码），根据一定规则组合起来，以表示大量复杂多样的信息的一种编码。一般来说，根据描述信息的不同可分为数字编码、字符编码、汉字编码等。1. 数字编码数字编码是用二进制数码按照某种规律来描述十进制数的一种编码。最简单最常的是8421码，或称BCD码（Binary-Code-Decimal）。它利用四位二进制代码进行编码，这四位二进制代码，从高位至低位的位权分别为23、22、21、20，即8、4、2、1。并用来表示一位十进制数。下面列出十进制数符与8421码的对应关系。十进制数0123456789 8421码0000000100100011010001010110011110001001根据这种对应关系，任何十进制数都可以同8421码进行转换。如（52）10（01010010）BCD （1001 0100 1000 0101）（9485）102字符编码在计算机系统中，除了处理数字外，还需要把符号、文字等利用二进制表示，这样的二进制数称为字符编码。ASCII码（American Standard Code of Information Interchange）是“美国标准信息交换代码”的缩写。该种编码后来被国际标准化组织ISO采纳，作为国际通用的字符信息编码方案。ASCII码用7位二进制数的不同编码来表示128个不同的字符（因27=128），它包含十进制数符09、大小写英文字母及专用符号等95种可打印字符，还有33种通用控制字符（如回车、换行等），共128个。ASCII码表如表1-5所示，如A的ASCII码为1000001。ASCII码中，每一个编码转换为十进制数的值被称为该字符的ASCII码值。表1-5 ASCII表 b7b6b5b4b3b2b10000010100111001011101110000NULDLESP0P 、p0001SOHDC!1AQaq0010STXDC“2BRbr0011ETXDC#3CScs0100EOTDC$4DTdt0101ENQNAK%5EUeu0110ACKSYN&6FVfv0111BELETB7GWgw1000BSCAN(8HXhx1001HTEM)9IYiy1010LFSUB*:JZjz1011VTESC+;Kk1100FFFS ，Mn1111SIUS/?O_oDEL2. 2. 汉字编码：汉字在计算机内也采用二进制的数字化信息编码。由于汉字的数量大，常用的也有几千个之多，显然汉字编码比ASCII码表要复杂得多，用一个字节（8 bit）是不够的。目前的汉字编码方案有二字节、三字节甚至四字节的。在一个汉字处理系统中，输入、内部处理、输出对汉字的要求不同，所用代码也不尽相同。汉字信息处理系统在处理汉字词语时，要进行输入码、国标码、内码、字型码等一系列的汉字代码转换。国标码1981年我国制定了中华人民共和国国家标准信息交换汉字编码（GB2312-80标准），这种编码称为国标码。在国标码字符集中共收录了汉字和图形符号7445个，其中一级汉字3755个，二级汉字3008个，西文和图形符号682个。国标GB2312-80规定，所有的国标汉字与符号组成一个94594的矩阵。在此方阵中，每一行称为一个区（区号分别为0194）、每个区内有94个位（位号分别为01-94）的汉字字符集。汉字与符号在方阵中的分布情况如下：115区为图形符号区：

人人文库> 全部分类> 应用文书 > 事务文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

计算机中数据的表示与信息编码

文档简介

温馨提示

最新文档

评论

计算机中数据的表示与信息编码

文档简介

温馨提示

最新文档

评论

相关文档