计算机数据表示.doc_第1页
计算机数据表示.doc_第2页
计算机数据表示.doc_第3页
计算机数据表示.doc_第4页
计算机数据表示.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机数据表示数据ISO的定义:数据是对事实、概念或指令的一种特殊表达形式,可以进行通信、转换或加工处理。一般的数字、文字、图画、声音、活动图像都是数据,计算机通过二进制编码形式对其进行处理。计算机内部把数据区分为数值型和非数值型。一、计算机中数据的表示一个数在计算机内被表示的二进制形式称为机器数。1、机器数形式最常见的原码和补码。1 原码:整数x的原码是指其符号位的0和1表示的正或负,其数值部分就是x绝对值的二进制数表示。 例如,假设机器数的位数是8,其中最高位是符号位,其余是数值部分。+17原=00010001,-17原=10010001+0原=00000000, -0原=10000000反码:在反码表示法中,正数的表示方式与原码相同,负数的反码是把其原码除符号为外的各位去反(即0变1,1变0)。+17反=00010001,-17反=11101110补码:在补码表示法中,正数的表示方式与原码相同,负数的补码是在其反码的最低有效位上加1。+17补=00010001,-17补=11101111例题已知x=6,y=2,求x-y解:x补=00000110, -y补=10000010原=11111101反 =11111110补 x-y= x补+ -y补= 00000110+11111110=000000100 x-y 补=00000100=4习题已知x=-1,y=-2,求x+y解:-x补=10000001原=11111110反 =11111111补 -y补=10000010原=11111101反 =11111110补 x+y= -x补+ -y补= 11111111+11111110=111111101 x+y 补=11111101补=10000010反=10000011原=-3数制:十进制、二进制、十六进制、八进制一个任意十进制数S用位权法(权为10)可表示为: S=AnAn-1An-2A1A0A-1A-2A-m相当于 S=An*10n-1+An-1*10n-2+A2*101+ A1*100 + A0*10-1+A-1*10-2+A-m*10-m-1如 (1997.07)10=1*104-1+9*103-1+9*102-1 +7*101-1+0*100-1+7*10-1-1二进制数(B):它的基本数码0和1(权为2)(1111.01)2=1*24-1+1*23-1+1*22-1+ 1*21-1+0*20-1+1*2-1-1八进制数(Q):它的基本数码07(权为8)(562.01)8=5*83-1+6*82-1+2*81-1+ 0*80-1+1*8-1-1十六进制数(H):它的基本数码09、A(10)、 B(11)、 C(12)、 D(13)、 E(14)、 F(15)、 (权为16)(A89.EF)16=10*163-1+8*162-1+9*101-1+ 14*160-1+15*16-1-1二、数据转换1、十进制数转换成二进制数 十进制整数转换成二进制整数采用整数除2取余数。直到商数等于0为止。 213 余数 1 2 6 余数 0 2 3 余数 1 2 1 余数 1 0 商 0 (13)D=(1101)B十进制数小数转换成二进制数 方法:乘2取整 (0.6875)D=( )B 0.6875 * 2 1.3750 取整数1 0.375 * 2 0.750 取整数0 结果 (0.6875)D=(0.1011 )B2、 十进制转换成八进制数、 十进制转换成十六进制数与十进制数转换成二进制数方法相似,将权分别设为8(八进制)或16(十六进制)。如: 8123 余数 3 8 15 余数 7 8 1 余数 1 0 商 0 (123)D=(173)Q 16 123 余数11 B 16 7 余数 7 7 0 商 0 0 (123)D=(7B)H3、二进制、八进制、十六进制之间转换二进制数转换成八进制 8=23 方法:三位一体 如(1111011.1011)B=( )Q 001,111,011.101,100) 三位一体 (1111011.1011)B=(173.54)Q二进制数转换成16进制 16=24 方法:四位一体 如(1111011.1011)B=( )H (0111,1011.1011) 四位一体 (1111011.1011)B=(7B.B)H例题(34.56)Q=( )H(011,100.101,110)B=(0001,1100.1011,1000)B=(1,1100.1011,1)B=(1C.B8)H通常,整数部分最左边的“0”以及小数点后面小数部分中最右边的“0”可以省略。三、计算机中数据的分类计算机中的数一般可分类为:数值数据、字符数据、逻辑数据。1、数值数据 数值数据 :带符号数和带小数点数。 带符号数:0代表正数,1代表负数 如:+48D=00110000B -48D=10110000B带小数点数:定点数和浮点数定点数:小数点位置固定数,其最高位是符号位。 如:+0.75在计算机中内用八位二进制数表示为:01100000浮点数:小数点位置不固定的数。浮点数可用阶码和尾数两部分来表示。 任何一个二进制数N,都可以写成2e *t,即N= 2e *t,(e称阶码,为二进制数,t成为尾数,纯小数二进制数)如1010.11=2100*0.101011浮点表示的机器数比定点表示的机器数范围大得多。2、西文信息在计算机内的表示 字符包括:字母、数字、标点符号等。 字符集:每一字符各有一个代码,构成代码表。ASCII码:美国标准信息交换码,七位二进制编码,表示128个字符。如A的位1000001B(41H)(65D)。ASCII码一个字节的编码对应一个字符,最高位一般为0,是7位编码,可表示128个,如0110001为1、1000101为E等。EBCDIC码: EBCDIC码是美国IBM公司在它的各类机器上广泛使用的一种信息代码。一个字符的EBCDIC码占用一个字符,用八位二进制表示信息,最多可以表示出256个不同代码。 “0”的EBCDIC码为F0H(11110000)2,字母“A”的编码为C1H(11000001)2。3、中文信息在计算机内的表示汉字字符集与编码 1981年,GB2312-80(国家标准信息交换用汉字编码)国家标准,其中有6763个汉字和682个西文字符、图形。其字符及编码称为国标码又叫国际交换码。 国际码是二个字节码,用二个七位二进制数码表示一个汉字。 例如“巧”字的代码是39H 41H。在机内形式如下: 0111001 1000001 第一字节 第二字节 在计算机内部,汉字编码和西文编码是共存的,如何区分它们是个很重要的问题,因为对不同的信息有不同的处理方式。方法之一是对于二字节的国标码,将二个字节的最高位都置成1。而ASCII码所用字节最高位保持0,然后由软件(或硬件)根据字节最高位来作出判断。 GB2312字符集的构成: 一级常用汉字3755个,按汉语拼音排列 二级常用汉字3008个,按偏旁部首排列 非汉字字符(西文字符、图形)682个汉字编码 外部编码(输入码):将汉字信息输入计算机。 机内码:在计算机内部,汉字以机内码形式工作、存储。 输出码:用汉字字形码输出汉字点阵信息。 国际码:计算机与计算机之间进行汉字信息交换。汉字外部编码:汉字输入码、汉字输出码。汉字外部编码就是利用计算机的输入设备所提供的符号,按照设定的编码规则和约定用一窜符号代码来表示汉字。汉字编码的方法和种类很多如五笔字型、汉语拼音、智能ABC等。汉字机内码(2字节表是一个汉字):不论使用的外部编码如何,在计算机内部处理时,都必须换成机内码。汉字的输入 方法:手写汉字联机识别、扫描输入识别、键盘输入。 输入编码要求:易学、易记、效率高、重码少、容量大。汉字编码:外部编码(输入码):将汉字信息输入计算机。 输入编码分类:1. 数字编码(如:区位码、电报码,难记)2. 字音编码即音码(全拼、智能ABC、微软拼音、双拼等)(简单,但重码多)3. 字形编码(如:五笔字形、表形码,重码少,规则难)4. 形音编码(规则简单、重码少,学习不易)。机内码 GB2312构成两维平面(区位码),94*94,行号为区号,列号为位号,各占一个字节,取其7位表示。 例:“大”的区号是20,位号是83,则其区位码为: 2083。(00010100 01010011 ) 区位码+32=国标码; 00110100 01110011 汉字以双字节表示,各字节的最高位为1的汉字编码叫“机内码”,或“内码”。 例:“大”的区号是20,位号是83,则其机内码为: 10110100 11110011汉字机内码汉字机内码是指在计算机内部表示一个汉字的编码。机内码和国际码稍有区别。高位字节=区码+20H(避免ASCII控制码冲突)+80H (避免ASCII字符冲突) =区码+A0H低位字节=位码+20H+80H=位码+A0H或高位字节=将汉字国际码的高位字节的高位上置“1”。低位字节=将汉字国际码的低位字节的高位上置“1”。如“南”的国标码高字节为01000100B,汉字机内码为11000100B=C4H, 低字节为01001111B,汉字机内码为11001111B=CFH, “南”汉字机内码C4CFH汉字字符集与编码 内码的表示方法可以不同。 BIG5-台湾,420个图形符号,13070个汉字,繁体。 ISO 10646:ISO 10646 是国际标准化组织 ISO 公布的一个编码标准,简称 UCS (国际),大陆译为通用多八位编码字符集,台湾译为广用多八位元编码字元集,中国标准为GB13000,其编码空间大,缺点是效率低;其简化方案为UCS-2,Unicode编码,长度为16位,CJK编码为此方案的大中国区的统一编码。(ISO 10646 是一个包括世界上各种语言的书面形式以及附加符号的编码体系。其中的汉字部分称为“CJK 统一汉字”(C 指中国,J 指日本,K 指朝鲜)。而其中的中国部分,包括了源自中国大陆的 GB 2312、GB 12345、现代汉语通用字表等法定标准的汉字和符号,以及源自台湾的 CNS 11643 标准中第 1、2 字面(基本等同于 BIG-5 编码)、第 14 字面的汉字和符号。)u GBK: GBK是又一个汉字编码标准,全称汉字内码扩展规范(GBK), GB 即“国标”,K 是“扩展”的汉语拼音第一个字母。 汉字的输出 字库(font):汉字字符的形状描述信息集合,不同的字体对应不同的字库。 字形描述方法:点阵字形(“1”表示对应位置是黑点、“0”表示是空白)和轮廓字形(用曲线描述,精度高、字形可变,如:Windows中的TrueType)。字形描述方法 点阵字形:“1”表示对应位置是黑点 “0”表示是空白 轮廓字形:用曲线描述,精度高、字形可变, 如:Windows 中的 TrueType 汉字字形码:汉字字形码:汉字可以用点阵来描述。16*16点阵汉字,表示有16行,每一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论