付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计算机数据与编码1.6.1信息和数据信息是人们对客观世界的认识,即对客观世界的一种反映。数据是表达现实世界中各种信息的一组可以记录、可以识别的记号或符号。它是信息的载体,是信息的具体表现形式。数据形式可以是字符、符号、表格、声音、图像等。数据可以在物理介质上记录或传输,并通过输入设备传送给计算机处理加工。数据的单位分为以下几种:1)位(bit)计算机中最小的数据单位二进制的一个数位,称为比特位,简称位。1位二进制只能表示两种状态,即0或1。n位二进制能表示2n种状态2)字节(Byte)相邻8个比特位组成一个字节,用B表示。字节是计算机中用来表示存储容量大小的基本单位。1B=8bits1KB=2
2、10B=1024B1MB=220B=1024KB1GB=230B=1024MB1TB=240B=1024GB3)字(Word)在计算机中作为一个整体被存取、传送、处理的二进制数位叫做一个字,每个字中二进制位数的长度,称为字长。用8位字长表示一个整数与用16位字长表示一个整数,其所表示的数的上限和下限是不一样的。字长所占位数其所表示的数的范围8-128127即:-27(27-1)16-3276832767即:-215(215-1)32-21474836482147483647即:-231(231-1)1.6.2数字化信息编码在计算机内部,可用物理器件的高低电平代表二进制的“0”和“1”,另外,脉
3、冲的正负极性,晶体管的导通和截止都可以用来表示二进制的“0”和“1”。由于二进制只有两个状态,数据的传输和处理不容易出错,另外二进制数的记数、加减法运算规则较为简单,可用开关电路实现,且二进制的“0”和“1”正好与逻辑命题的两个值“真”和“假”相对应,为计算机种中实现逻辑运算和逻辑判断提供了便利的条件。所以,在计算机中,广泛采用的是只有“0”和“1”两个基本符号组成的基二码,或称为二进制码。计算机最重要的功能是处理信息,这些信息包括数值、文字、图形、符号、图象、声音等,所有这些信息都必须经过编码,转换成计算机能够识别和处理的二进制码的形式才能够被存储、传送和加工。BCD码是二进制编码的十进制数
4、(BinaryCodedDecimal)的简写。有四位BCD码、六位BCD码和扩展的BCD码三种。(1)非数值数据的表示1)字符数据的表示ASCII码(AmericaStandardCodeforInformationInterchage)是美国标准信息交换码,被国际化组织指定为国际标准,分为7位和8位两种版本。国际通用的是7位ASCII码,它已对大、小写英文字母、阿拉伯数字、标点符号及控制符等特殊符号编码,共128个字符。表中特殊符号的意义如下:NUL空白SOH标题开始STX正文开始EXT正文结束EOT传输结束ENQ询问ACK承认BEL告警BS退格HT横向列表LF换行VT垂直列表FF换页CR
5、回车SO移位输出SI移位输入SP空格DLE转义DC1设备控制1DC2设备控制2DC3设备控制3DC4设备控制4NAK否认SYN空转同步ETB信息组传送结束CAN作废EM纸尽SUB取代ESC扩展FS文字分隔符GS组分隔符RS记录分隔符US单元分隔符DEL删除(2)汉字的表示汉字与英文的主要区别:1)英文是拼音文字,汉字是表意文字。英文字母只有26个,汉字多达5万个以上,常用汉字也有6000多个。2)汉字的同音字很多,一个音往往会有几个甚至几十个字。3)英文排序简单,汉字排序非常复杂,而且与文字本身没有本质联系。开发一个完善的中文信息处理系统必须解决以下三个主要问题:(1)汉字输入(2)汉字输岀(
6、3)汉字与西文的兼容性汉字的编码和表示1)汉字交换码(国标码)汉字交换码(国标码)主要用于汉字信息交换。国标码:以国家标准局1980年颁布的信息交换用汉字编码字符集"基本集(代号为GB231280)规定的汉字交换码作为国家标准汉字编码。GB231280中共有7445个字符符号:汉字符号6763个一级汉字3755个(按汉语拼音字母顺序排列)二级汉字3008个(按部首笔划顺序排列)非汉字符号682个GB231280规定,所有的国标码汉字及符号组成一个9494的方阵。在此方阵中,每一行称为一个”区",每一列称为一个"位”。这个方阵实际上组成一个有94个区(编号由01到9
7、4),每个区有94个位(编号由01到94)的汉字字符集。一个汉字所在的区号和位号的组合就构成了该汉字的”区位码"。其中,高两位为区号,低两位为位号。这样区位码可以唯一地确定某一汉字或字符;反之,任何一个汉字或符号都对应一个唯一的区位码,没有重码。区位码分布情况如下:区号内容1区键盘上没有的各种符号2区各种序号3区键盘上的各种符号(按中文方式给岀)4-5区日文字母6区希腊字母7区俄文字母8区标识拼音声调的母音及拼音字母名称9区制表符号10-15区未用16-55区一级汉字(按拼音字母顺序排列)56-87区二级汉字(按部首笔划顺序排列)88-94区自定义汉字由上可以看出,所有汉字与符号的9
8、4个区,可以分为四个组: 1-15区:为图形符号区。其中19区为标准符号区;1015区为自定义符号区。 16-55区:为一级汉字区,包含3755个汉字。这些区中的汉字按汉语拼音顺序排序,同音字按笔画顺序列岀。 56-87区:为二级汉字区,包含3008个汉字。这些区中的汉字是按部首笔划顺序排序的。 88-94区:为自定义汉字区。国标码规定,每个汉字(包括非汉字的一些符号)由2字节代码表示。每个字节的最高位为0,只使用低7位,而低7位的编码中又有34个适用于控制用的,这样每个字节只有27-34=94个编码用于汉字。2个字节就有9494=8836个汉字编码。在表示一个汉字的2个字节中,高字节对应编码
9、表中的行号,称为区号;低字节对应编码表中的列号,称为位号。汉字国标码的范围用二进制表示是:00100001001000010111111001111110(1+32)10(1+32)10(94+32)10(94+32)107位ASCII码是128个字符组成的字符集。其中编码值031(0000000000011111)不对应任何印刷字符,通常称为控制符,用于计算机通信中的通信控制或对计算机设备的功能控制。编码值32(00100000)是空格字符SP。编码值127(1111111)是删除字符DEL。汉字国标码的起始二进制位置选择00100001即(33)10是为了跳过ASCII码的32个控制字符和
10、空格字符。所以,汉字国标码的高位和低位分别比对应的区位码大(32)10或(00100000)2或(20)H,即:国标码高位=区码+20H(H表示十六进制)国标码低位=位码+20H2) 汉字机内码(内码)(汉字存储码)汉字机内码(内码)(汉字存储码)的作用是统一了各种不同的汉字输入码在计算机内部的表示。为了将汉字的各种输入码在计算机内部统一起来,就有了专用于计算机内部存储汉字使用的汉字机内码,用以将输入时使用的多种汉字输入码统一转换成汉字机内码进行存储,以方便机内的汉字处理汉字机内码是在计算机内部存储、处理的代码。计算机既要处理汉字,又要处理英文。因此计算机必须能区别汉字字符和英文字符。英文字符
11、的的机内码是最高为为0的8位ASCII码。为了不与7位ASCII码发生冲突,把国标码每个字节的最高位由0改为1,其余位不变的编码作为汉字字符的机内码。汉字机内码的范围用二进制表示是:10100001101000011111111011111110机内码的高位和低位比对应的国标码的高位和低位大(128)10或(10000000)2或(80)H即:机内码高位=国标码高位+80H机内码低位=国标码低位+80H又因为:国标码高位=区码+20H国标码低位=位码+20H所以:机内码高位=区码+A0H机内码低位=位码+A0H也就是说,机内码高位和机内码低位分别比对应的区码和位码大(160)10或(10100
12、000)2或(A0)H例如:汉字"啊"的区位码为"1601",其中区码为(16)10或(10)H,位码为(01)10或(01)H。贝U:机内码高位=10H+A0H=B0H机内码低位=01H+A0H=A1H所以:机内码=B0A1H3) 汉字输入码(外码)汉字输入码(外码)是为了通过键盘字符把汉字输入计算机而设计的一种编码。英文输入时,相输入什么字符便按什么键,输入码和机内码一致。汉字输入时,可能要按几个键才能输入一个汉字。汉字输入方案有成百上千个,但是这千差万别的外码输入进计算机后都会转换成统一的内码。汉字输入方案大致可分为以下4种类型:(1)音码:如全拼、双拼、微软拼音等(2)形码:如五笔字型、郑码、表形码等(3)音形码:如智能ABC、自然码等(4)数字码:如区位码、电报码等4) 汉字字形码(输出码)汉字字形码(输出码)用于汉字的显示和打印,是汉字字形的数字化信息。汉字的内码是用数字代码来表示汉字,但是为了在输出时让人们看到汉字,就必须输出汉字的字形。在汉字系统中,一般采用点阵来表示字形。16*16汉字点阵示意16*16点阵字形的字要使用32个字节(16*16/8=32)存储,24*24点阵字形的字要使用72个字节(24*24/8=72)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 产品黄金营销方案(3篇)
- 墙体开洞建筑施工方案(3篇)
- 应急预案里的预警预案是指(3篇)
- 方便米饭营销方案(3篇)
- 海南椰子营销方案(3篇)
- 营销比赛方案范文(3篇)
- 适老化营销方案(3篇)
- 妊娠合并胰腺炎的药物基因组学研究
- 2026道德与法治四年级加油站 生态文明意识
- 妊娠合并胎儿镜手术的术后远程监护方案
- 数字化转型下小微企业财务管控-轻量化工具赋能与效率提升研究毕业论文答辩
- 替人背债合同范本
- 书法反文旁课件
- 2025国防素养大赛试题及答案
- 地理信息安全在线培训考试系统题库及答案
- (2025年)爱的教育阅读测试题及答案
- 中国区块链行业研究及十五五规划分析报告
- 勘察项目重点、难点分析及解决措施
- 软件测试回归测试方案
- 山西护理副高答辩题库及答案解析
- 积木搭建游戏教学课件
评论
0/150
提交评论