信息技术基础模块1 项目5 信息编码_第1页
信息技术基础模块1 项目5 信息编码_第2页
信息技术基础模块1 项目5 信息编码_第3页
信息技术基础模块1 项目5 信息编码_第4页
信息技术基础模块1 项目5 信息编码_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

模块一信息技术素养

数字引领,服务现代科技生活认识计算机项目一任务5信息编码任务5信息编码文字图像图形数字化编码任务5信息编码

二——十进制的数字编码

西文字符编码

汉字编码1、二——十进制的数字编码(8421码,又称BCD码(全称BinaryCodeDicemal))计算机采用二进制,为了便于人机交互,常常用一组四位二进制编码表示一个十进制数字符号,称为二进制编码的十进制数。最常用的是8421码,又称为BCD码。例如:397的BCD码是126的BCD码是十进制数BCD码十进制数BCD码000005010110001601102001070111300118100040100910010011100101110001001001102、西文字符编码字符是计算机中使用最多的信息形式之一,是人与计算机进行通信、交互的重要媒介。同样,要计算机识别字符也必须对字符进行二进制编码。字符的编码有各种规定(标准),我国颁布的字符编码标准与国际上较普遍使用的ASCII码基本相同。2、西文字符编码ASCII(AmericanStandardCodeforInformationInterchange,美国信息交换标准代码)采用七位二进制编码(d6d5d4d3d2d1d0),故可以表示27=128个字符,第8位一般为0(如果需要,可以用作奇偶校验位),存储时占一个字节。128个字符包括:10个十进制数(0~9),52个英文大写和小写字母(A~Z,a~z),32个通用控制字符,34个专用字符。规律:从A到Z、从a到z和从0到9码值均为+1

趋势大小比较:数字<大写字母<小写字母;如0<A<a要求能正确查找西文字符的ASCII编码!b6b5b4b3b2b1b0通常计算机中用一个字节(8位二进制码)来表示一个字符,右边七位对应字符的ASCII码,最左边的一位通常用作奇偶校验,用来发现错误。所谓“奇校验”是指在校验位上设置0或1,以保证一个字节中“1”的个数为奇数。奇偶校验码是一种最简单的校验码,如果数码在存储、传送过程中,由于某种原因使得字符编码的某一位发生变化(由1变为0或由0变为1),在接收到的字节中,“1”的个数不是原规定的偶(或奇)数,于是就能发现错误。3、汉字编码汉字比西文字符数量要多且复杂,这给计算机的汉字编码带来了一定的困难。汉字是象形文字,在一个汉字处理系统中,输入、内部处理、输出对汉字有不同的编码要求。汉字信息处理系统在处理汉字时要进行一系列的汉字代码转换。这里主要介绍四类汉字代码:汉字输入码、汉字交换码、汉字内码和汉字字型码。为适应计算机处理汉字信息的需要,我国于1980年发布了《信息处理交换用汉字编码字符集基本集》GB2312-80。GB2312-80是由区位码演变而来的:区位码中,汉字被分成了94个区域,每个区域有94个位置。因此被称为:区(区域)位(位置)码其中,就像是坐标—样:区是横坐标,位是纵坐标。“啊”的区位码:区是16,位是01。区和位组成区位码:即“啊”的区位码就是1610(十进制)此时是十进制,计算机中应表示为二进制,而GB2312-80应该是十六进制的。汉字系统对每个汉字规定了输入计算机的代码,即汉字的外部码,键盘输入汉字是输入汉字的外部码。计算机为了识别汉字,要把汉字的外部码转换成汉字的内部码,以便进行处理和存储。为了将汉字以点阵的形式输出,还要将汉字的内部码转换为汉字的字形码,确定一个汉字的点阵。并且,在计算机和其它系统或设备需要信息、数据交流时还必须采用交换码。(1)外部码

外部码是计算机输入汉字的代码,代表某一个汉字的一组键盘符号。外部码也叫汉字输入码。目前汉字输入编码的方案很多,常见的就有几十种,如汉语拼音码、五笔字型、区位码等。各种输入编码法大致可以分为四类:A、数字编码:国标码、区位码B、字音编码:全拼、微软拼音、智能拼音C、字形编码:五笔字型、郑码、太极码D、音形编码:自然码随着科技的发展还有其它方式输入汉字:语音输入、手写输入、OCR识别等。例:输入汉字“张”时的区位码、拼音码和五笔码“张”区位码:5337“张”拼音码:zhang“张”五笔码:xt注意:同一个汉字,不同的输入法,它的输入码是不同的。(2)内部码

汉字内部码亦称为汉字内码或汉字机内码。计算机处理汉字,实际上是处理汉字的代码。当计算机输入外部码时,通常要转成内部码,才能进行存储、运算、传送。一般用二个字节表示一个汉字的内码。内部码经常是用汉字在字库中的物理位置表示,如汉字在字库中的序号或汉字在字库中的存储位置表示。注意一般情况下,汉字的内部码不能与西文字符编码(ACSII码、EBCDIC码等)发生冲突,并容易区分汉字与西文字符;尽可能占用少的字节表示尽可能多的汉字;与标准交换码兼容。除了二字节汉字内部码外,还有三字节内部码、四字节内部码、带引导码的汉字内部码、带符号的汉字内部码、带括号的汉字内部码等。(3)交换码(国家标准交换码)当计算机之间或与终端之间进行信息交换时,要求它们之间传送的汉字代码信息完全一致,国家规定了信息交换用的标准汉字交换码“GB312-80信息交换用汉字编码字符集(基本集)”,即国标码。交换码是用于不同的汉字信息系统间进行汉字交换时使用的编码,简称国标码。国标码共收集了7445个图形字符,其中汉字6763个,一般符号、数字、拉丁字母、希腊字母、汉语拼音等709个。(3)交换码(国家标准交换码)GBK字符集(简体+繁体)《汉字内码扩展规范》

即汉字扩充内码规范,又称大字符集,是目前见到的收录汉字最多的汉字系统。BIG-5码(繁体)通用于台湾、香港地区的一个繁体字编码方案。区位码、国标码和机内码之间的关系:国标码=(区位码的十六进制表示)+2020H机内码=国标码+8080H编码的转换举例:汉字区位码16进制国标码机内码文4636每个汉字用两个字节(2B)的空间存储2E24H4E44HCEC4H汉字区位码16进制国标码机内码大20831453H3473HB4F3H(4)汉字输出码汉字输出码又称汉字字形码或汉字发生器的编码。为了输出汉字,对汉字字形经过点阵的数字化后的一串二进制数称为汉字输出码。汉字字形码是表示汉字字形的字模数据。汉字的字形码是用在显示或打印汉字时产生字形,通常用点阵、矢量和曲线函数等方式表示用点阵表示字形时,汉字字形码叫做这个汉字的字形点阵码。例如,16*16点阵码,每个汉字占32个字节,其中每个字节的一位(Bit)代表一个点,当该位为“0”时,对应的点为“白”色,为“1”时,对应的点为黑。提高型汉字为24*24点阵、32*32点阵、48*48点阵等。每个24*24点阵汉字占用72字节,同理,每个16*16点阵占用32字节。(4)汉字输出码例:汉字“次”的16×16点阵字形码(4)汉字输出码点阵字形码占用存储空间计算方法方法:字节数=点阵行数×点阵列数÷8原理:点阵中的每个点需要一个二进制的位来存储。例:用16×16点阵和48×48点阵表示一个“次”字,分别需要多大的存储空间?解:16×16点阵占空间:16×16÷8=32字节48×48点阵占空间:48×48÷8=288字节(5)汉字编码之间的关系输入码交换码(国标码)机内码字形码例如,我们通过键盘输入一个汉字“计”,并在屏幕上显示,其编码的转换过程如下:①通过键盘输入输入码:ji(拼音输入法)。②通过输入法控制程序,依据交换码(国标码0011110001000110),把输入码(ji)转换成机内码(1011110011000110),并保存在计算机内。③汉字显示驱动程序根据机内码计算出“计”的字形码所在字库的地址,通过相应的地址把字库中的字形码取出,存入到相应的显示内存单元中。④在显示驱动程序的控制下,根据显示内存中的字形码,在屏幕的相应位置显示汉字“计”的字形。练习任务5信息编码1、有一个末位为零的非零无符号二进制整数,若将其末位去掉,形成一个新的数,则新数的值是原数值的________。A.4倍B.2倍C.1/4D.1/22、二进制数1101001用十进制表示为()。A.209B.18C.105D.573、将下列字符的ASCII码值进行比较,正确的一个是()。A.4>空格字符B.w<XC.I<3D.a>A练习任务5信息编码4、大写字母C的ASCII码值为十进制数67,ASCII码值为十进制数69的字母是()。A.BB.CC.DD.E5、ASCII码编码范围从0000000B~1111111B,共有()个不同的码值。A.256B.255C.128D.1276、二进制数10010110减去二进制数110000的结果是()。A.100110B.1000110C.1100110D.10000110任务5信息编码7、在微型计算机内部,对汉字进行传输、处理和存储时使用汉字的()。A、国标码B、字形码C、输入码D、机内码8、在微机中,西文字符所采用的编码是()。A、EBCDIC码B、ASCII码C、国标码D、BCD码任务5信息编码9、存储1024个24×24点阵的汉字字形码需要的字节数是()。A、720BB、72KBC、7000BD、7200B10、在ASCII码表中,根据码值由小到大的排列顺序是()。A、空格字符、数字符、大写英文字母、小写英文字母B、数字符、空格字符、大写英文字母、小写英文字母C、空格字符、数字符、小写英文字母、大写英文字母D、数字符、大写英文字母、小写英文字母、空格字符任务5信息编码11、存储一个48X48阵的汉字形码需要的字节个数是()A、384

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论