已阅读5页,还剩57页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
成武一中技术中心2017-10-20,数据编码的基本方式,了解二进制的基本原理和进制转换方法知道数值、文字、图形图像、音视频等数据在计算机中的编码方式。,学习目标,3,计算机最主要的功能就是处理信息,而信息在计算机中如何表示、存放、传递?这是首先要解决的问题。基本要求是:信息的表示、存放和传递要方便、可靠、易处理。显然,在计算机内部,信息只有经过数字化编码后才能表示、存放和传递。,计算机与信息处理,4,信息的表示及采集编码:用少量的基本符号,根据简单的组合规则,以表示大量复杂的信息。二进制:是一种最简单的编码系统。多媒体信息的表示与采集基于计算机的信息处理信息的组织信息的传输信息的检索,数据编码的基本方式,5,计算机中的信息采用二进制编码来表示。二进制表示数字容易实现(只有0、1)。二进制运算规则简单(逢二进一)。二进制编码在物理上最容易实现;自然界中具有两个固定状态的物理量很多,例如:电流的有无、电压的高低等。,计算机为什么选用二进制,6,数制:人们利用符号来计数的科学方法。进位计数制:按一定进位规则进行计数的方法。基数:是指该进制中允许使用的基本数码的个数。十进制的基数为10,数码为0,1,2,9十个。二进制的基数为2,数码为0,1两个。八进制的基数为8,数码为0,1,7八个。十六进制的基数为16,数码为09,AF十六个。位权:数制每一位所具有的值,简记为“权”。,计算机中的数制,7,按权展开式:234.32=2*102+3*101+4*100+3*10-1+2*10-2,8,在按位定制的计数制中,十进制数可以表示成下列形式(用D代表或略去,无后缀符默认为十进制数):(D)10=Di10i=Dn-110n-1+Dn-210n-2+D0100+D-110-1+D-m10-m举例:519.02=5102+1101+9100+010-1+210-2特点:有0-9十个数字符号,基数为10,是逢十进一的计数制,各数位的权是以10为底的幂。,n-1,i=-m,十进制表示法,9,一个二进制数可以表示成下列形式(用B代表):(B)2=Bn-12n-1+Bn-22n-2+B020+B-12-1+B-m2-m举例:1101.01=123+122+021+120+02-1+12-2特点:数值用0,1表示,基数为2,是逢二进一的计数制,各数位的权是以2为底的幂。表示:1101.01B或(1101.01)2,二进制表示法,10,一个八进制数可以表示成下列形式(用Q代表):(B)8=Bn-18n-1+Bn-28n-2+B080+B-18-1+B-m8-m举例:3765.02=383+782+681+580+08-1+28-2特点:数值用07表示,基数为8,是逢八进一的计数制,各数位的权是以8为底的幂。表示:452.16Q或(1101.01)8,八进制表示法,11,一个十六进制数可以表示成(用H代表):(H)16=Hn-116n-1+Hn-216n-2+H020+H-116-1+H-m16-m举例:A3F.3B=10162+316+15160+316-1+1116-2特点:有0-9及A-F共16个数字符号,基数为16,是逢十六进一的计数制,各数位的权是以16为底的幂。表示:3EFH或(20)16,十六进制表示法,不同进制数之间的转换,12,13,(11001.101)2=124123022021120121022123=(25.625)10(16A.B)16(11626161101601116-1)10(25696100.69)10(362.69)10(34.6)8=?,=(38148068-1)10=(2440.75)10=(28.75)10,二、八、十六进制转换成十进制,14,方法:除2反序取余法例:(29)10=(?)2结果:(29)10=(11101)2,十进制整数转换成二进制整数,15,方法:乘2顺序取整法例:(0.125)10=(?)2结果:(0.125)10(0.001)2,并非所有的十进制小数都能用有限位的二进制小数来表示。例如将(0.63)10转换为二进制。因为,小数部分乘以2会无限循环下去,故:只能取近似值。,十进制小数转换成二进制小数,16,100(D)=144(Q)=64(H),十进制转化成八、十六进制,17,八进制数转换为二进制数只需将每一个八进制数字改写成等值的3位二进制数即可,且要保持高、低位次序的不变。(16.327)8(001110.011010111)2(1110.011010111)2,二进制与八进制之间的转换,18,整数部分从低位向高位方向每3位用一个等值的八进制数来替换,最后若不足3位的在高位处用0补够3位;小数部分从高位向低位每3位用一个等值的八进制数来替换,不足3位的在低位处用0补够3位。(011110111.100010101)2(367.425)8367.425,二进制数转换成八进制数,19,十六进制数转换成二进制数把每一个十六进制数字改写成等值的4位二进制数即一位拆成四位,且要保持高、低位的次序不变。(4C.2E)16(01001100.00101110)24C2E(1001100.0010111)2,二进制与十六进制间的转换,20,整数部分从低位向高位方向每4位用一个等值的十六进制数来替换,即四位并为一位,最后不足4位时在高位处补0,补够4位;小数部分从高位向低位方向每4位用一个等值的十六进制数来替,最后不足4位时在低位处补0,补够4位。(111001011010.10111001)2(E5A.B9)16E5A.B9,二进制数转换为十六进制数,21,0000010001200103001140100,练习,5010160110701118100091001,101010111011121100131101141110151111,(1110011010.111)2()8()16,22,计算机是美国人发明的,因此计算机的字符集中自然包含了英文的26个字母。计算机要在全世界通用,必须采用公认的标准格式对字符、符号进行编码。常用的字符编码有ASCII码、BCD码、西文字符编码和EBCDIC码。,编码,23,十进制数的二进制编码(BCD)是指十进制数在计算机中用二进制编码来表示。二十进制编码的方法很多,8421码是最常见的一种,即每一位十进制数用四位二进制编码来表示。例如,十进制数2816的8421码为:十进制数28168421码0010100000010110,BCD码在形式上变成了0和1组成的二进制形式,而实际上它表示的是十进制数,只不过是每位十进制数是用4位二进制编码表示。,BCD(BinaryCodedDecimal)码,24,ASCII码有标准ASCII码和扩展ASCII码两种。标准的ASCII码使用7位的二进制数来编码,即每一个字符对应着一个7位的二进制数。所以用标准的ASCII码可以表示27=128个字符,其中包含10个阿拉伯数字,52个英文大小字母,33个符号及33个控制字符。扩展的ASCII码用8位二进制数来表示,可以表示256种不同的符号。,ASCII码(AmericanStandardCodeforInformationInterchange,美国标准信息交换码),25,西文字符处理起来比较简单,而中文信息处理起来就复杂了。汉字是图形文字,常用汉字就有30006000个,形状和笔画差异很大。这就决定了汉字字符的编码方案必须完全不同于西文的编码方案。在计算机系统中汉字的输入、内部处理、存储和输出过程中不能使用同一代码。,输入码,机内码,字库,字形码,26,输入码是解决汉字输入采用的编码,如“国标区位码”、“全拼”、“双拼”、“五笔”、“智能ABC”、“搜狗拼音”等输入编码。每一种输入码之所以能存在,是因为各有其特点。如果有人问,哪种输入码最好,回答是“你熟练掌握的那种输入码就是最好的”。,输入码,27,我国在1980年制定了信息交换用汉字编码字符集基本集作为国家标准GB2312-80编码字符集,称为国标码。GB2312-80中规定了信息交换用的6763个汉字和682个非汉字图形符号(包括字母、数字和符号,例如英文、俄文、日文平、片假名等)的代码。在国家标准GB2312-80中,每个汉字采用双字节表示。每个字节只用ASCII码中的低7位,最高位为0。国标码采用十六进制表示。每个汉字的区位码同时对应一个国标码。,国标码,28,十六进制编码,十进制编码,区位编码,国标码编码,0020,2122232425267C7D7E,7F,0020,位区,12345691929394,212F,115,非汉字图形符号(常用符号、数字序号、俄文、英文、法文、希腊字母、日文平、片假名等),3057,1655,啊阿埃一级汉字(3755个),5877,5687,二级汉字(3008个),787E,8894,空白区域,7F,29,由于低7位中只有94种状态可用于汉字编码(其它34位是控制字符,不能用),所以两个字节的低7位共有9494=8836种不同的状态。国标码将6763个汉字和682个非汉字字符(共7445个)划分为94个区,每个区又分为94位,称其为区位表。每个汉字在区位表中有唯一的一个区位码(四位十进制数,前两位数是区号,后两位数是位号)与之对应,称之为“区位码”。例如,汉字“啊”在区位表中的编码是“1601”,既区号是“16”,位号是“01”。,30,GB2312-80统一规定了汉字的基本编码标准,但是要存储在计算机中与西文编码在计算机中的表示有冲突。例如,英文字符“L”和“1”的ASCII码是“76”和“108”,而汉字的“天”的区位码也是“76”和“108”。问题出在ASCII码和汉字国标码都采用字节的低7位编码方式。为了避免冲突,将国标码两个字节的最高位置“1”,形成汉字的机内码。例如,汉字“中国”,的机内码分别是十六进制的“D6D0”和“B9FA”。,机内码,31,国标码和机内码解决了汉字的编码标准和存储表示,但还没有解决汉字的显示和输出问题。一套汉字(如GB2312)其所有字符形状的数字描述信息组合在一起称之为字库(font)。对汉字形状的数据描述,我们称为汉字字形码。目前计算机系统中有两种字形码:点阵式字形码和矢量字形码。,字形码,32,以点阵方式来表示汉字。每个点用二进制的一位“0”或“1”来分别表示汉字相应位置处的状态,如白、黑特征,从而体现出字的形和体。点阵越大,点数越多,输出的字形就越清晰,越美观。常见的有1616、2424、3232、4848和128128。通过一组直线和曲线的数学描述(端点及控制点的坐标),将汉字的每个笔画都转化为数字特征值,组合在一起便得到了这个汉字的字形矢量信息。通过矢量法表示的汉字字形大小、方向可以任意变化,这种方式构成的汉字精度高、美观、清晰,Windows环境中使用的TrueType字库采用的就是典型的矢量字形表示法。缺点是输出前必须通过复杂的运算处理。,字形码,33,“大”字的区号为20,位号为83,区位码为:2083,用14位二进制表示为:00101001010011国标码:01101001110011七位+七位机内码:1011010011110011八位+八位(1)字形码:1616点阵,34,汉字信息的处理过程,35,汉字处理过程中各种编码之间的关系,如下图所示。,自动转换,字节最高位置“1”,转换(调用汉字字库),36,声音、图形(Graphic)、图像(Image)等多种信息在计算机中的处理也是基于二进制的,但其表现形式是复杂多样的。采集量化编码,多媒体信息的表示与采集,描述数字声音的参数有:取样频率:一秒钟内采样的次数。量化位数:采样值的二进制位数。声道数目:一次采样所记录产生的声音波形个数,分为单声道和双声道。码率(BitRate):表示每秒的数据量,以kb/s为单位。采用的压缩编码方法:MPEG通过对实际声音的波形信号进行数字化处理而获得的数字声音,我们称为“波形声音”。PC机中使用最广泛的波形声音文件是采用.wav作为扩展名的数据文件,称为波形文件格式。除此之外还有.mid、.mp3等其它描述音乐的数据文件。合成声音是使用符号(参数)对声音进行描述,然后通过合成的方法来生成声音。典型的有MIDI声音。,37,声音信息的表示,38,1秒钟CD音质的数据量(码率)为:(44.1kHz16bit2)8=1411.2kb/s8=176.4kB/s1小时CD音质的数据量为:176.4kB/s36001000=635.04MB,声音信息存储的文件大小计算,39,点阵图像(DotMatrixImage)/位图图像(Bitmap)“图像”(Image)几何图形/矢量图形“图形”(Graphics)通过以下几个方面对Image进行描述:图像由一个像素组成的矩阵来表示。矩阵中的行数称为图像的垂直分辨率,列数称为图像的水平分辨率。矩阵中的元素是像素彩色分量的亮度值,用整数表示,一般是8位12位。描述数字图像属性指标有:图像的分辨率(图像大小)位平面的数目:彩色分量(Component)的数目彩色空间的类型:彩色图像所使用的颜色描述方法,也叫彩色模型。常见的彩色空间有RGB(红、绿、蓝)空间、CMYK(青、橙、黄、黑)空间、YUV(亮度、色差)空间等。,图像信息的表示,图像,40,像素的深度(所有分量的位数之和):决定了图像中可能出现不同颜色(灰度)的最大数目。例如,由R、G、B三个位平面组成的彩色图像,若三个位平面中像素的位数分别为4、4、2,此时,该图像的深度为10,因而像素的最大颜色数目为24+4+2=210=1024。一幅图像的数据量按下面的公式进行计算(以字节为单位):图像数据量=图像宽度图像高度图像深度/8,图像信息存储的文件大小计算,41,图形的形成可以简单地认为是通过使用专业的命令集合来描述形成图形的各种几何要素,如直线、圆、矩形等,同时还要确定它们的位置、大小、线条粗细等等,并能把它们组合在一起构成一幅完整的图像。用计算机实现时:造型(Modeling)-绘制(Rendering)/图像合成(ImageSynthesis),图形及图像合成,42,信息组织是依据信息资源的主题内容或特征,利用一定的规则和方法,通过对其特征的分析、选择、处理,将无序的信息资源组织为有序集合的过程。信息组织的层次结构位、字节、域、记录、文件、数据库文件和数据库技术,信息的组织,二进制的运算,1算术运算(1)加法运算。(2)减法运算。2逻辑运算(1)逻辑加法(OR“或”运算)。(2)逻辑乘法(AND“与”运算)。(3)逻辑否定(NOT“非”运算)。,数据的单位,数据单位换算公式如下:1Byte=8Bit1KB=1024Byte=210Byte1MB=1024KB=220Byte1GB=1024MB=230Byte1TB=1024GB=240Byte,45,进制和不同进制之间的转换编码:字符、文字处理。多媒体信息的表示与采集信息的组织,数据编码的基本方式,谢谢大家,47,数据编码的基本方式,数制(计数制)指用一组固定的符号和统一的规则来表示数值的方法。编码是采用少量的基本符号,选用一定的组合原则,以表示大量复杂多样的信息的技术。计算机只认识“0”和“1”,任何信息必须转换成二进制形式数据后才能由计算机进行处理、存储和传输。,48,二进制数的特点:最多只有两个不同的数字符号,即0和1。逢二进一。(基数为二,逢二进一,借一为二。)二进制优点:0,1两个状态易物理实现;运算规则简单。算术运算与逻辑运算容易沟通。,一、二进制数,49,二进制数与其它数制的对照表,二进制十进制八进制十六进制00000000001111001022200113330100444010155501106660111777100081081001911910101012A10111113B11001214C11011315D11101416E11111517F,50,不同进制数之间的转换,51,十进制整数转换为二进制整数,规则:除二取余,直到商为零为止,倒排。例:将十进制数86转化为二进制2|8602|4312|2112|1002|512|202|110所以,(86)10=(1010110)2,52,规则:乘二取整,直到小数部分为零或给定的精度为止,顺排。例:将十进制数0.875转化为二进制数0.87521.750.7521.50.521.0所以(0.875)10=(0.111)2,十进制小数转换为二进制小数,53,例:(1999.8)10=1103+9102+9101+9100+810-1,“权”,(1101.1)2=123+122+021+120+12-1=(8+2+1+0.5+0.25)10=(11.75)10,二进制数转换为十进制数,规则:按“权”展开,求和。,54,二、计算机的数据单位与编码,1数据单位(1)位(bit):位是计算机中存储数据的最小单位,指二进制数中的一个位数,其值为“0”或“1”。(2)字节(byte):字节是计算机存储容量的基本单位,一个字节由8位二进制数组成。在计算机内部,一个字节可以表示一个数据,也可以表示一个英文字母,两个字节可以表示一个汉字。1024个字节称为1K字节(1KB),1024K个字节称为1兆字节(1MB),1024M个字节称为1吉字节(1GB)。(3)字(word):字是指计算机一次存取、加工、运算和传送的数据长度,一个字的二进制位数称为字长。计算机中常用的字长有8位、16位、32位、64位等。,55,存储容量:一个存储器中存储单元的总数称为该存储器的存储容量。表示存储容量的单位有字节(B)、KB、MB、GB、TB,它们之间的关系是1KB=1024B,1MB=1024KB,1GB=1024MB,1TB=1024GB。,二、计算机的数据单位与编码,56,汉字编码,汉字字符集与编码1981年,GB2312-80国家标准,其中有6763个汉字和682个非汉字字符,其字符及编码称为国标码又叫国际交换码。GB2312字符集的构成:一级常用汉字3755个,按汉语拼音排列二级常用汉字3008个,按偏旁部首排列非汉字字
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年高端鲜花定制公司大型花艺装置设计管理制度
- 浙海院海洋科学论文:浅谈海洋灾害
- 2026年高端私人影院建设公司施工安全事故报告与处理管理制度
- 扣篮训练案例分享
- 2025-2026学年高一上学期期中模拟地理试卷 (陕晋青宁专用)(解析版)
- 浙海院海洋科学导论讲义第11章 海洋遥感
- 2025-2026学年广东省茂名市茂名地区高一上学期10月月考历史试题(解析版)
- 职业病常见症状及护理培训
- 痔疮常见症状及护理技术论述
- 2025天津市口腔医院第二批次派遣制人员招聘12人笔试考试备考试题及答案解析
- 购房合同协议书标准模板
- GB/T 3048.12-2025电线电缆电性能试验方法第12部分:局部放电试验
- 2025初一英语期末复习知识点总结
- 十五五规划建议专题测试及答案
- 选举大会活动方案
- 心内科护士年度工作总结
- 百万医疗保险活动方案
- 2025-2026学年人教版九年级物理《电阻的测量》教学设计
- DB2101∕T 0006-2018 聚丙烯纤维混凝土生产与应用技术规程
- 淤地坝安全管理培训课件
- 初中重点化学方程式每日一练小纸条【答案】
评论
0/150
提交评论