计算机科学数据的表示与编码市公开课一等奖省赛课微课金奖课件_第1页
计算机科学数据的表示与编码市公开课一等奖省赛课微课金奖课件_第2页
计算机科学数据的表示与编码市公开课一等奖省赛课微课金奖课件_第3页
计算机科学数据的表示与编码市公开课一等奖省赛课微课金奖课件_第4页
计算机科学数据的表示与编码市公开课一等奖省赛课微课金奖课件_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机学科导论第2章数据表示与编码

第1页本章教学

目了解数字系统和数制概念;掌握二进制、十进制及其它进制计数方法,掌握不一样进制间转换方法;掌握二进制整数和实数表示方法掌握二进制原码、反码、补码表示方法;掌握二进制数算术运算;了解英文字符、汉字字符等编码方式;了解各种数据类型编码方式及在计算机中存放第2页本章教学内容数和数制数值表示与运算非数值信息编码第3页掌握进位计数制和数制之间转换了解定点数和浮点数了解带符号数表示方法掌握字符编码了解非字符信息编码本章学习重点第4页第一节数和数制第5页2.1数和数制

本节主要内容数字系统计数与进制二进制和位八进制和十六进制不一样进制间转换设计计算机最初目标是进行数值计算,计算机中最早表示数据就是各种数字。伴随发展,当代计算机中数据以不一样形式展现,如:数字、文字、图像、声音和视频等。而在计算机内部,这些数据都是以数字形式存放和处理。第6页2.1数和数制数据:对事实、概念或指令一个特殊表示形式,能够用人工方式或自动化装置进行通信、翻译转换或加工处理。普通计算机中数据包含以下两类:

——数值型数据:含有特定值一类数据,可用来表示数量多少,可比较其大小。

——非数值型数据:含有特定值一类数据,可用来表示数量多少,可比较其大小。第7页2.1数和数制计算机表示信息路径:

经过使用数字对各式各样信息按照进行一定规则进行编辑,最终变换为计算机易于识别信息,这个过程称为数字化编码。数字化编码:用少许最简单基本符号,对大量复杂多样信息进行一定规律组合。编码两大基本要素:基本符号种类(比如二进制“0”和“1”)组合规则当代计算机内部采取二进制符号进行信息编码。第8页2.1.1数字系统计算机中使用位置化数字系统。位置化数字系统中,在数字中符号所占据位置决定了其表示值。在该系统中,一个数字这么表示:

±(Sk-1…S2S1S0.S-1S-2…S-1)b

其值为:

n=±Sk-1×bk-1+…+S1×b1+S0×b0+S-1×b-1+S-2×b-2+…+S-1×b-l

其中,S是一套符号集;b是底(或基数),它等于S符号集中符号总数,其中Si指该符号位置是i。第9页2.1.2计数与进制十进制计数法创造可能源于人类习惯使用10个手指计数。玛雅文明创造了二十进制数字系统,称为玛雅数字系统。十二进制可能源于一只手除拇指以外四个手指指节个数。六十进制是苏美尔人和美索不达米亚人使用。六十进制系统被认为是十进制和十二进制合并过程中产生。巴比伦文明六十进制可能与天文历法计时相关。十六进制曾经在中国重量单位上使用过。第10页2.1.3二进制和位二进制数字系统是最简单数字系统。其底为2,数字取值范围是0和l,计数规则是“逢2进位”。二进制数字系统中只有两个数字0和1。位是信息基本单位,也是存放在计算机中最小单位。位英文是“bit”(比特)代表“binarydigit”,1位具备最少信息量,更复杂信息需要多位比特来表示。第11页2.1.4八进制和十六进制数据在计算机中最终以二进制形式存在,不过二进制数不适合人书写和思索。用较大进制数能够有效缩短数字串长度,于是引入了八进制和十六进制。进制越大,数表示长度也就越短。八进制是逢8进位,用“0”~“7”这8个符号组成数字表示,其基数为8。十六进制是逢16进位,用“0”~“9”这10个数字,再加上“A”~“F”6个字母共16个符号组成数字表示,其基数为16。为防止混同,在使用不一样进制时,采取后缀表示进制,比如用2、8、10、16表示二、八、十和十六进制数;也可用字母表示,通惯用D表示十进制,用B表示二进制,用O或Q表示八进制,用H表示十六进制数。比如十六进制数FDA59B能够表示为(FDA59B)16或FDA59BH。第12页进位制二进制八进制十进制十六进制规则逢二进一逢八进一逢十进一逢十六进一基数R=2R=8R=10R=16基本符号0,10,1,2,…,70,1,2,…,90,1,..,9,A,..,F权2i8i10i16i形式表示BODH计算机科学中惯用各种进制数表示第13页2.1.5不一样进制间相互转换1.任意进制数转换为十进制数2.十进制数转换任意进制数

十进制数转换为二进制十进制数转换为八进制十进制数十六进制数3.二进制数与十六进制数转换

二进制数转换为八、十六进制数八、十六进制数转换为二进制数第14页2.1.5不一样进制间相互转换1.任意进制数转换为十进制数转换规则:第15页

将(100.11)2转换为十进制数解:(100.11)2=(1×22)+(0×21)+(0×20)+(1×2-1)+(1×2-2)

=(4.75)10(2AF5)16=(2×163)+(10×162)+(15×161)+(5×160)=(2×4096)+(10×256)+(15×16)+(5×1)=(10997)10【例1-2】第16页2.1.5不一样进制间相互转换任一个十进制数X,能够表示为X=X整数+X小数。将这两部分分开转换整数部分转换:采取“除基数求余法”,转换方法为:将X整数连续用基数除,求得余数(1或0)分别为K0、K1、K2、…,直到商为0,全部余数排列Kn-1Kn-2…K2K1K0即为所转换所求进制整数部分。小数部分转换:采取“乘基数取整法”。转换方法为:连续用基数乘X小数,依次求得各整数位(0或1)K-1、K-2、…、K-m,直到乘积小数部分为0。在小数转换过程中,出现Fi恒不为0时,可按精度要求确定所求进制小数位数。

2.十进制数转换为任意进制数转换规则:第17页十进制数120转换成八进制数。要将120转换为8进制,先将要转换数120除以8,得到商15和余数0;把商15作为新源继续除以8,得到商1和余数7;再把商1作为新源继续除以8,得到商0和余数1;最终将全部余数逆序排列得到最终止果为:170。被除数(源)计算过程(除)商(新源)余数(目标)120120/81501515/81711/801整数部分转换第18页将十进制数0.625转换为二进制数。因为0.625没有整数部分,该例子显示小数部分怎样计算。这里是以2为底。在左边一列写上这个十进制数。连续乘2,并统计结果整数和小数部分。小数部分作为新源,整数部分作为目标。当小数部分为0,或到达足够位数时结束。结果是0.625=(0.101)2。被乘数(源)计算过程(乘)小数部分(新源)整数部分(目标)0.6250.625×20.2510.250.25×20.500.50.5×201十进制数转换成其它进制数,请大家用类似方法尝试,通惯用纸笔就能够完成。小数部分转换第19页2.1.5不一样进制间相互转换二进制数要转换为十六进制,就是以4位一段,分别转换为十六进制。反之亦然。

假如一个二进制数很长,我们需要将它转换成10进制数时,除了前面学过方法是,我们还能够先将这个二进制转换成16进制,然后再转换为10进制。3.二进制数和十六进制数相互转换第20页进位制二进制八进制十进制十六进制规则逢二进一逢八进一逢十进一逢十六进一底281016数符集0,10,1,2,…,70,1,2,…,90,1,..,9,A,..,F权2i8i10i16i表示BODH进制转换表第21页第二节数值表示与运算第22页2.2数值表示与运算

本节主要内容:整数表示实数表示位算术运算第23页2.2数值表示与运算计算机只能直接识别和处理用0,1两种状态表示二进制形式数据,在计算机中无法按人门日常书写习惯用正、负号加绝对值来表示数值,需要用二进制代码0和1来表示正负号。计算机表示带符号数值时,数符和数据均采取0,1进行了代码化。这种采取二进制形式连同数符一起代码化数据,统称为机器数或机器码。与机器数对应用正、负符号加绝对值来表示实际数值称为数真值。机器数可分为无符号数和带符号数两种。无符号数是指计算机字长全部二进制位均表示数值。带符号数是指机器数分为符号和数值部分,且均用二进制代码表示。第24页2.2.1整数表示无符号整数无符号整数在计算机中应用非常广泛。将一个无符号整数表示为一连串二进制数字序列。有符号整数在实际中存在大量负数。将2k

个bit中,专门用一个bit表示正负符号,这么将表示数一分为二,二分之一表示正数,另二分之一表示负数。这种方法称为符号位表示法,即原码表示法;方法之二:将一个正数全部位全部取反,即得到该正数所对应负数编码,称之为反码表示法。

不一样编码方法会造成不一样加法器逻辑复杂度。前面两种编码方法,符号位法和反码表示法,在硬件逻辑设计上都相当复杂。所以,需要设计更适合硬件操作编码方案,于是有了补码表示法。几乎当前全部计算机都采取这种编码方式。第25页2.2.1整数表示原码、反码和补码数值有正负之分,所谓原码是用一个数最高位存放符号(0为正,1为负),后续其它位与数真值相同。数值反码表示法是用最高位存放符号,并将原码其余各位逐位取反。反码取值空间和原码相同且一一对应。负数取反码后会出现(-0)。而零是没有正负之分,于是引入了补码概念。在补码表示法中,正数补码表示与原码相同,即最高符号位用0表示正,其余位为数值位。而负数补码则为它反码、并在最低有效位(即D0位)加1所形成。第26页2.2.1整数表示原码、反码和补码之间转换原码、反码和补码这三种编码关系特点:1)正数3种编码都等于真值本身,而负数各不相同。2)符号位都在最高位,补码和反码符号位可作为数值位一部分对待,与数值位一起参加运算,不过原码符号位不允许和数值位一样对待,需要分开处理。3)真值零原码和反码都有两种不一样表示形式,而补码表示形式只有一个。第27页2.2.1整数表示原码、反码和补码之间转换正数原码、反码和补码表示形式是相同,而负数则各不相同,所以3种码制之间相互转换实际上就是其负数形式转换。1)将反码表示数据转换成原码。转换方法:负数符号位保持不变,数值部分逐位取反。2)将补码表示数据转换成原码。转换方法:利用互补道理对补码再次求补即得到原码。3)将原码表示数据转换成补码。转换方法:负数符号位保持不变,数值部分逐位取反后,最低位加1便得到负数补码。第28页2.2.2实数表示实数是带有整数部分和小数部分数字。用于维持正确度或精度处理方法是使用浮点表示法。1.规范化为了使表示法固定部分统一,科学计数法(用于十进制)和浮点表示法(用于二进制)都在小数点左边使用了唯一非零数码。这称为规范化。2.符号、指数和尾数在一个数规范化之后,计算机中只存放了一个数三部分信息:符号,指数,和尾数(小数点右边位)。3.余码表示法为了让正和负整数都能够作为无符号数存放,计算机通常采取余码表示法。在余码系统中,使用一个正整数(称为一个偏移量)加到每个数字中,用于把他们统一移到非负一边。这个偏移量值是2m-1-1,m是内存单元存放指数大小。第29页2.2.3位算术运算算术运算包含加,减,乘,除等等。适合用于整数和浮点数。

1.整数算术运算全部加,减,乘,除等算术运算均适合用于整数。加和减是基本运算形式。乘法运算能够在软件中经过连加方法,或在硬件中经过其它技术实现。除法运算能够在软件中经过连减方法,或在硬件中经过其它技术执行。对整数全部形式都能够进行加和减运算。现在在计算机中整数只以补码形式存放。二进制补码中加法就像十进制中加法一样:列与列相加,假如有进位,就加到下一列上。不过,注意处理二进制数不象处理十进制数一样。当两位相加,结果是0或1。在加法中,得到一个1进位需要进到下一列上。二进制补码中两个整数相加法则:

2个位相加,将进位加到下一列。假如最左边列相加后还有进位,则舍弃它。第30页2.2.3位算术运算

1.整数算术运算【例1‑7】用二进制补码表示方法计算17加22。解:(+17)+(+22)=(+39)这些数字在8位存放单元中用二进制补码分别表示为00010001和00010110。结果对于任何分配大小来说是类似。

进位100010001+00010110-----------------------------------------------

结果00100111结果是十进制数39。第31页2.2.3位算术运算

1.整数算术运算

【例1‑8】按补码形式计算24加-17。解:(+24)+(-17)→(+7)这两个数补码可按以下描述运算:进位1111100011000+11101111---------------------------------------结果00000111结果是+7,注意最终进位被舍去(从行最左侧算起)。

第32页2.2.3位算术运算

1.整数算术运算【例1‑9】按补码形式计算-35加20。解:(-35)+(+20)­­­­­­­­­­­­→(-15)这两个数补码可按以下描述运算:

进位11111011101+00010100-------------------------------------------结果11110001

结果是-15。第33页2.2.3位算术运算

2.浮点数算术运算浮点数(实数)加减法处理过程以下:

检验符号,假如符号相同,相加其值,结果符号与他们相同。

假如符号不一样,比较绝对值,绝对值大减去小,结果符号取绝对值大一方。移动小数点,使二者阶数相同。也就是说,当阶数不一样时,数值小一方将小数点左移,但要使值不变。

将变换后数值进行加减运算(包含整数和小数部分)。第34页第三节非数值信息编码第35页2.3非数值信息编码

本节主要内容:字符编码静态图像编码动态数据编码第36页2.3非数值信息编码编码(或代码)通常指一个在人和机器之间进行信息转换系统(体系)。编码是人们在实践中逐步创造一个用较少符号来表示较复杂信息表示方法。

伴随当代计算机利用深入,计算机不但仅进行科学计算,实际上更大量工作是用于处理人们日常工作和生活中最常使用信息形式,也就是所谓非数值型数据,包含语言文字、逻辑语言、视频图像等非数值信息。这需要为计算机找到一个适当方法来表示这些信息。计算机中使用了不一样编码来表示和存放数字、文字符号、声音、图片和图像(视频)信息。

第37页2.3.1字符编码1.ASCII码字符是非数值型数据基础,字符与字符串是计算机中用得最多非数值型数据。为使计算机能够识别和处理字符,必须对字符按一定规则进行二进制编码,使得每个字母有唯一编码;文本中数字和标点符号,也必须编码。美国最先制订了美国标准信息交换标准码(AmericanStandardCodeforInformationInterchange),简称ASCII码。用7位二进制编码,表示27=128个字符。ASCII码中,编码值0~31通常称为控制字符,用于通信中通信控制或对计算机设备功效控制。编码值32是空格(或间隔)字符SP。编码值127是删除控制DEL码。其余94个字符称为可印刷字符。第38页2.3.1字符编码2.汉字编码汉字也是字符,与西文字符相比较,汉字数量大,字形复杂,同音字多,这就给汉字在计算机内部存放、传输、交换、输入、输出等带来了一系列问题。为了能直接使用西文标准键盘输入汉字,还必须为汉字设计对应输入编码,以适应计算机处理汉字需要。汉字及其编码特点:

(1)汉字是一个象形文字,据统计,从甲骨文至今约有六万左右汉字。当前常见汉字有约七千个。(2)汉字字形结构复杂,笔划繁多。(3)汉字同音字多,多音字多。(4)包括各种编码:第39页2.3.1字符编码2.汉字编码(1)国际码

1980年我国首次颁布了《信息交换用汉字编码字符集基本集》代号为GB2312-80,是国家要求用于汉字信息处理使用代码依据,这种编码称为国家标准码。在国家标准码字符集中共收录了6763个惯用汉字和682个非汉字字符(图形、符号),其中一级汉字3755个,以汉语拼音为序排列,二级汉字3008个,以偏旁部首进行排列。(2)机内码

汉字机内码是计算机系统内部对汉字进行存放、处理、传输统一使用代码,又称为汉字内码。汉字内码是与ASCII对应,用二进制对汉字进行编码。普通用2个字节来存放汉字内码,即双字节字符集(double-bytecharacterset,简称DBCS)

注意:在汉字字符集中,为了显示和打印等需要,定义了与英文和其它语言中符号,这些符号是作为汉字文字处理,称为全角符号,不一样与其原语种符号。比如全角符号“A”与字母“A”之间区分。第40页2.3.1字符编码2.汉字编码(3)汉字输入编码汉字输入通常有键盘输入、语音输入、手写输入等方法,都有一定优缺点。键盘输入方式:将每个汉字用一个或几个英文键表示,这种表示方法称为汉字“输入编码”。汉字输入编码种类:

数字编码:如电报码、区位码等。特点:难于记忆,不易推广;

字音编码:如拼音码等。特点:简单易学,但重码多;

字形编码:如五笔字型、表形码等。特点:重码少,输入快,但不易掌握;

音形编码:如自然码、快速码等。特点:规则简单,重码少,但不易掌握。第41页2.3.1字符编码3.Unicode码

Unicode即统一码,又称万国码,是一个以满足跨语言、跨平台进行文本转换、处理要求为目标设计计算机字符编码。Unicode码采取唯一16位模式来表示每一个符号。Unicode码由65536个不一样位模式组成——足以表示各种语言文字。它为每种语言中每个字符设定了统一而且唯一二进制编码。Unicode编码方式与ISO10646通用字元集(亦称通用字符集)概念相对应,使用16位编码空间。也就是每个字符占用2个字节。对于汉字而言,Unicode编码里面包含了GB18030全部汉字(27484个字)。Unicode扩展自ASCII。使用16位元编码,并可扩展到32位,能够表示世界上全部书写语言中可能用於电脑通讯字元、象形文字和其它符号,这使其有可能成为ASCII替换者。第42页2.3.2静态图像编码静态图像是与动态图像相对应概念,专门指单幅图形。在计算机应用中经常需要用到各种图像显示与处理,比如统计图、照片等。1.位图图像位图表示图象方法中,图像被分成像素矩阵,也称点阵,每个像素是一个小点。把图像分成像素之后,每一个像素被赋值为一个位模式。位图文件基本编码格式为BMP(bitmap缩写)文件。BMP是一个与硬件设备无关图像文件格式。标签图像文件(TaggedImageFileFormat,简写为TIFF)格式是图像专业领域使用较广泛一个编码形式,主要用来存放照片和艺术图等对图像质量要求较高平面图像。它也是位图文件格式一个。第43页2.3.2静态图像编码静态图像数据信息量大,且其信息含有一定规律,所以普通不采取直接编码方式,而是经常采取一些压缩算法来表示图像信息。2.图像压缩编码为了存放和传输数据,在保留原有内容条件下,缩小其数据量是有益(有时是必须)。这种技术称为数据压缩。数据压缩方案有两类。一类是无损压缩,一类是有损压缩。无损方案在压缩中不丢失信息,能100%还原。有损方案在压缩过程中会发生信息丢失。通常有损技术比无损技术提供更大压缩,在允许领域应用很广,如图像和音频。当前最主流图像压缩方式是JPEG(JointPhotographicExpertsGroup,联合图像教授组)编码格式,文件后辍名为“.jpg”或“.jpeg”。JPEG压缩技术即支持无损压缩,也支持大压缩比有损压缩。JPEG是一个很灵活方法,含有调整图像质量功效,允许用不一样压缩百分比对文件进行压缩,支持各种压缩级别。

JPEG格式压缩主要是高频信息,对色彩信息保留很好,适合应用于互联网,可降低图像传输时间。第44页2.3.2静态图像编码RAW格式伴随高素质数码相机普及,RAW格式文件应用越来越多。RAW格式文件被称为数字底片(digitalnegative),是拍摄时从影像传感器得到电信号在模数转换(A/D转换)后,不经过其它处理而直接存放影像文件格式,反应是从影像传感器中得到最原始信息。其优点是影像质量最高,含有很大动态范围和很宽色域度,很多参数能够在不影响画质情况下进行后期调整。其缺点是RAW格式文件占用存放空间较大,其字节数通常是拍摄像素数1.5倍左右,以万像素数码相机为例,对于同一幅照片其RAW文件大小可能会有30MB以上,而JPEG格式文件通常只有5MB大小;另外,RAW格式不一样于BMP、JPEG等格式,RAW代码中没有头文件,这使得很多软件无法支持对它读取和编辑,通用性差。伴随技术进步,越来越多软件支持对RAW格式浏览和编辑。第45页2.3.2静态图像编码3.矢量图矢量图表示方法并不存放位模式,它是将图像分解成一些曲线和直线组合,其中每一曲线或直线由数学公式表示当图像要显示或打印时,将图像尺寸作为输入传给系统。系统重新设计图像大小并用相同公式画出图像。每次调整矢量图时,计算机将绘图公式重新估算一次,并依据新公式画出图像,因为重新估算公式地计算量远小于调整像素,所以能够有效防止屏幕抖动现象。

普通工程制图软件都使用矢量图方式保留,方便于按图元方式对图像进行编辑。经典格式是AutoDesk企业AutoCAD所使用DWG格式。第46页2.3.3动态数据编码1.音频音频包含各种声音信息形式。基本想法即将音频转换成数字数据,并使用位模式存放它们。音频实际上是模拟量,它是连续性,需要一个称为采样过程将连接音频转化为数字。采样详细方法是以相等间隔来测量信号值,并量化采样值。采样时间间隔称为采样频率。量化就是给采样值分配值(从一个值集中),将采样值做近似处理。详细原理大家能够参考信号处理技术中采样定理。类似静态图像,采样频率越高,相当于图像分辨率越高,则音频文件越大;采样量化越精细,相当于像素深度越大,音频文件也越大。惯用采样频率有11kHz、22kHz和44kHz三种,采样位数普通是8位或16位。音频文件尺寸通常很大,在计算机中也是以压缩编码形式存在为主。未压缩音频文件大小可按下面公式估算:

音频文件大小=(取样频率×量化位数×声道)×时间/8(1Byte=8bit)第47页2.3.3动态数据编码1.音频音频编码方式也有非压缩编码和压缩编码两类,压缩编码又分为有损压缩和无损压缩两种。基本音频编码是PCM(PulseCodeModulation,脉冲编码调制)。PCM编码最大优点就是音质好,最大缺点就是未压缩造成体积大。常见AudioCD就采取了PCM编码,一张光盘容量只能容纳72分钟音乐信息。基本WAV文件通常都使用PCM编码,它们通常都很大。当前公认无损音频编码是APE,在真正无损前提下提供50~70%压缩比。MP3(MPEGAudioLayer-3)是当前最为普及音频压缩编码格式,是MPEG1衍生编码方案。MP3能够做到12:1压缩比并保持音质基本可接收。

第48页2.3.3动态数据编码2.视频视频是单幅图像在时间上连续表示,是经典动态数据类型。动态视频基础是前面讨论过静态单幅图像,在这里称为帧。动态视频压缩基础理论是在单幅图像压缩基础上,结合帧与帧之间相关性,进行深入压缩。最有影响视频编码技术是MPEG(MovingPicturesExpertsGroup,动态图像教授组),它属于国际标准化组织(ISO/IEC)。MPEG标准主要有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论