大学计算机信息技术+第三章.ppt_第1页
大学计算机信息技术+第三章.ppt_第2页
大学计算机信息技术+第三章.ppt_第3页
大学计算机信息技术+第三章.ppt_第4页
大学计算机信息技术+第三章.ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章数字媒体及应用,学习目标与要求:(p74)回顾:计算机的一般定义;我们要研究处理的对象:数据的表示与应用,3.1数值信息与数值计算,一.二进制1.二.八.十六及各种进制.进制的本质?为什么要用二(八.十六)进制?2.各种进制之间的转换(2,8,16,x)进制转换为10进制10进制转换为(2,8,16,x)进制2进制与8进制与16进制之间转换,做习题:p83(1),P83第1题,10011B=()Q=()H=()D111101.1101=()Q=()H=()D,126.6=()B=()Q=()H,2.二进制运算:,数值运算.加,减,乘,除(举例)逻辑运算.与(举例)或(举例)非(举例),由CPU的ALU完成,Pentium处理器的结构,ALU,3.计量单位,bitByte(基本单位)容量单位:B-KB-MB-GB-TB(1024)传输速率单位:bps-Kbps-Mbps-Gbps-Tbps(1000)字(word):另一个角度的描述,如何描述数值数据与非数值数据,二.数值信息表示:(二进制),原则:便于实现,便于运算,便于传输数值数据:整数.实数1.整数(定点数)定点:小数点(隐含)位置固定不带符号表示:(以1B为例)00000000到11111111范围:0到2n-1(为什么)下面讨论带符号表示(难),unsigned,关键:符号数字化(最左边一位:0为正;1为负)原码:范围?-(2n-1-1)+(2n-1-1)注意:0有两种形式表示(+0与-0)反码:正数:同原码.负数的反码形式:符号位不变.其余求反加1.补码:正数:同原码;负数:取反加1注意:0唯一表示;负数方向多1,形式为10000000范围:-(2n-1)+(2n-1-1)补码的作用:减变加(连同符号位一起运算),带符号表示,原,反,补码各自的特点,功能及其关系,特殊的BCD码,这是一种规定;用四位二进制表示一位十进制;例:(-43)=101000011p29表3-2.真实的Pentium数据表示习题p83(2),特殊的移码,2.实数(浮点数)表示,实数的组成:尾数(定点小数/纯小数)+阶码(用移码)(小数点浮动的)举例IEEE(美国电气与电子工程师协会)制定标准:IEEE754(32bit),三部分:数符,阶码E,尾数移码:E-127(便于对阶)尾数:定点小数原码表示。默认:1.xxx见表:3-3(p81)(简单介绍)做习题p83(4),根据浮点数的长度:单精度32b;双精度64bPentium:单32b,双64b,扩充80bP4用到128b;P81表3-3是以32b为例(debug)思考:1.浮点数的长度越长:范围?精度?开销?2.定点数与浮点数的区别?3.同样长度的定点数与浮点数,范围?精度?,浮点数类型,对数值数据的应用?,h,回顾,数值与非数值数据在计算机的表示(3个原则)数值整数:不带符号数;带符号数(原码,反码,补码)浮点数(尾数+阶码)IEEE754与Pentium规定例:(389.625)d=(110000101.101)b=1.1000010110128尾数:(10000101101)b=(42D)h;阶码?公式8=e-127;e=8+127阶码=00001000+01111111=(10000111)b=(87)h,对数值数据的应用?,三.数值计算,1.数学建模算法编程运行结果.(举例)2.开发工具(二次开发):FORTRAN语言;C系列语言;VB;V-ForMATLIB专业计算软件(水资源应用计算程序包;SAP5;PKPM)可视化计算技术的应用,非数值数据?(文字符号、声音、图形/像)二进制!关键:如何全球统一编码?兼容旧码?,文本按一定格式组织起来的、具有相关性的字符流。字符:是文本的细胞,计算机中用二进制表示。字符集与其编码:计算机信息处理的基础。,计算机对文本的处理流程图,3.2文本与文本处理,以下是一个没有安装GBK和GB18030系统的例子,缺字,一、编码字符集,字符(character)记录语言的符号,它适用于一种或多种书面语言。编码字符集(codedcharacterset)按某种规则编码的字符的有序集合。每个编码字符集有两个最重要的属性:字汇(repertoire):编码字符集中有哪些字符编码规则:如何确定每个字符的代码码长:字符代码的长度。它决定了代码空间的大小定长码:7位,8位,双字节,4字节可变长码:单双4字节码,1、稳定的西文字符编码,ASCII编码:P84用7b表示,存放1B;128(96+32)字符A=41H;a=61H;0=30H字母排序ISO2022标准:用8b表示;ASCII+扩展部分(128-255)广泛使用,各地计算机公司支持,2、多变的汉字编码(全球统一编码),GB231280共6763个汉字+682其他字符3部分组成:字母等符号682个一级汉字(按照拼音排序)3755个二级汉字(按照偏旁部首)3008个字符集是个二维平面(9494)计算机用2个字节表示为区位码(10进制)例“大”(20)d(83)d问题:通信?ISO2022规定:国标交换码=区位码+32/(20)h例“大”的交换码:(3473)h问题:与ASCII?方法之一:机内码=交换码+80h“大”:(B4F3)h,GB2312字符集及其码位分布,大,位号:83,区号:20,双字节代码空间中GB2312汉字内码的码位分布,GBK汉字内码,问题的提出:GB2312-80的不足我国1995年发布汉字内码扩展规范共收入21003个汉字和883图形符号双字节编码,第1字节的最高位必为“1”,第2字节不一定是“1”;简体和繁体在同一字符集中;包含了CJK汉字与GB2312-80保持向下兼容;GBK的应用:P86,GBK字符集及其码位分布,CJK汉字,增补汉字,UCS/Unicode字符集与编码,问题的提出:全世界6800种语言文字.ISO制定:ISO/IEC10646标准通用多8位编码字符集,UniversalMultiple-OctetCodedCharacterSet工业标准Unicode(统一码/联合码)历程:UCS-4码长4B,编码空间大,浪费UCS-2码长2B,含各国常用文字(如CJK)如何保持与ASCII兼容?采用UTF-8可变长码.P88UCS/Unicode提供统一编码方案;采用UTF-8实现,UCS-2编码到UTF-8编码的转换规则(部分)UTF:UCSTransformationForm-8,问题:UCS/Unicode与GB2312,GBK不兼容,GB18030-2000的编码,采用单字节、双字节和四字节三种方式对字符编码。单字节部分使用0 x00至0 x80码位。双字节表示一个字符,其首字节码位从0 x81至0 xFE,尾字节码位分别是0 x40至0 x7E和0 x80至0 xFE。四字节部分采用GB11383未采用的0 x30到0 x39作为对双字节编码扩充的后缀,这样扩充的四字节编码,其范围为0 x81308130到0 xFE39FE39。,GB18030双字节汉字的代码空间,GB18030四字节汉字的代码空间,GBK和GB18030的应用,条件:输入显示与打印处理:排序、检索、分词.举例:扩充的汉字:朱鎔基,冃冄円冇冊冋冎冏冐冑冓冔冘冚冝冞繁體字:南京大學計算機係,今天天氣很好。,汉字编码小结1,汉字是记录汉语(国语,华语)的文字,属于表意文字,它用符号直接表达词或词素。汉字的特点:数量大(我国汉字自古至今累计已超过7万字,国家语委颁布的“现代汉语通用字表”包含7000汉字)多个国家和地区使用:港台地区,日、韩、朝、新、马等字形复杂,同音字多,异体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论