计算机基础与C++语言【3】-数据表示及字符编码.ppt

上传人：油*** IP属地：浙江上传时间：2020-03-22 格式：PPT 页数：44 大小：680.51KB 积分：25 举报 版权申诉

已阅读5页，还剩39页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

熟悉不同数制及数制之间的相互转换理解数字在计算机内部的表示及整数赋值方法熟悉部分字符编码及字符集了解信息保存和传输中的基本校验方法计算机中的数据表示什么是数据数据是对事实或概念的一种符号表示形式可以用人工方式或自动化装置进行通信翻译转换或加工处理数值型数据具有特定值的一类数据可用来表示数量的多少可进行算术运算非数值型数据包括字符字符串图形图像音频视频等信息和信息处理信息信息是可能对人的行为和决策施加影响的数据所包含的意义如数据 1 3 5 所揭示的等差性质数据 30000V 告诉你应该远离数据院士的头衔使你肃然起敬信息处理通过数据的采集和输入有效地把数据组织到计算机中由计算机系统对数据进行相应的处理加工编码存储转换计算比较传送等操作最后向人们提供有用的信息的全过程媒体及其分类媒体媒体又称媒介指承载信息的手段方法工具设备或装置感觉媒体能使人的各种感觉器官直接产生感觉的一类媒体如声音文字图画气味等它们是人类使用信息的有效形式表示媒体为了使计算机有效地处理传输感觉媒体而在计算机内部采用的特殊表示形式即数值文字图像音频视频等的二进制编码表示存储媒体用于存放表示媒体以便计算机加工处理的物理实体如磁盘光盘半导体存储器等传输媒体用来将表示媒体从一台计算机传送到另一台计算机的通信载体如电话线双绞线光纤无线电频道红外线等信息的数字化编码常见编码身份证号校园卡号五线谱电报码数字编码 ASCII编码数值的二进制表示图像的数字表示编码用少量简单的基本符号对大量复杂多样的信息进行一定规律的组合表示一切信息编码的两大要素基本符号的种类组合规则数字化编码基本符号 0 1 不同类型的数据组合规则不同数值编码方法计数进制 R数制转换为十进制 1 2 例1将 11011 11 2转换为十进制数解 11011 11 2 1 24 1 23 0 22 1 21 1 20 1 2 1 1 2 2 27 75 10 只需按下述公式计算 R数制转换为十进制 2 2 例3将 A5C B2 16转换为十进制数解 A5C B2 16 10 162 5 161 12 160 11 16 1 2 16 2 2652 6953125 10 例2将 732 6 8转换为十进制数解 732 6 8 7 82 3 81 2 80 6 8 1 474 75 10 十进制转换为R进制数任一十进制数N N整 N小将这两部分分开转换整数部分除R取余直到商零先得低位小数部分乘R取整直到得零或满足精度先得高位十进制正数转化为R进制 0 255 0 2 1 3 二进制与八进制十六进制的转换 001011010110 101011100 2 1326 534 81326534 01011101 01011010 2 5D 5A 165D5A 二进制转化成八十六进制整数部分从右向左按三四位分组不足补零小数部分从左向右按三四位分组不足补零八十六进制如何转换到二进制定点数小数点位置固定的数计算机内部总是用定长的二进制位表示因此可表示数的范围和精度是有限的浮点数小数点位置不固定的数由于表示的特点定点数能够表示的数的范围较小不能满足数据处理要求产生了浮点表示方式任何一个二进制数N可以表示为 N S 2E S称为尾数 E称为阶码 2是阶码的基数 E的不同取值使得S中的小数点位置可以浮动因此称为浮点数如 1 01101 23 10 1101 22表示的数相同浮点数在机器内部的表示由3部分构成不同类型的数 float double 其i j不同可表示的数的范围为 2n 1 2n 1 实质整数的绝对值的二进制再在最高位补上1个符号位 0正1负例 n 8 求X 1011001和Y 1011001的原码解原 01011001 Y 原 27 1011001 11011001 整数的原码表示 n比特整数 n比特整数整数的原码表示范围 n 8 求X 0和Y 0的原码解 0 原 00000000 0 原 27 0 10000000 0 原 0 原一定会带来不便整数的原码表示的优缺点优点表示简单易于理解真值转换方便乘除运算简单缺点运算麻烦运算完全与笔算相同如两个正数相减首先要判断被减数的绝对值与减数的绝对值的大小然后决定是颠倒过来相减还是直接相减最后在结果的前面加上正确的正负号所以势必花费较多的运算时间降低运算速度使运算器的逻辑复杂化 0的表示不唯一对处理带来了不便设法克服这些缺点补码表示反码原码和补码的桥梁 n比特整数 a b modk 指a b对模k是同余的可表示的数的范围为 2n 1 2n 1 实质正整数的反码和原码相同负整数的反码将原码符号位不变其余位取反例 n 8 求X 1011001和Y 1011001的反码解反 01011001 Y 反 28 1 1011001 100000000 1011010 10100110 可表示的数的范围为 2n 1 2n 1 多1个实质正整数的补码和原码相同负整数 2n 1例外的补码为其反码加1 符号位和数值位同样运算例 n 8 求X 1011001和Y 1011001的补码解补 01011001 Y 补 28 1011001 10100111 整数的补码表示 n比特整数例 n 8 求X 0和Y 0的补码解 0 补 00000000 0 补 28 0 100000000 00000000 mod28 0 补 0 补 0可以统一处理例 n 8 求X 128 27和Y 127 27 1的补码解补 28 27 27 10000000 0 原 Y 补 28 27 1 27 1 10000001又 Y 1111111 Y 原 11111111 Y 反 10000000 Y 补 10000001 整数0的补码表示唯一 C 中的整数是用补码表示的无符号整数没有符号位所有的位都用于表示数值如 unsignedint unsignedlong等有符号整数的最高位为符号位如 int long等求出若干整数的补码通过调试手段验证内存中的内容注意字节序bigendian 大尾高位字节在后或高地址和littleendian 小尾低位字节在后或高地址 PowerPC系列CPU和Intel的x86系列CPU分别使用BE和LE C 的字节序与目标CPU相关 Java总采用BE 所有网络通信协议使用BE C 中整数类之间的赋值是内存的原样拷贝实现正整数的二进制表示的置位反转等补码加减法规则补码加减法公式符号位和数位一样运算 X Y 补 X 补 Y 补公式一 X Y 补 X 补 Y 补公式二 X Y 补 X 补 Y 补公式三补码加减法举例 1 2 补码加减法举例 2 2 问为什么要有多种编码表示答简化数字的算术运算易于硬件实现加减运算采用补码乘除运算采用原码浮点数IEEE表示大多数系统的浮点数表示采用IEEE754制定的标准小数点左侧固定为1 为了保存更多有效数字不予保存指数部分用移码表示 float中各段分为1 8 23位共32位 E e 127double中各段分为1 11 52位共64位 E e 1023127和1023称为偏置量 Bias E是移码若干特殊浮点数的表示特殊浮点数的产生 0 小数点左侧固定为1 0无法保存只能特殊处理 NaN 负数开平方结果无定义不是一个数浮点数的运算结果超出了可表示范围视为无穷大非规格化数设float数X 1 001 2 125 Y 1 0001 2 125 对应十进制的2 6448623 10 38和2 4979255 10 38 X Y 0 0001 2 125 表达为规范浮点数则为1 0 2 129 超出了float的表示范围只能近似为0 这意味着1 X Y 这一运算可能出现问题编程输出产生特殊值的表达式特殊float表示中的约定移码E的范围及表示float用8位表示移码偏置量为127 可表示的指数范围为 127 128 对应的移码范围为 0 255 此范围用无符号整数的二进制表示 E 0或255与尾数的不同组合表示特殊浮点数见前文表内似的约定可推至double 给出几个浮点数的表示通过调试手段验证内存中的内容字符编码 ASCII码 1 3 美国标准信息交换代码 AmericanStandardCodeforInformationInterchange 简称ASCII码基本ASCII用7位二进制编码可表示27 128个字符 ASCII中编码值0 31不对应任何可印刷或称有字形字符通常称它们为控制字符用于通信控制或计算机设备的功能控制编码值为32的是空格字符SP 编码值为127的是删除控制DEL码其余的94个字符称为可印刷字符扩展ASCII Latin 1 用8位二进制编码可表示28 256个字符除基本ASCII字符还包括西欧语言希腊语泰语阿拉伯语希伯来语对应的文字符号字符编码 ASCII码 2 3 7位ASCII码字符编码 ASCII码 3 3 7位ASCII码汉字编码按用途有多种编码特点 1 汉字是一种象形文字据统计从甲骨文至今约有六万左右的汉字常见的汉字约有七千个 2 汉字字形结构复杂笔划繁多 3 汉字同音字多多音字多 1980年国家标准局颁布实施了GB2312 80 信息交换用汉字编码字符集基本集该标准收入了6763个常用汉字其中一级汉字3755个按汉语拼音排序二级汉字3008个按偏旁部首排序以及英俄日文字母与其它符号682个共计7445个符号汉字在计算机处理过程中有多种编码 GB2312 80的区位码区位码 GB2312 80将汉字和符号分成94区94位每个字符用两个字节编码高字节为区号低字节为位号例 0102 啊 1601 鳌 8701 GB2312中01区 02区的字符例 0179 0283 GB2312中16区 17区的字符例啊 1601 笔 1742 GB2312 80中的机内码机内码二字节编码其值为区位码两字节的编码各加上160 即机内码区位码 H A0A0H编码的范围在此编码规范下编码的范围为 A1A1 FEFE 共有8836个码位除收录的汉字和各种符号外还有1000多个码位用于扩展输入码现存输入码极多输入汉字除输入码外还有字形识别语音识别字形码用于构造汉字字形有两种基本的表示方式点阵字形矢量字形现在广泛使用矢量字体不同的汉字字体和大小对应于不同的字形码字符编码的发展 1 不断发展新版标准持续发布字符集越来越大 2 保持向下兼容横向兼容 3 越来越方便国际化但也有兼容性问题统一字符集的码位结构统一字符集UCS UniversalCharacterSet 是ISO制定的ISO10646标准所定义的标准字符集 UCS用4个字节编码一个字符最高字节为group编号共256个次高字节为平面编号每组256个每个平面包含256 256个码位这一编码方案并不实用因为历史以来存在着多种编码体系与其保持兼容是必须的 Unicode编码广为使用的编码 Unicode是UniversalCode的缩写 Unicode计划使用了17个平面一共有17 65536 1114112个码位在Unicode5 0 0版本中已定义的码位只有238605个分布在平面0 平面1 平面2 平面14 平面15 平面16 其中平面15和平面16上只是定义了两个各占65534个码位的专用区 PrivateUseArea 分别是0 xF0000 0 xFFFFD和0 x100000 0 x10FFFD 所谓专用区就是保留给大家放自定义字符的区域可以简写为PUA UCS 2 用2字节编码一个字符范围为U 0000 U FFFF 可编码65536个字符 UCS 2对应前述码位空间中的0组0号平面plane0 称为基本多文种平面BMP BasicMultilingualPlane BMP以外的字符则需要使用五位或六位十六进制数表示 UCS 4 用4字节编码一个字符范围为U 00000000 U 7FFFFFFF 可编码32768 65536个字符其中U 00000000 U 0000FFFF编码的字符与UCS 2对应相同 UTF编码 Unicode传输编码 UnicodeTransformationFormat 统一传输为了有效传送Unicode编码以文本方式传送任何内容避开通讯协议中的特殊码位等目的将Unicode编码转换为UTF编码这一转换为一一映射保证双向无损转换 UTF 8 用字节序列 1 5 表示一个Unicode编码 UTF 16 用2字节序列表示一个Unicode编码 UTF 32 用4字节序列表示一个Unicode编码 UTF 8 WEB中应用最多的传输编码主要用于互联网上的数据传输用最多达6个字节的序列来表示一个字符为有效分析字符串用第一个字节指明字节序列中的字节数理解浏览器中的UTF 8配置选项观察百度搜索中关键字的UTF 8传送 UTF 16和UTF 32 UTF 16 用一个16位的值来编码映射到不大于65535数值的字符映射到大于65535的数值的字符则被编码成一组16位的值代用对 UTF 32 用一个32位的值来编码一个字符码长相等便于处理但占空间较大 Unix系统使用广泛 Windows对Unicode的支持 Windows2000 WindowsXP WindowsVista支持Unicode 如果在这些操作系统上运行非Unicode编码程序在处理之前操作系统在其内部将应用程序的文本依据代码页特定编码与Unicode编码的对照表转化为Unicode编码的文本在把信息传回应用程序之前操作系统把Unicode编码的文本转化回所希望的代码页形式任何磁盘文件中的字符均采用某种编码存储在读写文件时必须用相同的编码体系保存才能正确解释文件内容在Notepad中用不同编码保存文件用十六进制编辑工具观察其内容编码数据校验码的作用信息

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

计算机基础与C++语言【3】-数据表示及字符编码.ppt

文档简介

温馨提示

最新文档

评论

计算机基础与C++语言【3】-数据表示及字符编码.ppt

文档简介

温馨提示

最新文档

评论

相关文档