




已阅读5页,还剩39页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
熟悉不同数制及数制之间的相互转换理解数字在计算机内部的表示及整数赋值方法熟悉部分字符编码及字符集了解信息保存和传输中的基本校验方法 计算机中的数据表示 什么是数据 数据是对事实或概念的一种符号表示形式 可以用人工方式或自动化装置进行通信 翻译转换或加工处理 数值型数据具有特定值的一类数据 可用来表示数量的多少 可进行算术运算 非数值型数据包括字符 字符串 图形 图像 音频 视频等 信息和信息处理 信息信息是可能对人的行为和决策施加影响的数据所包含的意义 如 数据 1 3 5 所揭示的等差性质 数据 30000V 告诉你应该远离 数据 院士 的头衔使你肃然起敬 信息处理通过数据的采集和输入 有效地把数据组织到计算机中 由计算机系统对数据进行相应的处理加工 编码 存储 转换 计算 比较 传送等操作 最后向人们提供有用的信息的全过程 媒体及其分类 媒体媒体又称媒介 指承载信息的手段 方法 工具 设备或装置 感觉媒体 能使人的各种感觉器官直接产生感觉的一类媒体 如声音 文字 图画 气味等 它们是人类使用信息的有效形式 表示媒体 为了使计算机有效地处理 传输感觉媒体而在计算机内部采用的特殊表示形式 即数值 文字 图像 音频 视频等的二进制编码表示 存储媒体 用于存放表示媒体以便计算机加工处理的物理实体 如磁盘 光盘 半导体存储器等 传输媒体 用来将表示媒体从一台计算机传送到另一台计算机的通信载体 如电话线 双绞线 光纤 无线电频道 红外线等 信息的数字化编码 常见编码 身份证号 校园卡号 五线谱 电报码 数字编码 ASCII编码 数值的二进制表示 图像的数字表示 编码用少量简单的基本符号 对大量复杂多样的信息进行一定规律的组合表示 一切信息编码的两大要素基本符号的种类 组合规则 数字化编码基本符号 0 1 不同类型的数据组合规则不同 数值编码方法 计数进制 R数制转换为十进制 1 2 例1将 11011 11 2转换为十进制数解 11011 11 2 1 24 1 23 0 22 1 21 1 20 1 2 1 1 2 2 27 75 10 只需按下述公式计算 R数制转换为十进制 2 2 例3将 A5C B2 16转换为十进制数解 A5C B2 16 10 162 5 161 12 160 11 16 1 2 16 2 2652 6953125 10 例2将 732 6 8转换为十进制数解 732 6 8 7 82 3 81 2 80 6 8 1 474 75 10 十进制转换为R进制数 任一十进制数N N整 N小 将这两部分分开转换 整数部分 除R取余 直到商零 先得低位 小数部分 乘R取整 直到得零或满足精度 先得高位 十进制正数转化为R进制 0 255 0 2 1 3 二进制与八进制 十六进制的转换 001011010110 101011100 2 1326 534 81326534 01011101 01011010 2 5D 5A 165D5A 二进制转化成八 十六 进制整数部分 从右向左按三 四 位分组 不足补零 小数部分 从左向右按三 四 位分组 不足补零 八 十六 进制如何转换到二进制 定点数 小数点位置固定的数 计算机内部总是用定长的二进制位表示 因此可表示数的范围和精度是有限的 浮点数 小数点位置不固定的数 由于表示的特点 定点数能够表示的数的范围较小 不能满足数据处理要求 产生了浮点表示方式 任何一个二进制数N可以表示为 N S 2E S称为尾数 E称为阶码 2是阶码的基数 E的不同取值使得S中的小数点位置可以浮动 因此称为浮点数 如 1 01101 23 10 1101 22表示的数相同 浮点数在机器内部的表示由3部分构成不同类型的数 float double 其i j不同 可表示的数的范围为 2n 1 2n 1 实质 整数的绝对值的二进制再在最高位补上1个符号位 0正1负 例 n 8 求X 1011001和Y 1011001的原码 解 原 01011001 Y 原 27 1011001 11011001 整数的原码表示 n比特整数 n比特整数 整数的原码表示范围 n 8 求X 0和Y 0的原码 解 0 原 00000000 0 原 27 0 10000000 0 原 0 原 一定会带来不便 整数的原码表示的优缺点 优点表示简单 易于理解 真值转换方便 乘除运算简单 缺点 运算麻烦 运算完全与笔算相同 如两个正数相减 首先要判断被减数的绝对值与减数的绝对值的大小 然后决定是颠倒过来相减 还是直接相减 最后在结果的前面加上正确的正负号 所以 势必花费较多的运算时间 降低运算速度 使运算器的逻辑复杂化 0的表示不唯一 对处理带来了不便 设法克服这些缺点 补码表示 反码 原码和补码的桥梁 n比特整数 a b modk 指a b对模k是同余的 可表示的数的范围为 2n 1 2n 1 实质 正整数的反码和原码相同 负整数的反码将原码符号位不变 其余位取反 例 n 8 求X 1011001和Y 1011001的反码 解 反 01011001 Y 反 28 1 1011001 100000000 1011010 10100110 可表示的数的范围为 2n 1 2n 1 多1个 实质 正整数的补码和原码相同 负整数 2n 1例外 的补码为其反码加1 符号位和数值位同样运算 例 n 8 求X 1011001和Y 1011001的补码 解 补 01011001 Y 补 28 1011001 10100111 整数的补码表示 n比特整数 例 n 8 求X 0和Y 0的补码 解 0 补 00000000 0 补 28 0 100000000 00000000 mod28 0 补 0 补 0可以统一处理 例 n 8 求X 128 27和Y 127 27 1的补码 解 补 28 27 27 10000000 0 原 Y 补 28 27 1 27 1 10000001又 Y 1111111 Y 原 11111111 Y 反 10000000 Y 补 10000001 整数0的补码表示唯一 C 中的整数是用补码表示的 无符号整数没有符号位 所有的位都用于表示数值 如 unsignedint unsignedlong等 有符号整数的最高位为符号位 如 int long等 求出若干整数的补码 通过调试手段验证内存中的内容 注意字节序bigendian 大尾 高位字节在后或高地址 和littleendian 小尾 低位字节在后或高地址 PowerPC系列CPU和Intel的x86系列CPU分别使用BE和LE C 的字节序与目标CPU相关 Java总采用BE 所有网络通信协议使用BE C 中整数类之间的赋值是内存的原样拷贝 实现正整数的二进制表示的置位 反转等 补码加减法规则 补码加减法公式 符号位和数位一样运算 X Y 补 X 补 Y 补公式一 X Y 补 X 补 Y 补公式二 X Y 补 X 补 Y 补公式三 补码加减法举例 1 2 补码加减法举例 2 2 问 为什么要有多种编码表示 答 简化数字的算术运算 易于硬件实现 加减运算采用补码 乘除运算采用原码 浮点数IEEE表示 大多数系统的浮点数表示采用IEEE754制定的标准 小数点左侧固定为1 为了保存更多有效数字 不予保存 指数部分用 移码 表示 float中各段分为1 8 23位 共32位 E e 127double中各段分为1 11 52位 共64位 E e 1023127和1023称为 偏置量 Bias E是 移码 若干特殊浮点数的表示 特殊浮点数的产生 0 小数点左侧固定为1 0无法保存只能特殊处理 NaN 负数开平方 结果无定义 不是一个数 浮点数的运算结果超出了可表示范围 视为无穷大 非规格化数 设float数X 1 001 2 125 Y 1 0001 2 125 对应十进制的2 6448623 10 38和2 4979255 10 38 X Y 0 0001 2 125 表达为规范浮点数则为1 0 2 129 超出了float的表示范围 只能近似为0 这意味着1 X Y 这一运算可能出现问题 编程输出产生特殊值的表达式 特殊float表示中的约定 移码E的范围及表示float用8位表示移码 偏置量为127 可表示的指数范围为 127 128 对应的移码范围为 0 255 此范围用无符号整数的二进制表示 E 0或255与尾数的不同组合表示特殊浮点数 见前文表 内似的约定可推至double 给出几个浮点数的表示 通过调试手段验证内存中的内容 字符编码 ASCII码 1 3 美国标准信息交换代码 AmericanStandardCodeforInformationInterchange 简称ASCII码 基本ASCII用7位二进制编码 可表示27 128个字符 ASCII中 编码值0 31不对应任何可印刷 或称有字形 字符 通常称它们为控制字符 用于通信控制或计算机设备的功能控制 编码值为32的是空格字符SP 编码值为127的是删除控制DEL码 其余的94个字符称为可印刷字符 扩展ASCII Latin 1 用8位二进制编码 可表示28 256个字符 除基本ASCII字符 还包括西欧语言 希腊语 泰语 阿拉伯语 希伯来语对应的文字符号 字符编码 ASCII码 2 3 7位ASCII码 字符编码 ASCII码 3 3 7位ASCII码 汉字编码 按用途有多种编码 特点 1 汉字是一种象形文字 据统计 从甲骨文至今约有六万左右的汉字 常见的汉字约有七千个 2 汉字字形结构复杂 笔划繁多 3 汉字同音字多 多音字多 1980年国家标准局颁布实施了GB2312 80 信息交换用汉字编码字符集 基本集 该标准收入了6763个常用汉字 其中一级汉字3755个 按汉语拼音排序 二级汉字3008个 按偏旁部首排序 以及英 俄 日文字母与其它符号682个 共计7445个符号 汉字在计算机处理过程中 有多种编码 GB2312 80的区位码 区位码 GB2312 80将汉字和符号分成94区94位 每个字符用两个字节编码 高字节为区号 低字节为位号 例 0102 啊 1601 鳌 8701 GB2312中01区 02区的字符 例 0179 0283 GB2312中16区 17区的字符 例 啊 1601 笔 1742 GB2312 80中的机内码 机内码二字节编码 其值为区位码两字节的编码各加上160 即机内码 区位码 H A0A0H编码的范围在此编码规范下 编码的范围为 A1A1 FEFE 共有8836个码位 除收录的汉字和各种符号外 还有1000多个码位用于扩展 输入码现存输入码极多 输入汉字除输入码外 还有字形识别 语音识别 字形码用于构造汉字字形 有两种基本的表示方式 点阵字形 矢量字形 现在广泛使用矢量字体 不同的汉字字体和大小对应于不同的字形码 字符编码的发展 1 不断发展 新版标准持续发布 字符集越来越大 2 保持向下兼容 横向兼容 3 越来越方便国际化 但也有兼容性问题 统一字符集的码位结构 统一字符集UCS UniversalCharacterSet 是ISO制定的ISO10646标准所定义的标准字符集 UCS用4个字节编码一个字符 最高字节为group编号 共256个 次高字节为平面编号 每组256个 每个平面包含256 256个码位 这一编码方案并不实用 因为历史以来存在着多种编码体系 与其保持兼容是必须的 Unicode编码 广为使用的编码 Unicode是UniversalCode的缩写 Unicode计划使用了17个平面 一共有17 65536 1114112个码位 在Unicode5 0 0版本中 已定义的码位只有238605个 分布在平面0 平面1 平面2 平面14 平面15 平面16 其中平面15和平面16上只是定义了两个各占65534个码位的专用区 PrivateUseArea 分别是0 xF0000 0 xFFFFD和0 x100000 0 x10FFFD 所谓专用区 就是保留给大家放自定义字符的区域 可以简写为PUA UCS 2 用2字节编码一个字符 范围为U 0000 U FFFF 可编码65536个字符 UCS 2对应前述码位空间中的0组0号平面plane0 称为基本多文种平面BMP BasicMultilingualPlane BMP以外的字符则需要使用五位或六位十六进制数表示 UCS 4 用4字节编码一个字符 范围为U 00000000 U 7FFFFFFF 可编码32768 65536个字符 其中U 00000000 U 0000FFFF编码的字符与UCS 2对应相同 UTF编码 Unicode传输编码 UnicodeTransformationFormat 统一传输 为了有效传送Unicode编码 以文本方式传送任何内容 避开通讯协议中的特殊码位等目的 将Unicode编码转换为UTF编码 这一转换为一一映射 保证双向无损转换 UTF 8 用字节序列 1 5 表示一个Unicode编码 UTF 16 用2字节序列表示一个Unicode编码 UTF 32 用4字节序列表示一个Unicode编码 UTF 8 WEB中应用最多的传输编码 主要用于互联网上的数据传输 用最多达6个字节的序列来表示一个字符 为有效分析字符串 用第一个字节指明字节序列中的字节数 理解浏览器中的UTF 8配置选项 观察百度搜索中关键字的UTF 8传送 UTF 16和UTF 32 UTF 16 用一个16位的值来编码映射到不大于65535数值的字符 映射到大于65535的数值的字符则被编码成一组16位的值 代用对 UTF 32 用一个32位的值来编码一个字符 码长相等 便于处理 但占空间较大 Unix系统使用广泛 Windows对Unicode的支持 Windows2000 WindowsXP WindowsVista支持Unicode 如果在这些操作系统上运行非Unicode编码程序 在处理之前 操作系统在其内部将应用程序的文本依据代码页 特定编码与Unicode编码的对照表 转化为Unicode编码的文本 在把信息传回应用程序之前 操作系统把Unicode编码的文本转化回所希望的代码页形式 任何磁盘文件中的字符 均采用某种编码存储 在读写文件时必须用相同的编码体系保存 才能正确解释文件内容 在Notepad中用不同编码保存文件 用十六进制编辑工具观察其内容编码 数据校验码的作用 信息
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届吉林省化学高三第一学期期中调研试题含解析
- (2025年标准)归属确认协议书
- (2025年标准)广告资源协议书
- 化妆品行业产品质量安全追溯系统
- (2025年标准)灌区管护协议书
- (2025年标准)关于用款的协议书
- 2026届新疆乌鲁木齐市70中化学高二第一学期期中教学质量检测试题含解析
- 普通企业市场竞争策略大纲
- 家用电器维修技术操作手册
- 现代观光农业园区商业计划书
- 2024广东省中考英语真题【原卷版】
- ECMO培训计划方案
- 物业管理中的控烟规章制度
- 云上贵州大数据(集团)有限公司招聘笔试冲刺题2024
- 反比例函数教材分析课件
- 空调工人安装合同模板
- Unit 8 Lets celebrate!教学设计2024-2025学年牛津译林版英语七年级上册
- 国际商务课件全套教程
- 22.3 实际问题与二次函数 课件 2024-2025学年人教版数学九年级上册
- 文言合集(1):120个文言实词小故事(教师版+学生版)
- 教科版(2024)小学科学一年级上册(全册)教案及反思(含目录)
评论
0/150
提交评论