信息的表示.ppt_第1页
信息的表示.ppt_第2页
信息的表示.ppt_第3页
信息的表示.ppt_第4页
信息的表示.ppt_第5页
已阅读5页,还剩97页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 2计算机中的信息表示 2 1常用数制 2 2数制间的转换 2 3二进制数的运算 2 4数值型数据的表示及处理 2 5文字的表示和处理 2 2 1常用数制 十进制 二进制 八进制和十六进制 3 特点 数值用0 9表示 逢十进一 十进制 Decimal 举例 123 45 10 123 45D 123 45D 3 100 2 101 1 102 4 10 1 5 10 2 按权展开式 通式 4 二进制 计算 1B 1B 10B Binary 特点 0或1 逢二进一 举例 101 11 2 101 11B 101 11B 1 20 1 22 1 2 1 1 2 2 1 4 0 5 0 25 5 75 5 八进制 计算 1O 7O 10O Octal 特点 0 7 逢八进一 举例 76 01 8 76 01O 76 01Q 76 01Q 6 80 7 81 1 8 2 6 56 0 0625 62 0625 6 十六进制 计算 1H AH BH Hexadecimal 特点 数值用0 9 A 10 B 11 C 12 D 13 E 14 F 15 表示 逢十六进一 举例 7D6 A 16 7D6 AH 7D6 AH 6 160 13 161 7 162 10 16 1 6 208 1792 0 625 2006 625 7 二进制中只有0和1两个符号 使用有两个稳定状态的电子器件就可以分别表示它们 二进制数的运算规则简单 易于进行高速运算 数理逻辑中的 真 和 假 可以分别用 1 和 0 来表示 这样就把非数值信息的逻辑运算与数值信息的算术运算联系了起来 为什么计算机只用二进制 8 9 10 11 12 二进制数太长 书写 阅读 记忆均不便 八 十六进制与二进制之间的转换直观 方便 为什么还用八 十六进制 13 2 2数制间的转换 14 1 十进制数与二进制数的转换 十进制整数二进制整数 例1 将二进制整数 1010101 2转换成十进制整数 1010101 2 1 26 0 25 1 24 0 23 1 22 0 21 1 20 64 16 4 1 85 10 方法描述 位权相加法 计算按权展开式的和 15 例2 将 19 10转换为二进制数 故 19 10 10011 2 方法描述 除 倒取余 直到商为0 16 十进制小数二进制小数 例3 将二进制小数 0 111 2转换成十进制数 0 111 2 1 2 1 1 2 2 1 2 3 0 5 0 25 0 125 0 875 10 方法描述 位权相加法 计算按权展开式的和 17 例4 将 0 625 10转换为二进制数 故 0 625 10 0 101 2 方法描述 乘以 顺取整 直到小数部分为0 18 故取近似值 0 1 10 0 00011 2 小数部分乘2会无限循环下去 例5 将 0 1 10转换为二进制 并非所有的十进制小数都能用有限位的二进制小数来表示 注意 19 十进制数转换成二进制数时 要将整数和纯小数部分分开转换为相应的二进制 然后再将二进制数的整数和小数部分连接起来 例6 将 19 625 10转换为二进制数 解 19 10 10011 2 0 625 10 0 101 2 故 19 625 10 10011 101 2 注意 20 二进制数转换为八进制数 011110111 100010101 2 3 6 7 4 2 5 小数部分从高位向低位 整数部分从低位向高位 367 425 8 例7 将 011110111 100010101 2转化为八进制数 方法描述 先用两端补 0 的方法 将二进制数的整数与小数部分分别补足为3的倍数位 再将三位二进制数用一位等值的八进制数表示 2 八进制数与二进制数的转换 21 16 327 8 八进制数转换为二进制数 例8 将 16 327 8转换为二进制数 001110 011010111 2 方法描述 一位八进制用三位二进制数表示 22 转换表八进制数二进制数八进制数二进制数00004100100151012010611030117111 记熟 23 3 十六进制数与二进制数的转换 二进制数转换为十六进制数举例 001101001110 11001100B 十六进制数转换为二进制数举例 35A2 CFH 34E CCH 0011010110100010 11001111B 24 转换表十六进制数二进制数十六进制数二进制数0000081000100019100120010A101030011B101140100C110050101D110160110E111070111F1111 记熟 25 4 十进制与八进制或十六进制间的转换 八 十六进制 十进制按位权展开十进制 八进制除8倒取余和乘8顺取整十进制 十六进制除16倒取余和乘16顺取整 和十进制与二进制转换类似 26 R进制转换为十进制 R 2 8 16 十进制转换为R进制 R 2 8 16 二进制 八进制 十六进制之间相互转换 数制转换小结 27 下列最大的数是 A 11001010BB 712QC 4FFHD 566D 练习 在某一进制下 如果7 7 61 则4 6 A 24B 30C 18D 33 B C 计算74 75D B Q H 1001010 11 112 6 4A C 28 2 3二进制数的运算 1 算术运算 向高位进1逢2进1 29 向高位借1 30 2 逻辑运算 1 逻辑数据的表示 真 假 是 非 对 错 有 无 2 逻辑运算逻辑非逻辑与逻辑或 31 2 逻辑运算 与或非 32 逻辑与 用 AND 表示运算规则 0 1 01 0 00 0 01 1 1 当两个逻辑量同时为真时 结果才为真 33 逻辑或 用 OR 表示运算规则 0 1 11 0 11 1 10 0 0 当两个逻辑量只要有一个为真时 结果才为真 34 举例 求 10011010OR11110000 10011010 11110000 11111010 35 练习 计算01011001 10100111 00000001 36 2 4数值型数据的表示及处理 1 任何数据在计算机内都采用二进制表示 2 为了解决数值数据的表示范围问题 引入数据的定点表示和浮点表示 注意 37 数据定点表示的两种形式 1 如规定小数点隐含在有效数字的最后 则说明表示的是整数 在计算机中并不能表示出小数点和小数点的位置 而是必须人为地做出规定 2 4 1整数 定点数 的表示 说明 2 如规定小数点隐含在有效数字的最前面 则说明表示的是纯小数 小数点的位置固定 38 例如 二进制数01011101的两种表示 1 如规定小数点隐含在有效数字的最后 则其表示整数 1011101 2 如规定小数点隐含在有效数字的最前面 则其表示纯小数 0 1011101 39 整数的分类 无符号整数 表示正整数 8位 16位 32位 例如 10000001 取值范围 8位0 255 28 1 16位0 65535 216 1 32位0 232 1 找出最大值和最小值考试中经常出现 40 有符号整数 表示正整数 负整数 其余各位用来表示数值的大小例如 00101011 43 10101011 43 符号位 使用最高位 最左面的一位 作为符号位 0 正数 1 负数 可以采用不同的方法 原码 反码 补码 来表示有符号整数 41 举例1假设只用8位二进制来表示一个整数 求 7和 7的原码 解 7 原 若符号位为0 则表示正数 若符号位为1 则表示负数 原码表示 表示方法规定 最高位作为符号位 其余各位代表数值本身的绝对值 以二进制表示 00000111 10000111 7 原 用 X 原表示X的原码 42 1 原 127 原 1 原 127 原 绝对值相同的正数和负数 它们除了符号位不同外 其他各位都相同 00000001 10000001 01111111 11111111 总结一下 43 举例2 假设用8位二进制来表示一个数 求0的原码 解 根据原码的定义 0 原 0 原 结论 0的原码不唯一 分析 当由数轴的左端趋向0时 我们记为 0当由数轴的右端趋向0时 我们记为 0 0 0 00000000 10000000 44 假设用8位二进制表示一个数用原码表示的最小值为 127 其原码为11111111用原码表示的最大值为 127 其原码为01111111 所以 原码的表示范围为 127 127 原码的表示范围 45 解 7 反 7 反 反码表示 表示方法规定 1 一个数如果值为正 则它的反码与原码相同 2 一个数如果值为负 则将其符号位置为1 其余各位为对原码的相应数据位取反 举例1 假设只用8位二进制来表示一个整数 求 7和 7的反码 00000111 11111000 46 举例2 假设用8位二进制来表示一个数 求 0和 0的反码 解 根据反码的定义 0 反 0 反 结论 0的反码不唯一 00000000 11111111 47 假设用8位二进制表示一个数用反码表示的最小值为 127 其反码为10000000用反码表示的最大值为 127 其原码为01111111 所以 反码的表示范围为 127 127 反码的表示范围 与原码是一致的 48 补码表示 应用补码的原因 通过对负数的适当处理 把减法转化为加法 不论求和求差 也不论操作数为正为负 运算时一律只做加法 从而大大简化加减运算 表示方法规定 1 正数的补码 反码 原码相同 2 对于负数的补码 则将其最高位置为1 其余各位为对原码的相应数据位取反 然后再对整个数加1 49 举例1假设只用8位二进制来表示一个整数 求 7和 7的补码 解 7 补 00000111 7 补 1111000 1 1 11111001 补充公式 X为负数时 x 补 x 反 1 想一想 若已知X的补码为11111010 如何求X 50 补充 对负数来说 对补码再求一次补 会得到该数的原码 128 补不适合此规律 已知补码为 1111101010000101 110000110 6 51 注意 零的补码表示是唯一的 举例2假设只用8位二进制来表示一个整数 求 0和 0的补码表示 0 补 00000000 0 补为11111111 1 00000000 1 进位自然舍去 故 0 补 00000000 0 补 52 注意 用补码进行运算 减法可以用加法来实现 即两数相减 只需将两数的补码相加 就得到结果值的补码 举例3 假设只用8位二进制来表示一个整数 求7 6的值解 7 补 00000111 6 补 11111010 00000111 11111010 100000001 进位自然舍去 53 127 01111111 原码 反码 补码的表示范围 若一个数值数据的长度 包括符号位 为一个字节 则它表示的整数的范围为 原码 127 11111111 反码 127 10000000 补码 最小值 最大值 128系统规定其补码为 10000000 127 01111111 127 01111111 54 各种整数表示法的比较 55 BCD整数 BinaryCodedDecimal 称为 二进制编码的十进制整数 例如 51 BCD 101010001 32767 BCD 000110010011101100111使用4个二进制位表示1个十进制数字 最高位仍为符号位 也称8421码 想想为什么要用4位 BCD码 56 举例 很多高级程序语言 数值型数据都可以写成如下形式4 32E 5表示4 32 10 5 0 00004320 432E 1表示0 432 10 1 0 0432浮点表示与十进制中的科学计数法 两者很类似 但又不同 为什么要引入浮点数 在一定字长下 整数数值的表示范围有限 实际的数据往往有整数部分又有小数部分 实际数据有的特别大 有的特别小 2 4 2实数 浮点数 表示 小数点的位置不固定 57 基数 R 在计算机中 通常隐含为2尾数 M 必须是二进制定点纯小数 位数决定数的精度阶码 E 必须是二进制定点整数 位数决定数的范围 在一般数据的浮点表示法中 一个数可表示成 N M RE 58 回忆 二进制数01011101的两种表示 1 如规定小数点隐含在有效数字的最后 则其表示整数 1011101 2 如规定小数点隐含在有效数字的最前面 则其表示纯小数 0 1011101 59 26 5 10 例1 假设某机器字长为16位 规定前6位表示阶码 包括阶码符号 原码表示 后10位表示尾数 包括尾数符号 原码表示 则 0001011110101000表示的浮点数是 0 110101 2 2 101 2 11010 1 2 0001011110101000 阶码 尾数 60 0 078125 10 例2 假设数值数据的长度为16位 其中前4位为阶码 包括阶码符号 原码表示 后12位为尾数 包括尾数符号 原码表示 则 1010001010000000表示的浮点数是D 1010001010000000 0 0101 2 0 000101 2 N M RE 2 10 2 61 复习 假设用8位二进制来表示一个数 计算 12 原 12 反 12 补 10001100 11110011 11110100 某存储单元中的机器码0110110001011100表示一个浮点数 该浮点数的阶码为4位 含阶符1位 补码表示 尾数位12位 含数符1位 补码表示 则与该浮点数等值的十进制数是 29 125D 62 2 5文字的表示及处理 2008年8月8日 China 63 文字是人与计算机进行信息交流的主要媒体 文字的基本元素 字符 字符在计算机中采用采用二进制编码表示 西文字符编码汉字编码汉字的输入输出文本处理 主要内容 64 1 ASCII码 2 5 1西文字符的编码 ASCII码 即美国标准信息交换码 AmericanStandardCodeforInformationInterchange 使用7个二进位对字符进行编码 想一想 ASCII码可以表示多少个不同的字符 其中 可打印字符95个 如常用字母 数字 标点符号 控制字符33个 不可直接显示或打印 65 ASCII码字符集 想一想 相邻的两个字母的ASCII码值相差多少 小写字母的ASCII码值比同一大写字母的ASCII码值大多少 66 每个字符用标准规定的7位二进制数表示 在机内占一个字节 最高位为0 如 字符 A 的ASCII码为 字符 0 的ASCII码为 00110000 2或 48 10 60 8 30 16 01000001 2或 65 10 101 8 41 16 67 会比较ASCII字符的大小 按其ASCII码值 空格 0 9 A Z a z 要求 会推算同组字符ASCII码值如A的ASCII值 十进制 为65 则B C 的ASCII值分别为66 67 68 2 EBCDIC码 说明 有很多编码没有使用 保留做为扩充 定义方式 用8位二进制数位表示一个字符的扩充二 十进制交换码 特点 每个字符对应一个字节 共256种 69 GB2312 80汉字编码 国标码 GBK汉字内码扩展规范UCS Unicode汉字编码GB18030 2000编码 2 5 2汉字编码 70 国家标准局1981年 信息交换用汉字编码字符集 汉字交换码的国家标准 采用双字节编码 1 GB2312 80汉字编码 71 第一部分 字母 数字和各种符号 包括拉丁字母 俄文 日文平假名与片假名 希腊字母 汉语拼音等共682个 统称为GB2312图形符号 第二部分 一级常用汉字 共3755个 按汉语拼音排列第三部分 二级常用字 共3008个 按偏旁部首排列 组成 72 这是一个二维代码表 有94行 94列 汉字在代码表中的位置用它所处的区位号表示 汉字区位码 例如 北 字的区号17 位号17区位码是1717用2个字节表示为 0001000100010001 73 GB2312 80字符集 74 解决方案 为了避免冲突 每个汉字的区号和位号必须分别加上32 得到的代码称为汉字的 国标交换码 国标交换码 问题 信息通信中 汉字的区位码与通信使用的控制码 00H 1FH 发生冲突 75 大 字的区号20 位号83区位码2083二进制表示为 0001010001010011 例如 国标交换码52115二进制表示为0011010001110011 76 解决方法 使表示GB2312汉字的两个字节的最高位 b7 都置为 1 这种汉字编码称为GB2312汉字的 机内码 机内码 问题 文本中的汉字与西文字符经常是混合在一起使用的 汉字信息如不予以特别的标识 它与单字节的标准ASCII码就会混淆不清 77 大 字的区号20 位号83区位码2083二进制表示为 0001010001010011 例如 国标交换码52115二进制表示为 0011010001110011 机内码180243二进制表示为 1011010011110011 B4F3H 机器中存储 大 的真正编码 总结 区位码 32 国标码国标码 128 机内码 78 解决方法 1995年颁布GBK 全称为 汉字内码扩展规范 GBK每一个字符都采用双字节表示 共23940个码位共收入21003个汉字和883图形符号与GB2312保持兼容 微软公司自Windows95简体中文版开始 各种版本的中文操作系统均采用GBK代码 2 GBK汉字内码扩充规范 GBK 95 问题 GB2312 80只有6763个汉字 使用时功能不够 79 GBK编码区分三个部分 汉字区 21003个汉字 图形符号区 用户自定义区GBK每一个字符都采用双字节表示总体编码范围为 8140H FEFEH 共23940个码位 首字节范围 81H FEH 二进制最高位为1 尾字节范围 40H FEH 二进制最高位可以为0或1 GBK汉字内码扩充规范 80 目的 统一的多文本处理环境 实现全世界所有字符在同一字符集中统一编码 途径 UCS ISO IEC10646 通用多8位编码字符集 Unicode 统一码或联合码 与UCS完全等同的工业标准 优点 编码空间极大 4个字节 能容纳足够多的各种字符集 13亿字符 3 UCS Unicode UniversalMultiple OctetCodedCharacterSet 编码 81 克服 UCS 2为其子集 采用双字节编码 共有字符49194个 其中包括 欧洲及中东地区使用的拉丁字母 音节文字 各种标点符号 数学符号 技术符号 几何形状 箭头及其他符号 中 日 韩 CJK 统一编码的汉字 缺点 4字节的字符编码使存储空间浪费严重 82 目的 与GB2312和GBK兼容 向UCS Unicode过渡 内容 信息交换用的基本图形字符及二进制编码的十六进制表示 同时收录了主要的少数民族文字 编码方式 在GB2312和GBK的基础上进行了扩充 采用单字节 双字节 四字节三种方式编码 码位数160多万 4 GB18030 2000汉字编码标准 83 GBK 95 GB2312 80 GB18030 2000 00FF 00FF 00FF 00FF 27484汉字 21003汉字 6763汉字 GB2312 80 GBK 95 GB18030 2000 3种汉字编码的关系 这三者向下兼容 但与Unicode不兼容 84 5 BIG5编码 收录内容 13461个汉字和符号符号408个常用汉字5401个次常用汉字7652个 使用范围 通行于台湾 香港地区的一个繁体字编码方案 俗称 大五码 85 2 5 3汉字的输入输出 1 汉字输入 86 拼音编码 如 智能ABC 紫光拼音 搜狗拼音 谷歌拼音优点 易学缺点 同音字引起的重码多 需增加选择操作 键盘输入 字形编码 如 五笔字形法等优点 重码少 输入速度较快缺点 编码规则不易掌握 大 的输入码为 da 想想为什么要对汉字进行编码才能输入 87 文字识别的性能指标 识别精度和识别速度工作过程 在书写板上书写 书写板将笔尖的运动按时间采样 发送到计算机中 由软件进行识别 然后用该汉字 或符号 对应的代码进行保存 例如 汉王笔正确识别率95 90 速度12字 秒需求的配件 专用的书写板 笔 联机手写汉字识别 笔输入 88 使计算机具有人的听觉 使人机语音通讯中能听懂人类口述的语言 语音识别 分类 按照不同的应用及要求 小词汇量 中词汇 大词汇量语音识别孤立词 连接词 连续语音识别特定人 限定人 非特定人语音识别目标 非特定人大词汇量的连续语音识别技术 89 脱机文字识别 分类 印刷体OCR手写体OCR 对已经印刷或写完的文字进行识别 自动输入计算机并转换为数字文本形式的一种技术 也叫做OCR OpticalCharacterRecognition 手写体OCR的关键问题 用算法识别书写随机性带来的文字变化 90 汉字字形码 用于汉字在显示器或者打印机上输出 按表示形式分类 点阵表示形式矢量表示形式 2 汉字输出 汉字的输出过程 先根据字符的字体确定相应的字形库 再按照该字符的代码从字型库取出相应的字形 生成映像最后再传送到显示器或打印机输出 91 汉字矢量表示存储描述汉字轮廓特征的信息 汉字字形码用点阵表示 一个点用一个二进制位表示16 16 24 24 40 40 如Windows中TrueType技术 字形库 简称字库 同一种字体的所有字符的形状描述信息的集合 不同的字体对应不同的字库 想一想 在16 16点阵字库中 存储每个汉字的字形码用几个字节 92 输入码 汉字在机内的处理流程 总结 93 1 文本的编辑文本编辑的主要功能 了解 对字 词 句 段落进行添加 删除 修改等操作字的处理 设置字体 字号 字的排列方向 间距 颜色 效果等段落的处理 设置行距 段间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论