




已阅读5页,还剩74页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息的数字化 有 字符 图形 影像 声音 社会中信息形式 只有 二进制 二进制形式 社会中信息形式 建立一一对应关系 计算机内部信息形式 将声音 Audio 图像 StillImage 图形 Graphic 视频 Video 转化为二进制代码存储的过程叫数字化 计算工具的发展史 能进行八位计算 利用卡片输入程序和数据的设计被后人所采用 字符的数字化 ASCII码 ASCII码 美国标准信息交换码 用7位二进制代码表示 共有27 128种不同的组合 表示128个字符 其中有94个字符 10个数字符号 26个大写英文字母 26个小写英文字母 标点符号和其他常用符号 和34个控制符 每个字符可以用一个字节表示 字节的最高位为0 ASCII编码表 最高位为0 0000000 11111110 127 ASCII码 用7位二进制代码表示 共有2 7 128个字符 其中有94个字符和34个控制符 每个字符可以用一个字节表示 字节的最高位为0 ASCII码的递推 A010000012 6 2 0 64 1B010000102 6 2 1 64 2C010000112 6 2 1 2 0 64 3 Z010110102 6 2 4 2 3 2 1 64 26 逻辑表达式 判断一个字符ch是否是英文字母1 判断ch是否是小写英文字母ch a andch A andch a andch A andch Z ASCII编码表 控制符 0 9 A Z a z ASCII码 用7位二进制代码表示 共有2 7 128个字符 其中有94个字符和34个控制符 每个字符可以用一个字节表示 字节的最高位为0 大小关系 控制符 0 9 A Z a z 计算机中中文字符的表示 汉字是一个大字符集 说文解字 东汉 收录9353字 玉篇 南朝 收录16 917字 广韵 宋代 收字26 194字 字汇 明朝 收录33 197字 康熙字典 清朝 收录47 043字 汉语大字典 1992年 收录超过5 6万字 二计算机中中文字符的表示 GB2312 80国标码汉字机内码汉字输入码汉字字形码 GB2312 80国标码简介 1980年 为了使每一个汉字有一个全国统一的代码 我国颁布了第一个汉字编码的国家标准 GB2312 80 信息交换用汉字编码字符集 基本集 这个字符集是我国中文信息处理技术的发展基础 也是目前国内所有汉字系统的统一标准 GB2312 80国标码简介 国标码 GB 包含 简化汉字 符号 字母 日文假名 共7445个字符 其中包含了6763个汉字 并分作两级 一级为常用字 3755个 按照拼音排序二级为次常用字 3008个 按照部首排序 GB码的编码空间 一个字符的国标码由两个部分组成 分别是该字符的区号和位号 GB码规定共有94个区 每个区中有94个位 编码空间为 94 94 8836个码位1 9区是西文字母 数字 日文假名 图形符号16 87区是汉字区 其中16 55区是一级汉字 40 94 5 3755个 56 87区是二级汉字 32 94 3008个 10 15 88 94区是用户自定义区 GB码区位示例 01区 78位 GB码区位示例 续 保 位于17区 03位 GB码区位示例 续 GB码区位示例 续 GB码区位示例 续 国标码 国标码 先将十进制区码和位码转换为十六进制的区码和位码 这样就得了一个与国标码有一个相对位置差的代码 再将这个代码的第一个字节和第二个字节分别加上20H 就得到国标码 保 位于17区 03位 区位码1703 十进制1703D 1103H 十六进制 保 的GB码 国标码 国标码最大是多少 GB码规定共有94个区 每个区中有94个位 最大的区位码是9494D 5E5EH5E5EH 20H 7E7EH 0111 1110 0111 1110B两个字节 其前后两字节的最高位为0与ASCII码发生冲突如 保 字 国标码为0011 0001 0010 0011 而 1 和 的ASCII也为0011 0001和0010 0011 现假如内存中有两个字节为0011 0001 0010 0011 这到底是一个汉字 保 还是两个西文字符 1 和 汉字机内码 大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码 这样既解决了汉字机内码与西文机内码之间的二义性 又使汉字机内码与国标码具有极简单的对应关系 汉字机内码 是供计算机系统内部进行存储 加工 传输时统一使用的代码 GB码 汉字机内码 保 国标码3123H B1A3H 1011 0001 1010 0011B 0011 0001 0010 0011B 大小关系 控制符 0 9 A Z a z 汉字 计算机内存中有4个字节的数据01100001 01000001 00110001 01010001这项数据是 A 2个汉字B 4个西文字符C 4个控制符D 汉字和西文字符混合字符串分析 01100001 01000001 00110001 01010001汉字在计算机内按机内码存储每个字节以1开始 故这是4个ASCII码值 汉字输入码 输入码 汉字输入码是指直接从键盘输入的各种汉字输入方法的编码 属于外码 五笔输入码拼音码全拼码 汉字的字形码 用点阵方式来构造汉字字型 然后存储在计算机内 构成汉字字模库 目的是为了能显示和打印汉字 16 16点阵24 24点阵32 32点阵 汉 16 16点阵图 黑色记1 白色记0010000000001000001101111111100000100000001000100000100001000011000100001000 16 16点阵字库 对于16 16的矩阵来说 它所需要的位数共是16 16 256个位 每个字节为8位 因此 每个汉字都需要用256 8 32个字节来表示 即每两个字节代表一行的16个点 共需要16行 显示汉字时 只需一次性读取32个字节 并将每两个字节为一行打印出来 即可形成一个汉字 点阵字库 行列分得越多 描出汉字越精细 占用空间越大 汉字字形数字化后 以二进制文本形式存储的汉字字模库 又称汉字字形库 简称汉字字库 点阵字库实例 计算机中中文字符的表示 用途将不同的系统使用的不同编码统一转换成国标码 再转换成汉字机内码后 内部使用 内部直接使用输入中文字符输出中文字符 数字化还原 国标码汉字机内码汉字输入码汉字字形码 字符的数字化流程 通过汉字输入码输入电脑转换汉字机内码 在电脑中处理处理结果通过汉字字形码输出 汉字机内码 汉字输入码 汉字字形码 练习 汉字机内码是用 个字节表示的存储空间汉字的字形码比机内码 在计算机存储器中 一个字节可以存放 A 一个256 512之间的任意整数B 一个英文字母C 一个汉字D 一个大于255的整数汉字的字形点阵为24 24时 需要的存储空间为 个字节 2 大 B 72 11111111B 255 模拟量与数字量 话音信号是典型的连续信号 不仅在时间上是连续的 而且在幅度上也是连续的 在时间上 连续 是指在一个指定的时间范围里声音信号的幅值有无穷多个 在幅度上 连续 是指幅度的数值有无穷多个 我们把在时间和幅度上都是连续的信号称为模拟信号 数字量是指某一物理量用与它相当的数值表示 模拟量与数字量 模拟量 数字量模数转换 A D 数字量 模拟量数模转换 D A 声波的数字化 声波的数字化 声音是一种波 声波通过空气的振动传递到人的耳膜 引起振动 形成听觉效果 称为声波 是时间或幅度上连续的模拟信号 声波的数字化 模数转换 A D 010000000001000001101111111100000100000001000100000100001000011000100001000 数模转换 D A 声波的数字化 声音数字化处理步骤 采样 sampling 量化 quantization 编码 coding 采样 量化 采样 按一定的频率 每隔一段时间 测得模拟信号的模拟量的值 如图 量化 将测得的模拟量值归入一个量化区域 把值转化为二进制代码 如图 采样 采样频率 采样频率 一秒种采样的次数 HZ 采样频率越高 单位时间内采集的样本数越多 得到的波形越接近原始波形 音质越好 数字化声音的数据量也越大 一般CD采样频率为44 1KHZ 立体声为双声道 采样 采样精度 采样精度越高 位数越多 表示的数值范围越大 数字化后波形振幅的精度越高 声波的还原越细腻 声音的质量越好 需要的存储空间越多 通常有8位 2 8 256个等级 16位 2 16 65536个等级 采样位数用bit s 即bps 波特率 表示 数据率 bit s 采样频率 Hz 样本精度 bit 声道数 计算存储量 CD采用44 1KHZ的采样频率 16位量化分辨率 立体声双声道 每秒的数据量是多少字节 分析 16位量化分辨率 是每个测试点采用16位二进制数表示 即每个点存储信息需要占用2个字节 1字节 8位 数据量 44100 2 2 176400B 172KB 练习 某同学想用windows自带的 录音机 功能录制自己唱的歌 送给在外地的爷爷奶奶 他选用44 1KHZ的采样频率 32位量化分辨率 立体声双声道 那么计算机每秒采的样本数是多少 每秒的数据量是多少字节 采样频率 一秒种采样的次数 HZ 44 1KHZ的采样频率说明计算机每秒采的样本数是44 1K 44100数据量 44100 4 2 352800B 344KB 练习 16位声卡可将每个采样量化值划分为65536个等级 32位声卡 可以将每个采样量化值划分为 个等级 16位声卡声音振幅用16位二进制表示 即2 16 65536 个等级32位振幅用32位二进制表示2 32 2 16 2 16 65536 65536 编码 coding 按一定的格式把离散的量化数值加以记录 即将量化后的信号转换成一个二进制编码组输出 量化后的数字音频信号直接存入计算机会占用很大的存储空间 通过编码可以去除信号冗余和量化噪音 减少数据的存储量 并被存储为不同编码形式的文件 如 wav mp3 格式的声音文件 声卡 SoundCard 在电脑上录音的本质就是把模拟声音信号转换成数字信号 反之 在播放时则是把数字信号还原成模拟声音信号后 用音箱播放出来 转换设备 声卡声卡的位是指声卡在采集和播放声音文件时所使用数字声音信号的二进制位数 即采样精度 声波的数字化 声音数字化处理步骤 采样 采样率越高 声音越好 数据量越大 量化 模 数转化 位数越多 噪声越小 编码 声音数字化流程 wav mp3 格式的声音文件 数模转换 D A 模数转换 A D 失真 传输声音 由于干扰存在 信号会产生失真通过整形来消除失真 图像的数字化 图像的数字化 把图像网格化 一个方格一种颜色 这些方格称为 像素 桌面分辨率 dpidotsperinch 1024 768 水平像素 垂直像素黑白2色 1位二进制存储 黑色1 白色0 黑白灰度色 黑白二色的不同的灰度 用1个字节彩色256色 8位二进制存储 1个字节24位彩色一种颜色用3个字节 24位二进制来表示 它可以达到人眼分辨的极限 发色数是1677万多色 也就是2 24 11111111B 255 24位真彩色 R red G green B blue 红 绿 蓝 三个基色分量 屏幕上的所有颜色 都由这红色绿色蓝色三种色光按照不同的比例混合而成的 RGB各有256级亮度 数字表示从0 1 2 255 24位真彩色 R G B各自的数值连起来表达一种颜色 如R32 G39 B28 R20 G27 B1C 十六进制 计算存储量 一幅1024 768的彩色图像 每个像素使用3个字节 则存储占用多少多少字节 分析 1024 768 3 2359296B 2 25MB 位图 思考 位图文件的大小是和图像的像素数目及描述每个像素的色位数 成正比 成反比 无关 成正比 矢量图和位图 位图 由单个像素染色以构成图样 优点 能表现层次丰富的逼真图像效果 缺点 放大后图像呈方格样 文件扩展名 BMP矢量图 用直线和曲线来绘制图形 只能靠软件生成 文件占用空间较小 优点 放大后图像不会失真 和分辨率无关 缺点 难以表现层次丰富的逼真图像效果 文件扩展名 WMF 在MicrosoftOffice中调用编辑 swf Flash动画的文件格式 小华的父亲保存了很多老照片和旧的文字手稿 有些手稿还是用毛笔写的 他想与自己的亲朋好友在网上共享这些珍贵的历史资料 为此小华提出了一些建议 以下建议可行的有 用绘图仪将这些老照片和旧文稿转换成图片文件 再传到网上 用数码相机拍摄这些老照片和旧文稿 将照片文件传到网上 用数码摄像机拍摄这些老照片和旧文稿 将视频文件传到网上 通过扫描仪将这些老照片和旧文稿变成电子图片文件 再传到网上 图像数字化设备 扫描仪数码相机数码摄像机 常见图片格式bmp tif gif jpg 视频的数字化 视频的数字化 视频是由连续的图像帧组成的 将连续每个图像帧的存储量求和就是视频的总存储量 我国采用PAL制 每秒钟显示25帧 计算存储量 分辨率为720 576的PAL制式的彩色视频 10秒钟长的视频存储需要多少字节 分析 720 576 3 25 10B 300MB多媒体信息的数据量是非常大 练习 我国彩色电影 每秒钟显示24帧 画面分辨率为800 600 那么录制25分钟 其数据量为多少GB 分析 800 600 3 24 60 25 1024 1024 1024 视频数字化设备 数码摄像头视频卡 VideoCard 用来支持视频信号 如电视 的输入与输出采集卡能将电视信号转换成计算机的数字信号 便于使用软件对转换后的数字信号进行剪辑处理 加工和色彩控制 还可将处理后的数字信号输出到录像带中 数字化 ASCII码 字母 数字 符号二进制7位二进制汉字编码的作用 汉字二进制国标码2个字节声音数字化 声音二进制步骤 采样 量化 编码图像的数字化 图像二进制视频的数字化 图像二进制 信息编码 字符 汉字 声音 视频 二进制数据代码信息编码是为了方便信息的存储 检索和使用而规定的符号系统 编码的过程是将信息按照一定的规则进行变换 举例 身份证 商品条形码 邮政编码邮政编码 第1 2位代表省 自治区 直辖市 第3位数代表邮区 第4位数代表县 市 末2位数代表邮局及其投递区 信息处理工具 纸 笔 算盘 电报 电话 录音机 照相机 摄像机 计算机等 g13 数字化时代 21世纪人类进入了信息时代 也可以称为数字化时代 你用的手机 Cellphone 你听的MP3 MusicPlayer 你看的DVD DigitalVideoDisk 你播放的CD光碟 CompactDisk 还有数字电视 HDTV 更不用说你用的电脑了全是数字化的产物 你已经被数字化包围了 多媒体 计算机处理作用于人感官的文字 图形 图像 动画 声音和视频等各种媒体信息 称为多媒体技术 数据的压缩 数据的压缩 多媒体信息的数据量是非常大的 必须要对其进行数据的压缩才能被广泛应用 一幅图像的像素色彩值为 绿绿绿绿绿绿绿绿绿绿红红红红红红红红黄黄黄黄黄黄黄黄黄黄黄黄黄 能用简练方式表达吗 绿10红8黄13 数据压缩就是采用特殊的编码方式来保存数据 使数据占用的存储空间相对减少 有损压缩 保存重要的而丢弃部分数据 声音 图片 视频无损压缩 压
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 紧固件采购工作总结与计划
- 《秦兵马俑》课件评语
- 抑郁症评估护理查房
- 新修订森林法核心解读与实施要点
- 公司水电火安全培训课件
- 护理不良事件分析与防范培训
- 《甲午战争》课件
- 广东省汕头市金平区2024-2025学年高一下学期第一次月考英语考试题目及答案
- 五个好作风课件
- 跟合作伙伴汇报
- 2025鄂尔多斯市东胜城市建设开发投资集团有限责任公司招聘笔试备考题库及答案详解参考
- 2025年项目管理考试题库及答案
- 农村生活污水处理设施水污染物排放控制规范编制工作指南
- Unit 2 Home Sweet Home 重点短语和句式-人教版英语八年级上册
- 防治大气污染课件
- 国际音标教学课件
- 常用概率分布题目及答案
- 2025年互联网营销师考试题及答案
- 《煤矿安全规程》2024年修改内容-机电运输部分培训课件简约版
- 地铁机电安装与装饰工程监理规划
- DB21T 4094-2025特色民宿建设与运营指南
评论
0/150
提交评论