5 多媒体技术_1_第1页
5 多媒体技术_1_第2页
5 多媒体技术_1_第3页
5 多媒体技术_1_第4页
5 多媒体技术_1_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章数字媒体及应用 主要内容 5 1文本及文本处理5 2数字声音及应用5 3图像与图形5 4图像处理软件Photoshop5 5视频技术及应用 要求 掌握数字媒体的相关概念 ASCII码和汉字编码的表示方法 多媒体数据的采集与数字化过程 常见的多媒体文件的格式及特点 了解常用多媒体播放软件 多媒体计算机的软硬件结构 数据压缩的概念及两大国际压缩标准多媒体技术的基本特征 发展和应用 5 1文本及文本处理 5 1 1字符编码 1 ASCII码美国标准信息交换码 AmericanStandardCodeforInformationInterchange 每个字符由七个二进制位表示 共有27 128个字符 每个字符占用一个字节 8位 的存储单元 最高位一般保持为 0 在数据传输时可用作为奇偶校验位 注意几个特殊字母的ASCII码 如A 1000001 2a 1100001 20 0110000 2659748 校验位 b7 2 扩充ASCII字符集 ISO陆续制定了一批适用于不同地区的扩充ASCII字符集 每个扩充ASCII字符集分别可以扩充128个字符这些扩充字符的编码均是高位为1的8位代码 十进制数128 255 称为扩展ASCII码 3 汉字的编码 1 基本集GB2312 801980年我国颁布了 信息交换用汉字编码字符集 基本集 GB2312 80 选取了6763个常用汉字 一级常用汉字3755个 按汉语拼音排序 二级常用汉字3008个 以偏旁部首排序 2 其他五个辅助汉字集 GB2312汉字的编码 机内码 每一个GB2312汉字使用16位 2个字节 表示 每个字节的最高位均为 1 如1100101111110101如用十六进制CBF5可以表示一个汉字在16位代码空间中的码位分布 几种汉字编码的对比 3 汉字内部编码问题区位码 字符的代码表为94 94的表 行号 0 93 为区号 列号 0 93 为位号 该字符所在的区号 行号 及位号 列号 的二进制代码 7位区号在左 7位位号在右 共14位 即为区位码 每个汉字在码表中的位置编码 称为区位码 如 江 的区位码为2913国标码 由于信息传输的原因 汉字的区号和位号必须加上32所得的二进制代码才是其对应的国标码 如 江 的国标码为6145国标码 区号 32 位号 32 如0011110100101101机内码 在计算机内部 汉字以两个字节来表示一个汉字 为和ASCII码区别 其最高位为1 该码称为汉字的机内码 又称内码 如 1011110110101101BDAD 在中文Windows环境下 设有一串汉字的内码为CBF5D0B45043CAC7D6B8 这段文本中 含有 A 2个汉字和1个西文字符B 4个汉字和2个西文字符C 8个汉字和2个西文字符D 4个汉字和1个西文字符 练习 答案 B 练习 已知 江苏 两字的区位码为2913和4353 其机内码是 A 6145 7585B 3D2D 4B55C BDAD CBD5D 4535 535D 答案 C 解答 思路 区位码 国标码 机内码步骤 1 江 区位码为2913 其中29为区号13为位号2 国标码 区号位号分别 32 十进制 区号 29 32 61 10 00111101 2位号 13 32 45 10 00101101 23 将两个字节的首位均设为 1 机内码 1011110110101101BDAD则 BDAD为 江 的机内码 步骤 先将区位码中的区号位号分别转成16进制 再分别加A0即可 转换的方法二 5 繁体汉字的编码标准 BIG5编码是目前台湾 香港地区普遍使用的一种繁体汉字的编码标准 包括440个符号 一级汉字5401个 二级汉字7652个 共计13060个汉字 繁体汉字编码另外还有香港增补字符集 HKSCS 是香港政府订立的BIG5扩展标准 5 1 2文本的输入和输出 1 文本信息的输入 人工输入 通过键盘 手写笔或语音输入方式输入字符特点 速度慢 成本高 不适合需处理大批量文字的应用自动输入 将纸介质上的文本通过识别技术自动转换为文字的编码特点 速度快 效率高文字的自动识别分为 印刷体识别和手写体识别 1 文本信息的输入 键盘输入 输入码 一个汉字用若干个键盘中的键来表示 称为输入码 汉字编码的要求 易学 易记 高效 容量大以及重码少汉字编码的方法 数字编码基于数字表示 难记忆不易推广 如区位码 电报码字音编码基于汉字的拼音 简单易学重码多 如全拼字形编码分解汉字字形 重码少速度快难掌握 如五笔字形表形码音形编码综合字音与字形编码 规则简化 重码少 不易掌握 2文本信息的输出要将计算机处理过的汉字进行输出或打印 需将汉字的机内码进行相应的转换 附 输出过程中字形的生成过程 先根据字符的字体确定相应的字库 font 再按照该字符的代码从字库中取出该字符的形状描述信息然后按形状描述信息生成字形 并按照字号大小及有关属性 粗体 斜体 下横线 将字形作必要的变换最后将变换得到的字形放置在页面的指定位置处 2文本信息的输出 存放汉字字形的信息库 简称字库 不同的字体 黑体 宋体 隶书 对应不同的字库 2种不同的字库 1 点阵字库 16 16 24 24 32 32点阵中 1 对应位置为黑点 0 对应位置为空白 2 轮廓字库 用直线曲线勾画轮廓 并以数学函数来描述精度高 字形可任意变化 点阵描述 轮廓描述 汉字的处理过程 输入码汉字输入法机内码计算机内部处理字库 字型码 输出 简单文本 纯文本 没有字体 字号的变化 不能插入图片 表格 也不能建立超链接 其文件后缀名是 txt由一串用于表达正文内容的字符编码所组成 几乎不包含任何其他的格式信息和结构信息举例 丰富格式文本 本书由南京大学出版社 PublishingHouseofNanjingUniversity 出版 有字体字号等属性变化 设置了段落和页面排版格式的文本称为 丰富格式文本 除了正文内容之外 还使用了许多 标记 用来说明文本的版面结构 内容组织 文字的外貌属性举例 下面标题的格式为 中文用黑体 西文用ArialBlack体 居中 使用HTML语言描述为 本书由南京大学出版社 PublishingHouseofNanjingUniversity 出版 用一对指出的是标记 如和等 用于说明排版的格式和文字属性 它们不属于正文内容 正文内容 不同的软件使用的标记语言并不相同如微软的word和Adobe的Acrobat公用的中间格式 RTF格式 超文本 文本在信息组织上是线性的和顺序的 也就是说 只能一页一页地读下去 人的思想是跳跃性 超文本若干文本或文本中的各个部分可按照其内容的关系互相链接起来 从而形成 超文本 采用一种非线性的网状结构来组织信息 它由若干内部互联的文本块 或其他 组成 称之为节点文本 图形 图像 动画 音频 视频链 信息节点连接的指针举例1 POWERPOINT的链接 举例2 帮助文件 举例3web网页 超链接的妙处 Hyperlink 给你带来更多的与此相关的文字 图片等信息 超媒体 超媒体 超文本 多媒体 5 2数字声音及应用 5 2 1声音信号的数字化 声音是一种波 通过空气传播 在空气中能引起非常小的压力变化 自然界的各种声音大都具有周期性的强弱变化的特性 因而也使得输出的压力信号周期变化 大气中的声音 1 模拟信号 Analog 和数字信号 Digital 模拟信号是一种指时间和幅度上都连续的信号连续的模拟量 以电的 磁的等形式表示 计算机不能直接处理模拟音频 1 声音信息的数字化 玫瑰麦克风 波形声音获取 A D Analog Digital 转换 数字信号是模拟信号的一个子集是对前者经过采样 时间离散化 量化 幅值离散化 编码 可能压缩 而得到的近似表示前者的数据序列 声卡 声音处理部件 补充 理解 为了处理声音信息 计算机都要有一个声卡声卡有三个插孔 LINEOUT LINEIN MICIN 还有一个15针的MIDI接口声卡的功能将输入的波形声音进行模数转换 处理将处理后的进行数模转换 输出可外接MIDI乐器等等 Analog Digital模拟 数字 A D转换 声波转换为电信号 语音输入系统 需要语音识别软件 2 声音信号的数字化过程 方法 采样 sampling 时间离散化量化 quantization 幅值离散化编码 encoding 硬件实现 声卡中的A D转换器 采样 4 每秒钟采集声音样本的次数是多少 4 0 1 2 3 每个声音样本的用多少位来表示 4 4 声音数字化过程 3 相关概念及定律 采样频率 奈奎斯特采样定律 fs 2f如果采样频率fs 2倍的采样信号最高频率 就可以根据所采样本还原出原来的声音 实现无损数字化 Losslessdigitization 采样频率的大小决定带宽例如 人类能接受的听觉带宽 20Hz 20KHz按照奈奎斯特采样定理 要产生听得见的频率范围需要大于40KHz的采样率 音乐 菲利浦和索尼公司在设计光盘 时 选择了44 1KHz的采样率 声音数字化三要素 声音的采样和量化 声音信息的计量 声音文件的字节数 采样频率 量化位数 声道数 时间 s 8例 一个声音文件中的声音取样频率为44 1kHz 量化位数8位 声道数2 声音播放时间为10分钟 不采用压缩技术 请估计该文件约有多大 注意 单位必须一致 44 1 103 8 2 10 60 8 5 2 2声音文件的格式 常见格式及相应的文件扩展名 WAV文件 即波形文件 是微软专门为Windows设计的波形文件存储格式 文件扩展名 WAV获取过程 采样 量化 编码缺点是 文件太大适用于所有声音 MIDI文件 MIDI MusicalInstrumentDigitalInterface 乐器和计算机等电子设备之间交换信息与控制信号的一种标准协议文件扩展名 MID RMI文件内容 是指令集 指示MIDI设备发出规定的演奏音符 决定演奏多长时间 音量的变化和生成音响效果等优点是 文件小 容易编辑 可以作背景音乐仅适用于音乐 MIDI音乐不可用来表示人的声音 主要用来表示背景音乐 双击扩展名为 mid的文件 Windows自动打开媒体播放器进行播放 声音的效果取决于声卡的性能 简单的方法 安装软波表如 YAMAHASYXG 100 安装后 需重新启动 播放会令你有意外的惊喜 与CD Mp3的不同 在不同的设备或电脑中 效果可能悬殊 钢琴音乐可能变成小提琴 全频带数字音频编码的标准 MP3文件 MPEGAudioLayer3 所谓 MP3音乐 就是一种采用MPEG 1层3编码的高质量数字声音 压缩比可达到1 10 1 12文件扩展名 mp3一首30M的WAV格式的歌曲 转换成该格式 文件大小仅3M左右 其它格式文件 RMI是Microsoft公司的MIDI文件格式VOC是Creative公司的MIDI文件格式AIF是Apple公司的专用音频文件格式SND是Next计算机的波形音频文件格式 6 WMA WindowsMediaAudio 文件 WMA格式是由微软公司开发的流式声音文件 以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的文件扩展名 wmaWMA的压缩率一般都可以达到1 18左右WMA的优点 提供商可以加入防拷贝保护支持音频流 Stream 技术 适合在网络上在线播放只要安装了Windows操作系统就可以直接播放WMA音乐相比较而言MIDI格式的文件最小 WMA格式的文件比较小 MP3格式的文件最大 但是音质也是最好的 7 RealAudio文件 RealAudio主要适用于在网络上的在线音乐欣赏文件格式 RA RealAudio RM RealMedia RealAudioG2 RMX RealAudioSecured 等优点 可以随网络带宽的不同而改变声音的质量 在保证大多数人听到流畅声音的前提下 令带宽较富裕的听众获得较好的音质 8 VOC文件 Voice文件是新加坡著名的多媒体公司CreativeLabs开发的声音文件格式多用于保存CreativeSoundBlaster系列声卡所采集的声音数据与WAV文件的结构相似 可以通过一些工具软件方便的互相转换 5 2 3音频处理与编辑软件 录音机 可录制和编辑WAV文件CD播放机 播放CD媒体播放机 MediaPlayer 可用于播放当前最流行格式的音频 视频和混合型多媒体文件 媒体播放机 MediaPlayer 千千静听豪杰超级音频解霸3000RealPlayerWinampPowerDVDTotalRecorder等 常见播放软件 5 2 4什么是计算机合成声音 计算机合成声音就是计算机模仿人说话或演奏音乐计算机合成声音有两类 计算机合成语音 计算机模仿人把一段文字朗读出来 即把文字转换为语音 简称为TTS 应用 有声查询 文稿校对 语言学习 语音秘书 自动报警 残疾人服务等计算机合成音乐 计算机模拟各种乐器发声并按照乐谱演奏音乐应用 计算机作曲 配器等 例 计算机合成的语音 Hello everybody 1 你好 我是贝尔实验室的中文语音合成系统

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论