第二章 数据编码_第1页
第二章 数据编码_第2页
第二章 数据编码_第3页
第二章 数据编码_第4页
第二章 数据编码_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 数据编码 主要内容: 数据编码标准 语音编码与IP电话通信 数据编码数据编码标准 国际5号码 国际2号码 EBCDIC 汉字编码国际5号码 国际5号码是由美国标准化协会于1963年提出的ASCII码,被国际标准化组织ISO和原国际电报电话咨询委员会CCITT采纳后发展起来的,现已成为国际通用的信息交换标准代码。 国际5号码是7单位码,能够表示128个符号。其中有34个编码是通信、格式等控制字符,其余94个编码分别为09十个阿拉数字、26个英文字母的大小写以及运算符号和标点符号等。国际2号码 国际2号码是5单位码,是由博多发明的,因此又称为博多码。博多码中因为定义了转义字符“数字/字母”

2、,因此博多码最多能表示64个字符,但国际2号码只使用了其中的58个。 国际2号码主要应用于电报通信中,我国电报通信采用5中取3恒比码。 EBCDIC 扩展二十进制交换码(Extended Binary Coded Decimal Interchange Code)。 EBCDIC码是由IBM公司开发的一种数据编码方案,主要用于IBM大型机及外围设备中。 EBCDIC码是8位码,最多可以表示256个字符,但实际中只定义了143种,剩余113个可以自主定义。汉字编码 汉字编码的步骤: 先转换成字符编码,即“外码”,亦称汉字输入码,用于终端与人之间的交互; 然后由计算机将“外码”转换成二进制,称为“

3、内码”,“内码”是计算机内部用来存储、处理的码。 不同的输入方法,形成不同的汉字外码。 汉字外码的形式 流水码:按汉字的排列顺序形成的编码,如区位码,该码是4位十进制码。 音码:按汉字的读音形成的编码,如全拼,双拼,简拼等。 形码:按汉字的字形形成的编码,如五笔,郑码等。 音形码:按汉字的音形结合形成的编码。如自然码 信源编码在移动通信中被称为语音编码。 语音编码是指模拟话音信号进行模数转换的过程。 主要有以下三种方式: 波形编码 参量编码 混合编码语音编码与IP电话原理 波形编码的基本原理:将话音抽样、量化、编码。 参量编码的基本原理:以LPC(线性预测编码声码器)为例,在发端将语音的特征参

4、数分析出来,然后将其编成二进制码传送。 混合编码的基本原理:同时使用两种或两种以上的编码方法进行编码的过程。 IP电话原理:通过语音压缩算法对语音信号进行压缩编码处理。然后将数据按TCP/IP标准进行打包,经过网络把数据包发送到接受地。数据压缩编码 哈弗曼编码 LZW编码 LZ编码哈弗曼编码 基本思想:根据已经统计出的符号概率进行编码,为概率大的字符编长度短的码,为概率小的字符 编码步骤: 1、为每个符号指定一个只包含一个节点的二叉树,把该字符的概率指派给对应的树,称之为权值; 2、寻找权值最小的两棵树,将其作为子树合并成一棵树,新树的权值是两树权值之和 3、重复第2步直到只剩一棵树; 4、给

5、树的所有左分支指派一个0(或1),右分支指派一个1(或0); 5、从根出发到达每个叶节点,连接沿途所有的指派值。哈弗曼编码例如:有一信源包含5个符号:请对以上信源进行哈夫曼编码,并写出每个符号所对应的码字。 0.250.150.100.200.30ABCDE例:有一如下信源:请对以上信源进行哈夫曼编码,并写出每个符号所对应的码字。 12345670.19 0.10 0.01 0.18 0.20 0.17 0.15aaaaaaa实验:哈夫曼编码程序设计实验内容:1、一维哈夫曼编码:输入一个数组进行编码; 2、二维哈夫曼编码:输入一张图片进行编码。LZ编码和LZW编码 1977年,由两位以色列教授

6、Lenpel和Zip提出,查找冗余字符和用较短的符号标记替代冗余字符的概念,该方法即为LZ编码,有LZ77,LZ78 1985年,有Welch加以改进形成LZW编码。 现用的算法:LZ77,LZ78 ,LZW,均为无损压缩。 LZ77,LZ78 ,LZW一起垄断着数据压缩领域,广泛应用于计算机文件。主要应用于图像压缩,对简单图像和平滑且噪声小的信号源有较高的压缩比(除用于图像处理以外,还用于文本程序等数据压缩领域)。对可预测性不大的数据有较好的效果,如GIF动画效果格式的图像压缩,平均压缩比在2:1以上,最高可达3:1 Windows系统下的压缩工具以LZ编码为核心的有:Winzip,Winr

7、ar等; MS-DOS系统下的压缩工具以LZ编码为核心的有:ARC; Unix系统下的压缩工具以LZW编码为核心的有:compress 和 uncompress(几乎成unix上的压缩标准) LZ编码编码思想:“字典模型”编码思路:1、将已编过的信息作为字典; 2、从编码的第一个字符开始在字典中查找对应的字符串,看是否曾经出现过来找出应对措施。编码字典:可跟随压缩进程滑动,大小固定的字符串窗口。编码模型:编码步骤: 1、从当前编码位置开始考察待编码数据,并在滑动窗口中找到尽可能长的匹配字符串,如果找到,进入第2步,否则,进入第3步; 2、输出(off,len,c),滑动窗口向后滑动len+1个

8、字符,进入第1步; 3、输出(0,0,c),滑动窗口向后滑动len+1个字符,进入第1步。例1:若窗口的大小为10个字符,已经编过的字符是abcdbbccaa,即将编码的字符为:abaeaaabaee,写出未编码字符的编码过程。例2:上题窗口不变,即将编码的符号变为:cdbbaacdbb,学生自己做!LZW编码 LZW编码中字符字典不断增大,放入串表中的每个字符串都用一个数字代码指明其位置。 LZW编码中字符串字典的组成。LZW编码步骤: 1、若新字符串在串表中,则不输出,直接取下一字符; 2、若新字符串不再串表中,则输出新串前缀所对应的代码,并将新串加入串表中,再取下一字符。 新字符串=前缀+当前输入字符前缀的取法: 1、若当前输入字符为第一个输入字符时,前缀为NULL; 2、若串表中刚刚形成的新字符串所对应的输出为“无输出”,则该新串整体作为下一新串的前缀; 3、若非1、2,则上一新串的最后一个字符是下一新串的前缀。例1:写出输入字符串ababc的LZW的编码过程。例2:写出输入字符串abcdeedabcd的LZW的编码过程。实验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论