现代通信技术基础蒋青主编第章讲课文档_第1页
现代通信技术基础蒋青主编第章讲课文档_第2页
现代通信技术基础蒋青主编第章讲课文档_第3页
现代通信技术基础蒋青主编第章讲课文档_第4页
现代通信技术基础蒋青主编第章讲课文档_第5页
已阅读5页,还剩175页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

现代通信技术基础蒋青主编第章第一页,共180页。通信网中传输,因此必须对信源输出的信息进行处理后才能在信道中有效传输。第1章1.2节已经指出,在数字通信系统中,信源编码有两个重要作用:其一,当信息源为模拟信源时,信源编码器将模拟信源输出的模拟信号转换成数字信号,以实现模拟信号的数字化传输;第二页,共180页。其二,当信息源为数字信源(离散信源)时,信源编码器设法寻找适当的方法把信源输出符号序列变换为最短的码字序列,以消除信源符号之间存在分布不均匀和相关性,减少冗余、提高编码效率,从而提高数字信号传输的有效性。第三页,共180页。差错控制是在信息序列上附加上一些监督码元,利用这些冗余的码元,使原来不规律的或规律性不强的原始数字信号变为有规律的数字信号,从而提高数字信号传输的可靠性。第四页,共180页。本章讨论的通信传输技术主要包括信源编码、差错控制(即信道编码)、调制解调技术以及数字信号的基带传输。对于信源编码,首先分析模拟信号的数字化原理,然后讨论对离散信源进行无失真信源编码的相关概念。第五页,共180页。2.2模拟信号的数字化利用数字通信系统传输模拟信号,首先需要在发送端把模拟信号数字化,即进行模/数变换;再用数字通信的方式进行传输;最后在接收端把数字信号还原为模拟信号,即进行数/模变换。第六页,共180页。模/数变换的方法采用得最早而且目前应用得比较广泛的是脉冲编码调制(PCM)。它对模拟信号的处理过程包括抽样、量化和编码3个步骤,由此构成的数字通信系统称为PCM通信系统,如图2-1所示。第七页,共180页。图2-1模拟信号的数字传输第八页,共180页。由图2-1可见,PCM主要包括抽样、量化和编码三个过程。抽样是把时间连续的模拟信号转换成时间离散但幅度仍然连续的抽样信号;量化是把时间离散、幅度连续的抽样信号转换成时间和幅度均离散的信号;编码是将量化后的信号编码形成一个二进制码组输出。第九页,共180页。在具体实现上,编码与量化通常是同时完成的,换句话说,量化实际是在编码过程中实现的。国际标准化的PCM码组(电话语音)是八位码组代表一个抽样值。通过PCM编码后得到的数字基带信号可以直接在系统中传输(即基带传输);也可以将基带信号的频带搬移到适合光纤、无线信道等传输频带上再进行传输(即频带传输)。

第十页,共180页。接收端的数/模变换包含了译码和低通滤波器两部分。译码是编码的反过程,它将接收到的PCM信号还原为抽样信号(实际为量化值,它与发送端的抽样值存在一定的误差,即量化误差)。低通滤波器的作用是恢复或重建原始的模拟信号。它可以看作是抽样的反变换。第十一页,共180页。语音信号的数字化叫做语音编码,图像信号的数字化叫做图像编码,两者虽然各有特点,但基本原理是一致的。下面以语音信号的PCM编码为例,分析模拟信号的数字化过程,PCM编码方法同样适用于图像编码。第十二页,共180页。2.2.1抽样定理所谓抽样就是每隔一定的时间间隔Ts(又称抽样间隔),抽取模拟信号的一个瞬时幅度值(样值)。即抽样是把时间上连续的模拟信号变成一系列时间上离散的抽样序列的过程。那么,抽样间隔Ts应该取多大,才能使上述时间上离散的样值序列包含原模拟信号的全部信息?

第十三页,共180页。并且,经过量化、编码、传输和译码后,接收端能否还原成原来时间上连续的模拟信号?这些就是抽样定理要解决的问题。第十四页,共180页。抽样定理指出:一个频带限制在(0,)内的时间连续的模拟信号,如果抽样频率(即抽样间隔),则可以通过低通滤波器由样值序列无失真地重建原始信号。第十五页,共180页。抽样与恢复的过程如图2-2所示。抽样器可以看作是相乘器,抽样过程相当于模拟信号与抽样脉冲序列(载波)相乘的过程,在收端,已抽样信号通过低通滤波还原成原来的模拟信号。第十六页,共180页。图2-2抽样与恢复抽样定理引入了单位冲激函数(抽样脉冲序列),下面先介绍单位冲激函数的概念,然后简单证明抽样定理。第十七页,共180页。1、单位冲激函数冲激函数不同于普通函数,称为奇异函数。普通函数描述的是自变量与因变量间的数值对应关系(如质量、电贺的空间分布,电流、电压随时间变化的关系等)。第十八页,共180页。如果要考察某些物理量在空间或时间坐标上集中于一点的物理现象(如质量集中于一点的密度的分布,作用时间趋于零的冲击力,宽度趋于零的电脉冲,以及图2-2所示的对信号某点的取样等),普通函数的概念就不够用了,而冲激函数就是描述这类现象的数学模型。可见,在通信系统的分析研究中,冲激函数具有极重要的作用。第十九页,共180页。单位冲激函数的定义为(2.2-1)

并且有(2.2-2)

第二十页,共180页。因此,单位单位冲激信号是这样一个信号:它在瞬间的值为无限大,在其他瞬间的值均为零,而且它所覆盖的面积(通常称为冲激强度)等于1,如图2-3所示。图2-3单位冲激信号第二十一页,共180页。由式(2.2-1)推广可得并且有

第二十二页,共180页。单位冲激函数具有许多重要的性质。例如,当与另一信号相乘时,由于它在除以外的其他瞬间都等于零。因此有(2.2-3)并且有(2.2-4)

第二十三页,共180页。式(2.2-4)表明:信号与单位冲激函数的乘积任仍然是一个冲激函数,但是其强度等于该信号在单位冲激函数所在瞬间的值。上述性质就是所谓抽样性。第二十四页,共180页。2、抽样定理的证明设为低通模拟信号,抽样脉冲序列是一个周期性冲激函数,则抽样信号为(2.2-5)

式中(2.2-6)

第二十五页,共180页。的频谱为上式中,是抽样脉冲序列的基波角频率,为抽样间隔。(2.2-7)

第二十六页,共180页。对(2.2-5)式求傅里叶变换可以得到抽样信号的频谱表达式其中,为低通信号的频谱。式(2.2-8)表明,抽样后信号的频谱是无穷多个间隔为的相叠加而成。这就意味着中包含的全部信息。(2.2-8)

第二十七页,共180页。由图2-4可以得到如下结论:(1)抽样后信号的频谱具有无穷大的带宽;(2)只要抽样频率,频谱无混叠现象。在收端,经截止频率为的理想低通滤波器后,可无失真地恢复原始信号;(3)如果抽样频率,则会出现频谱混叠现象,如图2-5所示,则收端不可能无失真地恢复原始信号。第二十八页,共180页。图2-5抽样频率时产生的混叠现象

第二十九页,共180页。对于频谱限制于的模拟信号来说,就是无失真重建原始信号所需的最小抽样频率,即,此时的抽样频率通常称为奈奎斯特抽样速率。那么最大抽样间隔即为,此抽样间隔通常称为奈奎斯特抽样间隔。但是如果采用奈奎斯特速率抽样,则抽样信号频谱中的各相邻边带之间没有防卫带。

第三十页,共180页。这时要将从中分离出来就需要一个滤波特性十分陡峭的理想低通滤波器,而理想低通滤波器是不能物理实现的,故一般都应该有一定的防卫带。例如语音信号频率一般为300~3400Hz,CCITT规定单路语音信号的抽样速率为8000Hz。此时的防卫带为。第三十一页,共180页。越高对防止频谱混叠越有利,但后面将会看到的提高使码元速率提高,这是我们不希望的,因此抽样频率一般选择为。例2.2-1]已知一基带信号,对其进行理想抽样。为了在接收端能不失真的从已抽样信号中恢复,试问抽样间隔应如何选择?第三十二页,共180页。解:基带信号的最低频率,最高频率,对其进行理想抽样,由抽样定理知,抽样频率应满足,抽样间隔第三十三页,共180页。2.2.2量化模拟信号经过抽样后,在时间上是离散了,但其幅度取值仍然是连续的,所以它还是模拟信号。要把它变成数字信号,必须对抽样信号进行幅度的离散化处理。所谓量化,就是将抽样后幅值为连续的信号变换为幅值为有限个离散值的过程。量化分为均匀量化和非均匀量化。第三十四页,共180页。1、均匀量化把输入信号的取值域按等距离分割的量化称为均匀量化。如将取值域均匀等分为个量化区间,则称为量化级数或量化电平数。在均匀量化中,每个量化区间的量化电平通常取在各区间的中点,量化间隔(或量化阶距)取决于输入信号的变化范围和量化电平数。当信号的变化范围和量化电平数确定后,量化间隔也被确定。第三十五页,共180页。设输入信号的最小值和最大值分别用a和b表示,量化电平数为M,则均匀量化时的量化间隔为

(2.2-9)第三十六页,共180页。图2-6中,模拟信号按抽样速率进行均匀抽样,在各个抽样时刻上的抽样值用“·”表示,第k个抽样值用表示,抽样值在量化时转换为M个规定电平之一。量化值用符号“”表示,即

量化器的输出是一个数字序列信号。(2.2-10)第三十七页,共180页。式中,表示第个量化级的起始电平,;表示第量化区间的量化电平,可表示为

从上面的结果可以看出,量化后的信号是对原来抽样值的近似。当抽样速率一定时,量化级数目(量化电平数)增加并且量化电平选择适当时,可以使与的近似程度提高。(2.2-11)第三十八页,共180页。我们将量化值(离散值)与抽样值(连续值)之间的误差称为量化误差,用表示。量化误差=|量化值-抽样值|=其中,表示抽样间隔。(2.2-12)第三十九页,共180页。量化误差一旦形成,在接收端是无法去掉的,这个量化误差像噪声一样影响通信质量,因此量化误差也称为量化噪声。由量化误差产生的功率称为量化噪声功率,通常用表示。均匀量化最大的量化误差是半个量化级。第四十页,共180页。在衡量量化器性能时,单看绝对误差的大小是不够的,因为信号有大有小,同样大的量化噪声对大信号的影响可能不算什么,但对小信号却可能造成严重的后果,因此在衡量量化器性能时应看信号功率S与量化噪声功率的相对大小,用量化信噪比表示。第四十一页,共180页。均匀量化的特点是,在量化区内,无论信号大小如何,量化间隔都相等,最大量化误差也就相同。因此,均匀量化有一个明显的不足:小信号的量化信噪比太小,不能满足通信质量要求,而大信号的量化信噪比较大,远远地满足要求。在电话通信中,小信号所占比重较大,显然,均匀量化对提高信噪比不利。为了克服这一缺点,实际上大多采用非均匀量化。第四十二页,共180页。2、非均匀量化。非均匀量化根据信号的不同区间来确定量化间隔,即量化间隔与信号的大小有关。当信号幅度小时,量化间隔小,其量化误差也小;当信号幅度大时,量化间隔大,其量化误差也大。因此,量化噪声对大、小信号的影响大致相同,即改善了小信号时的量化信噪比。第四十三页,共180页。在实际应用中,非均匀量化的实现方法通常是采用压缩扩张技术,其特点是在发送端将抽样值进行压缩处理后再均匀量化,在接收端进行相应的扩张处理,第四十四页,共180页。所谓压缩实际上是对大信号进行压缩,而对小信号进行放大的过程。信号经过这种非线性压缩电路处理后,改变了大信号和小信号之间的比例关系,使大信号的比例基本不变或变得较小,而小信号相应地按比例增大,即“压大补小”。在接收端将收到的相应信号进行扩张,以恢复原始信号对应关系。第四十五页,共180页。下面的问题是寻找一种什么样的函数关系来满足上述的压缩特性?一般来说,压缩特性的选取与信号的统计特性有关。理论上,具有不同概率分布的信号都有一个相对应的最佳压缩特性,使量化噪声达到最小。但在实际应用时还应考虑压缩特性易于电路实现以及压缩特性的稳定性等问题。第四十六页,共180页。目前在数字通信系统中被采用的有压缩律和A压缩律两种对数压缩特性,它们接近于最佳特性并且易于进行二进制编码。美国和日本采用压缩律,我国和欧洲各国采用A压缩律。下面分别介绍压缩律和A压缩律的原理。这里只讨论的范围,的关系曲线和的关系曲线是以原点奇对称的。第四十七页,共180页。(1)、压缩律所谓压缩律就是压缩器的压缩特性具有如下关系的压缩律

式中,X和Y分别表示归一化的压缩器输入和输出电压。即

(2.2-13)第四十八页,共180页。为压缩参数,表示压缩程度。越大,压缩效果约明显。

第四十九页,共180页。对应于均匀量化。一般取左右,也有取的。在小输入电平时,当时,的特性近似于线性,而在高输入电平,即时,的特性近似为对数关系。第五十页,共180页。(2)、A压缩律所谓A压缩律就是压缩器的压缩特性具有如下关系

(2.2-14)第五十一页,共180页。式中,x为归一化的压缩器输入,y为归一化压缩器输出。A为压扩参数,表示压缩程度。当A=1时,压缩特性是一条通过原点的直线,没有压缩效果;A值越大压缩效果越明显。在国际标准中取A=87.6。第五十二页,共180页。(3)、数字压扩技术由式(2.2-13)得到的律压扩特性和按式(2.2-14)得到的A律压扩特性都是连续曲线,和A的取值不同其压扩特性亦不同,而在电路上实现这样的函数规律是相当复杂的。为此,人们提出了数字压扩技术,所谓数字压扩是利用数字电路形成许多折线来近似非线性压缩曲线(A律或律)从而达到压扩目的。第五十三页,共180页。目前,有两种常用的数字压扩技术,一种是13折线A律压扩,它的特性近似A=87.6的A律压扩特性;另一种是15折线律压扩,其特性近似的律压扩特性。A律13折线主要用于中国和欧洲各国,律15折线主要用于美国、加拿大和日本等国。ITU-T建议G.711规定上述两种折线近似压缩律为国际标准,且在国际间数字系统相互连接时,要以A律为标准。第五十四页,共180页。下面主要介绍13折线A律压扩技术,简称13折线法。关于15折线律压扩请读者阅读有关文献。国际通用的13折线压缩特性如图2-9所示。图中的x和y分别表示归一化输入和输出。构成折线的方法是:(1)、对x轴在0~1(归一化)范围内不均匀分成8段,分段的规律是每次以1/2对分,第一次在0到1之间的1/2第五十五页,共180页。处对分,第二次在0到1/2之间的1/4处对分,第三次在0到1/4之间的1/8处对分,其余类推。可以得到分段点为。(2)、对y轴在0-1(归一化)范围内采用均匀分段方式,均匀分成8段,每段间隔均为1/8。(3)、将x,y各个对应段的交点连接起来,构成8个折线段。第五十六页,共180页。以上得到的是第一象限的折线,由于语音信号是双极性信号,因此在负方向也有与正方向对称的一组折线。由于靠近零点的负方向与正方向的第1、2段斜率都等于16,可以合并为一条折线,因此,正、负双向共有13折,故称其为13折线。在原点上,折线的斜率等于16,而由式(2.2-15)知A律曲线在原点的斜率等于令两者相等,可得A=87.6。

第五十七页,共180页。因此,可以用13折线来逼近A=87.6的压扩特性。表2.2-1为13折线分段时的x值和A律压扩特性(A=87.6)的x值的比较表。表2.2-113折线分段时的x值和A律压扩特性(A=87.6)的值的比较表第五十八页,共180页。表中第二行的x值是根据A=87.6时计算得到的,第三行的x值是13折线分段时的值。可见,13折线各段落的分界点与A=87.6压扩特性的曲线十分逼近。第五十九页,共180页。2.2.3脉冲编码调制量化后的信号,已经是取值离散的数字信号。下一步的问题是如何将这个数字信号编码。最常用的编码是用二进制符号表示此离散数值,例如“1”和“0”。通常把从模拟信号抽样、量化,直到变换成为二进制符号的基本过程,称为脉冲编码调制PCM(PulseCodeModulation),简称脉码调制。第六十页,共180页。图2-10和表2.2-2给出了脉冲编码调制的一个实例。假设模拟信号的最大值小于4V,以的速率进行抽样,且抽样按16个量化电平进行均匀量化,其量化间隔为0.5V。因此各个量化判决电平依次为-4,-3.5,…,3.5,4V,16个量化电平分别为-3.75,-3.25,…,3.25和3.75V。

第六十一页,共180页。表3.2-2列出了图2-9所示模拟信号的抽样值和相应的量化电平以及二进制、四进制编码。由表2.2-2还可以看出,如果按照二进制脉冲编码电平由小到大的自然编码调制,发送的比特序列为110011101110…,比特速率为4。第六十二页,共180页。表2.2-2模拟信号的量化和编码可以看出,脉冲编码调制能将模拟信号变换成数字信号,它是实现模拟信号数字传输的重要方法之一。在讨论编码原理以前,需要明确常用的编码码型及码位数的选择和安排。第六十三页,共180页。1、常用的二进制码型常用的二进制码型有自然二进制码和折叠二进制码两种。我们以4位二进制码为例,将这两种编码列于表2.2-3中,在表中16个量化值分成两部分。第0至第7个量化值对应于负极性电平;第8至第15个量化值对应于正极性电平。显然可见,对于自然二进制码,这两部分之间没有什么联系。

第六十四页,共180页。但是,对于折叠二进制码则不然,除了其最高位符号相反外,其上下两部分还呈现映像关系,或称折叠关系。这种码在应用时可以用最高位表示电平的极性正负,而用其它位来表示电平的绝对值。也就是说,在用最高位表示极性后,双极性信号可以采用单极性编码的方法处理,从而使编码电路和编码过程大大简化。第六十五页,共180页。折叠二进码的另一个优点是误码对小信号影响较小。比如一个小信号码组1000,在传输或处理过程中发生1个符号错误,变成0000。从表2.2-3中可见,若它为自然二进码,则误差是8个量化级,若它为折叠二进码,则误差只有1个量化级。第六十六页,共180页。但是,若一个大信号码组1111,在传输的过程中误为0111,若其为自然码,其误差仍为8个量化级;但若为折叠码,则误差增大为15量化级。这表明,折叠码对于小信号有利。由于语音信号小幅度出现的概率大,所以折叠码有利于减小语音信号的平均量化噪声。基于以上的原因,在PCM系统中广泛采用折叠二进码。第六十七页,共180页。无论是自然码还是折叠码,码组中符号的位数都直接和量化值的数目有关。量化间隔越多,量化值也越多,则码组中符号的位数也随之增多。同时,信号量噪比也越大。当然,位数增多后,会使信号的输出量和存储量增大,编码器也将较复杂。在语音通信中,通常采用8位的PCM编码就能够保证满意的通信质量。第六十八页,共180页。下面结合我国采用的A律13折线编码,介绍一种码位排列方法。2、13折线的码位安排在A律13折线编码中,普遍采用8位折叠二进码,对应有个量化级,即正、负输入幅度范围内各有128个量化级。考虑到正、负双向共有16个段落,这需要将每个段落再等分为16个量化级。按折叠二进码的码型,这8位码的安排如下:第六十九页,共180页。极性码段落码段内码C1C2C3C4C5C6C7C8

(1)C1称为极性码,表示信号样值的正负极性。正极性时为“1”,负极性时为“0”。(2)C2C3C4称为段落码,由于A律13折线有8大段,各个折线段的长度均不相同。为了表示信号样值属于哪一段,第七十页,共180页。要用三位码表示。且由于每一段的起点电平各不相同,如第1段为0,第2段为16等,因此用这三位段落码既表示不同的段,也表示不同的起点电平。(3)C5C6C7C8称为段内码,用来代表段内等分的16个量化级。由于各段长度不同,把它等分为16小段后,每一小段的量化值也不同。。第1段和第2段为;等分16单位后,每一量化单第七十一页,共180页。为;而第8段为1/2,每一量化单位为,如果以第1、2段中的每一小段1/2048作为一个最小的均匀量化级,则在第1~8段落内的每一小段段内均匀量化级依次应为。第七十二页,共180页。在上述编码方法中,虽然段内码是按量化间隔均匀编码的,但是因为各个段落的斜率不等,长度不等,故不同段落的量化间隔是不同的。其中第1段和第2段最短,斜率最大,其横坐标x的归一化动态范围只有1/128;再将其等分为16小段后,每一小段的动态范围为1/2048,这是最小量化间隔。第8段最长,其横坐标的归一化动态范围只有1/2;将其等分为16小段后,每段长度为1/32。第七十三页,共180页。若采用均匀量化而仍希望对小信号保持有同样的动态范围1/2048,则需要用11位码组才行。现在采用非均匀量化,只需要7位就够了。目前在电话网中广泛采用这类非均匀量化的PCM语音编码方案。随着数字信号处理技术和微电子技术的发展,PCM技术已经历了多代发展,并由集成PCM编解码芯片实现。第七十四页,共180页。在2.2.1节中提到过,典型电话信号的抽样频率是8000Hz。故在采用这类非均匀量化编码器时,典型的数字电话传输比特率为64kbit/s。这个速率已经被国际电信联盟(ITU)制订的建议所采用。第七十五页,共180页。2.3离散信源编码

2.2节讨论了模拟信源的PCM编码技术,本节讨论离散信源的编码技术。从编码结果使信源符号的信息量有无损失这一角度来看,信源编码分为无失真信源编码和限失真信源编码。本节仅讨论离散信源的无失真编码。第七十六页,共180页。2.3.1信源编码的相关概念信源编码的实质是对原始信源符号按照一定规则进行变换,以码字代替原始信源符号,使变换后得到的新信源符号(码元)接近等概分布,从而提高信息传输的有效性。需要指明的是,在研究信源编码时,通常将信道编码和译码看作是信道的一部分,而且不考虑信道干扰问题,所以信源编码的数学模型比较简单。第七十七页,共180页。信源编码就是利用编码器将信源符号变换成由码字组成的一一对应的输出符号序列的过程,如图2-11所示。其中输入信源符号为,同时存在另一码符号集合(或信道基本符号集合),其中称为适合信道传输的码符号(或者码元),输出符号序列称为码字,长度称为码字长度或简称码长,是个

第七十八页,共180页。由组成的序列,并与一一对应,所有码字的集合C称为码。第七十九页,共180页。信源编码器的主要任务是完成输入消息集合与输出代码集合之间的映射。若要实现无失真编码,这种映射必须是一一对应的,可逆的。为此,必须进行如下工作:1)选择合适的码符号集合X,以使映射后的代码C能适应信道。2)寻求一种方法,把信源发出的消息符号变成相应的代码组。这种方法就是编码,变换成的代码就是码字。第八十页,共180页。3)编码应使消息集合与代码集合中的元素一一对应。上述三点也是信源编码的基本要求。下面,我们给出一些码的定义。1、定长码和变长码。若一组码中所有码字的码长都相同,称为定长码。若一组码中所有码字的码长各不相同,即任意码字由不同长度的码符号序列组成,则称为变长码。第八十一页,共180页。2、非奇异码和奇异码。若一组码中所有码字都不相同,即所有信源符号映射到不同的码符号序列,则称为非奇异码;反之,为奇异码。3、惟一可译码。若码的任意一串有限长的码符号序列只能被惟一地译成所对应的信源符号序列,则此码为惟一可译码。否则,称为非惟一可译码。

第八十二页,共180页。例如{0,10,11}是一种惟一可译码。因为任意一串有限长码序列,如100111000,只能被分割成10,0,11,10,0,0。任何其他分割法都会产生一些非定义的码字。显然,奇异码一定不是惟一可译码,而非奇异码可能是非惟一可译码或惟一可译码。第八十三页,共180页。[例2.3-1],设信源S有四种不同的符号,它们的先验概率为。现用码符号集对信源的四种不同符号进行信源编码,得到表2.3-1所示的五种码。我们来分析一下这五种码的情况。第八十四页,共180页。第八十五页,共180页。1)码1:信源符号S2和S4的码字都是“11”,不符号一一对应的条件,码1为奇异变长码。不是惟一可译码,当然也不是无失真信源编码。2)码2:四种不同的码字(0,11,00,01)各自对应信源S的四种不同的信源符号。这种码为非奇异变长码。但它不是惟一可译码。因为对于码2,其有限长的码符号序列能译成不同的信源符号序列。例如我们收到一个码第八十六页,共180页。字序列(01000),我们可以翻译为信源符号序列(S4S3S1),但也可以翻译为信源符号序列(S1S2S3)、(S1S2S1S1)、(S4S1S1S1)等,所以码2不是惟一可译码。3)码3。它的显著特点是每个不同码字中所含码符号的个数(码长)都相同,都等于2,这种码称为定长码。又由于码3中各码字都不相同,所以它又是非奇异码。第八十七页,共180页。对于非奇异定长码,其有限长的码符号序列只能被惟一地译成信源符号序列,因此,它是惟一可译码。4)码4和码5。显然,它们都是非奇异变长码,而且每一种不同的码字序列唯一地对应一种信源符号序列,它们都是惟一可译码。第八十八页,共180页。综上所述,若要实现无失真的编码,则不但要求信源符号与码字是一一对应的,而且要求码符号序列的反变换也是惟一的。也就是说,所编的码必须是惟一可译码。否则,所编的码不具有惟一可译性,就会使译码带来错误与失真。第八十九页,共180页。2.3.2即时码及其构成1、即时码无须考虑后续的码符号即可从码符号序列中译出码字,这样的惟一可译码叫即时码。换句话说,若码C中,没有任何完整的码字是其他码字的前缀,则此码为即时码。即时码一定是惟一可译码,反之,惟一可译码不一定是即时码。第九十页,共180页。如果接收端收到一个完整的码字后,不能立即译码,还需要等下一个码字接收后才能判断是否可以译码,这样的码叫非即时码。即时码是惟一可译码的一类子码,所以即时码一定是惟一可译码,反之惟一可译码不一定是即时码。因为有些非即时码它具有惟一可译性,但不满足前缀条件(如码4)。我们可用图2-12来描述这些码之间的关系。第九十一页,共180页。2、即时码的树图构造法由于即时码一定是惟一可译码,且能即时译码,所以无失真信源编码中经常采用这种码。我们常采用“树图法”构造即时码。对给定码字的全体集合来说,可以用码树来描述它。对r进制树图,有树根、树枝和节点。树图最顶部的节点称为树根A。树枝的尽头称为节点,每个节点生出的树枝树目等于码符号树r。第九十二页,共180页。图2-13分别给出了二进码和三进码树,当某一节点被安排为码字后,它就不再继续伸枝,此节点称为终端节点(用粗黑点表示)。而其他节点称为中间节点,中间节点不安排为码字(用空心圈表示)。给每个节点所伸出的树枝分别从左向右标上码符号0,1,…,r。这样,终端节点所对应的码字就由从根出发到终端节点走过的路径所对应的码符号组成。第九十三页,共180页。另外,从码树上可知,当第i阶的节点作为终端节点,且分配以码字,则码字的码长为i。图2-13码树图第九十四页,共180页。例如即时码用码树表示如图2-14所示。图2-14码树第九十五页,共180页。从即时码的构造过程中,我们得到一个重要启示,信源编码是否具有惟一可译性,与待编码信源的信源符号数q、码符号集的码符号数(进制数)r、码字长度等编码的结构参数密切相关。那么信源符号数、码符号数和码字长度之间满足什么条件才可以构成即时码和惟一可译码?从而引入克劳夫特(Kraft)不等式。第九十六页,共180页。3、克劳夫特不等式设信源S的符号集合;码符号集合,q个码字的长度分别为。则信源存在即时码的充分必要条件是满足

反之,若码长满足上述不等式,则一定存在具有这样码长的即时码。(2.3-1)第九十七页,共180页。式(2.3-1)称为克拉夫特不等式。在1956年,麦克米伦(B.McMillan)证明惟一可译码也满足式(2.3-1)。需要注意的是,上述不等式是即时码和惟一可译码存在的充要条件,但是不能作为判别的依据。它说明,惟一可译码一定满足上述不等式;反之,满足上述不等式的码不一定是惟一可译码,但一定存在至少一种惟一可译码。并且,任何惟一可译码均可用一个即时码来代替,而不必改变任一码字的长度。第九十八页,共180页。2.3.2编码效率衡量一种编码方法的优劣通常有许多指标,但一般来说码字的平均长度最短和易于实现是最被人们重视的。这两条也是信源编码的最主要目的,实质上,前者追求用尽可能少的码符号来表示尽可能多的信源消息符号,即提高编码效率,后者需要综合考虑其实现方法的性能价格比。第九十九页,共180页。信源编码效率可以用信道参量以及信息传输速率来定义,下面先引入码的平均长度,再讨论编码效率。设信源为编码后的码字为;其码长分别为第一百页,共180页。因为对惟一可译码来说,信源符号与码字是一一对应的,所以有

则这个码的平均码长为

的单位是码符号/信源符号。它是每个信源符号平均需用的码元数。(2.3-2)第一百零一页,共180页。编码后平均每个信源符号能载荷的信息量即编码后信道的信息传输速率为

若传输一个码符号平均需要t秒钟,则编码后信道每秒钟传输的信息量为(2.3-3)(比特/码元)(比特/秒)

(2.3-4)

第一百零二页,共180页。由此可见越短、越大,信息传输效率就越高。为了衡量各种编码是否已达到极限情况,我们定义编码效率为

(2.3-5)第一百零三页,共180页。一定是小于或等于1的数。由式(2.3-5)可以清楚地看出,在给定信源的情况下,若码的平均码长越短,信道的信息传输速率就越高,也越接近于1,所以可用码的效率来衡量各种编码的优劣。下面举例分析在给定信源的情况下,定长码和变长码的编码效率。第一百零四页,共180页。2.3.3几种常用变长码的编码方法常见的变长码编码方法有香农编码、霍夫曼(Huffman)编码、费诺编码。它们均为匹配编码,也称统计编码,都是通过使用较短的码字来给出现概率较高的信源符号编码,而出现概率较小的信源符号用较长的码字来编码,从而使平均码长最短,达到最佳编码的目的。第一百零五页,共180页。1、香农编码设有离散无记忆信源,

。二进制香农码的编码方法步骤如下:第一百零六页,共180页。(1)将信源发出的q个消息,按出现概率递减顺序进行排列;(2)计算各消息的;(3)确定满足下列不等式的整数码长:(4)为了编成唯一可译码,计算第i个消息的累加概率;(5)将累加概率变换成二进制数;(6)取二进制数的小数点后位作为第i个符号的二进制码字。第一百零七页,共180页。香农编码的编码效率较低,因此其实用性受到较大限制。但有着重要的理论意义。通常称具有最短的代码组平均码长或编码效率接近于1的信源编码为最佳信源编码,也简称为最佳编码。比较著名的最佳编码是霍夫曼(Huffman)编码,它是一种效率比较高的变长无失真信源编码方法,其编码的基本思想就是第一百零八页,共180页。根据给定的消息概率,编成变长码,对于出现概率大的符号用短码,对于出现概率小的符号用长码。这样在大量信源符号编成码后,平均每个信源符号所需要的输出符号数就可以降低,也就是说,输出代码的平均长度自然比较短。从而提高编码效率。第一百零九页,共180页。2、霍夫曼编码1952年霍夫曼(Huffman)提出了一种无失真信源编码的方法,这种编码方法根据给定信源的信源空间和规定的码符号集,合理利用信源的统计特性,构造出惟一可译码,并具有尽可能小的平均码长,使无失真信源编码具有较高编码效率。下面首先介绍二元霍夫曼编码,然后推广到多元霍夫曼编码。第一百一十页,共180页。(1)、二元霍夫曼码首先给出二进制霍夫曼码的编码方法。其编码步骤如下:①将q个信源符号以概率递减的次序排列。②用0和1码符号分别代表概率最小的两个信源符号,并合并成一个符号,从而得到只包含q-1个信源符号的新信源,称为信源的缩减信源。第一百一十一页,共180页。③将缩减信源的符号仍以概率递减的次序排列,再将其最后二个概率最小的符号分别用0和1表示,并合并成一个符号,形成了q-2个符号的缩减信源。④依次继续下去,直到信源最后只剩两个符号为止,将最后这两个符号分别用0和1表示。然后从最后一级缩减信源开始,向前返回,就得出各信源符号所对应的码符号序列,即对应的码字。第一百一十二页,共180页。从以上编码的实例中可以看出,霍夫曼码具有以下三个特点:第一,霍夫曼码的编码方法保证了概率大的符号对应于短码,概率小的符号对应于长码,而且短码得到充分利用。第二,每次缩减信源的最后二个码字总是最后一位码元不同,前面各位码元相同,(二元编码情况),见图2-16和图2-17。第一百一十三页,共180页。第三,每次缩减信源的最长两个码字有相同的码长,见图2-16和图2-17。这三个特点保证了所得的霍夫曼码一定是最佳码。3、费诺编码费诺编码属于统计匹配编码。它不是最佳码,但有时也能得到与霍夫曼编码相同的性能。二元费诺编码的步骤如下:第一百一十四页,共180页。(1)将信源符号按其出现的概率由大到小依次排列;(2)将依次排列的信源符号按概率值分为两大组,使两个组的概率之和近于相同,并对各组分别赋予一个二进制码元“0”和“1”。(3)将每一大组的信源符号进一步再分成两组,使划分后的两个组的概率之和近于相同,并又分别赋予一个二进制码元“0”和“1”。第一百一十五页,共180页。(4)如此重复,直至每组只剩下一个信源符号为止。(5)信源符号所对应的码字即为费诺码。需要指出的是,费诺编码方法同样适合于r元编码,只需每次分成r组即可。第一百一十六页,共180页。2.4差错控制2.4.1差错控制的基本概念数字信号在传输过程中,由于信道不理想、加性噪声以及码间串扰等都会产生误码。为了提高系统的抗干扰性能,可以加大发射功率,降低接收设备本身的噪声,以及合理选择调制、解调方法等。此外,还可以采用差错控制技术。第一百一十七页,共180页。差错即是误码。差错控制的核心是抗干扰编码,简称差错编码。差错控制的目的是提高信号传输的可靠性。差错控制的实质是给信息码元增加冗余度,即增加一定数量的多余码元(称为监督码元或校验码元),由信息码元和监督码元共同组成一个码字,两者间满足一定的约束关系。如果在传输过程中受到干扰,某位码元发生了变化,就破坏了它们之间的约束关系。第一百一十八页,共180页。接收端通过检验约束关系是否成立,完成识别错误或者进一步判定错误位置并纠正错误,从而保证通信的可靠性。1、差错控制方式常用的差错控制方式有3种:检错重发、前向纠错和混合纠错。它们的系统构成如图2-18所示,图中有斜线的方框图表示在该端检出错误。第一百一十九页,共180页。(1)前向纠错方式前向纠错方式记作FEC(ForwardError-Correction)。发送端发送能够纠正错误的码,接收端收到码后自动地纠正传输中的错误。其特点是单向传输,实时性好,但译码设备较复杂。(2)检错重发方式检错重发又称自动请求重传方式,记作ARQ(AutomaticRepeatrequest)。第一百二十页,共180页。由发送端送出能够发现错误的码,由接收端判决传输中有无错误产生,如果发现错误,则通过反向信道把这一判决结果反馈给发送端,然后,发送端将错误的信息再次重发,从而达到正确传输的目的。其特点是需要反馈信道,译码设备简单,对突发错误和信道干扰较严重时有效,但实时性差,主要应用在计算机数据通信中。第一百二十一页,共180页。(3)混合纠错方式混合纠错方式记作HEC(HybridError-Correction)是FEC和ARQ方式的结合。发送端发送具有自动纠错同时又具有检错能力的码。接收端收到码后,检查差错情况,如果错误在码的纠错能力范围以内,则自动纠错;如果超出了码的纠错能力,但能检测出来,则经过反馈信道请求发送端重发。这种方式具有自动纠错和检错重发的优点,误码率较低,因此,近年来得到广泛应用。第一百二十二页,共180页。另外,按照噪声或干扰的变化规律,可把信道分为3类:随机信道、突发信道和混合信道。恒参高斯白噪声信道是典型的随机信道,其中差错的出现是随机的,而且错误之间是统计独立的。具有脉冲干扰的信道是典型的突发信道,错误是成串成群出现的,即在短时间内出现大量错误。短波信道和对流层散射信道是混合信道的典型例子,随机错误和成串错误都占有相当比例。第一百二十三页,共180页。对于不同类型的信道,应采用不同的差错控制方式。图2-18差错控制方式第一百二十四页,共180页。2、纠错码的分类(1)根据纠错码各码组信息码元和监督码元之间的函数关系,纠错码可分为线性码和非线性码。如果函数关系是线性的,即满足一组线性方程式,则称为线性码;否则为非线性码。(2)根据信息码元和监督码元之间的约束方式不同,可分为分组码和卷积码。分组码的各码元仅与本组的信息元第一百二十五页,共180页。有关;卷积码中的码元不仅与本组的信息元有关,而且还与前面若干组的信息元有关。(3)根据码的用途,可分为检错码和纠错码。检错码以检错为目的,不一定能纠错;而纠错码以纠错为目的,一定能检错。第一百二十六页,共180页。(4)根据纠错码组中信息码元是否隐蔽,可分为系统码和非系统码。若信息码元能从码组中截然分离出来(通常k个信息码元与原始数字信号一致,且位于码组的前k位),则称为系统码;否则称为非系统码。第一百二十七页,共180页。2.4.2差错控制的基本原理码的检错和纠错能力是用信息量的冗余度来换取的。一般信息源发出的任何消息都可以用二进制信号“0”和“1”来表示。例如,要传送A和B两个消息,可以用“0”码来代表A,用“1”码来代表B。在这种情况下,若传输中产生错码,即“0”错成“1”,或“1”误为“0”,接收端都无从发现,因此这种编码没有检错和纠错能力。第一百二十八页,共180页。如果分别在“0”和“1”后面附加一个“0”和“1”,变为“00”和“11"(本例中分别表示A和B),这时,在传输“00”和“11”时,如果发生一位错码,则变成“01”或“10”,译码器将可判决为有错,因为没有规定使用“01”或“10”码组。这表明附加一位码(称为监督码)以后码组具有了检出1位错码的能力。但因译码器不能判决哪位是错码,所以不能予以纠正,这表明没有纠正错码的能力。第一百二十九页,共180页。本例中“01”和“10”称为禁用码组,而“00”和“11”称为许用码组。进一步,若在信息码之后附加两位监督码,即用“000”表示A,用“111”表示B,这时,码组成为长度为3的二进制编码,而3位的二进制码有23=8种组合,本例中选择“000”和“111”为许用码组。此时,如果传输中产生一位错误,收端将成为001,010,100或011,101,110,这些均为禁用码组。因此,收端可以判决传输有错。

第一百三十页,共180页。不仅如此,收端还可以根据“大数”法则来纠正一个错误,即3位码组中如有2个和3个“0”码判为“000”码组(消息A),如有2个和3个“1”码判为“111”码(消息B),所以,此时还可以纠正一位错码。如果在传输中产生两位错码,也将变为上述的禁用码组,译码器仍可以判为有错。这说明本例中的码具有可以检出两位和两位以下的错码以及纠正一位错码的能力。

第一百三十一页,共180页。由此可见,纠错编码之所以具有检错和纠错能力,是因为在信息码之外附加了监督码。监督码不载荷信息,它的作用是用来监督信息码在传输中有无差错,对用户来说是多余的,最终也不传送给用户,但它提高了传输的可靠性。但是,监督码的引入降低了信道的传输效率。一般说来,引入监督码越多,码的检错、纠错能力越强,但信道的传输效率下降也越多。第一百三十二页,共180页。1、码重、码距以及检错纠错能力对于二进制码组,码组中非0码元的数目称为该码组的码重,用W表示。如码组110101的码重W=4。两个等长码组之间相应位取值不同的数目称为这两个码组之间的汉明(Hamming)距离,简称码距d。如码组011001和码组100001之间的距离d=3。码组集合中各码组之间距离的最小值

第一百三十三页,共180页。称为码组的最小距离,用表示。它体现了该码组的纠、检错能力。码组间最小距离越大,说明码字间最小差别越大,抗干扰能力越强,因此是极重要的参数,它是衡量码检错、纠错能力的依据。第一百三十四页,共180页。若检错能力用e、纠错能力用t表示,可以证明,检、纠能力与最小码距有如下关系:(1)为了能检测e个错码,要求最小码距。(2)为了能纠正t个错码,要求最小码距。(3)为了能纠正t个错码,同时检测e个错码,要求最小码距。第一百三十五页,共180页。2、编码效率设编码后的码组长度、码组中所含信息码元以及监督码元的个数分别为n,k和r,三者间满足,定义编码效率R为

可见码组长度一定时,所加入的监督码元个数越多,编码效率越低。(2.4-1)第一百三十六页,共180页。2.4.3简单的差错控制编码常用检错码的构造一般都很简单,但因其具有较强的检错能力,且易于实现,所以实际中应用较多。1、奇偶监督码奇偶监督码又称奇偶校验码,它只有一个监督元,是一种最简单的检错码,在计算机数据传输中得到广泛应用。编码时,首先将要传送的信息分组,按每第一百三十七页,共180页。组中“1”码个数计算监督码元的值。编码后,整个码组中“1”个数成为奇数的称奇校验,成为偶数的称偶校验。设码长为n,码组,其中前n-1位是信息位,是监督位,二者之间的监督关系可表示为奇校验满足(2.4-2)

第一百三十八页,共180页。偶校验满足接收端用一个模2加法器就可以完成检错工作。当错码为一个或奇数个时,因打乱了“1”数目的奇偶性,故能发现差错。然而,当错误个数为偶数时,由于未破坏“1”数目的奇偶性,所以不能发现偶数个错码。(2.4-3)

第一百三十九页,共180页。2、行列监督码行列监督码也叫方阵校验码,编码原理与简单的奇偶监督码相似,不同点在于每个码元都要受到纵、横两个方向的监督。以图2-19为例,有28个待发送的数据码元,将它们排成4行7列的方阵。方阵中每行是一个码组,每行的最后加上一个监督码元进行行监督,同样在每列的最后也加上一个监督码元进行列监督,然后按行(或列)发送。第一百四十页,共180页。接收端按同样行列排成方阵,发现不符合行列监督规则的判决有错。它除了能检出所有行、列中的奇数个错误外,也能发现大部分偶数个错误。因为如果碰到差错个数恰为4的倍数,而且差错位置正好处于矩形四个角第一百四十一页,共180页。行列监督码在某些条件还能纠错,观察第3行、第4行出错的情况(方阵中码元下面打“.”的位),假设在传输过程中第3行、第4列的“1”错成“0”,由于此错误同时破坏了第3行、第4列的偶监督关系,所以接收端很容易判断是3行4列交叉位置上的码元出错,从而给予纠正。第一百四十二页,共180页。行列监督码也常用于检查或纠正突发错误。它可以检查出错误码元长度小于和等于码组长度的所有错码,并纠正某些情况下的突发差错。观察图2-20(这是在图2-19基础上改第2行信息元为错码的情况),此时由于第2行的监督位以及1~7列监督位同时显示错误,可以推断是第2行的信息位出现了突发型的传输错误。第一百四十三页,共180页。3、恒比码恒比码又称等比码或等重码。恒比码的每个码组中,“1”和“0”的个数比是恒定的。我国电传通信中采用的五单位数字保护电码是一种3:2等比码,也叫五中取三的恒比码,即在5单位电传码的码组中(),取其“1”的数目恒为3的码组(),代表10个字符(0~9),如表2.4-1所示。第一百四十四页,共180页。因为每个汉字是以四位十进制数表示的,所以提高十进制数字传输的可靠性,相当于提高了汉字传输的可靠性。表2.4-13:2恒比码第一百四十五页,共180页。国际电传电报上通用的ARQ通信系统中,选用三个“1”、四个“0”的3:4码,即七中取三码。它有个码组,分别表示26个字母及其他符号,第一百四十六页,共180页。在检测恒比码时,通过计算接收码组中“1”的数目,判定传输有无错误。除了“1”错成“0”和“0”错成“1”成对出现的错误以外,这种码能发现其他所有形式的错误,因此检错能力很强。第一百四十七页,共180页。2.4.4线性分组码一个长为n的分组码,码字由两部分构成:信息码元(k位)和监督码元(r位),n=k+r,表示为(n,k)码。(n,k)码可以表示个状态,即可以有个码字,但其中只有个是许用码字,其余为禁用码。第一百四十八页,共180页。监督码元根据一定规则由信息码元变换得到,变换规则不同就构成不同的分组码。如果监督位为信息位的线性组合,就称为线性分组码。要从k个信息元中求出r个监督元,必须有r个独立的线性方程。根据不同的线性方程,可得到不同的(n,k)线性分组码。第一百四十九页,共180页。例如,已知一(7,4)线性分组码,4个信息元和3个监督元之间的关系可以表示为

(2.4-4)第一百五十页,共180页。式(3.4-4)中,符号“+”为模2加。为了说明(n,k)线性分组码的编码原理,下面引入监督矩阵H和生成矩阵G的概念。1、监督矩阵H改写式(2.4-4)所示(7,4)线性分组码的3个线性方程式第一百五十一页,共180页。(2.4-5)

第一百五十二页,共180页。写成矩阵形式(2.4-6)

第一百五十三页,共180页。并简记为或

(2.4-7)

式中

(2.4-8)

是阶矩阵,称为线性分组码的一致

监督矩阵(或校验矩阵),它决定了信息

码元和监督码元之间的校验关系。第一百五十四页,共180页。

(2.4-9)矩阵A表示编码器的输入信息码元序列。

(2.4-10)分别是矩阵的转置。H矩阵可以分成两部分(2.4-11)

第一百五十五页,共180页。式中P为阶矩阵,为阶单位方阵,具有形式的H矩阵被称为典型监督矩阵。根据典型监督矩阵和信息码元很容易计算出各监督码元。线性代数的基本理论指出,典型形式的监督矩阵各行一定是线性无关的,非典型形式的监督矩阵可以经过线性变换化为典型形式的监督矩阵。第一百五十六页,共180页。2、生成矩阵G改写式(2.4-4)为矩阵形式(2.4-12)

第一百五十七页,共180页。或者

其中,Q为阶矩阵。该式表明,已知Q矩阵,同样可以由信息位算出监督码元。不难看出,Q是P的转置,即第一百五十八页,共180页。如果在Q侧左边加上一个阶单位方阵,就构成了一个新的阶矩阵

(2.4-13)第一百五十九页,共180页。称为G典型生成矩阵。由典型生成矩阵可以得到系统码,也就说,利用G可以产生码组A,即

可见,生成矩阵G一旦给定,给出信息码元就容易得到码字。一般地,在线性分组码中,设M是编码器的输入信息码元序列,则编码器的输出码字A表示为

(2.4-14)(2.4-15)第一百六十页,共180页。由于信道中存在干扰,R中的某些码元可能与A中对应码元的值不同,也就是说产生了错误。由于二进制序列中的错误不外乎是“1”错成“0”或者“0”错成“1”,因此,如果把信道中的干扰也用二进制序列表示,则有错的值为“1”,无错的值为“0”,我们称E为信道的错误图样。第一百六十一页,共180页。接收码字R是发送的码字A与错误图样E模2相加的结果,可表示为R=AE(2.4-16)例如,发送码字A=(10111000),接收码字R=(10010100),从左开始的第3、5、6位产生了错误,因此信道的错误图样E的3、5、6位取值为1,其余各位取值为0,这时错误图样E=(00101100)。第一百六十二页,共180页。在发送端可以通过监督矩阵确定监督码元和信息

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论