




免费预览已结束,剩余16页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
VoIP技术连载之一:IP电话发展历史IP电话是一种数字电话,是技术创新的一种通信服务业务。在全球范围内得到了迅速的发展,可以说是当仿世界上发展最快、普及最快的一门应用服务技术之一。/VoIP技术连载之一:IP电话发展历史/ IP电话作为下一代电话而倍受瞩目的原因,是与通信业务经营者所传输的语音量和IP信息量比率有关。以因特网为代表的IP通信的信息量,现在以指数函数的方式增加。由于在全部信息传输量中,IP信息量占极高的比例,因此整个网络应适应于IP信息量,少量的语言信息量也应搭载在IP网上,这比起分别建立IP网和语音网要经济得多。正因为如此,IP电话技术将成为未来的电话技术。 IP(Internet Protocol)电话是一种数字电话,是技术创新的一种通信服务业务。它把语音、压缩编码、打包分组、分配路由、存储交换、解包解压等交换处理在IP网或互联网上实现语音通信。它促进了网络资源利用,降低语音业务成本。因此在全球范围内得到了迅速的发展,可以说是当仿世界上发展最快、普及最快的一门应用服务技术之一,也是计算机网络界关注的热点之 一。 1. IP电话产生的背景 (1)IP电话的产生Internet商业化以后,在全世界,特别是发达国家迅速发展起来。在一些国家(如美国)本地电话Internet接入采用包月 制,不限时限量,因此Internet是近乎免费的(Free)的,人们都希望能通过这近乎免费的网络进行传统的电话和传真服务。1995年2月以色列 VocalTec公司研制出可以通过Internet网打长途电话的软件产品Internet Phone。 用户只要在多媒体PC机上安装该软件,就可以通过Internet网和任何地方安装同样软件的联机用户进行通话。这项技术上的突破引起全世界的瞩目,其背后的无限商机也 使许多公司进行此项技术的研究,从而使IP电话技术得到迅速发展,人们把这种在Internet上实现电话业务称为Internet电话,应该说是IP电 话的雏形。 经过五年的发展,IP电话成为信息技术进步带来的一项新型电话业务在全世界开展,并对传统电话业务形成越来越大的威胁。IP电话从当初的PC到PC发展到 今天的PC到PC、PC电话、电话到电话等多种业务形式,但不论是现在还是将来,电话到电话的应用将拥有最大的市场,IP电话承载网络可以是 Internet ,更多的是遵循TCP/IP协议的专用网或Internet 。因此对我们来说,IP电话/传真就是通过IP网络传送电话/传真业务。IP网泛指基本TCP/IP协议的网络,包括因特网Internet和企业网 Internet。 (2)IP电话迅速发展的背景,从最初的Internet联应用到可以利普通电话实现通话,IP电话在短短的几年间得到了非常迅速的发展。IP电话为什么 会在这样短的时间里引起全球电信界的关注,并且正在或将要对传统的通信方式产生巨大的冲击?这除了IP电话采用语音压缩和统计复用技术节约宽带从而造成运 营成本降低外,还有以下两个原因: 第一, 电话业务历来都是各国管制最为严格的业务,但对于IP电话各国大多采取宽容甚至是扶植的态度,如美国将IP电话归类为增值业务,从而不必承担长途电话公司 所受的管制规定,这样IP电话提供长途电话业务时,不必向本地电话公司交纳占长途电话费40%左右的接入费。这样庞大的通信市场潜力,必然吸引众多传统和 新型的电信公司加入到IP电话的研究、开发和经营的队伍中。 第二, 各国国际长途电话费存在着严重的不平衡性,且国际长途电话业务在很多国家都是垄断经营的。这样,国际话费低的国家电信 运营者可以利用各国对IP电话的政策优惠,通过IP电话向国际话费高的国家渗透,直接或间接进入电信市场中尚未开放国家的国际长途业务经营领域;而资费高 的国家可以降低IP电话同国际回叫业务争夺用户,同时开拓新的用户群;在国际电信业务垄断经营国家,新的电信或ISP运营者迫切希望进入这一高利润的 垄断经营领域,IP电话的应运而生好正好为其提供了一条有效途径。 2. IP电话发展阶段 IP电话在技术上大致经历这样的几个阶段: (1) 技术突破期(1995-1996)IP电话最早是作为Internet上的联机应用出现的,那时只要通放双方拥有同样的客户端应用软件就可以在 Internet上进行实时通话了,当然语音质量存在很多问题。最早推出这种客户端软件的是以色列的VocalTec公司,他们在1995年2月宣布推出 Internet Phone,可以说是现代IP电话的雏形。 自从VocalTec推出了软件Internet Phone后,不少软件公司,包括很多在公司,都相继推出了类似的软件,比如微软的NetMeeting、IDT的 Net2Phone、NetSpeak的WebPhone、英特尔的Internet Video Phone等,用户只需在PC机上安装客户端软件,并配合麦克风、声卡、音响等设备, 就可以在IP网上与同样安装了这些软硬件的用户通话了。由于当时这种应用只限于在Internet上使用,因此那时人们通常将这种应用称为 Internet电话。 这一时期,使用者大多数是Internet上的网迷,语音质量基本没有保证,技术还不完全成熟,人们对它的认识也比较稚嫩,我们也可以把这一时期IP电话 发展的萌芽期。 (2) 发展期(1996-1999)逐渐地,电信公司开始认识到利用Internet实现语音业务的巨大潜在市场,他们开始考虑如何将Internet和已有的 PSTN结合起来,从而更加广泛的普通电话用户提供业务。于是,用以连接Internet和PSTN的网关设备出现了,由于利用Internet代替传统 的长途电话线路可以大大降低成本,许多产品制造商和业务商纷纷看好这一市场并开始制造设备和提供业务。可以说,这时IP电话进入快速的发展阶段。 由于利用公司的Internet传输实时的语音存在很多不足,难以保证用户接受的语音质量,这对一项业务来说显然是不行的。因此很多业务商建立了专用的 IP网或在Internet上构建VPN来提供语音业务,从而实现较好的语音质量,这时的IP电话也可以真正地称为IP电话了。 (3) 成熟期(2000)也许再过几年,IP电话将步入成熟期,届时IP电话将具有以下特点: 1) 技术成熟。 2) 统一标准。 3) 全球网络实现互通。 4) 语音质量良好。 5) 大部份传统电信运营公司开始提供IP电话业务。 6) 向IP传输多媒体业务过渡。目前,IP电话正处于发展期,各个设备制造商纷纷推出IP电话网关产品,众多电信运营公司开始经营IP电话业务,IP电话正以 强大的吸引力吸引着传统和新型的电信公司。VoIP技术连载之二:VoIP原理及技术通过因特网进行语音通信最根本的技术是VoIP,因此有必要首先分析VoIP的基本原理,以及VoIP中的相关技术问题。 通过因特网进行语音通信是一个非常复杂的系统工程,其应用面很广,因此涉及的技术也特别多,其中最根本的技术是VoIP (Voice over IP)技术,可以说,因特网语音通信是VoIP技术的一个最典型的、也是最有前景的应用领域。因此在讨论用因特网进行语音通信之前,有必要首先分析 VoIP的基本原理,以及VoIP中的相关技术问题。 一、 VoIP的基本传输过程 传统的电话网是以电路交换方式传输语音,所要求的传输宽带为64kbit/s。而所谓的VoIP是以IP分组交换网络为传输平台,对模拟的语音信号进行压缩、打包等一系列的特殊处理,使之可以采用无连接的UDP协议进行传输。 为了在一个IP网络上传输语音信号,要求几个元素和功能。最简单形式的网络由两个或多个具有VoIP功能的设备组成,这一设备通过一个IP网络连接。 VoIP模型的基本结构图如下图所示。从图中可以发现VoIP设备是如何把语音信号转换为IP数据流,并把这些数据流转发到IP目的地,IP目的地又把它 们转换回到语音信号。两者之音的网络必须支持IP传输,且可以是IP路由器和网络链路的任意组合。因此可以简单地将VoIP的传输过程分为下列几个阶段。 1、 语音-数据转换 语音信号是模拟波形,通过IP方式来传输语音,不管是实时应用业务还是非实时应用业务,道貌岸首先要对语音信号进行模拟数据转换,也就是对模拟语音信号 进行8位或6位的量化,然后送入到缓冲存储区中,缓冲器的大小可以根据延迟和编码的要求选择。许多低比特率的编码器是采取以帧为单位进行编码。典型帧长为 1030ms。考虑传输过程中的代价,语间包通常由60、120或240ms的语音数据组成。数字化可以使用各种语音编码方案来实现,目前采用的语音编 码标准主要有ITU-T G.711。源和目的地的语音编码器必须实现相同的算法,这样目的地的语音设备帮可以还原模拟语音信号。 2、 原数据到IP转换 一旦语音信号进行数字编码,下一步就是对语音包以特定的帧长进行压缩编码。大部份的编码器都有特定的帧长,若一个编码器使用15ms的帧,则把从第一来 的60ms的包分成4帧,并按顺序进行编码。每个帧合120个语音样点(抽样率为8kHz)。编码后,将4个压缩的帧合成一个压缩的语音包送入网络处理 器。网络处理器为语音添加包头、时标和其它信息后通过网络传送到另一端点。语音网络简单地建立通信端点之间的物理连接(一条线路),并在端点之间传输编码 的信号。IP网络不像电路交换网络,它不形成连接,它要求把数据放在可变长的数据报或分组中,然后给每个数据报附带寻址和控制信息,并通过网络发送,一站 一站地转发到目的地。 3、 传送 在这个通道中,全部网络被看成一个从输入端接收语音包,然后在一定时间 (t)内将其传送到网络输出端。t可以在某全范围内变化,反映了网络传输中的抖动。网络中的同间节点检查每个IP数据附带的寻址信息,并使用这个信息把该 数据报转发到目的地路径上的下一站。网络链路可以是支持IP数据流的任何拓结构或访问方法。 4、 IP包-数据的转换 目的地VoIP设备接收这个IP数据并开始处理。网络级提供一个可变长度的缓冲器,用来调节网络产生的抖动。该缓冲器可容纳许多语音包,用户可以选择缓 冲器的大小。小的缓冲器产生延迟较小,但不能调节大的抖动。其次,解码器将经编码的语音包解压缩后产生新的语音包,这个模块也可以按帧进行操作,完全和解 码器的长度相同。若帧长度为15ms,是60ms的语音包被分成4帧,然后它们被解码还原成60ms的语音数据流送入解码缓冲器。在数据报的处理过程 中,去掉寻址和控制信息,保留原始的原数据,然后把这个原数据提供给解码器。 5、 数字语音转换为模拟语音 播放驱动器将缓冲器中的语音样点(480个)取出送入声卡,通过扬声器按预定的频率(例如8kHz)播出。 简而言之,语音信号在IP网络上的传送要经过从模拟信号到数字信号的转换、数字语音封装成IP分组、IP分组通过网络的传送、IP分组的解包和数字语音还 原到模拟信号等过程。VoIP技术连载之三:国际标准化组织研究IP电话的国际标准化组织主要包括国际电信联盟电信标准部 (International Telecommunications Union- Telecommunications Standardization section,1TU-T)、欧洲电信技术标准所(European Telecommunications Standards Institue,ETSI)、因特网工程任务组(Internet Engineering Task Force,IETF)、国际多媒体电视会议联合会(IMTC)和INOW。1. ITU-T 国际电联是世界是制定通信标准最具有权威性和影响力的组织,ITU-T第16研究组制定的H.323协议已经提到计算机业和传统电信业的广泛支持,目前, H.323 v2已经完成,并已经开始H.323 v2的研究的制定工作。第16组于1999年5月在智利会议上提出H.gcp草案,并开始研究MGCP与H.gcp的进一步融合。2. ETSI ETSI TIPHON项目研究组在业务互操作、网络结构、编号和寻址、服务质量等方面研究得比较深入,其目的是结合电信和Internet技术,提出IP网上传输语音的标准,TIPHON将研究过程分为四个阶段:第一阶段的重点是由IP网到电路交换网络,即IP网中的一个用户向PST/ISDN、GSM中的发起呼叫,其目的是使IP网的用户能够接入PST/ISDN、GSM,并使用电路交换网络所能提供的业务,如补充业务和基本的IP业务。其示意图如图所示。第二阶段的重点是电路交换网到IP网,即PSTN/ISDN、GSM中的用户向IP网中的一个用户发起呼叫,其关键是如何将E-164地址转换成IP地址,示意图如图所示。第三阶段的重点是电路交换网通过IP网至电路交换网,即实现以Internet作为传送手段进行通信的目的,其示意图如图所示。第四阶段的重点是IP网电路交换网至IP网,其示意图如图所示。3. IMTC和IETF 国际多媒体电视会议联合会(IMTC)是一个非盈利性组织,由大约140个成员组成。IMTC目前与ETSI TIPHON合作重点研究互通问题,以保证设备的互操作性;IETF中的IPTEL、PINT、MEGACO等研究组正在进行IP电话方面厂家,主要研究IP电话的新协议(如MGCP、SIP等)、IP电话网与PSTN和IN的互通等。4. INOW INOW是由ITXC发起的。ITXC是一个IP电话业务批发商,它拥有一个覆盖全球的IP电话网,目前已经建立127个网关接入点。ITXC的网络中采用了朗讯和VocalTec两定公司的产品。1986年6月,ITXC、朗讯和VocalTec宣布开发可以在ITXC网络上互通产品,并于1998年11月向人们公开了产品规范,目前已经公布第二版的规范书,这一举动引起了许多厂家,标准化组织的电信公司的关注。VoIP技术连载之四:IP电话的五项基本原则IP电话系统建设应遵循五项基本原则,它们是:延时400毫秒的基本原则,99.9999%可靠电信原则,网络的开发原则,后方管理的保障原则。1、 延迟400毫秒的基本原则 能否将语音业务集成到数据网络中,关键就是如何保证QoS。对于IP电话而言,保证其QoS就怎样保证语音传输的最低延迟及怎样减少丢包率。据专家介绍, 只有端到端延迟降低到400毫秒以下,将丢包率降低到5%-8%,才能使IP电话与传统电话相媲美,实现收费质量的语音业务,而且必须自始至终保证这 两项指标。IP电话虽然有了标准,但实现起来并不容易。目前,从电信厂商到网络厂商,都已根据自己的强项技术的产品,提出解决QoS的办法。从网络核心到 网络边缘,QoS解决方案各具特色,但其能否满足IP电话这个基本原则,能否保证IP电话的语音质量,还必须经过实践的检验。经过较长时间的讨论与发展。 许多厂家都推出了产品。2、 99.9999%可靠电信原则 IP网络已成发展潮流,已成为网络应用的热点。在IP有一点非常清晰:IP网络必须发展与PSTN同样的功能甚至超过PSTN,PSTN发展100年, IP网络要走的路决不是坦途,电信服务质量、通用业务、全球互通,6个9的(99.9999%)可靠性、内容丰富的服务及收费质量等,这些要求在PSTN 中实现起来也许很容易,但在以包交换为基础的IP电话网络中能实现吗?专家的建议是,实现IP电话网络的电信质量,在建设电信级的IP电话业务及承载网络 之外,还需采用负载分担,路由备份等技术来保障网络的可靠性、可用性及服务质量,同时还必须保证IP网络的可管理性、可综合性、可扩展性。看来,唯有经过 漫长、艰苦的变革,VOIP才能成为下一代电信基础设施结构的核心。3、 多媒体应用发展原则 IP电话影响深远、引人注目,因为三网合一正式开始,用户翘首期盼的也是IP电话的更高境界-多媒体应用。IP电话的应用领域应该说是十分广阔的,它还可提供多媒体功能和呼叫管理功能,如交互式WEB商务、呼叫中心、LAN PBX、协商计算、企业传真等。最终,基于IP的业务功能将超来PSNT,可提供一体化信息处理,在高速线上提供多条虚拟线路,并提供多媒体会议、智能代 理(Intelligent Agent)及信息业务等。节省费用只是IP电话众多优点中的一小部份,但在目前IP网络基础设施阶段,设备成本才基本电话功能的可用性促成了IP电话替 代传统电话的最初应用。IP电话从廉价呼起叫步,逐步与视频及数据通信技术紧紧结合,向多媒体应用发展,才会带动网络融合。4、 网络的开放原则 传统的卢信网络作为专用网络设计,它具有封闭式结构的协议,而IP电话网络则不同,它会在一个开放的环境中逐步成熟。开放的环境引来众多厂商大显身手,寻 求商机。目前,各厂商的IP电话还不能完全互能,如不能解决这个问题,IP电话的发展必将大打折扣。有鉴于此,国际电信组织下促进各厂商使用标准协议,不 仅要使IP电话产品的互通,还要使IP电话能与现有的传统电话很好地合作。此外,使用标准协议还有利于各厂商开发设计出开放的应用程序,服务IP电话 系统。由于IP电话网络的开放性,用户今后可以随时买到最先进的程序或者自己编写需要的程序,而不是必须依赖于某些厂商,增大了用户应用的自由度。当然, 开放、灵活的同时会给IP网络的管理、集成测试、验证等带来非常严峻的挑战,作为开放的环境必然会带来开放的竞争推动技术创新和技术改造。可以说,在网络 开放的原则下,IP电话技术发展会有一个相当快的步伐,为广大用户提供一个很好的环境。5、 后台管理的保存障原则 在LAN、WAN和Internet 数据领域中,后方管理不用过多考虑,计费是按统一费率进行的。网络管理在企业网内进行。随着数据和语音的综合,从数据领域遗留下来的这一问题便会成为不利 的包袱,并且成为运营商环境中的长期障碍。大规模的语音业务需要后方管理工具和措施以支撑其商业运作,其服务,内容包括用户管理、认证授权,异地漫游、精 确到秒或字节的可靠计费系统、网络管理和大规模的业务管理、管理安全性、大规模网络配置和监控等,都是运商必须具备的条件,才能提高网络运营效率。实现这些管理的难点在于,骨干网技术基于分组而不是电路。在网络管理与安全方面的矛盾将日益突出,成为今后需要重点研究的课题之一。 VoIP技术连载之五:H.323协议简介在传统电话系统中,一次通话从建立系统连接到拆除连接都需要一定的信令来配合完成。同样,在IP电话中,如何寻找被叫方、如何建立应答、如何按照彼此的数据处理能力发送数据,也需要相应的信令系统,一般称为协议。目前在国际上,比较有景响的IP电话方面的协议包括ITU-T提出的H.323协议和IETE提出的SIP协议,本节主要介绍目前用得最广泛H.323协议。 一、H.323的体系结构 为了能在不保证QoS的分组交换网络上展开多媒体会议,由ITU的第15研究组SG-15于1996年通过H.323建议的第一版,并在1998年提出了H.323的第二版。H.323制定了无QoS(服务质量)保证的分组网络PBN(packet Based Networks)上的多媒体通信系统标准,这些分组网络主宰了当今的桌面网络系统,包括基于TCP/IP、IPX分组交换的以太网、快速以太网、令牌网、FDDI技术。因此,H.323标准为LAN、WAN、Internet、因特网上的多媒体通信应用提供了技术基础和保障。 H.323是ITU多媒体通信系列标准H.32x的一部份,该系列标准使得在现有通信网络上进行视频会议成为可能,其中,H.320是在N-ISDN上进行多媒体通信的标准:H.321是在B-ISDN上 进行多媒体通信的标准:H.322是在有服务质量保证的LAN上进行多媒体通信的标准:H.324是在GSTN和无线网络上进行多媒体通信的标准。 H.323为现有的分组网络PBN(如IP网络)提供多媒体通信标准。若和其它的IP技术如IETF的资源预留协议RSVP相结合,就可以实现IP网络的 多媒体通信。基于IP的LAN正变得越来越强大,如IP over SDH/SONET、IP over ATM技术正在快速发展以及LAN 宽带正 在不断的提高。由于能提供设备与设备、应用与应用、供应商与供应商之间的互操作能力,因此,H.323能够保证所有H.323兼容设备的互操作性。更高速 率的处理器、日益增强的图形器件和强大的多媒体加速芯片使提PC成为一个越来越强大的多媒体平台。H.323可提供PBN与别的网络之间进行多媒体通信的 互连互通标准。许多计算机、 网络通信公司,如Inter、Microsoft和Netscape都支持H.323标准。H.323标准包括在无QoS保证的分组网络中进行多媒体通信 所需的技术要求。这些分组网络包括LAN、WAN、Internet/因特网以及使用PPP等分组协议通过GSTN或ISDN的拨号连接或点对点连接。 从整体上来说,H.323是一个框架性建设,它涉及到终端设备、视频、音频和数据传输、通信控制、网络接口方面的内容,还包括了组成多点会议的多点控制单元(MCU)、多点控制器(MC)、多点处理器(MP)、网关以 及关守等设备。它的基本组成单元是域,在H.323系统中,所谓域是指一个由关守管理的网关、多点控制单元(MCU)、多点控制器(MC)、多点处理 器(MP)和所有终端组成的集合。一个域最少包含一个终端,而且必须有且只有一个关守。H.323系统中各个逻辑组成部份称为H.323的实体,其种类 有:终端、网关、多点控制单元(MCU)、多点控制器(MC)、多点处理器(MP)。其中终端、网关、多点控制单元(MCU)是H.323中的终端设备, 是网络中的逻辑单元。终端设备是可呼叫的和被呼叫的,而有些实体是不通被呼叫的,如关守。H.323包括了H.323终端与其它终端之间的、通过不同网络 的、端到端的连接。VoIP技术连载之六:语音编码器本章综述在IP语音技术(VOIP)中常用的编码解码器(codess)。它们常被称为编码解器、语音编码器或者简称为编码器。有关这方面的知识很多。 本章首先简要介绍编码器的主要功能、编码器的分类,然后阐述以及用于VOIP的三种编码器:IUT-T G.723语音编者按码器、ITU-T G.729语音编码器。 一、 语音编码器的功能 语音编码器的主要功能就是把用户语音的PCM(脉冲编码调制)样值编码成少量的比特(帧)。这种方法使得语音在连路产生误码、网络抖动和突发传输时具有健壮性(Robustness)。在接收端,语音帧先被误码为PCM语音样值,然后再转换成语音波形。 二、 语音编器的分类 语音编码器分为三种类形:(a)波形编器;(b)声码器;(c)混合编码器。波形编码器会尽可能构出包括背景噪单在内的模拟波形。由于波形编码器作用于所 有输入信号,因此会产生高质量的样值。然而,波形编码器工作在高比特率。例如:ITU-G.711规范(PCM)用的比特率为64Kbps。 声码器(vocoder)不会再生原始波形。这组编码器会提取一组参数,这组参数被送到接收端,用来导出语音产生模形。线性预测编码(LPC) 用来获取一时变数字滤波器的参数。这个滤波器用来模拟说话人的声道输出WEST96。在电话系统中使用声码器,语音质量不够好。 合成分析操作低比特率编码器的MOS得分-比特率关系曲线(WEST96)在VOIP中常用的语音编码器是混合编码器,它融入了波形编码器和声器的长处,它的另一特点是它工作在非常低的比特率(4-6Kbps)。混合编码器采用合成分析(AbS)。 为了说明问题,考虑人的声道产生的一个语音模式:当人说话产生语音信号时就会发出浊音(如音素pa、da等)和清音 (如音素sh、th)。激励信号就是由输入的语音信号导出的,其方法是使合成语音与输入语音的差别非常小。LPC的用法、激励的产生以及对合成分析 (AbS)系统的误差检查均如图4-1所示。 长话质量编码器在比特率高于8Kbps时容易实现,如图4-2所示。长话质量的语音平均意见得分(MOS)必须在分或许分以上。传统的PCN语音在比特率 小于32 Kbps,语音质量会严重恶化,在这里就不讨论PCN了。混合编码和声码器在比特率相当低的MOS上的得分是可接受的。在现阶段,大多数基于VOIP的编 码器的工作范围在5.28kbps。研究表明,标准的编码器在比特率为4 Kbps时能提供可接受的NOS得分,一些分用系统在4.8 Kbps的MOS上的得分为3.8。 矢量量化和码激励线性预测 一种较好的方法就是用预测存储的 最优参数(码元矢量)的码本对输入语音信号的表示矢量进行编码,这种技术称为矢量量化(VQ,vector quantization)。 将VQ和AbS技术结合在一起会进一步提高编码性能。AbS VQ是技术构成CELP的基础。VQ和AbS VQ的主要区别在于进行矢量量化码簿搜索时采用的量化失真测量定义的不同WONG96。 三、线性预测合成分析编码器 最常用的比特率在4.8kbps16 kbps之间的语音编码器是基于模型编码器的,这些编码器都是线性预测合成分析(LPAS)方法。为了随着时间的变化模拟语音信号,线性预测语音产生模型 必须用适当的信号来激励。每隔一段固定时间(如每隔20ms),语音模型参数和激励参数都必须做一次估计和更新,并用来控制语音模型。下面将介绍两种 LPAS编码器:前向至应LPAS编码器和后向自适应LPAS编码器。 3.1 前向自适应LPAS编码器:8kbps G.729编码器和6.3kbps 与5.3kbps G.723.1编码器 在前向自适应的AbS编码器中,预测滤波器的系数和增益是显示传送的。为了提供长话质量的语音性能,这两种编码器都依赖于信源模型。激励信号(以语音基调 周期的信息形式表示)也要传送。这种编码器所提供的模型对语音信号来说是比较好的,但对于一些噪音或者多数器来说并不合适。因此,在背景噪音和音乐环境 下,LPAS编码器的质量比7.726和7.727的编码器的质量要差一些。 G.723.1 ITU-T G.723.1编码器在6.4kbps提供长话质量语音。同时 G.723.1还包括一个工作在5.3kbps的低质量语音编码器。G.723.1是为低比特率可视电话而设计的。在这种适应中,由于视频编码时延通常大于语音编码时延,因此对时延的要求不是很严格。G.723.1编码器的帧长为30ms,还有7.5ms的前视。再加上编码器的处理时延,编码器的单向总时延为67.5ms。其它时延是由系统缓冲区和网络造成的。 G.723.1编码器首先对语音信号进行传统电话带宽的波滤(基于G.712),再对语音信号用传统的8000Hz速率进行抽样(基于 G.711),并变换成位的线性PCM码作作为该编码器的输入。在编码器中对输出进行逆操作来重构语音信号。 G.723.1系统用LPAS编码方法将语音信号编码成帧。编码器能够产生两种速率的语音流量:(a)用于高速率的6.3kbps;(b)用于低速率的5.3kbps。主速率编码器使用多脉冲最大自然量化(MP-MLQ),低速率编码器使用代数码激励线性预测(ACELP, Algebraic-Code-Excited Linear-Prediction)方法。编码器和解码器都必须支持两种速率,并通能够在帧间对两种速度进行转换,此系统同样能够对音乐和其它音频信号 进行压缩和解压缩,但它对语音信号来说是最优的。 编码器对帧进行操作,每帧包括240个样点,采用速率为8000Hz。在进一步的处理(高通滤波器去直流分量)后把每帧分成4个子帧,每个子帧 包括60个样点,其它的各种操作包括LPC滤波器以及LSP滤波器非量化系数的计算等,将会导致30ms的分组时延。对每个子帧,用未经处理的输入信号计 算LPC滤波器。最后一个子帧的滤波器系数用来预测分裂矢量量化器(PSVQ,Predictive split Vector quantizer)进行量化。正如前面所介绍的,前视占有7.5ms,所以整个编码时延为37.5ms。这个时延在评介编码器,尤其是通过数据网络传输 语音时是个很重要的因素,因为如果编码及解码时延比较小的话,就意味着处理互联网中的时延及其抖动时具有更大的自由度。 解码器的处理也是基于帧的,解码过程如下(G.723.1算法摘要): 对LPC的量化索引号进行解码。 对构造LPC合成滤波器。 对每个子帧,先对自适应码本激励和固定码本激励解码,然后再输入合成滤波器。 激励信号经基音后置滤波器处理后,再送入合成滤波器。 合成信号被输入到共振峰后置滤波器,该滤波器采用增益标度单元以使其输出能量维持在糨的输入水平。 静音压缩已运用多年,它运用了在总会话时间中静音时间占大约50%这一事实。其基本思路是在静音期间减少传送的比特数,从而节省了所需传输的总 比特数。 在电话网中,多年来对模拟语音信号都是用时间分配语音插值(TASI,Time-Assigned Speech Interpolation)主法进行处理。这一技术也就是将其它语音信号或者数据信号放置在谈话的静音期间内,从而为多信道链路提供附加容量。现今, TASI已运用数字信号中并被赋予新名称-其中的一个例子就是时分多址(TDMA,Time Division Multiple Access)。简要地讲,DTMA是将通常的信号划分成很小的、数字化片段(slots即时隙)。这些时隙和其它时隙一起在一个信道中进行时分复用。 G.723.1采用了执行不连续传输的静音压缩,这就意味着在静音期间的比特流中加入了人为的噪声。除了预留带宽之外,这种技术使发信机的调制解调器保持边续工作,并且避免了载波信号的时通时断。 G.729 G.729编码器是为低时延应用设计的,它的帧长只有10ms,处理时延也是10ms,再加上5ms的前视,这就使得G.729产生的点到点的时延为 25ms,比特率为8 kbps。这些时延性能在互联网中很重要,因为我们知道任何能减少时延的因素都是非常重要的。 G.729有两个版本:G.729和G.729A。G.729比G.723.1简单。这两个版本互相兼容但它们的性能有些不同,复杂性低的版本 (G.729A)性能较差。两种编码器都提供了对帧丢失和分组丢失的隐藏处理机制,因此在因特网上传输语音时,这两种编码器都是很好的选择。Cox等 COX98认为G.729在处理随机比特错误方面性能不好。建议在有随机比特错误的信道上不使用此编码器,除非利用信道编码(前向纠错码和卷积码,将 在无线部份讨论)保护最敏感的比特。 3.2 后向自适应LPAS编码:16 kbps G.728低时延码激励线性预测 G.728是低比特线性预测合成分析编码器(G.729和G.723.1)和后向ADPCM编码器的混合体。G.728是LD-CELP编码器,它一次只处理5个样点。 CELP是上种语音编码技术,它的激励信号是从一个可能的激励信号集合中通过全搜索方法选出的。低速率语音编码吕器对样值预测滤波器采用前向自 适应方案。而LD-CELP采用后向自适应滤波器并每隔2.5ms做一次更新。CELP中共有1024个可能的激励矢量。这些矢量可进一步分析为4种可能 的增益,两种符号(+和-)与128种形状矢量。 对于低速率(56128 kbps)的综合业务数字网(ISDN)可视电话,G.728是一种建议采用的语音编码器。由于其后向自适应特性,因此G.728是一种低时延编码器,但 它比其它的编码器都复杂,这是因为在编码器中必须重复做50阶LPC分析。G.728还采用了自适应后置滤波器来提高其性能。 四、参数语音编码器:2.4 kbps混合激励线性预测编码 参数编码器采用简化激励信号的语音模型,因而能工作在最低比特率。前而讨论的所有语音编码器都可描述为波形跟踪,它们输出信号的波形和相位与输入信号很相似。 参数语音编码器却不同,它不呈现为波形跟踪。这类编码器是基于分析合成模型的,可用相当少的参数表示语音信号。这些参数通常是每隔 20ms40ms就会从语音信号中提取和量化。在接收端,这些参数用来生成合成语音信号。在理想条件下,合成语音听起来和原始语音相似。在背景噪音较大 的情况下,由于输入的语音信号不能根据其内在的语音模型很好的建模,所以任何参数编码器都将失败。美国政府选择了2.4 kbps MELP用于保密电话。 对于我媒体应用,COX98的研究指出:当需要低比特率时,参数编码器是一种好的选择。例如,简单的用户游戏中经常用参数编码器。这会降低所需的存储空 间。出于同样的原因,参数编码器对某些多媒体消息型业务也是一种好的选择。对所有类型的语音环境来说,参数编码器的绝对语音质量都较低,尤其是在噪声环境 下。如果事先能对语音文件做仔细的编辑,那么这个缺点是能克服的。目前,多媒体应用中的大多数参数编码器都不是标准的。而是适用于这类专用编码器。 用于无线通信的G.723.1可变速率编码 G.723.1的附件C规定了一个信道编码规范,此规范可以和三倍速率的语音编码器一起使用。这个信道编码器的比特率的可变的,它作为整个H.324标准系列的一部份,是为移动多媒体应用设计的。 这个信道编码器支持的比特率范围从0.7 kbps到4.3 kbps。它也支持G.723.1的三个操作模式的编解码器,即高速率模式、低速率模式和不连续传送模式。 这个信道编码器采用截短卷积码,根据每一类型信息比特主观重要性的不同,信道编码器的比特率可对不同的比特类型分进行优化。这种分配算法对编码器和解码器 都是已知的。每次的系统控制信号无论是改变G.723.1的速率还是改变信道编码器的比特率,这个算法都会使信道编码器适应于新的语音业务配置。 如果信道编码器的可用速率较低,那么首先要保护主观上最敏感的比特位。当信道编码器的比特率增加时,多余的信道比特首先用来保护更多的信息比特 位,然后再对已保护过的比特类型增强保护。 在运用信道编码之前,语音参数要在信道适配层作部份的变化以提高对传输错误的健壮性。五、编码器评价 评估编码器的性能时要考虑几个重要因素。这些因素如下提示: 帧大小:帧的大小表示语音流量的时间长度,也称为帧时延。 帧是语音信号的分立部件,且每帧是根据语音样点更新的。本 介绍的编码器都是一次处理一帧。每帧信息各放在各语音分组 中,并传送给接收端。 处理时延:它表示在编码器中对一帧语音做编码算法处理所 需时间。它通常简单计入帧时延。处理时延好称为算法时延。 前视时延:编码器为了对当前帧的编码提供帮助而检查下一 帧的一定长度,此长度就称为前视时延。前视的想法是为了利 用相邻语音帧之间的密切相关性。 帧长度:这个值表示经编码处理后的字节数(不包括帧头)。 语音比特率:当编解码器的输入是标准脉冲编码调制的语音 码流(比特率为64 kbit/s)时,编解码器的输出速率。 DSP MIPS:此值是指支持特定编码器的DSP处理器的最低 速度。值提注意的是DSP MISP与其它处理器的MISP速率无 关。与用在工作站和个人计算机上通用处理器不同,这些DSP 是为特定任务而专门设计的。因此,为实现上述的编解码器处 理所需求MISP,通用处理器要比专用DSP处理器大。 RAM需求:它描述了支持特定的编码过程所需要RAM的大 小。 评价编码器性能的关键因素是编码器工作所需时间。这个时间是指编码器的缓存及处理时间,称为单向系统时延。其值等于:帧大小+处理时延+前视时延。显然,解码时延也非常重要。实际上,解码时延大约是编码时延的一半。六、语音编码器的比较 为了标准编码器的讨论作个总结,表4-1RUDK97对几种编码器的比特率、MOS、复杂性(以G .711为基准)和时延(帧大小及前视时间)作为比较。 标准编码类型比特率(kbps)MOS复杂性时延(ms)G.711PCM644.310.125G.726ADPCM324.0100.125G.728LD-CELP164.0500.625GSMRAE_LPT133.7520G.729CSA-CELP84.03015G.729A15G.723.1ACELP6.33.82537.5MP-MLQ6.3US DodLPC-102.4合成语音1022.5FS1015 标准 编码类型 比特率 MOS 复杂性 时延 (kbps) (ms) G.711 PCM 64 4.3 1 0.125 G.726 ADPCM 32 4.0 10 0.125 G.728 LD-CELP 16 4.0 50 0.625 GSM RAE_LPT 13 3.7 5 20 G.729 CSA-CELP 8 4.0 30 15 G.729A 15 G.723.1 ACELP 6.3 3.8 25 37.5 MP-MLQ 6.3 US Dod LPC-10 2.4 合成语音 10 22.5 FS1015 七、小结 语音编码器是建立和处理VOIP分组的发动机的。它由DSP驱动。 原来的DS0、TMD G.711 64kbps编码器最终会被工业淘汰,并由低比特率编码器所替代。 VoIP技术连载之七:推动VoIP发展的动力由于相关的硬件、软件、协议和标准中的许多发展和技术突破,使得VoIP的广泛使用很快就会变成现实。这些领域中的技术进步和发展为创建一个更有效、功能和互操作性更强的VoIP网络起着推波助澜的作用。表2-2简单列出了这些领域中的主要发展。从表中可以看出,推动VoIP飞速发展乃至广泛应用的技术因素可以归纳为如下几个方面。 1、 数字信号处理器 先进的数字信号处理器(Digital Signal Processor ,DSP)执行语音和数据集成所要求的计算密集的任各。DSP处理数字信号主要用于执行复杂的计算,否则这些计算可能必须由通用CPU执行。它们的专门化的处理能力与低成本的结合使DSP很好地适合于执行VoIP系统中的信号处理功能。单个语音流上G.729语音压缩的计算开销开常大,要求达到20MIPS,如果要求一个中央CPU在处理多个语音流的同时,还执行路由和系统管理功 能,这是不现实的,因此,使用一个或多个DSP可以从中央CPU卸载其中的复杂语音压缩算法的计算任务。另外,DSP还适合于语音的活动检测和回声取消这 样的功能,困为它们实时处理语音数据流,并能快速访问板上内存,因此。在本章节中,比较详细地介绍如何在TMS320C6201DSP平台来实现语音编码 和回声抵消的功能。 协议和标准 软件 硬件 H.323 加权公平排队法 DSP MPLS标记交换 加权随机早期检测 高级ASIC RTP, RTCP 双漏斗通用信元速率算法 DWDM RSVP 额定访问速成率 SONET Diffserv, CAR Cisco快速转发 CPU处理功率 G.729, G.729a:CS-ACELP 扩展访问表 ADSL,RADSL,SDSL FRF.11/FRF.12 令牌桶算法 Multilink PPP 帧中继数据整流形 SIP 基于优先级的CoS Packet over SONET IP和ATM QoS/CoS的集成 协议和标准 软件 硬件 H.323 加权公平排队法 DSP MPLS标记交换 加权随机早期检测 高级ASIC RTP, RTCP 双漏斗通用信元速率算法 DWDM RSVP 额定访问速成率 SONET Diffserv, CAR Cisco快速转发 CPU处理功率 G.729, G.729a:CS-ACELP 扩展访问表 ADSL,RADSL,SDSL FRF.11/FRF.12 令牌桶算法 Multilink PPP 帧中继数据整流形 SIP 基于优先级的CoS Packet over SONET IP和ATM QoS/CoS的集成VoIP技术连载之八:回声消除技术对于IP电话设备,回声消除技术是十分重要的,因为一般IP网络的时延很容易就达到4050ms。为了防止回声,一般需要回声消除技术,在处理器中有特殊的软件代码监听回声信号,并将它从听话人的语音信号中消除。/VoIP技术连载之八:回声消除技术/ “在PBX或局用交换机侧,有少量电能未被充分转换而且沿原路返回,形成回声。如果打电话者离PBX或交换机不远,回声返回很快,人耳听不出来,这种情况下无关紧要。但是当回声返回时间超过10ms时,人耳就可听到明显的回声了。为了防止回声,一般需要回声消除技术,在处理器中有特殊的软件代码监听回声信号,并将它从听话人的语音信号中消除。对于IP电话设备,回声消除技术是十分重要的,因为一般IP网络的时延很容易就达到4050ms。 ” 一、 因特网语 音通信中回声的特点 与传统电话相比,因特网上进行语音的实时传输,有其致命的弱点,那就是语音质量较差,影响因特网语音质量的因素是多方面的,最关键的因素之一是回声的影 响。因此,要提高因特网的语音质量,就必须在因特网的语音传输过程中进行消回声的处理,也就是说,IP电话网关作为因特网的语音接入设备,几须具有回声的 消除功能。由于因特网的语音传输是采用分组交换技术实现的一种全新的电信业务,传送的语音信号要经过编码、压缩、打包等一系列处理,这不仅造成回声路径的 延迟较大,而且延迟抖动也较大。因此,在因特网的语音传输过程中,回声问题显得尤其突出,并具有如下特点。 1、 回声源复杂 在传统电话系统中,存在着一种所谓的电路回击。该回声产生的主要原回是在系统中存在2-4线的转换。完成2-4转换的混合器因阻抗匹配,造成泄漏 ,从而导致了电路回声。从因特网IP电话网关的连接方式可以看出,IP电话网关一端连接PSTN,另一端连接因特网。 尽管电路回声产生于PSTN中,但同样会传至于IP电话网关,是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB61T 880-2014 玉米 秦龙468规范
- 加盟分店合同(标准版)
- 出租交房合同(标准版)
- 分布式光伏能源存储与管理方案
- 仓储(仓库)管理合同2篇
- 2025上海青浦兰生学校秋季招聘考试参考试题及答案解析
- 混凝土抗裂技术实施方案
- 2025年山东海洋文化旅游发展集团有限公司公开招聘工作人员考试参考试题及答案解析
- 2025南昌东湖城市建设投资发展有限公司招聘2人备考练习题库及答案解析
- 2025年甘肃省定西市岷县西寨镇卫生院招聘乡村医生考试参考试题及答案解析
- 2025年中国东方航空集团招聘笔试参考题库含答案解析
- 临床研究课题验收报告
- 扳机点(激痛点)疗法(理论及实操演示附全身激痛点分布图)
- 2024ESC心房颤动管理指南解读
- 村级换届业务培训
- 《预防未成年人犯罪》课件(图文)
- 医院数据分级分类制度
- 常见皮肤病的治疗课件
- GB/T 22838.5-2024卷烟和滤棒物理性能的测定第5部分:卷烟吸阻和滤棒压降
- 议论文阅读训练10篇(附答案及解析)
- 《医师资格考试报名资格规定2014版》
评论
0/150
提交评论