电子与通信工程硕士论文-基于AMR技术的GSM网络优化方法研究.pdf_第1页
电子与通信工程硕士论文-基于AMR技术的GSM网络优化方法研究.pdf_第2页
电子与通信工程硕士论文-基于AMR技术的GSM网络优化方法研究.pdf_第3页
电子与通信工程硕士论文-基于AMR技术的GSM网络优化方法研究.pdf_第4页
电子与通信工程硕士论文-基于AMR技术的GSM网络优化方法研究.pdf_第5页
免费预览已结束,剩余61页可下载查看

电子与通信工程硕士论文-基于AMR技术的GSM网络优化方法研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西安电子科技大学 硕士学位论文 基于amr技术的gsm网络优化方法研究 姓名:周琳 申请学位级别:硕士 专业:电子与通信工程 指导教师:宋彬;苏宇楼 20100301 摘要 1 摘要 近年来,随着移动通信用户数量的迅速增长,网络规模不断扩大,虽然 gsm 半速率 (hr) 技术能够有效地提升网络容量, 但由于其低速语音编码的固有缺陷, 同时也造成了网络质量的下降。已被 gsm phase 2+系统和 3gpp 采纳的自适应 多速率(amr)语音编码技术,与传统的各种语音编码方式相比,在相同的资源 配置条件下,具有高效的编码效率和良好的网络适配性,可广泛应用于 gsm 现 网中。 然而, amr 技术在国内 gsm 现网应用中尚处于起步阶段, 由于其算法复杂, 各设备提供商在具体功能实现方面各不相同,且各运营企业对 amr 技术都还没 有一套成熟的应用经验和网络优化方法。因此,如何结合现网,充分发挥 amr 技术的优点, 推出一套切实可行的基于 amr 技术的 gsm 网络优化策略, 目前是 国内 gsm 运营企业和设备提供商的研究热点。 本论文重点对自适应语音编码在gsm网络中的应用进行研究, 通过gsm网络中有 效应用amr技术,来提高语音业务的服务质量和网络投资利用率。首先,基于目前 gsm网络急需解决的容量和质量的均衡问题,给出国内外amr技术的应用现状和国 内amr应用存在的问题;还利用amr技术,权衡现网系统容量和话音质量的要求, 给出有效提升gsm网络qos(服务质量)的调整方法;然后,基于amr算法的原理, 研究amr技术的tch分配算法、编码速率适配算法和切换算法,以及基于现网不同 场景的参数优化模型和优化策略;接下来,在现网中对amr进行dt(驱车测试)、 cqt(定点质量测试),进行了切换和容量实验,其中重点关注话务负荷和平均意 见得分(mos)。通过对现网实际应用试验,结果表明amr技术对网络容量和网络 质量的巨大提升作用,而且网络质量相对于hr也有明显的提高。 最后, 根据现网实验结果, 以及对amr技术特点的深入分析, 论文给出了amr 应用半速率的典型场景,并从语音质量、网络覆盖、网络容量、频率复用度、系 统性能五个方面系统分析了amr技术对网络的影响, 从而为amr在gsm网络中的 推广给出了应用准则和依据。 关键词关键词:amr;gsm;网络优化;系统容量;话音质量 abstract 3 abstract in recent years,with the explosive growth of mobile users, network scale has continuously expanded. although the gsm half rate technology (hr) can improve the network capacity effectively, its inherent defect known as low bit rate speech coding would result in decline in the network quality. comparing with traditional voice encoding methods, adaptive multi- rate speech coding technology (amr) which has been adopted in gsm phase 2 + system and 3gpp has a better coding efficiency and network adaptability. this technology can be widely used in current gsm networks. however, amr technology in domestic gsm network applications is still at an early stage. due to its complicated algorithm, different equipment providers use different means to achieve specific function realization and the gsm providers have not yet found a mature application experience and network optimization method. for the domestic gsm providers and equipment providers, the current study focuses on the introduction to a series of practicable gsm network optimization strategy based on amr technology. this paper emphasized the research on application of adaptive speech encoding technology to improve the voice quality of service and network investment utilization via effective use of amr technology in the gsm network. firstly, pointing at the urgent equilibrium problems of capacity and quality, the status quo of amr technology application and problems at home and broad were offered. according to the requirement of system capacity and voice quality in current gsm network, an effective way of improving the quality of service (qos) utilizing amr technology was also been mentioned. then, based on the principle of amr algorithm, research of amr technology tch allocation algorithm, encoding rate adaptation algorithm, handoff algorithm, parameter optimization models and strategies in the different scenarios, the drive test (dt), call quality test (cqt), handoff and capacity experiment were completed, which focused on traffic load and the mean opinion score (mos). through the practical experiment comparing with hr technology, it was obviously that amr technology plays an important role in the improving of network capacity and quality. finally, the amr half- rate voice in typical application scenarios was introduced based on in- depth analysis on technical characteristics of amr. its impact to network was also analyzed from voice quality, coverage, capacity, system performance and frequency reuse degrees. thus the guidelines and basis was given to promote the application of amr technology in gsm network. keyword: amr, gsm, network optimization, system capacity, voice quality 西安电子科技大学西安电子科技大学 学位论文独创性(或创新性)声明学位论文独创性(或创新性)声明 秉承学校严谨的学分和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下 进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内 容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技 大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中做了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切的法律责任。 本人签名: 日期 西安电子科技大学西安电子科技大学 关于论文使用授权的说明关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读 学位期间论文工作的知识产权单位属西安电子科技大学。学校有权保留送交论文的复印件, 允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其 它复制手段保存论文。同时本人保证,毕业后结合学位论文研究课题再攥写的文章一律署名 单位为西安电子科技大学。 (保密的论文在解密后遵守此规定) 本学位论文属于保密,在 年解密后适用本授权书。 本人签名: 日期 导师签名: 日期 第一章 绪论 1 第一章第一章 绪论绪论 1.1 研究背景 在我国移动通信事业高速发展以及电信市场日趋开放的今天,移动通信市场 的竞争日益激烈,客户对移动通信网络的选择主要取决于网络运营的质量、资费 政策、业务种类及其后期服务。其中,网络质量目前仍然是客户选择网络的第一 因素。为了提高移动通信企业的市场竞争能力,保证企业投入及时得到回收,移 动通信企业必须为客户提供高质量的通信网络。 在移动通信业飞速发展的今天,gsm 用户依旧发展迅猛, 就中国移动通信陕 西公司来说,全省 gsm 网络客户数量已经突破 1800 万。巨大的网络扩容压力使 得运营商、维护部门、施工单位疲于奔命。另一方面,随着话费的不断下调、数 据业务量的成倍剧增, 市场对网络容量的需求也更加强烈。 然而频率资源的短缺、 公众环保意识的加强, 通过传统的基站扩容、小区分裂、新建基站等物理方式进 行扩容的难度越来越大。在移动通信用户数量迅速增长,网络规模不断扩大的情 况下,在通信网络的可用资源( 系统容量、频道资源等) 数量有限且扩容速度不 快的前提下,对各种信息的压缩技术成为了有效提高网络利用率,和间接提升网 络带宽最为直接的方法。 传统的语音编码模型普遍存在一个问题,即语音编码输出速率单一。而实际 的移动通信信道具有时变特性,以典型的瑞利衰落信道为例,衰落深度可达到 20db。显然,如果采用语音编码速率单一的模型,语音编码和信道编码方案只能 以假定某种恶劣的信道情况为典型环境而设计,在实际系统用户并不总是处于恶 劣环境中,按照上述原则设计,不可避免的造成无线资源的浪费和系统容量的损 失。虽然 gsm 半速率(hr)技术能够有效地提升网络容量,但由于其低速语音 编码的固有缺陷,同时也造成了网络质量的下降。自适应多速率语音编码技术就 是在这种情况下, 被 gsm phase2+系统和 3gpp (3rd generation partnership project) 采纳。 自适应多码率语音编解码器(adaptive multi- rate speech codec- amr)是欧洲电 信标准化协会(etsi)下属的smg11(special mobile group11)为gsm系统所定制的 语音编解码标准, 其目的是在半速率信道容量的情况下得到有线语音编解码质量1 2 3 4。 amr语音编解码器能提供高质量的语音,增强抗信道误差的能力,并通过低 编码速率灵活的提高了系统容量,编码速率根据无线环境和本地容量需求动态选 择。amr语音编解码能很好地适应无线接口的容量波动,根据信道质量和小区的 话务量来选择编码速率,以获得语音质量和系统容量的最佳平衡,具有其它语音 2 基于 amr 技术的 gsm 网络优化方法研究 编码方式不可替代的优点。amr语音编码性能提高主要表现为: 自适应选择语音编码模式,语音整体质量获得提高。 通过网络的控制而在语音质量和网络容量间取得平衡; 合理协调编码语音的质 量和容量,灵活地控制语音和信道编码模式的结合。 提高噪声环境下系统的顽健性。 提高系统的可操作性。 带内增加的快速传输信号提高了系统转移和功率控制性能。 本论文重点对自适应语音编码在gsm网络中的应用进行研究,希望能通gsm 网络中amr技术的应用,提高语音业务的服务质量和有效性。基于目前gsm网络 急需解决的容量和质量的均衡问题、amr的实际应用需求特点,论文下面给出国 内外amr技术的应用现状,然后针对国内amr应用的问题,研究并提出多种解决 策略。 1.2 国内外 amr 技术应用的现状 1999年, 由爱立信、西门子、诺基亚公司提出的amr标准被3gpp采纳, 成为 第三代移动通信中语音编解码器的标准。 作为第四代gsm语音编解码标准, amr 已凭借其优异的性能成为umts(universal mobile telecommunication system)和 itu(international telecommunication union)第三代系统候选编码,并且将会同 h.263v2、 mpeg- 4影像一起构成流业务媒体编码的骨干技术。 目前的amr算法已 经广泛应用在国外gsm和第三代移动通信的运营网络中。 虽然amr技术已经提出了许多年时间,但国内gsm系统现网应用中尚处于 起步阶段。对于各大运营商来说,由于无线设备厂家的不同,对于amr算法的应 用规模和应用程度也有所不同。由于其算法较为复杂,且各设备提供商在具体功 能实现方面也不尽相同,各运营企业对amr技术的应用和基于amr的网络优化都 还在探索当中。国内各个运营商对于amr算法在gsm网络中都的应用也仅仅局限 于对于amr不同参数的调整,并没有一套成熟的应用经验和网络优化策略,没有 建立基于amr的gsm网络优化体系模型, 不利于对amr技术的深入应用和潜力挖 掘。 如何结合现网,充分发挥amr技术的优点,推出一套切实可行的基于amr 技术的gsm网络优化策略, 目前是国内gsm运营企业和设备提供企业的研究热点。 1.3 论文主要工作和组织结构 论文工作以西安移动现网 gsm 网络为基础平台, 应用 amr 技术, 构建一个 系统的网络优化模型,提高语音业务的服务质量和有效性,有效均衡系统容量和 网络质量, 为 amr 技术在 gsm 网络中的大规模推广和应用构建一套有指导意义 第一章 绪论 3 的模型。 1.3.1 论文主要工作 本论文重点对自适应语音编码在 gsm 网络中的应用进行研究,希望能通过 gsm 网络中 amr 技术的应用,提高语音业务的服务质量和有效性。基于目前 gsm 网络急需解决的容量和质量的均衡问题、amr 的实际应用需求特点,论文 给出国内外 amr 技术的应用现状,然后针对国内 amr 应用的问题,研究了在 gsm 网络中,如何借助 amr 技术,最有效的提升网络 qos(服务质量) ,在系 统容量和话音质量中取得平衡点。论文研究的主要内容和贡献如下: 研究了 amr 的编码调整原理、amr 的 tch 分配算法和切换算法,得出了 基于不同场景的参数优化参考模型。在现网中对 amr 进行 dt(驱车测试) 、 cqt(定点拨打)测试,进行了切换、功控和容量实验,并对网络性能指标 进行了前后对比分析。 总结给出了 amr 应用半速率的场景,从语音质量、网络覆盖、网络容量、 频率复用度、系统性能等方面分析了 amr 对网络的影响。 1.3.2 论文组织结构 论文共分六章: 第一章概述了论文的研究背景,amr 技术的产生的背景,国内外对于 amr 技术的应用现状,以及论文主要工作和组织结构。 第二章阐述了 amr 技术的基本原理以及关键技术。 第三章给出 amr 的编码调整原理、amr 的 tch 分配算法、切换算法,并 通过对算法的分析,得出了参数优化通用方案和基于不同场景的参考模型; 在现网中对 amr 进行 dt(驱车测试) 、cqt(定点拨打)测试,进行了切 换、功控和容量实验,并对网络性能指标进行了前后对比分析。 第四章总结给出了 amr 应用半速率的场景,从语音质量、网络覆盖、网络 容量、频率复用度、系统性能等方面分析了 amr 对网络的影响。 第五章给出了 amr 实现和应用的条件。 最后一章总结全文,给出今后工作的方向。 第二章 自适应多速率语音编码的基本原理和关键技术 5 第二章第二章 自适应多速率语音编码的基本原理和关键技术自适应多速率语音编码的基本原理和关键技术 数字蜂窝系统自适应多码率语音传输编解码器是欧洲电信标准化协会(etsi) 下属的smg11为gsm系统所定制的语音编解码标准。与以前的gsm语音编码方式 不同,过去的语音编码主要是以全速率、半速率或增强全速率为主,它们的共同 点在于都是采用了固定速率和确定的错误保护级别,而amr的语音编码方式提供 了一种自适应的解决方法来跟踪快速变化的无线信道环境和本地流量情况,根据 当前的无线信道和需要传递的信息量的情况确定错误保护级别。它选择最佳信道 和编码模式的组合,使语音质量和系统容量完美结合。针对不同信道状况自适应 使用相适应的语音编码、信道编码组合,在较差的信道状况下使用鲁棒性较好的 编码组合,在较好的信道状况下使用话音质量较好的编码组合。这样,原来无法 接入的用户可以接入网络,原来无线信道状况较好的用户可以提高话音质量。从 整个系统来说,话音质量和系统容量都能获得提高。 2.1 amr 编解码算法的原理 amr语音编码技术是基于变速率多模式语音编码技术发展起来的,在amr标 准中规定了8种语音编码输出速率,分别从4.75kbps到12.2kbps不等,每种语音编码 模式都要求一种信道编码模式与之对应。为了降低成本和复杂度,8种模式都采用 celp(code excited liner prediction)算法,所不同的是参量的量化码本和量化比特 数。 假设信道接入速率即信道编码后的输出速率一定, 对应amr平台而言, 就存在 信源编码和信道编码速率的不同分配。由于多数比特分配给信源编码,高模式的 语音编码器(如mr122)可以提供优良的可懂度和自然度,但是抗噪声能力差。 反之低模式的语音编码器(如mr475),多数比特被用于信道编码,具有很强的 纠错能力,而声码器本身合成的语音质量的自然度较差。 在实际系统中,每种模式的语音合成质量是由语音编码和信道编码方案共同 决定的,在信道状况较好时,误比特率较低,高模式声码器的合成语音自然度好 的优点就显现出来。而在信道状况恶劣的情况下,相对信源编码而言,信道编码 对合成语音的质量起着更主要的作用,低模式声码器就有着一定的优势。amr这 种“变” 的特点可以和移动信道的时变特性进行匹配,通过语音编码、信道编码和 链路适配技术的联合设计,使得用户可以根据当前的信道状况,自适应的选择最 优的编码模式,以实现语音质量和系统容量的优化。因此,amr可以看成语音业 务的平台, 信源编码、信道编码、链路控制等技术方案依此而设计,其中语音编码 部分3gpp中标准化的程度较高。 2.1.1 amr 语音编码器的信源编码速率 amr 可以选择最优的信道方式 (fr 或 hr) , 同时选择最佳的语音编码方式, 基于 amr 技术的 gsm 网络优化方法研究 6 取得最佳的语音质量和系统容量的平衡。amr 技术支持上下行独立工作,上下 行可以采用不同的编码方式5。 amr支持八种速率:12.2kb/s、10.2kb/s、7.95kb/s、7.40kb/s、6.70kb/s、5.90kb/s、 5.15kb/s和4.75kb/s。此外,它还包括低速率 (1.80kb/s)的背景噪声编码模式,如表 2.1所示。 表 2.1 amr 语音编码器的信源编码速率表 信道 编码速率 12.2 kbit/s 10.2 kbit/s 7.95 kbit/s 7.40 kbit/s 6.70 kbit/s 5.90 kbit/s 5.15 kbit/s tch/afs 4.75 kbit/s 7.95kbit/s(部分厂家不支持) 7.40 kbit/s 6.70 kbit/s 5.90 kbit/s 5.15 kbit/s tch/ahs 4.75 kbit/s amr编码方式是让容错度随无线信道和传输环境的改变而改变,通过选择最 佳信道和编码模式使语音质量和系统容量达到完美的结合。 amr 中的每种编码模 式提供了不同的容错度,实际的语音速率主要取决于现存的无线信道环境。每种 编码的适应性算法是选择最佳语音速率作为信道质量函数。编码适应性主要依靠 在移动端到网络端的信道质量和被与语音数据一起传输给空中接口的带宽信息24 25。 2.1.2 amr 系统接口的主要信息流 amr采用帧作为语音处理的基本单位。进行编码时,处理的语音帧长度20ms。 在该时间间隔内可以认为语音是平稳信号;通过8khz采样后的时域样点数为160。 每一语音帧使用的真正的编码率取决于当时的无线信道环境。编码自适应算法根 据信道质量选择最优编码速率,在传输环境较差时选择最健壮的编码模式,在传 输环境较好时选择提供最佳语音质量的编码模式26 27 28。 编码的自适应性依赖于 移动台和网络对信道质量的侧量,也依赖于随语音数据一起通过空中接口传送的 带内信息。图2.1给出了系统接口的数据信息流: 第二章 自适应多速率语音编码的基本原理和关键技术 7 图2.1 系统界面间主要信息流程 在上行链路编码模式的调整中,网络需估计信道质量,确定对存在的传输环境 的最佳编码,然后将该信息通过空中接口传送给ms(移动台)。对下行链路的编 码调整,ms 必须估计下行链路的信道质量,发送网络质量信息。在理论上,编 码模式每帧都会改变,而实际中,由于传输延迟和滤波器影响,编码模式按较低 的速率调整。每种链路可以有不同的编码模式,但两边链路的信道模式必须相同。 2.1.3 amr 编码原理 自适应多码率语音编码是采用合成分析法 (analysis- by- synthesis) 的语音编码, 是一种典型的混合编码方案。在中低速率能够给出高质量的合成语音,且抗噪声 和多次转接性能好。amr语音编码算法中所有编解码算法都基于码激励线性预测 编码模型。短时lp合成滤波器的激励信号由分别从自适应码本和固定码本中取出 的激励矢量相加得到。将此激励信号通过短时合成滤波器进行滤波,合成出语音 36。 amr编码器运用了代数码本线性预测(acelp) 混合编码方式,基本原理是原 始语音按帧输入,根据使合成语音与原始语音的加权均方误差最小的准则,从随 机码本和固定码本中挑选合适的码本以代替残差信号,并将码本地址和增益及各 滤波器的参数量化编码后传送到接收端。接收端恢复各滤波器时,采用与发送端 相同的码本,按照码元地址找到该码元乘上增益,激励合成滤波器,得到合成语 语 音 编 码 器 信 道 编 码 器 信 道 解 码 器 语 音 解 码 器 编码器 自适应 编码器 自适应 语 音 解 码 器 信 道 解 码 器 信 道 编 码 器 语 音 编 码 器 移动台 ms 基站 bts 代码转换器 trau 上行链路 模式命令 下行链路 模式指示 下行链路 下行链路 建议模式 上行链 路模式 上行链路 基于 amr 技术的 gsm 网络优化方法研究 8 音。在编码部分需要抽取下列典型参数:线性预测(lp)滤波器系数、自适应码本 (acb)和固定码本(fcb)索引以及2种码本的增益12 13 14。其原理如图2.2所示19。 图2.2 amr编码原理 2.1.4 amr 编解码器原理框图 amr语音编码器由一个多速率语音编码器、信源控制的速率方式(scr)、能够 有效克服传输错误和丢包的错误消除机制组成。多速率语音编码器是一种单个集 成的语音编码器, 包含8种固定的信源速率模式, 编码速率分别为4.75kb/s、 5.15kb/s、 5.90kb/s、6.70kb/s、7.40kb/s、7.95kb/s, 10.20kb/s和12.2kbps。此外,还包括低速率 的背景噪声编码模式,这种编码器能根据命令在每20ms语音帧中改变其速率33 34 35。amr语音编解码的原理框图如图2.3所示。 图2.3(a) amr语音编码器发送端框图 自适应码本 固定码本 lpc加权 合成滤波器 最小加权 感觉误差 感觉加权 滤波器 原始语音 s(n) e(n) 8bit/a律pcm码 转化为13bit线性 pcm码 lpfa/d 1 2 话音激活检测 语音编码器 舒适背景噪声发 射函数 3 6 4 5 不连 续发 射控 制和 操作 6 7 vad 语音帧 sid帧 发送类型标志 tx_type 信息比特 发射端 基站子系统 第二章 自适应多速率语音编码的基本原理和关键技术 9 图2.3(b) amr语音编码器接收端框图 图中, 是 8bita 律或 u 律 pcm,采样速率为 8000 sample/s; 是l3bit均匀pcm,采样速率也是8000 sample/s; 话音激活检测标志(vad); 是编码后的语音帧,帧长为20ms,每帧中的比特数取决于amr编码器模式; 是静默描述帧(sid); tx_type是发送指示,用2bit来表示发送的是语音还是静音信息,指示如果是 语音,信息比特有效,否则是静音信息; 是传给接入网的信息比特; 是从接入网接收的信息比特; rx_type,接收帧类型指示,量化为3比特; 是接收的静音描述; 是终端自适应函数; amr解码器分为三部分:译码部分、语音合成和后滤波。在解码器输入端, 从接收的比特流中获得线性频谱对(lsp)矢量、自适应码本和代数码本参数(索 引和增益)等。lsp参数还需要转化为lp滤波器系数,再根据lp滤波器系数内插 得到各子帧的合成滤波器系数。激励矢量由自适应码本和代数码本经各自的增益 加权后获得,将激励矢量输入合成滤波器得到重建的语音信号。最后,重建的语 音信号还需要经过后滤波处理。 2.2 amr 语音帧格式 2.2.1 amr 语音帧格式 amr帧结构分为3部分,即amr报头、amr辅助信息和amr核心帧15。 amr语音编码器的帧结构有两种,分别为amr interface format 1(amr if 1) 不连 续发 射控 制和 操作 语音帧替换 语音解码 舒适背景噪声 接收函数 13bit线性pcm码转 化为8bit/a律pcm码 lpfd/a 9 8 1 0 11 接收类型标志 rx_type 信息比特 sid taf 4 5 sid帧 语音帧 2 1 基站子系统 接收端 基于 amr 技术的 gsm 网络优化方法研究 10 和amr interface format2 (amr if2)。 amr if1指的是一般的(普通的)帧格式, amr if2主要和itu- th一系列协议连接时使用。 1) amr if1帧格式 amr if1帧分为三部分,即amr报头、amr辅助信息和amr核心帧。amr 报头部分包括帧类型和帧质量指示;amr辅助信息包括模式指示、模式请求和编 码器循环冗余校验(crc );amr核心帧由语音参数构成,分别由类型a,类型b或 类型c构成,如果是舒适背景噪声帧,它就是舒适背景噪声参数,此时核心帧由类 型a构成,且不考虑类型b和类型c。图2.4给出了amr if1帧格式。 图2.4 amr if1帧结构图 2) amr if2帧格式 amr if2帧类型和核心帧与amr if1的帧类型和核心帧一样。而比特填充主要 是为了使amr if2中的每一帧比特数为8的倍数, 即在每一帧最后填充0使该帧比特 数总和为8的倍数。图2.5给出了amr if2帧格式。 amr报头 帧类型(4比特) 帧质量指示(1比特) amr辅助信息 模式指示(3比特) 模式请求(3比特) 编码器crc(8比特) amr核心帧(语音和噪 声数据) 类型a(比特) 类型b(比特) 类型c(比特) 第二章 自适应多速率语音编码的基本原理和关键技术 11 图2.5 amr if2帧结构图 amr的帧长如表2.2所示: 表 2.2 amr 语音编码器的信源编码速率表 编码模式 编码比特率/kbps 比特/帧(20ms) a 类比特数 b 类比特数 c 类比特数 mr475 4.75 95 42 53 0 mr515 5.15 103 49 54 0 mr59 5.90 118 55 63 0 mr67 6.70 134 58 76 0 mr74 7.40 148 61 87 0 mr795 7.95 159 75 84 0 mr102 10.20 204 65 99 40 mr122 12.20 244 81 103 60 2.2.2 amr 帧类型 amr帧类型可以指示8种amr语音编码模式或4种舒适噪声模式,以及空帧, 如表2.3所示。除此之外,有3帧类型索引被保留备用。对模式指示和模式需求,分 配了3bit16 1718。 帧类型(4比特) amr核心帧(语 音和噪声数据) 类型a(比特) 类型b(比特) 类型c(比特) 比特填充 基于 amr 技术的 gsm 网络优化方法研究 12 表 2.3 amr 帧类型和编码速率对应表 帧类型索引 帧内容 amr 模式,柔和噪声或其它 0 4.75kbps 1 5.15kbps 2 5.90kbps 3 6.70kbps pdc- efr 4 7.40kbps is- 641 5 7.95kbps 6 10.2kbps 7 12.2kbps gsm efr 8 amr 柔和噪声帧 9 gsm- efr 柔和噪声帧 10 is- 641 柔和噪声帧 11 pdc- efr 柔和噪声帧 12- 14 备用 帧质量指示说明帧中的数据是否包含错误,见表2.4,占用1bit。 表2.4 帧质量指示的定义 帧质量指示(fqi) 数据质量 0 坏帧(比特用来支持错误隐藏) 1 好帧 amr报头数据定义了帧的发射类型tx_type和接收类型rx_type,见表2.5. 表2.5 帧质量和帧类型与tx_type和rx_type间的对应关系 帧质量 指示 帧类型索 引 tx_type 或 rx_type 注释 1 0- 7 speech_good 特殊帧类型采用选用的比特率 特殊帧类型采用选用的比特率 0 0- 7 speech_bad 破坏的数据可以作为错误隐藏的参考 1 8 sid_first 或 sid_update sid_first 和 sid_upadate 用类型 a 比特来区分 0 8 sid_bad 1 9- 11 sid_update 0 9- 11 sid_bad 1 15 no_data 典型无传递帧、抹去帧或偷帧作为错误隐藏 2.3 amr 中的关键技术 amr 技术在理论上属于 celp 编码的变速率语音压缩编码, 在可变速率上引 入了新的关键技术。其中包括:用来检测语音通信时是否有话音存在的话音激活 检测(vad,voice activity dectector)技术;为突出“变”速率而进行速率判决的 (rda, rate decision algorithm)的自适应技术;为避免语音帧丢失后带来负面 第二章 自适应多速率语音编码的基本原理和关键技术 13 效应的差错隐藏(ecu, error concealment units)技术;为克服背景噪声不连续 的舒适背景噪声(can, comfort noise aspects)生成技术等37 38。下面将给出这 些关键技术的基本原理和功能。 2.3.1 话音激活检测(vad) 话音激活检测是语音编码中一项非常关键的技术,有利于降低平均编码速率, 节约传输带宽6。 在语音通信的正常电话交谈中,交谈过程是双方交替进行的,平均下来每方大 约占据50%的时间是不说话的通话时间,在通话间断期,每个语音帧只包含背景噪 声。通话双方有话音时称为话音突发(talkspurt)或者话音激活(active),停顿称为静 默(slience) 7。产生这种现象主要有三方面原因: 会话双方一般情况总是一方在讲话,另一方在听,基于统计理论,这段时 间各占50%; 讲话时,必然存在句子与句子、词与词之间的停顿; 人的发音本身也存在音节间的停顿。 信源控制的速率通过考虑到语音信号不激活的情况, 即在输入信号仅为背景噪 声的情况下,用低于通常情况的比特率对输入的语音信号进行编码。这样使得在 输入信号仅为背景噪声的情况下,具有如下优势: 节省移动台的功率,用户端设备的耗电量减少,可以使得较小的电池进行 长时间的通话; 平均传输比特率减小,降低整个网络的干扰和负载,在网络负载减少和语 音质量提高的同时提高网络实用效率。 为实现间断传输方式,首先必须表明什么时候需要或不需要传输语音信号,因 此必须检测当前帧是否有语音激活,这就是话音激活检测。 话音激活检测算法的基本原理是用部分语音编码参数和子带电平估计得到的 能量信息,来检测信号帧是话音帧还是非话音帧。从输入语音信号的每一帧中提 取一些可测量的特征值,跟纯噪声环境下设定的阈值相比,若测量值超过阈值, 则认为有语音,否则认为没有话音或者只有噪声信号。阈值要根据噪声环境不断 的变化而及时的更新,vad输出为相应于每一帧的二元(0或者1)判决序列。其 基本原理如图2.6所示。 基于 amr 技术的 gsm 网络优化方法研究 14 图 2.6 amr 话音激活检测算法原理图 从上图可以看出,vad的输入是输入语音本身和amr语音编码器计算出来的 参数集,vad用这些信息来决定每20ms的语音帧是否包括语音。通过计算连续几 帧的部分语音编码参数(vad参数的计算),来决定用何种方法判断话音的存在 与否(vad判决方法)。vad算法的输出结果是布尔值(“l”或“0”),用于指示当 前信号帧是话音帧(有话)还是非话音帧(无话),如果输出是“1”,则说明当前 信号帧是话音帧;如果输出是“0”,则说明当前信号帧是非话音帧。 作为速率选择的重要依据,判断的正确与否会直接影响语音质量和编码效率, vad决策的最终结果用于实现变速率传输。 编码器根据输入数字语音信号的短时特性来确定编码速率。 在源控变比特率语 音编码中,编码器是根据语音的短时特性动态分配编码比特,目的是为了在确保 语音质量的同时给每一帧语音分配尽可能少的比特,降低平均编码速率。经过话 音激活检测的语音,可以根据判决值编码,如果是激活帧就用较高的比特率编码, 如果是静默帧用很低比特率 (甚至为0) 进行编码。 图2.7为vad算法的简化功能表。 图2.7 vad算法简化功能表 滤波器组和 子带电平计算 基音检测 音调检测 复合信号分析 vad 判决 s(i) t_opn ol_ltp 相关矢量 leveln pitch tone complex_warning complex_timer vad标志 第二章 自适应多速率语音编码的基本原理和关键技术 15 2.3.2 速率判决(rda) 速率判决技术是变速率语音编码中最关键的技术之一。它主要包括信源控制 速率(scr, source controlled rates)技术和信道控制速率(ccr, channel controlled rate)技术。 vad 技术为 rda 技术实现信源控制速率操作提供了保障,再结合信道质量 的信息实现信道控制速率操作,就可以实现真正意义上的“变”速率语音编码。 amr 算法采用了 scr 和 ccr 相结合的技术来实现速率的判决。 1) amr 中的 scr 技术基本原理 在amr中scr实现的功能如下: 发送端的话音激活检测; 发送端对背景噪声的估计,并将有关的特征参数传给接收机; 接收端根据这些特征参数在不发送语音期间重构与发送端类似的背景噪 声。 amr 中 8 种速率的切换就是通过源控速率机制完成的: 在编码器端决定当前 帧的编码模式,并将该模式参数通过信息位一起编码传送到接收端,接收端将根 据模式指示和接收类型等决定当前帧的内容及解码方式。 整个系统如图 2.8 所示: 图 2.8 源控速率机制 传输端源速率控制处理器传送由传输类型标明的传输帧到组帧单元。 每帧包括 信息位,编解码模式指示和传输类型。传输类型被用来指明传输的语音参数帧的 内容。表2.6列出了各种传输类型以及相应的信息位内容。 如果遇突发事件使发送端的scr功能丧失,则发送端的scr控制器就连续产生 语音帧, 而且这时的帧类型是“speech_good”; 如果发送端的scr操作正常运行, 则用vad标志来控制scr操作。 语音编码 话音激活检测 舒适噪声参数 估计 信息包 传输及分类 语音编码 错帧消除 舒适噪声产生 信息位 模式信息 发送类型 信息位 模式信息 发送类型 基于 amr 技术的 gsm 网络优化方法研究 16 表2.6 amr传输参数表 tx_type 信息比特 模式指示 speech_good 无错语音帧,根据不同编码模式,编 码长度 95- 244, 当前编码模式 speech_bad 损坏的语音帧,根据不同编码模式, 编码长度 95- 244 当前编码模式 sid_first 话音末端标志(第一静音描述帧) ,35 个舒适噪音参数都被置为“0” ,不包 括信息比特 如果帧类型是 “speech_good” , 则选 用相应的编码模式 sid_update 舒适噪音参数,35bits,无错 sid 帧 如果帧类型是 “speech_good” , 则选 用相应的编码模式 sid_bad 舒适背景噪声,35bits,损坏的 sid 帧 (坏 crc) 如果帧类型是 “speech_good” , 则选 用相应的编码模式 no_data 无有用信息,无信息需要发送 无有用信息 当系统重新设置后,为确保发送端的scr操作正常运行,将所有帧都视为无限 长时的语音帧。因此,为确保舒适背景噪声参数在接收端进行正确计算,即使vad 指示为无声状态,重新设置后的前7帧都必须被指示为“speech_good”。 当系统正常运行以后,vad将一直运行,对每帧进行评估以确定其是否为语音 帧,并输出二进制标识符,该标识直接决定了发送端的scr操作。当检测到有语音 时,语音编码输出帧将加上“speech_good”标志,直接传输给接入网络(an)发 出去; 当一段语音结束时, 将需要八个连续帧区产生一个静音描述帧(sid, silence descriptor)。通常,为了增强sid帧的质量,采用了延迟保护功能,即在语音结束 后的前7帧都加上“speech_good”指示直接传输给接入网络,而第8帧标志指示 为“sid _first”,“sid_first”帧不包含任何数据。图2.9给出了相应的延迟保护 示意图。 图2.9 用于amr中scr的延迟保护示意图(23 elapsed n) ssssssssssfnnun 353637383940414243444501 帧长 20ms vad标志 最后一个话音帧 话音突发的结束 第一个静默帧 tx type 第二章 自适应多速率语音编码的基本原理和关键技术 17 图中,“s” = speech; “f” = sid_first; “u” = sid_update; “n” = no data elapsed n表示从最后一个sid_update帧后的帧数; 如果语音的脉冲末端距上一个sid_update帧开始计算少于24帧, 那么就将最 近分析的sid_update帧直接传递至接入网络,直到最新的sid分析有效,这样就 避免了延迟等待而减少了网络负载。一旦sid_first帧被发送,只要连续无语音, 发送端的scr操作就周期性地 (每8帧) 发送sid_update帧, 第一个sid_update 帧需要在sid_first帧后的第三帧发出。如果发送类型是“speech_good”,则语 音编码器就以全速率语音模式运作,因为不是所有的语音编码都需要舒适背景噪 声参数估计,而且舒适背景噪声参数是按确定的时间间隔产生的。 在接收端接收语音分组并且重新组合语音参数, 根据当前接收帧类型及解码器 所处状态决定当前的解码方式。tx_type= “no data”表明信息位和编码模式都 不包括任何有用的信息(此帧不通过网络传输)。这种传输系统就是非连续传输 (dtx)系统,其目的是在编码器和接入网之间提供一种选择以便节省网络带宽。 接收端接入网将所有接收到的帧经过解帧器传送到接收端的scr控制器。 接收 端的scr控制器根据接收到的帧类型进行操作, 它有两个主要模式: 语音(speech) 模式和舒适背景噪声(comfort_noise)模式,初始的模式是speech。 接收端的scr具体操作过程为: 当接收到的帧被确认是 speech_good帧时,接收端的scr操作就进入 speech模式,这是scr操作器将接收到的语音帧直接传送给语音解码器进行译 码。 如 果 接收 端 的 scr 操作 进 入speech 模式 , 而接 收到 的帧 被 确 定 为 speech_bad或no_data,则scr控制器将接收到的语音帧进行弱化或用静音 替代。 如果接收端的scr操作进入 comfort_noise模式,而接收到的帧被确认为 sid_first或sid_update帧,则scr控制器就产生舒适背景噪声;而当接收到的 帧被确定为 sid_bad帧时,则scr控制器就将 sid_bad帧用静音替代。在 comfort_noise 模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论