(通信与信息系统专业论文)ngn媒体网关中的信号识别模块设计方案研究.pdf_第1页
(通信与信息系统专业论文)ngn媒体网关中的信号识别模块设计方案研究.pdf_第2页
(通信与信息系统专业论文)ngn媒体网关中的信号识别模块设计方案研究.pdf_第3页
(通信与信息系统专业论文)ngn媒体网关中的信号识别模块设计方案研究.pdf_第4页
(通信与信息系统专业论文)ngn媒体网关中的信号识别模块设计方案研究.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(通信与信息系统专业论文)ngn媒体网关中的信号识别模块设计方案研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京邮电大学硕士研究生学位论文摘要 摘要 本文给出了一个信号识别模块的设计方案,将进入媒体网关的话音、话带数 据、d t m f 和单音信号进行分类,以便媒体网关对不同的业务类别以不同的服务 质量和标准去处理。 信号分类器基于统计模式识别的方法设计,选取了可分性最优的双参数组 合,采用了分段线性判决规则。在帧长为3 2 m s 时,话音的识别率为9 7 3 4 ,话 带数据的识别率为9 8 6 0 ,d t m f 和单音信号的识别率接近1 0 0 。 本文讨论了加性高斯白噪声对分类器的影响,实验结果表明,信噪比不低于 1 6 d b 时,分类器具有较强的抗噪声性能。 本文还给出了基于统计最优的贝叶斯分类器,最后探讨了信号识别卡的设计 方案。 关键词:信号识别;信号分类器:话音;话带数据;d t m f 南京邮电大学硕i :研究生学位论文a b s t r a c t a b s t r a c t t h ep a p e rp r e s e n t sad e s i g no fs i g n a ld i s c r i m i n a t i o nm o d u l et oc l a s s i f ys p e e c h , v o i c e b a n dd a t a , d t m fa n dt e l e p h o n yt o n ee n t e r i n gi n t om e d i ag a t e w a y , s oa st ot h e m e d i ag a t e w a yc a l ld e a ld i f f e r e n tt y p eo fs e r v i c e sw i t ht h e i ro w nd i f f e r e n tq u a l i t ya n d s t a n d a r dr e q u i r e m e n t s s i g n a lc l a s s i f i e ri sb a s e do ns t a t i s t i c a lp a t t e r nr e c o g n i t i o nm e t h o d s f i r s t l y , w ed o al o to fe x p e r i m e n t st os e l e c tt h em o s td i s c r i m i n a b l ec o m b i n a t i o no ft w op a r a m e t e r s , u s ep i e c e w i s el i n e a rd e c i s i o nr u l e w h e nt h ef r a m ef r a m es i z ei s3 2 m s ,t h es a m p l e r e c o g n i t i o nr a t ei s9 7 3 4 f o rs p e e c h , 9 8 6 0 f o rv o i c e b a n dd a t a , a n dn e a r l y10 0 f o rd t m fa n dt e l e p h o n yt o n e t h e nw ed i s c u s st h ei n f l u e n c eo fa d d i t i v ew h i t eg a u s s i a nn o i s eo nt h ec l a s s i f i e r , t h ee x p e r i m e n tr e s u l t si n d i c a t et h a t ,w h e nt h es n ri sn o tl e s st h a n16 d b ,t h ec l a s s i f i e r h a ss t r o n ga n t i n o i s ep e r f o r m a n c e a n dt h e n ,t h ep a p e ra l s or a i s e dt h es t a t i s t i c a lo p t i m a lb a y e s i a nc l a s s i f i e r a tl a s t , w ed i s c u s s e dt h ed e s i g ns c h e m eo f s i g n a ld i s c r i m i n a t i o nc a r d k e y w o r d :s i g n a ld i s c r i m i n a t i o n ;s i g n a lc l a s s i f i e r ;s p e e c h ;v o i c e b a n dd a t a ;d t m f i i 南京邮电大学硕士研究生学位论文 缩略语 d f r d s p d t m f f s k h d l c i i r i n i p i s d n i t u t r l s t p m c b s p m g c p n g n p c m p s k p s t n q a m r t p s n r s p s s s s 7 s t m t d m v a d 缩略语 d i s c r e t ef o u r i e rt r a n s f o r m离散傅立叶变换 d i g i t a ls i g n a lp r o c e s s o r 数字信号处理器 d u a lt o n em u l t i p l ef r e q u e n c y双音多频 f r e q u e n c ys h i f tk e y i n g 移频键控 h i g hl e v e ld a t al i n kc o n t r o l 高级数据链路控制 i n f i n i t ei m p u l s er e s p o n s e无限冲击响应 i n t e l l i g e n tn e t w o r k 智能网 i n t e m e tp r o t o c o l网际协议 i n t e g r a t e ds e r v i c e sd i g i t a ln e t w o r k 综合业务数字网 t e l e c o m m u n i c a t i o ns t a n d a r d i z a t i o ns e c t o rf o ri t u 国际电联标准化局 i n t e r a c t i v ev o i c er e s p o n s e交互式语音应答 l o ws i g n a l i n gt r a n s p o r tp o i n t低级信令转接点 m u l t i c h a n n e lb u f f e r e ds e r i a lp o r t多通道缓冲串口 m e d i ag a t e w a yc o n t r o lp r o t o c o l媒体网关控制协议 n e x tg e n e r a t i o nn e t w o r k下一代网络 p u l s ec o d em o d u l a t i o n脉冲编码调制 p h a s es h i f tk e y i n g移相键控 p u b l i cs w i t c h e dt e l e p h o n en e t w o r k公共交换电话网 q u a d r a t u r ea m p l i t u d em o d u l a t i o n 正交幅度调制 r e a l t i m et r a n s f e rp r o t o c o l实时传输协议 s i g n a ln o i s e r a t i o信噪比 s t a t i s t i c a lp a c k a g ef o r t h es o c i a ls c i e n c e s 社科统计软件包 s i g n a l i n gs y s t e m7 7 号信令系统 s y n c h r o n o u st r a n s f e rm o d e同步转移模式 t i m ed i v i s i o nm u l t i p l e x i n g 时分复用 v o i c ea c t i v i t yd e t e c t i o n语音激活检测 4 8 南京邮电大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的 地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包 含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材 料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了 明确的说明并表示了谢意。 研究生签名:夺鸸日期 南京邮电大学学位论文使用授权声明 南京邮电大学、中国科学技术信息研究所、国家图书馆有权保留 本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其 他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一 致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布 ( 包括刊登) 论文的全部或部分内容。论文的公布( 包括刊登) 授权 南京邮电大学研究生部办理。 研究生签名:夸酮为导师签名:煎盟吼丑型王 南京邮电大学硕i i :研究生学位论文 第一章概述 1 1n g n 介绍 第一章概述 。 当前电信网络存在着两种类型的网络语音网和数据网。随着数据业务的 快速增长,目前这种网络结构已经不适用于新业务的发展:语音网和数据网的分 离接入( 分别有交换机和路由器) 需要巨大的投资:两个网络的功能和处理的重 复也造成许多不必要的浪费;由于新业务的开发,大量的拨号数据业务造成传统 的语音网络的拥塞,而i p 网由于无电信级的数据语音业务无法满足用户需要。 这些都迫切需要一个融合语音和数据的网络。 在下一代网络( n g n ) 中,将采用分布式的网络结构,其核心概念是软交换。 软交换的主要设计思想是分布式的结构,也就是业务层、控制层与传送层、接入 层分离,各实体之间( 控制层设备和传输层设备之间) 通过标准的协议进行连接 和通信,这样可以使得整个电信网提供业务更加灵活,为电信网带来了开放性、 灵活性和多业务性f 2 0 】。 1 2媒体网关 n g n 网络解决方案可提供所有p s t n i s d n 的业务和性能,包括语音、传真、 数据、补充业务、i n 、c e n t r e x 和计费,同时提供e 1 、s t m - 1 ( 光口) 等接口用 于与现有p s t n 网络互通。 图卜l 准直联方式虚中继网络结构 南京邮电大学硕l :研究生学位论文第一章概述 广茨网 1 ( 焦佥圆苤) l h 2 4 8 m g c ph 2 4 8 m g c p , 图1 - 2 直联方式虚中继网络结构 从图1 - 1 、图1 - 2 中我们可以看到,媒体网关在软交换的控制下,实现t d m 和i p 媒体流的转换,从而在i p 数据网上建立“虚中继 。 媒体网关位于软交换网络的媒体接入层,它将一种网络中的媒体转换成另一 种网络所要求的媒体格式。根据媒体网关设备在网络中的位置,可以将其分为中 继媒体网关、接入媒体网关、综合接入设备和综合接入网关。中继媒体网关位于 p s t n 网络和i p 网络之间,业务流通过电路交换机的中继电路进入或离开媒体网 关,再将p s t n 话路语音通过i p 网络进行传送,其主要功能是实现媒体数据流在 i p 网络中的传输。 为满足语音处理的需求,中继媒体网关需要具有以下功能: 1 不同编码技术 中继媒体网关应支持的基本编码形式如下: g 7 11 ( a 律p 律) 【2 】;g 7 2 3 1 1 4 】:g 7 2 9 a 和b 【3 l 。 g 7 1 1 支持的传输速率是6 4 k b i t s ( 不包括包头) ,g 7 1 1 编码可以用于透 明的传送传真和m o d e m 的信号。 g 7 2 9 a 的传输速率是8 k b i t s ( 不包括包头) ,支持v a d ( v o i c ea c t i v i t y d e t e c t i o n ) 和舒适噪声生成的功能。 g 7 2 3 1 支持5 3 k b i t s 和6 3 k b i t s 两种模式。 软交换在下发消息中说明所希望的编码类型,支持的成帧时间,g 7 1 l 和 g 7 2 9 a 为2 0 m s 和4 0 m s ,g 7 2 3 1 为3 0 m s 。 2 回波抵消 中继媒体网关支持i t u tg 1 6 8 标准,与g 1 6 5 向下兼容。 可以针对每个呼叫提供回波抵消功能,在呼叫建立阶段,中继媒体网关控制 是否应用回波抵消功能。尤其,当透明传送m o d e m 和i s d n 数据信号时,回波抵 南京邮电大学硕 :研究生学位论文 第一章概述 消功能需要关闭。 3 静音抑制和舒适噪声生成 中继媒体网关可以被配置成检测静音阶段,停止发送r t p 包,这样可以减少 占用带宽。 4 信号音的检测和生成 中继媒体网关应能正确检测传真及m o d e m 信号,关闭回波抵消功能,可以将 编码切换到g 7 1 l ,使用r t p 协议将数据透明地传送到另一个媒体网关。对于传 真信号,一种可以采用的协议是t 3 8 f 5 1 ,该协议对传真信号实施解调与再调制, 将基带信号打包传输,并可以采用前向纠错方式,我的同学王艳艳进行这方面的 研究。 1 3论文背景 本文是对n g n 媒体网关中的信号识别模块设计方案研究。低比特率语音编码 可以将6 4 k b i t s 的单路话音以电信质量压缩至8 k b i t s 、6 3 k b i t s 甚至 5 3 k b i t s ,有效地节省带宽。然而话路中同时存在话带数据和信号音,对话带 数据使用低比特率编码会造成误码率的急剧提升,尤其是高速m o d e m 信号,所以 必须采取不同的编码方式;低比特率语音编解码器无法保证完全正确自动识别和 生成双音多频( d t m f ) 和其它电话音信号,需要检测出这些信号,并发送描述信 号音内容的控制消息而不是通常的音频数据包【7 】。 i p 网络中,不同的业务类别对信号的传输要求各异。话音可以采用高效的 压缩算法而获得更低的编码速率,但不兼容话带数据业务和信号音,因此打包前 必须准确区分,根据实际情况以不同的服务质量和标准去处理。 对于中继电路中的话音、话带数据和d t m f 信号的识别和分类有着非常显著 的意义。通常基于信号码流的识别方法有两种:协议分析法和波形分析法。 协议分析法是在通信建立之前,主叫方与被叫方之间有一个握手过程。以传 真为例,两台传真机通过发送握手信号来建立连接,协商发送传真的波特率和调 制方式。握手信号采用h d l c 帧格式,协议分析法就是基于对h d l c 帧的分析来识 别传真信号。但是非标准传真的使用给协议分析非标准规程的握手信号带来了困 难。其次,在通信过程中,首次拨号由交换机识别,并完成主叫与被叫之间的接 南京邮电大学硕j j 研究生学位论文 第一章概述 续,二次拨号乃至多次拨号的识别则需由媒体网关来完成,在i v r 语音交互业务 平台上,这种多次拨号是不可缺少的。 波形分析法是通过直接对输入信号进行分析,提取信号的时域和频域特征, 加以综合,来判决信号的类别。话音、话带数据和d t m f 信号的时域和频域的统 计特征差异为采用波形分析法识别提供了依据。 1 4统计模式识别 中继线路信号的识别问题是一种典型的模式识别应用,它试图从信号的时域 和频域提取出典型的特征,并用一种比较好的方法把不同的识别参数在特征空间 中划分开来。基于统计的模式识别系统主要包括:信息获取、预处理、特征提取 和选择、分类器设计、分类决策【1 9 】。 训练过程 图1 - 3 模式识别系统的基本构成 评估识别算法好坏的标准有: 识别率,尤其是在低信噪比条件下的识别准确性; 运算量,即在特征参数提取和分类决策过程中所进行的加法和乘法计算的次 数; 实时性,即能否实时完成信号的识别,它依赖于执行信号分类算法的硬件的 处理速度。 南b 邮电 学碗l 。w 究生学位论立 挚一帝特缸参数提取 第二章特征参数提取 识别的关键是提取反映话音和话带数据本质的特征参数集,并从集合中选择 最有效的参数设计分类器。特征参数提取解决时域信号的数字表示问题,而特 征参数选择则通过选取有效的特征为模式的划分提供数据。通常,信号的特征参 数从时域和频域中提取。 2 1中继线路信号的特征 2 1 1 话音信号的特征 语音是非平稳时变信号,其幅度服从g a r a m a 分布,可用l a p l a c e 或6 a u s s 分布近似,。语音信号主要分“浊音”和“清音”。清音信号波形起伏小,能量小, 频谱较平坦。类似白噪声频谱能量分布在整个频率段内,无明显衰减;浊音信 号波形起伏大,能量大,具有一定的周期性,频谱能量大部分集中在低频部分 ( 3 0 0 8 0 0 h z ) ,衰减较快,呈现锯齿状。另外,浊音信号有一些重要的参数 如基音周期、共振峰等。 图2 - 1 语音信号时域波形和频谱 南京邮电大学顶士研究生学位论文 第二章特征参数提取 k 参 ll ln j业j 叩v 飞l。m 。一l 岫i 1 f 一矿1”w 旧y ;h ! 帆 r il。 呵 i 幽谢一ki 甜一撕一浙一谢 2 1 2 话带数据的特征 图2 2 浊音和清音频谱 话带数据信号目前主要是m o d e m 及f a x 信号,可分为低速和高速。低速m o d e m 信号采用f s k 、p s k 调制技术,其数据速率一般低于2 4 0 0 b p s 。高速m o d e m 采用 q a m 调制技术,采用回波抵消进行信道分割,只用一个载频,取1 7 0 0 h z 或1 8 0 0 h z , 速率可高达3 3 6 k b p s 或更高。 表2 一lg 7 6 3 1 1 支持的m o d e m 类型及比特率 调制解调器比特率( b i t s )工作模式 v 2 l3 0 0全双工 v 2 2 6 0 0 ,1 2 0 0全双工 v 2 2 b i s2 4 0 0全双工 v 2 3 1 2 0 0 半双工,字符模式 半双工,连续模式 第1 ,2 类模拟传真 v 2 62 4 0 0 全双工 v 2 6 b i s 1 2 0 0 ,2 4 0 0半双工 v 2 6 t e r 1 2 0 0 ,2 4 0 0全双工 v 2 7 b i s 2 4 0 0 ,4 8 0 0半双工 v 2 7 t e r2 4 0 0 ,4 8 0 0 半双工 三类传真 v 2 9 4 8 0 0 ,7 2 0 0 ,9 6 0 0半双工全双工 三类传真 南电太 宄4 学位论z 一e 特口# 数* n v3 2 2 4 0 0 ,4 8 0 0 9 6 0 0 全双工 v 3 39 6 0 0全双工 罔2 3 传真信号的时域波形和频谱 话带数据的一些特征: i 在数据链路建立阶段有个握手过程,包括呼叫、应答、发送状态序列、 训练序列、速率检测序,等。除握手过程,话带数据是不包含静默期的连续信号, 信号电平基本稳定。 2 由于m o d e m 内部配各成形滤波器,频谱比较规则。f s k 、p s k 是载频恒定 的恒包络信号,q a m 是载频恒定的正交幅度调制波,信号的包络大小由。a m 信号 点集决定。 2 13d t v a 。信号的特征 d t m f ( 双音多频) 信令是电信系统中一种广泛应用的标准。d t m f 信号是由 两个频率信号叠加而成的,其中一个频率取自低频段( 小于l k h z ) ,另一个取自 高频段( 1 2 k h z ) 。高低频段各有4 个频率,两频段中的任意两个组合可表示 1 6 个不同的d t m f 信号,如表2 2 所示。这8 个音额信号的各频率间不存在谐波 关系,大大减少了虚假信号的干扰,因而d t m f 信号工作可靠性高,特别是抗干 扰能力很强。 南京邮电大学硕士研究生学位论文 第二章特征参数提取 表2 - 2d t m f 信号频率及对应键值【6 1 = ( h z 芝: 1 2 0 91 3 3 6 1 4 4 7 1 6 3 3 低频群) 6 9 7l23a 7 7 0 456b 8 5 2789c 9 4 1 ,i c 0#d 2 1 4 单音信号的特征 p s t n 上的单音大致有两类:2 1 0 0 h z 单音和非2 1 0 0 h z 单音。 2 1 0 0 h z 单音来自话带m o d e m 的握手过程。为了避免回波抵消器对话带数据 的干扰,接收方的m o d e m 会向发送方的m o d e m 发送一个应答单音,来通知双方解 除回波抵消器。这个应答单音的频率是2 1 0 0 h z 。 非2 1 0 0 h z 的单音主要来自早期的程控交换机所采用的中国1 # 带内单脉冲 型线路信令,其频率是2 6 0 0 h z 。这种信令主要用于局间中继电路,包括市话局 间、长话局间和长市话局间。 g 7 6 3 支持的非2 1 0 0 h z 的单音还包括1 0 0 4 h z 的可选测试音、1l o o h z 的v 2 5 呼叫音以及1 3 0 0 h z 、2 0 0 0 h z 、2 4 0 0 h z 单音。 2 2信号的预处理 由于中继线路的输入信号是a 律压缩的p c m 数字信号,需要进行解扩。可以 通过查表法将信号进行扩张,转换为1 6 位的线性信号【1 7 】。 另外,需要对输入信号进行激活检测。我们假设传输信道的幅频响应对于频 带3 0 0 - - - 3 4 0 0 h z 只有+ o 5d b ( 基准频率1 0 0 0 h z ) 的偏差,高斯噪声电平通常在 一6 8 一4 2 d b m 0 范围内,我们设定信号电平的判决门限为- - 4 2 d b m o ,以8 m s 为 一帧,计算其平均功率电平。 南京邮电大学硕士研究生学位论文 第二章特征参数提取 2 3信号基本特征参数 2 3 1 短时能量 ( 1 ) 短时平均能量 短时平均能量是指将信号序列划分成一个个短时段后,某短时段信号幅度的 均方值。所谓“短时 ,一般指时间段小于3 2 m s 。缩短时间段长度有利于提高检 测速度,但最短不能小于基音周期的一半即2 m s 。 帧长为n 的信号在时刻n 的短时平均能量表示为: 麟( 以,) = 瓦1 州- 1 ) x 2 ( f ) ( 2 一1 ) 由于语音是断续的,其短时能量变化较大;话带数据除握手过程,其短时能 量变化不大。从能量谱的角度看,语音主要能量集中在9 0 0 h z 以下,而话带数据 的能量谱均匀分布在6 0 0 - 一3 0 0 0 h z ,其中大部分在9 0 0 h z 以上,故可以设计截止 频率为9 0 0 h z 的滤波器,将信号分别经高、低通滤波器,设所得信号为以( 力,) 和置( 一,) ,则有以下准则【9 l : 语音 e x ( n ,) e x ,( n ,n ) e x h ( n ,) 话带数据 e x ( n ,n ) e x h ( n ,n ) e x t ( n ,n ) ( 2 ) 短时能量变化 语音信号是非平稳信号,相邻帧的短时能量有较大的变化,而话带数据的短 时能量比较稳定。我们可以定义信号的短时能量变比为: r = 砉 ( 2 - 2 ) 其中,互、互一。分别为t 、t - 1 帧的短时能量。 当f s k 、p s k 调制时,话带数据的能量变比足一1 ;q a m 调制时,r 在 o 2 4 ,4 1 2 范围内。研究表明:如果在较长的一段时间内有万1 r 9 ,则信号 为话带数据;否则为语音【1 3 1 。 南京邮电大学硕一匕研究生学位论文 第二章特征参数提取 ( 3 ) 归一化中, b - - 阶矩 定义归一化中一5 , c - 阶矩为: 务i m 2 m , - 一l ( 2 - 3 ) 其中,啊2 专枷善u i z ( f ) | ,鸭2 专咖蓦d ,( 力。 归一化中一b - 阶矩反映了信号幅度的平均偏差 1 6 1 。研究表明:帧长取1 6 m s 时,f s k 信号的归一化中心二阶矩在 0 ,0 0 2 5 范围内;p s k 信号在 0 0 0 1 ,0 1 5 范围内;4 8 0 0 b i t sq a m 信号在 0 1 ,0 2 范围内;9 6 0 0 b i t sq a m 信号在 0 1 ,0 3 范围内。而语音信号的归一化中心二阶矩的离散性很大,约在 0 1 ,0 5 之间。 2 3 2 短时平均过零率 过零率指单位时间内信号的幅度值由正变负、由负变正的总次数。 一阶过零率z 0 用一帧语音信号采样值穿过横轴的次数表示为: z o = 去i s g n 【x ( 力) 卜s g n 【x ( ,z 一1 ) 】l ( 2 4 ) 其中,s g n 是符号函数,表示为: s 蝴舻篇髦 协5 , 过零率不受信号幅度的影响,对其分析所得的结果对于信号的整个幅度范围 都有效。话带数据具有载频,过零率大致是载频的两倍。语音的过零率有很大的 离散性,一般的经验数据是,对于清音语音,采样频率8 0 0 0 h z 条件下,其过零 率为每l o m s 内大于4 9 ,而对于浊音语音,其过零率为每l o m s 内小于1 4 。 一阶过零率对于判决语音信号有利,而对于话带数据作出判断需长时间观 察。为了弥补这种不足,引入信号导数过零点的概念,即二阶过零率。 二阶过零率z l 用一帧语音信号差值穿过横轴的次数表示为: z l = 去f s g n z ( 力) 一x ( 玎一1 ) 】一s g n 【x ( 力一1 ) 一x ( ,l 一2 ) 】f ( 2 6 ) 南京邮电大学硕士研究生学位论文 第二章特征参数提取 分别作语音和话带数据的z o z l 平面图,如图2 4 所示,可以看出语音和话 带数据位于不同的区域。话带数据为正弦调制波,信号的一阶过零率和二阶过零 率大致一样,即z o z l 。语音信号的z o 、互离散度较大;对于清音,其主要能 量集中在2 0 0 0 h z 以上,其z o 、互都较高。 得 脚 捌 鑫 1 l 图2 4 语音信号和话带数据在z o z l 平面上的分布 2 3 3 短时自相关函数 信号的自相关函数定义为: 足( d 2 专善x ( 刀) x 。+ 助( 2 - 7 ) 它反映信号中相距k 点的两个样值的相关程度。 归一化的自相关函数定义为: 是,( j ) = 疋( 詹) 疋( o ) ( 2 - 8 ) 语音信号和话带数据在频域内差异较为明显,尤其是浊音和话带数据,差别 更为显著。频域内的差异反映到时域内,就是自相关函数的差异。研究表明,帧 长n 取1 2 8 时,话带数据的相距为2 的归一化自相关函数灵,( 2 ) 除代表训练序列 的个别散点外,均为负值,且取值范围较为集中;语音信号的j 毫,( 2 ) 则散布在 - o 5 ,1 内,其中绝大多数在 o ,1 区间。结合前述的归一化中心二阶矩老,可 南京邮电大学硕士研究生学位论文 第二章特征参数提取 以对语音信号和话带数据作出较好的判决,即作老j l ,( 2 ) 平面图,可以发现话 带数据占据了整个区域的左下方,而语音信号分布在其余三个区域,这样语音信 号和话带数据就有了较明显的界限。判决准则为:若社o 3 且是,( 2 ) o ,则信 号为话带数据;否则为语音信号【l o l 。 2 3 4 基音周期 语音中的浊音又称基音,浊音的准周期称为基音周期。提取语音信号的基音 不仅可以得到基音周期,而且可以得到语音是清音还是浊音的信息。一般浊音的 基音周期在2 一- - 2 5 m s 之间,而通过提取话带数据的基音可以发现,f s k 、q a m 信 号的相关性很弱,没有明显的基音周期,类似语音信号中的清音。若对语音信号 和话带数据进行二次基音提取,则发现m o d e m 信号的二次基音的相关性仍然很 弱,表现为“清音 ,而语音信号中清音的二次基音的自相关函数有了明显的周 , 期,成了低周期的“浊音 ,同时浊音的二次基音仍是和语音周期相同的浊音。 据此特征我们可以找到识别语音信号和话带数据的依据:若一次基音提取过程中 求得的j i i ,( 七) 的最大峰值高于某一门限( 疋( o ) 的3 0 ) ,则是浊音( k 是基音周 期所在的位置) ,否则进行二次基音提取:若j ,( 七) 低于该门限,则是话带数据 信号;反之是清音。 2 3 5共振峰 使用线性预测编码分析法对语音信号和话带数据进行频谱估计,得到不同的 频谱特征:语音信号的频谱起伏比较大,第一共振峰频率在1 2 k h z 以下;话带 数据由于其能量分布在载频附近,其共振峰频率较高,一般大于1 2 k h z ,其频 谱形状大致呈钟形或马鞍形。 2 4特征参数分析 中继线路上的四类信号无论从时域还是频域,都有较大的区别。可以选择可 分性好的特征参数,使得话音信号、话带数据以及d t m f 信号的特征参数的概 南京邮电大学硕士研究生学位论文第二章特征参数提取 率分布距离应该尽可能远,设计一个分类器,将各类信号识别出来。语音信号中 的浊音和清音有明显的区别,但是清音的时域波形和频谱与话带数据十分相似, 这样会整体上影响话音的识别准确性。 南京邮电火学硕士研究生学位论文第三章特征参数选择 第三章特征参数选择 根据对话音和话带数据特征的分析,我们可以使用的识别参数包括短时能量 变比、一阶过零率、二阶过零率、归一化自相关函数、归一化中心二阶矩。使用 单一的特征参数,识别的准确性往往达不到标准的要求,一般可以几种特征参数 结合起来,综合分析取得结论。但使用大量的特征参数会极大的增加算法的运算 量,却不一定能有效的提高识别率。用少数几个特征参数进行分离器设计,不仅 在样本不多的条件下可以改善分类器的总体性能,而且在很大情况下,能够简化 特征的获取过程,以降低模式识别系统的代价。 s e w a l l 和c o c k b u r n 使用统计分析软件s p s s 对归一化中心二阶矩劈和头十 个归一化自相关函数r d ( 1 ) ,见( 1 0 ) 进行了五种不同距离测度( w i l k s l a m b d a ,u n e x p l a i n e dv a r i a n c e ,m a h a l a n o b i sd i s t a n c e ,s m a l l e s tfr a t i o ,a n d r a o sv ) 的计算,以此排列出这十一个特征参数线性识别话音和话带数据的效 果。结果显示,对于所有多个类别的话带数据和话音的识别,也( 4 ) 、岛( 5 ) 、局( 1 ) 、 岛( 7 ) 和r a 2 ) 具有最高的平均识别率,嚣的识别率仅排在倒数第二;而对于主 要的话音和话带数据的识别,五种距离测度的排列都是嚣、r d ( 9 ) 、r e ( 4 ) 、r e ( 1 ) 、 r e ( 2 ) 、r a s ) 、r e ( 3 ) 、r a l o ) 、r e ( 7 ) 、r a 5 ) 和r d ( 6 ) ,孝对于识别话音和话 带数据的非常有效;对于多个类别的话带数据的识别,兄( 4 ) 、髟( 2 ) 、髟( 6 ) 、 玛( 5 ) 和髟( 3 ) 具有最高的平均识别率【1 1 1 。 3 1类别可分离依据 特征参数选择的任务是从一组特征中挑选出一些最有效的特征以达到降低 特征空间维数。我们的目的是设计信号分类器,理论上可以用分类器的错误概率 作为标准,也就是说,使分类器错误概率最小的那组特征,就是组最好的特征。 根据模式识别理论,常用的几种判据有:用于可分性判据的类内类间距离、 基于概率分布的可分性判据和基于熵函数的可分性判据。基于概率分布的可分性 南京邮电大学硕j :研究生学位论文 第三章特征参数选择 判据中常用的概翠距离厦重包括b h a t t a c h a r y y a 距禺、c h e r n o f f 界限和敢发。 定义散度厶为区分q 类和哆类的总的平均信息,类条件概率密度函数 p ( x l r a , ) 和p ( x 1 ) 已知,两类密度函数的对数似然比为: t , j ( x 灿黜 1 ) 对哆类和哆类的平均可分性信息分别为: 弘郴】= 胁1 1 1 嬲出 ( 3 - 2 ) 似郴】= 胁h 黜出 ( 3 - 3 ) 两类平均可分信息之和: 厶= 毛+ 巳= 拟柏巾川m 揣也( 3 _ 4 ) 当类条件概率密度函数服从正态分布时,即p oiq ) :( 鸬,z ,) , p ( x l a j ) :n ( g ,) 厶可以简化为: 厶= 圭护【i 1 + ;1 ,一2 i + 三1 ( 鸬一一) r ( j 1 + j 1 ) ( 鸬一所) ( 3 - 5 ) 3 2特征参数选择 我们的待选特征参数包括短时能量变比足、一阶过零率z o 、二阶过零率z l 、 归一化中心二阶矩老和低阶的归一化自相关函数j 毫,( 1 ) ,o l i n冀,0 0 ) 。以散度作 为类别可分离性判据,假定特征参数的概率密度函数服从正态分布,采用计算量 较小的次优搜索算法,得到识别话音信号和话带数据的单个最优特征参数和最优 双特征参数组合,如表3 1 、表3 2 所示。 南京邮电大学硕士研究生学位论文第三章特征参数选择 表3 - 1 单个最优参数 参数 劈灵,( 2 ) 盖,( 1 ) 晨,( 3 ) z o 散度 8 8 9 4 0 17 8 6 2 6 25 7 7 8 115 4 7 6 8 94 4 4 2 8 0 参数 z l 冀,( 4 )晨。( 5 )晨,( 9 )晨,( 8 ) 散度 3 6 8 3 2 41 5 6 4 9 88 3 7 5 07 3 1 1 7 6 4 8 7 1 表3 - 2 最优参数组合( 双参数组) 参数 灵,( 2 ) ,爱,( 3 )j l ,( 1 ) ,嚣晨,( 2 ) ,晨,( 4 )灵,( 3 ) ,j 毫,( 4 ) 散度 6 4 7 6 5 23 8 1 6 6 9 1 9 7 4 8 31 7 6 6 5 3 参数 炅,( 2 ) ,爱掌( 5 )曼,( 3 ) ,晨j ( 5 )灵,( 4 ) ,畏,( 5 ) 散度 1 4 3 1 5 6 1 2 2 9 8 61 1 3 8 2 0 1 6 南京邮电大学硕j :研究生学位论文 第阴章信号分类器设计 第四章信号分类器设计 4 1已有算法及改进 ( 1 ) b e n v e n t u o 提出以2 0 0 0 h z 为载频对输入信号进行伪解调,然后分别计 算出解调信号的归一化中,b - - 阶矩和归一化二阶自相关函数。以这两个特征参数 作平面图,就可以有效的识别出话音和话带数据。当帧长取3 2 m s 时,对于话音 和话带数据的误识别率分别为2 3 2 和0 1 2 。 ( 2 ) s e w a l l 和c o c k b u r n 对上述算法作了简化和扩展,对输入信号进行全 波整流代替复杂的伪解调步骤,将自相关函数定义式修正为无偏估计式,考虑使 用多个低阶的归一化自相关函数作为特征参数来识别不同类别的话带数据,并基 于统计的方法来设计最优或近似最优的信号分类器。 省去对输入信号的解调对于识别的准确性影响并不大,仍旧可以得到信号的 有用信息,这里需要重新定义整流后的通带信号的归一化中, b - - 阶矩和归一化自 相关函数。 归一化中, 0 - - 阶矩为: 狰暑一l ( 4 - 1 ) 其中,铂= 专善i 孑( 叫,= 专善a 2 ( m 孑( d 为整流后的通带信号。 归一化自相关函数的无偏估计式为: 郴) = 南黟州圳 ( 4 - 2 ) s e w a l l 和c o c k b u r n 选取了归一化中,b - - 阶矩和归一化二阶、四阶、六阶自 相关函数作为特征参数,设计了一个由线性判别和准二次判别两阶段组成的信号 分类器,如图4 - i 所示。当帧长为2 5 6 m s 时,两个阶段的识别率分别可以达到 9 8 2 7 和9 9 5 4 。 南京邮电大学硕:i - 研究生学位论文 第四章信号分类器设计 信 图4 1 两阶段信号分类器 ( 3 ) s h i m o k o s h i 和h a s h i t s u m e 利用了神经网络来识别话音和非话音信号, 神经网络结构由三层前馈网络构成,学习算法使用了反向传播算法( b p 法) 。输 入信号经过模数转换后,8 通道的八阶滤波器组对信号进行时域到频域的变换。 滤波器组由一组基于g o e r t z e l 算法的d f t 组成,输入信号帧长为4 m s ,3 2 个采 样值。基于神经网络的分类器结构如图4 2 所示。神经网络经过学习后,输出1 表示语音信号,输出0 表示非语音信号。使用s 形函数作为判决门限时,仿真结 果为话音的误判率为2 7 ( 男声日文) 、1 9 ( 男声英文) ,v 2 1 m o d e m 、v 2 3 m o d e m 信号的误判率为0 ,d t m f 信号的误判率为0 3 ;使用s 形函数的近似折线作为 判决门限时,仿真结果话音的误判率为8 2 ( 男声日文) 、6 8 ( 男声英文) , v 2 1 m o d e m 、v 2 3 m o d e m 信号的误判率为0 ,d t m f 信号的误判率为0 6 ;硬件实 验条件下,话音的误判率为1 3 8 ( 男声日文) 、1 0 5 ( 男声英文) ,v 2 1 m o d e m 、 v 2 3 m o d e m 信号的误判率为0 ,d t m f 信号的误判率为0 7 1 1 2 1 。 输入信号一 图4 2 神经网络的话音与非话音信号分类器 分类标志 南京邮电大学硕十研究生学位论文第四章信号分类器设计 4 2信号识别算法 4 2 1 单音信号的检测 单音信号是确定性信号,不存在随机性,对于2 1 0 0 h z 和2 6 0 0 h z 的单音信号 的识别可以通过计算信号帧的过零率。为了防止把其它信号误判为单音信号,可 以将一帧信号分为几个子帧,分别计算每个子帧的过零率,并对各个子帧的过零 率进行差分计算,如果差值不超过2 ,则可以判定该帧信号为单音。 话路中的单音信号单一频率的正弦序列,每一正弦周期内有两次过零,每秒 过零率即为信号频率的两倍。帧长为3 2 m s 的单音信号,将信号帧分成4 个8 m s 长的子帧,那么2 1 0 0 h z 单音信号的子帧过零点数为: 2 x 2 1 0 0 上= 3 3 6 1 0 0 0 2 6 0 0 h z 单音信号的子帧过零点数为: 2 x 2 6 0 0 土= 4 1 6 1 0 0 0 实际的检测结果是:对于2 1 0 0 h z 的单音信号,一个8 m s 子帧的过零率是3 3 或3 4 ;对于2 6 0 0 h z 的单音信号,一个8 m s 子帧的过零率是4 1 或4 2 。 4 2 2d t m f 信号的检测和再生 d t m f 信号的检测主要完成对有效行列频率的检测以及对按键的判决。通常 不需要计算全部的频域信息,当计算的频率点不超过2 l o g :n 时,g o e r t z e l 算法 是计算d f t 的有效算法。g o e r t z e l 算法相当于一个二阶i i r 滤波器,其转移函 数为: 风( z ) 2 f蕊l历-e丽丽z(4-3j2zkn ) 一一- l 南京邮电大学硕士研究生学位论文 第四章信号分类器设计 x ( n y k ( n ) 图4 2g o e r t z e l 算法i j f i 程图 g o e r t z e l 算法由前向部分和后向部分组成,其后向部分差分方程为: 啪) - 2 c 0 s 譬以) 一啪- 2 ) + 删( 4 - 4 ) q ( 一1 ) = g ( 之) = 0( 4 - 5 ) 前向部分差分方程为: 以( 刀) = q ( 刀) 一孵q ( 刀一1 )( 4 6 ) 由( 4 - 4 ) 、( 4 5 ) 、( 4 - 6 ) 式有: 彳( 七) = 儿( ) = q ( 忉一孵q ( 一1 )( 4 7 ) 可以看出d t m f 信号的检测就是通过后向差分方程迭代计算出q ( ) 和 q ( n - 1 ) ,然后进行一次前向计算,从而得到所需频率的d f t 值,频率和参数的 关系为:嘉= 要,其中z 为所需检测的频率,f 为采样频率。t m f 信号检测不 必关心相位信息,对前向部分进行改进,输出幅度的平方值i x ( 尼) 1 2 即可,由( 4 - 7 ) 式有: l x ( 尼) 1 2 = 骈( ) + 研( 一1 ) 一2 c 。s ( 二2 矿z k ) q ( ) q ( 一1 ) ( 4 - 8 ) 这样不需要计算复数参数,由( 4 4 ) 、( 4 - 5 ) 、( 4 8 ) 式即可计算输入序列x ( n ) 的d f t 幅度平方值。 d t m f 检测器相当于是8 个固定参数的滤波器,参数值可由 c o s ( 等) = c 。s ( 2 以x f , ) r 角:g ,g 。e r t z e l 算法的i i r 滤波器结构,使得可以对输入 南京邮电大学硕士研究生学位论文 第网牵信号分类器设计 序列实时进行处理,将输入序列分别通过8 个滤波器计算出相应的f x ( 七) 1 2 值,和 门限比较器比较,来判断有效

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论