




已阅读5页,还剩63页未读, 继续免费阅读
(电路与系统专业论文)tms320c5402平台上g7231标准的实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 y d 2 m s d s p d i g i t a ls i g n a lp r o c e s s o r 是一种专用的数字信号处理器 随着超大 规模集成电路技术上取得的突破进展 高度集成化的d s p 数字信号处理器具有 体积小 功耗低和运算速度快等诸多优点 因此非常适用于语音信号的压缩处理 在诸多d s p 产品中 美国德州仪器 t i 开发的d s p 处理器芯片具有低成本 低功耗 高性能以及产品的多样化的优势 占据了目前d s p 市场5 0 以上的份 额 因此 在许多领域对于数字信号处理器的应用都是围绕美国德州仪器所开发 的d s p 处理器来进行的 在现代各种通信系统中 语音通信一直是一项非常重要的 必不可少的业 务 如何在不牺牲语音通话质量的前提下尽可能降低话音信号传输的比特速率是 摆在研究者面前的重要课题 同时 由于用数字化的方法进行语音信号处理是目 前发展最为迅速的信息学研究领域之一 由此诞生了许多种语音压缩处理方法 t j u t 也在此基础之上提出了一系列关于低速率语音编码的解决方案 g 7 2 3 1 标准就是其中之一 它能以5 3 k b i t s 和6 3 k b i t s 两种编码速率提供较好的语音合 成 本文从语音信号产生的离散数学模型出发 简要叙述了低速率语音编码的基 本原理 然后文章对线性预测编码声码器的一些关键技术进行了详细的论述 在g 7 2 3 1 标准的实现过程中 基于t i 公司的t m s 3 2 0 c 5 4 0 2 平台 我们首 先建立了语音编码硬件基础 对此做了比较详细的介绍 然后 分析了g 7 2 3 1 标准的结构 并提出了在t m s 3 2 0 c 5 4 0 2 平台上实现该标准的一个解决方案 最 后讨论了该方案实现过程中所遇到的一些问题及其解决途径 考虑到算法标准本身的不断改进 以及具体实现中需要重点考虑的降低算 法复杂度的问题 在论文的最后部分 就如何进一步降低编解码算法的速率及复 杂度等问题作了一些探讨 关键词 d s p t m s 3 2 0 c 5 4 0 2 3 7 2 3 1 语音编码算法 实时性 码激励线性 预测编码 低速率语音编码 a b s t r a c t d i g i t a l s i g n a l p r o c e s s o rh a s p l a y e d a l l i m p o r t a n t r o l ei nt h ed o m a i no f c o m m u n i c a t i o n w i t ht h e g r e a tp r o g r e s s e s a n ds e r i e so fb r e a k t h r o u g hi nv l s i t e c h n o l o g i e s i n t e g r a t e dd s pc o m e s i n t e g r a t e dd s p h a sl o t so f a d v a n t a g e s s u c ha s l o wp o w e rc o s t c o m p a c t n e s s h i g h e rw o r k i n gs p e e da n ds oo n d s pa r ev e r y s u i t a b l ei ns p e e c hs i g n a lp r o c e s s i n g d s pc h i p s w h i c hm a d eb yt i h e l dm o r et h a n 5 0p e r c e n ti nt h ew h o l em a r k e tb e c a u s eo fi t se x c e l l e n tq u a n t i t i e s t h e r e f o r e m o s t w o r k si na p p l i c a t i o no f d s p i nm a n ya r e a sa r ec a r r i e do u ta r o u n dt ip r o d u c t s s p e e c hc o m m u n i c a t i o n i sv e r yi m p o r t a n ta n di n d i s p e n s a b l es e r v i c ei nd i f f e r e n t m o d e mc o m m u n i c a t i o ns y s t e m s h o wt or e d u c et h eb i t r a t eo fs p e e c hw i t h o u t r e m a r k a b l yd e g r a d i n gi t sp e r c e p t u a lq u a l i t y i saq u e s t i o np l a c e di nt h ef r o n to ft h e r e s e a r c h e r s a tt h es a m et i m e t h ep r o c e s so fd i g i t a ls p e e c hs i g n a li sd e v e l o p e d r a p i d l yi n i n f o r m a t i o nf i e l d t h e r ea r em a n yw a y s h a v eb e e nb r o u g h tf o r w a r di n v o i c ec o m p r e s s i t u th a sa l s op u tf o r w a r das e r i e s o fo n e si nl o wr a t es p e e c h c o d e lr e c o m m e n d a t i o ng 7 2 3 1w h i c hh a sl o t so fa d v a n t a g e so f l o wb i tr a t es p e e c h c o d i n ga l g o r i t h m s c a nh e l p t og e th i g hv o i c es y n t h e s i sq u a l i t ya tt h er a t eo f 5 3 k b i v s a n d6 3 k b i g s b a s e do nt h ed i s c r e t ed i g i t a lm o d e l t h i sp a p e rb r i e f l y r e c o u n ts o m eb a s i c t e r m sa n dp r i n c i p l e si nl o w r a t es p e e c hp r o c e s s i n g f o c u so nt h er e s e a r c hi nt h el i n e a l p r e d i c t i v ec o d i n g a n dn a r r a t es o m ek e yt e c h n o l o g i e si nd e t a i l d u r i n gt h ec o n c r e t e l yr e a l i z a t i o n o f t h er e c o m m e n d a t i o ng 7 2 3 1 w e s e tu pt h e h a r d w a r ee l e m e n t so f t h es p e e c hc o d i n g w h i c h i st h et m s 3 2 0 c 5 4 x xd s pp l a t f o r m o ft ii n c w ei n t r o d u c e di tt o o i nt h ef o l l o w i n gw ed i s c u s st h ef r a m e w o r ko ft h e g 7 2 3 1f r o mt h es y s t e m a t i cv i e wa n db r i n go u tab l u ep r i n to fi m p l e m e n t a t i o n t h i s r e c o m m e n d a t i o n w ee v e ni n t r o d u c et h ep r o b l e m sw e m e ta n dg e tt h es o l u t i o n sw e f o u n d a tl a s t c o n s i d e r i n gt h ea l g o r i t h m sh a s b e e na n dw i l lb em e n d e d s o m e i n n o v a t i v e m e t h o d so nf u r t h e rr e d u c i n gt h e c o d e r a t ea n dd e c r e a s i n gt h ec o m p l e x i t yo f v o c o d e r sa r ei n c l u d e di nt h i sd i s s e r t a t i o n k e y w o r d s d s p t m s 3 2 0 c 5 4 0 2 g 7 2 3 1s p e e c hs i g n a lc o d e r r e a l t i m e c e l p l o w r a t es p e e c hc o d i n g 湖南太掌碗士学位论文 第一章绪论 d s p 芯片性能的不断提离和价格的犬幅下降 以及数字化产品 i n t e r n e t 和计算机的迅速普及 使得d s p 的应用范围不断扩大 d s p 应用几乎遍及整 个电子领域 其中3 c c o m m u n i c a t i o n c o m p u t e r c o n s u m e r 即通信 计算 机 消费类 领域占整个市场需求的9 0 常见的典型应用有 通用数字信 号处理 邋信 家用电脑 语音处理 图像 视频处理 自动化控制 消费电 子簿 可以预见 随饕d s p 芯片性价比的不颧提离觏数字催号处理技术的不 峨发展 d s p 芯片烬会在更广泛的领域德到鹿用 髓着享 会的发展 遴谖的终鼹斟盏提赢 可视魄话秘魄视会议 会成为 未浆重要鲍应用系统 当翦 i t u t 栋缝h 3 2 4 是在2 8 8 k b p s f 蛉雾媒体遐 售标敬 玟在蹋d s p 来开发一些遐谖产熬已逐步残为磷发的一个重点 遗谶离不 开语音浆缀玛 热楚将 g 7 2 3 1 撂准啡1 申语豢绽玛部分更好款在d s p 平台上 汇编实现并遴 步优纯 瞧蓑残羹我考惑懿臻究方良 语音缡玛技术豹磺究开始予上世纪3 0 零代发明翡声码器 但是矗到上链 纪7 0 年 弋中期 除了p c m 橡羚编码蠲京 秘a d p c m 爨遥疲差分脉冲编 码涌剽 敬褥较好鸯穹遴展辫 中鬣滗特率语音缡弱一矗没有大熬突破 在1 9 8 0 军美鬣致寤公布2 4 k b w s 的线毪预测编礴标准算法l p c 1 0 螽 线校预测编弱 成为磷究的焦点 先籍窭现了m p l p c 多踩渖激糯线性预测编弱 c e l p 鹤 激翩线性颥溺编确 算法珏1 舀前 c e l p 程 氐速率语音匿缩算法中藩予统治 葩位 j e 美的j s 9 5 l s 9 6 日本豹j d c 睾速率标准疆及i t u 豹g 7 2 3 g 7 2 8 3 7 2 9 采用的都是c e l p 算法 c e l p 克服了佼统声码器的缺点 其有压缩 率高 语音质藿较好的优点 在低速率语音编码中获得广泛的敷用 c e l p 编 码器需要大约2 0 m i p s 5 0 m i p s 的计算能力 t i 公司推出的c 5 4 x 系列d s p 芯片的计算能力高达10 0 m i p s 以上 1 最新的c 6 4 x 系列更怒高达8 8 0 0 m i p s 可以在 片d s p 芯片上实现 路或多路语音信号的编解码算法 g 7 2 3 1 济议 也包含了c e l p 编码方法 当前 对g 7 2 3 1 协议中算法的研究一直在进行 并且取得了很大的成绩 程序德到了很大的优化 但是这些研究更多的楚集中在如何减小整个算法的 复杂度方蕊 完垒独立在d s p 平台上的实现相对不是很多 3 而d s p 以其独 湖南大学硕士学位论文 特的结构和快速实现各种数字信号处理算法的突出优点 发展十分迅速 随 着计算机技术和超大规模集成电路工艺的不断发展 d s p 芯片的性能价格比 将不断提高 开发环境将更加完善 如何在d s p 平台上实现并根据d s p 芯片 的特点来优化g 7 2 3 1 协议中的相关算法应该成为研究的一个重点 本文共分为六章 具体安排如下 第一章 主要介绍研究该课题的意义 并介绍了g 7 2 3 1 编码标准以及相关 实现的发展情况 第二章 介绍了d s p 的发展以及应用 第三章 以语音信号的产生为基础建立相应的数学模型 第四章 对语音信号处理过程中线性预测分析的方法以及相关理论做了说明 第五章 首先介绍了g 7 2 3 1 算法 再根据具体情况提出了硬件结构和软件 设计方案 并针对常用的一些算法突出了自己的改进 最后给出部 分程序以及仿真波形 结论 湖南大学硕士学位论文 第二章d s p 数字信号处理器 2 1 d s p 的出现和发展 d s p 技术的发展经历了三个主要阶段 1 2 0 世纪7 0 年代 8 0 年代和9 0 年代 目前已发展到第五代产品 2 0 世纪7 0 年代的数字信号处理系统由分立 元件组成 包括部分处理器 线性电路模拟前端 a d 转换器 外围接口电 路 组合电路以及可编程逻辑阵列等 当时的数字信号处理的研究局限于理 论范围和医疗电子 生物电子和地球物理等狭窄的应用领域 7 8 年a m i 公司 发布了世界上第一个单片d s p 芯片 2 8 1 1 7 9 年美国i n t e l 公司发布的商用 可编程器件2 9 2 0 是d s p 芯片的一个重要里程碑 进入2 0 世纪8 0 年代 随着 数字信号处理技术和计算机应用范围的不断扩大 以及集成电路制造工艺的 提高 出现了集成在单个芯片上的数字信号处理器 2 0 世纪9 0 年代是数字 信号处理技术飞速发展的时期 d s p 的性能指标不断提高 而价格却不断下 降 同时d s p 也获得了越来越广泛的应用 成为不少新兴科技的主要推动力 其中包括通信 多媒体系统和消费电子等等 当前最成功的d s p 芯片当数美 国德州仪器公司 t i 的一系列产品 其d s p 市场分额占全世界市场的近5 0 f 7 今天 随着全球信息化和因特网的普及 多媒体技术得以广泛应用 尖 端科技向民用领域迅速转移 数字技术大范围地进入消费电子类产品 使d s p 不断更新换代 价格大幅度下降 各种开发工具日臻完善 从而使它成为最 有发展和应用前景的电子器件 据国际著名市场调查公司f o r w a r dc o n c e p t s 在2 0 0 0 年发布的一份统计和预测报告显示 目前世界d s p 产品市场正以每年 3 0 的增幅大幅度增长 其增长速度比整个半导体工业快s 0 倍 预计到2 0 0 7 年 全球d s p 市场总销售额将达5 0 0 亿美元 2 2d s p 的特点 数字信号处理任务通常需要完成大量的实时计算 如f i r 滤波和f f t 算 法 其中的数据操作具有高度重复的特点 特别是乘加和 m a c 操作 y a b c 在滤波 卷积和f f t 等常用的数字信号处理算法中用的最多 d s p 在很大程度上就是针对数字信号处理的运算特点设计的 与通用微处理器相 湖南大学硕士学位论文 比 d s p 在寻址和计算能力等方面作了扩充和增强 在相同的时钟频率和芯 片集成度下 d s p 完成f f t 算法的速度比通用微处理器要快2 3 个数量级i s 例如 对于1 0 2 4 点的f f t 算法 时钟相同 集成度相仿的i b mp c a t 3 8 6 与t m s 3 2 0 c 2 4 0 运算时间分别为o 3 秒和1 5 毫秒 速度相差2 0 0 倍 1 算术单元 乘法操作是d s p 的一个主要任务 在通用微处理器中通过微程序实现的 乘法操作需要1 0 0 多个时钟周期 非常费时 因此在d s p 内部都设有硬件乘 法器1 9 l 来完成乘法运算 这是区别d s p 与通用微处理器的一个重要标志 为了进一步提高速度 数字信号处理器内设置多个可并行操作的功能单 元 a l u 乘法器 地址产生器等 如在t i 公司的c 6 0 0 0 系列的d s p 内部 有8 个功能单元 即两个乘法器和六个a l u 由于多功能单元的并行操作 使d s p 在相同的时间内能够完成更多的操作 提高了程序的执行速度 定点 d s p 还设有移位单元 可以在不增加操作时间的前提下对操作数或操作结果 任意移位 2 总线结构 通用微处理器通常采用冯 诺依曼总线结构 同一的程序和数据空间 共享的程序和数据总线 由于总线的限制 微处理器在执行指令时 取指和 存取操作数必须共享总线 限制了指令的执行速度 对数字信号处理这样需 要大量数据处理的任务 冯 诺依曼总线结构大大的限制了系统的性能 因 此d s p 采用了具有独立程序总线和数据总线的哈佛结构 这样 取指和存取 操作数就可同时进行 许多d s p 甚至有两套或两套以上的数据总线 这种总 线结构被称为修正哈佛结构 对于乘法或加法运算 一条指令要从存储器中 取两个操作数 多套数据总线使两个操作数可同时取得 提高了执行效率 3 专用寻址单元 d s p 面向的是数据密集型的应用 伴随着频繁的数据访问 如果不在地 址计算上作特殊考虑 计算地址的时间比实际的算术操作时间还要长 例如 8 0 8 6 做一次加法需要3 个时钟周期 但是产生一次地址却需要5 1 2 个时钟周 期 因此d s p 内设有专门用于计算地址的单元 地址产生器 地址产生 器与算术单元并行工作 地址的计算不占用额外的时间 此外 地址产生器 还支持位反寻址 用于f f t 循环寻址等特殊寻址方式 4 指令系统 与密集的数据处理相对应 d s p 提供了丰富的单周期算术运算指令 如 湖南大学硕士学位论文 单周期乘 累加指令m a c 这些指令把在通用微处理器上至少需要两条指令完 成的功能 用一条单周期的指令完成了 极大地提高了d s p 的数据处理能力 非常适合运算密集型的应用 针对数字信号处理中迭代操作多的特点 许多 d s p 提供专门的循环指令 如6 0 0 0 的d o 指令 利用硬件实现迭代控制 不 增加额外的执行时间 5 流水处理 流水技术 3 是d s p 提高程序执行效率的一个重要手段 在处理器内 指 令的执行分为取指 解码 执行等若干阶段 每个阶段称为一级流水 利用 硬件上的并行性 若干相邻指令的不同执行阶段可以并行执行 从而提高程 序执行速度 若每一流水的执行时间为一个节拍 理想情况下 一条k 段流 水能在k n 1 个节拍内处理n 条指令 其中前k 个节拍用于完成第一条指令 的执行 其余n 1 条指令的执行需要r l 1 个节拍 而非流水处理器上执行n 条 指令则需要n x k 个节拍 当指令条数n 较大时 流水线的填充和排空时间可 以忽略不计 可以认为每个节拍内执行的最大指令数为k 但是由于程序中 存在数据相关 程序分支 中断以及一些其他因素 这种理想情况很难达到 对流水操作还有一个特殊的延迟间隙问题 即如果某条指令的执行时间 不是一个时钟周期 在指令结果可用之前要插入一个或几个节拍的等待时间 称为延迟间隙 这给编程带来了一些困难 2 3d s p 的选择 设计d s p 系统时 首先要根据应用的需要选择合适的d s p 处理器 选择 d s p 处理器主要考虑如下诸多因素 1 数据类型 d s p 按照所支持的数据结构类型不同分为定点d s p 和浮点d s p 两大类 定点d s p 进行算术处理时 使用的是小数点位置固定的有符号数或无符号数 浮点d s p 进行算术操作时 使用的是带有指数的小数 小数点的位置随着具 体数据的不同进行浮动 定点d s p 在硬件结构上比浮点d s p 简单 具有价格低 速度快的特点 因而用得最多 而浮点d s p 的优点是精度高 不需要进行定标和考虑有限字 长效应 但其成本 功耗相对较高 速度较慢 适于对数据动态范围和精度 要求高的特殊应用 2 性能 湖南大学硕士学位论文 d s p 的性能是选择d s p 的重要指标 以下是一些d s p 常用的性能指标 m f l o p s 百万次浮点操作 秒 浮点操作包括浮点乘法 加法 减 法 存储等操作 m f l o p s 是表征浮点d s p 芯片的重 要性能指标 选择d s p 芯片时要注意 厂商提供的通 常是峰值指标 因此系统设计时要留有余量 m o p s 百万次操作 秒 这里的操作 除了包括c p u 的操作外 还包括地址计算 d m a 访问 数据传输 i o 操作等 m i p s 百万条指令 秒 这是最为常用的处理器性能指标 由于d s p 芯片结构的多样性 这些指标并不能完全表征d s p 处理器的处 理能力 以m i p s 为例 t m s 3 2 0 c 6 2 0 3 采用了v l l w 甚长指令字 技术 在3 0 0 m h z 的时钟频率下其执行速度高达2 4 0 0 m i p s 而1 m s 3 2 0 c 5 4 1 6 的执 行速度最高为1 6 0 m i p s 尽管两者之间的m i p s 比值为1 5 1 在完成2 5 6 点 复数f f t 算法时 t m s 3 2 0 c 6 2 0 3 仅比t m s 3 2 0 c 5 4 t 6 快7 8 倍 这是因为v l i w 技术采用了指令较为整齐划一的指令集 每条指令所完成的工作比通常的 d s p 指令完成的工作少 其它的性能指标也存在类似的问题 对于常用的d s p 算法可咀参考d s p 厂商提供的基准 b e n c h m a r k 在系统设计时 要想得到 具体参数下的精确指标 则必须通过软件仿真器 软件评估模块等开发工具 3 存储器配置 由于d s p 面向的是数据密集型的应用 因此存储器的访问速度对处理器 的性能影响很大 大多数的定点d s p 芯片都设有片内程序 数据存储器 与片 外存储器相比 片内存储器不存在外部总线竞争和访问速度不匹配的问题 访问速度很快 可以有效的缓解d s p 的数据瓶颈 充分利用d s p 的处理能力 对于大多数嵌入式应用 其所需的程序和数据存储器较小 利用片内存储器 加少量片外存储器的配罱可以很好的满足系统的要求 但是随着应用的日益 复杂化 应用系统需要更大的存储空间 一些d s p 芯片采用片内高速缓存加 大的外部数据 地址总线的配置 在满足访问速度的同时 兼顾大容量存储空 间的需要 例如t m s 3 2 0 c 6 2 1 1 c 6 7 1 1 将7 2 k 的片内存储器作为两级高速缓存 使用 第一级高速缓存采用哈佛结构 程序缓存与数据缓存分开 各占用4 k 第二级高速缓存采用程序与数据统一的结构 大小为6 4 k 4 功耗 在便携式应用中 d s p 的功耗是选择d s p 芯片的重要指标 大多数的d s p 都具有功耗管理的能力 如在系统空闲时部分关闭系统时钟 关闭不需要的 湖南大学硕士学位论文 外设等a 一些d s p 处理器甚至提供了通过软件控制的方式改变处理器的时钟 频率的能力 d s p 厂商还针对便携式应用提供了工作于3 3 v 2 5 v 甚至1 8 v 电压下的d s p 芯片 这些d s p 的功耗比工作于5 v 下的d s p 的功耗要小得多 要精确估计d s p 的功耗大小是十分困难的 因为d s p 的功耗与d s p 上 执行的指令是相关的 大多数d s p 厂商提供的功耗参数都是在典型情况下的 参数 2 4d s p 的软件开发 在d s p 系统设计中 软件的设计对系统性能的影响是巨大的 好的d s p 代码可以充分利用d s p 芯片结构上的特点 发挥d s p 芯片的处理能力 d s p 系统的软件设计可以采用汇编语言编程 高级语言编程 一般是c 语言 和 混合语言编程三种方式 使用汇编语言开发的优势在于可以设计出非常紧凑高效的代码 缺点是 开发周期过长 不利于维护 另一方面 所有的d s p 厂商都提供高效的高级 语言编译器 这些编译器的编译效率大都超过9 0 高级语言开发所具有的 优势是不言而喻的 但是对于某些实时性要求高的应用 使用高级语言开发 的代码难以满足要求 在这种情况下可以采用混合语言编程方式 占用d s p 大部分处理能力的关键代码用汇编语言开发 非关键代码使用高级语言开发 这是目前最流行的编程方式 湖南大学硕士学位论文 第三章语音信号处理 3 1 语音信号的特点 1 语音信号的频谱分量集中在3 0 0 3 4 0 0 h z 的范围内 根据奈奎斯特采 样定理 用一个防混叠的带通滤波器将此范围内的语音信号频谱分量取 出 然后按8 k h z 的采样率对语音信号进行采样 就可以得到离散时域的 语音信号 2 语音信号具有短时性 语音信号是一种典型的非平稳信号 这是因为在 语音的形成过程中发音器官也在运动中 但是这种物理运动比起声音的 振动速度来要缓慢的多 因此语音信号常常可假定为短时平稳 即在1 0 3 0 m s 这样的时间段内 其频谱特性和某些物理特征参量可近似地看作不 变 3 2 语音信号的产生 人的发声器官由三部分组成 喉 声道和嘴 喉位于气管的上端 其中有两片肌肉 称为声带 声带之间的空隙称为 声门 说话时两片声带相互靠近但不完全封闭 这样声门变成一条窄缝 当 气流通过这条窄缝时其间的压力变小 使声带完全合拢气流不能再通过 在 气流阻断时压力又恢复为正常 声带间的空隙再次形成 气流再次通过 这 一过程周而复始的进行 就形成了一串周期性的脉冲气流送入声道中 这一 周期性气流脉冲的周期称为基音周期 嘴的作用是完成通过声道后的气体的向外辐射 嘴的张开形状会影响语 音频谱的形状 但是其作用较之声道而言是次要的 空气从肺部排出形成气流 空气流过声带时 如果声带是绷紧的 则声 带将产生张弛振动 即声带周期性地启开和闭合 声带启开时 空气流从声 门喷射出来 形成一个脉冲 声带闭合时相应于脉冲序列的间歇期 因此 这种情况下在声门处产生出一个准周期性脉冲序列的空气流 该空气流经过 声道后最终从嘴唇辐射出声波 这便是 浊音 语音 如果声带是完全舒展 湖南大学硕士学位论文 开来的 则肺部发出的空气流将不受影响地通过声门 空气流通过声门后 会遇到两种不同的情况 一种情况是如果声道的某个部位发生了收缩而形成 一个狭窄的通道 当空气流到达此处时被迫以高速冲过收缩区 并在附近产 生出空气的湍流 这种湍流通过声道后便形成 摩擦音 或 清音 另一种 情况是 如果声道的某个部位完全闭合在一起 当空气流到达时便在此处建 立起空气压力 一旦闭合点突然开启便会让气压快速释放 经过声道后便形 成 爆破音 由此可见 语音是由空气流激励声道最后从嘴唇或鼻孔或同时从嘴唇和 鼻孔辐射出来而产生的 对于浊音 清音和爆破音三种不同类型的语音来说 激励源是不同的 浊音语音是位于声门处的准周期脉冲序列 清音的激励源 是位于声道的某个收缩区的空气湍流 类似于噪声 而爆破音的激励源是位于 声道某个闭合点处建立起来的气压及其突然释放 1 1 鼻青 l i j 口音 图3 1 语音产生机理示意图 如图3 1 当声音由上述三种激励方式产生出来以后 便顺着声道进行传 播 气流流过声道时犹如通过一个具有某种谐振特性的腔体 腔体的一组谐 振点称为共振峰 这些共振峰的位置及各个峰的宽度决定了声道的频谱特性 共振峰及其带宽取决于声道的形状和尺寸 输出气流的频率特性要受到声道 共振特性的影响 声门脉冲序列具有丰富的谐波成分 这些频率成分与声道 的共振峰频率之间相互作用 对语音的音质产生很大的影响 共振峰频率与 声道传递函数极点相对应 当鼻道荧闭 并且声门振动是唯一的激励源时 声道传递函数就不会出现有限的零点 这将使分析大为简化 共振峰频率由 湖南大学硕士学位论文 低到高排列为第一共振峰 第二共振峰 相应的频率用f l f 2 表示 为了精确描述语音 必须采用尽可能多的共振峰 但在实际应用中 只有头三个共振峰才是最重要的 语音信号可分为两大类 浊音和清音 v u v 发浊音时 气流通过绷 紧的声带 冲激声带产生振动 使声门处形成准周期性的脉冲串 这些脉冲 串激励声道 产生浊音 浊音具有周期性信号的特点 发清音时 声带松弛 不振动 气流通过声门直接进入声道 清音具有随机白噪声信号的特点 3 3 语音信号产生的数学模型 表示抽样语音信号的离散模型是特别重要的 为了定量描述语音处理所 涉及到的某些因素 虽然已经假定了许多不同的模型 但是可以肯定 目前 还没有发现一种可以详细描述人类语音中己观察到的全部特征的模型 建立 模型的基本准则是要寻求一种可以表达一定物理状态下的数学关系 要使这 种关系不仅具有最大的精确度 而且还要最简单 我们希望模型既是线性的又是时不变的 这是最理想的模型 但是语音 信号是一连串的时变过程 根据语音的产生条件 不能精确的满足这两种性 质 此外 声门和声道相互耦合 还形成语音信号的非线性特征 然而 做 出一些合理的假设 在较短的时间间隔内表示语音信号时 可以采用线性时 不变模型 下面将给出经典的语音信号数字模型 这里 语音信号被看作是 基音 振幅 图3 2 语音信号的产生模型 湖南大学硕士学位论文 线性时不变系统 声道 在随机噪声或准周期脉冲序列激励下的输出 这一 模型用数字滤波器原理加以公式化后 就成为讨论语音处理技术的基础 图3 2 表示了语音信号的产生过程 语音信号可以看成是激励信号激励一 个线性系统而产生的输出 浊音信号是由一个周期性的6 脉冲串激励一个线 性系统而产生的输出 这个线性系统由声门波模型 声道模型组成 而清音 信号是由白噪声序列激励一个线性系统而产生的输出 3 4 语音信号的数字化 数字信号是指时问和幅度均为离散的信号 为了把模拟语音信号变换成 数字信号 必须经过取样和量化两个步骤 取样是将时间上连续的语音信号 x f 离散化成一个样本序列z 仃 工 胛r t 为取样周期 量化则是将该序 列的样本幅度再离散化 从而得到时间和幅度都为离散值的数字语音信号 图3 3 给出了语音信号数字化的一般方框图 xr n 删 屯 乃 r r 小 图3 3 语音信号数字化的一般框图 3 4 1 取样和量化 1 取样 取样 就是把模拟信号品似在时间域上进行等间隔抽取 得到序列 x 肝 x n t 一o o n 2 n f 湖南大学硕士学位论文 图3 4 语音信号的取样 而x a 能够唯一从它的样本序列x a 伽刀重构的条件是 2f 也就是说 当取样率大于信号的两倍带宽时 取样过程不会丢失信息 从圈 可精确重构原始波形 它们之间的关系由下面的插值公式 1 确定 啪 塾 s i n 华 d 当只 2 f o 时 c 又称为n y q u i s t 频率 2 量化 量化 就是将时间上离散而幅度仍连续的波形幅度值离散化 抽样幅度 量化过程就是将整个幅度值分割成有限个区间 把落入同一区间的样本都赋 予相同的幅度值 量化范围和电平的选取方法 取决于数字表示的应用 当 这种数字表示用数字系统处理时 量化电平和范围通常都是均匀分布的 图 3 5 给出了一个8 电平均匀量化器例子 其中 图3 5 a 是一个 上升中点 型量化器 该量化器的原点出现在阶梯形函数上升部分的中点 它有相同数 目的正负电平 这些电平关于原点对称 但没有零电平 图3 5 b 是一个 水 平中点 型量化器 它的负电平比正电平多一个 有一个零电平 对于一个 均匀量化器 它必须满足两个条件 x 一x x 一n l 这里 为量化阶距 间距 1 2 淘雍大学疆 掌链论交 j 殷 4 址 毒荔 盛越 m 倒 批 划 t 2 4 a t 船 五 瑚 一 剑 一砘 刖 一3 觇 l d 摩 羔心 一 一 圳花 叫 梆 上舞串矗 曩重兜 灌 弘 严 删 警 一擎一警 圣 卫划 ni 一 掣 q 擎擎挚 尸 1 4 忒 一 k 一 l 值艴曩 叫 秭 皋早串纛 叠i l t 匕i l 燃3 5 嚣秘棠用的均匀量化器特性 从例子中我们看到 均匀量化器只有两个参数 电平数目n 疑化 输距盎 邋鬻取电平数蟊n 2 8 虢倭最蠢效遥利雳b 侥二透铡褊字 冀外 和b 必须一起选择 以覆盖输入样值的幅度范围 假定输入i x 群目 x 一 那么肖 霉设x 阳的裰率密度涵数是对称酌 2 x 一 a 2 8 3 3 量纯嚣的样本毽x 灏原始馕x 竣麓p 雕 x 露 一 辨 舔热量纯误差或 量化噪声 从图3 5 可见 如按2 x 一 a 2 选定 和b 时 量化噪声满 殍 一会纠哪令 下面对这个量化噤声作统计分析 当信弩缅御波形的变化足够大 小时 可以假设量化噪声符合县燕下列特性的统计模型 1 缀化误麓是一个平稳的囱噪声过程 即 互 群弦 摊 磁奠 i 2 掰m o 式中 e 表示求统计平均 2 最化噪声和输入信号是不相关的 即 荔k n 口研 m o m 为任意熬数 3 4 或a 足够 3 5 3 6 湖南大学硕士学位论文 3 量化噪声在量化间隔内是均匀分布的 即有概率密度分布 只 j 去 一会 e c 会 i o 其他 在上述假设的统计模型下 求得量化噪声p 俐的均值和方差分别为 m h 如 定义信噪比s n r 为 洲 毒 矧 端 设输入信号的峰 峰值为2 x 则由 得2 x 一 a 2 5 得 孕 所以有 矿e 2 西 x l l a 3 x 2 2 8 3 7 3 8 3 9 r 3 1 0 3 1 1 3 一1 2 3 1 3 用d b 表示s n r 则有 s n r 划 蚓 础 埘 g 等 b 对语音信号幅度值的统计表明 其幅度直方图逼近伽玛 g a m m a 或拉普拉 斯 l a p l a c i a n 概率分御 1 如图3 6 所示 其中 生他 出 j 一 l p ltj生 2f 盯 潮毒文学醺圭学链论文 譬砷 高p 聃 一壶e 瓦 g l l 硝标燃差 3 1 5 3 1 6 精一佬纂嚣 謦3 6 实舔语音概率密度窝瑾论主豹鬻玛 拉警拉赣穰搴密囊 为简单起见 假定语蠹信号幅度值服从拉普拉斯分布 均值为零 此时由 于信号幅度超过4 ox 的概率只有0 3 5 t 丢l d z 通常敬 x 4 3 1 7 这时 s n r d b 6 转 7 2 3 1 8 讳 毯器 上式表明量化器中 码字中的每一位码元对信噪比贡献6 d b 例如 当b 1 6 时 s n r d b 8 8 8 d b 可满足高质量的电话通信要求 2 一般要求b 1 1 通常语音波形动态范围约5 5 d b 3 4 2 预处理及时域波形 语音 语音 i 迈丑压哗7 图3 7 语音信号处理系统框图 在真正的语音信号分析和处理之前 必须先进行信号的预处理o 除了 前面讨论的数字化之外 还应包括放大及增益控制 反混叠滤波 预加重 在需要语音输出的场合还要进行d a 变换和起平滑作用的模拟低通滤波 图3 7 为一般语音数字分析或处理的系统框图 a d 变换前的反混叠滤波器 主要有两个作用 一是抑制电源干扰 二 是抑制输入信号中各频率分量中频率分量超出 2 的所有分量 为信号采样 率 防止混叠干扰 因此 反混叠滤波器必须为带通滤波器 其上 下截止 频率分别是 和 对于目前的绝大多数语音编码器 矗 3 4 0 0 h z f l 6 0 1 0 0 h z i s 8 k h z d a 后面的低通滤波器用于平滑重构语音波形的高 次谐波 事实上 反混叠滤波 a d d a 和平滑滤波等许多功能可用一块专门的 集成电路芯片独立完成 在市场上能买到各种实用芯片 作为预处理的另一部分是 在a d 变换后加一个6 d b 倍频程的提升高 频特性的预加重数字滤波器 其目的就是提升高频部分 使语音信号的频谱 变得平坦 便于进行频谱分析或者声道参数分析 这是因为语音信号的平均 功率谱受声门激励和口鼻辐射的影响 落 预加重数字滤波器一般是一阶的 大约在2 0 0 5 0 0 h z 按6 d b 倍频程跌 其传递函数为 镬 湖南大学顶士学位论文 h z 1 一u z 一般u 值接近l 通常取u o 9 4 或0 9 2 处理后需要进行去加重处理 3 1 9 值得注意是 加重后的信号在分析 在进行语音信号数字处理时 最先接触到并且也直观的是它的时域波形 口3 1 为了获取一段语音信号的时域波形 首先将语音用话筒转换成电信号 再经a d 变换成为离散的数字化采样信号存在计算机内存中 将此信号取 出 用绘图仪或绘图软件即可绘成时域波形 图3 8 0 是一个男播音员说的 穷 则思变 的语音时域波形 采样率为8 k h z 每个采样信号用1 6 比特量化 图 中横轴为时间 纵轴为语音信号的幅度 由于时间轴压缩得很短 从图中无 法辨别语音波形的细节 但是可以看到语音能量的起伏 还可以大致分辩出 话语中每一个字在波形中的位置 图3 8 一段语音信号的时域波形 为了仔细辨别语音波形细节 可以把时间轴拉宽 图3 9 显示了该段波形 展宽后的细节 从图中可以看到语音信号具有很强的 时变特性 在有些段 落中它具有很强的周期性 在有些段落中它又具有噪声特征 而且周期性语 音和噪声语音的特征也在不断变化之中 只有在较短的时间段 2 0 1 0 0 m s 语 音信号的特征才基本保持不变i 1 这是语音信号数字处理的一个重要出发点 3 5 短时平均能量 振幅和跨零数 语音信号的特征是随时间而变化的 只有在一个短时段时间间隔内 语 音信号才保持相对稳定 平稳 语音信号的这种特性称为 短时性 这一段 短时间一般可取5 5 0 m s 啪1 语音信号的分析和处理一般建立在 短时性 基 湖南大学硕士学位论文 础上 即对语音信号流采用分段或分帧来处理 一般每秒的帧数为3 3 1 0 0 视实际需要确定 分帧即可以采用连续 也可采用交叠分段的方法 分帧一 般采用可移动的有限长度窗口对语音信号进行加权来实现 如图3 1 0 所示 图3 9 时域波形的展开图 3 5 1 短时平均能量 图3 1 0 语音信号的分帧 湖南大学硕士学位论文 根据图3 1 0 定义以n 为标志的某帧语音信号的短时平均能量e n 为 当u n 为直角窗 即 月 x m c o n m 2 x m c o n 一朋 2 3 2 0 n i c o n 0 n n 1 其他 3 2 1 时 短时平均能量e 为 e x 2 m 3 2 2 一n 若令h n w 2 栉 则上式可写成 x 2 m h 一引 x2 h 3 2 3 式 3 2 3 表示 窗口加权的短时能量相当于将 语音平方 信号通过一个线 性滤波器的输出 该滤波器的单位取样响应为h n 如图3 1 1 所示 由此可 见 单位取样响应h n 的选择或等效地说窗函数的选择决定了短时平均能量 表示方法的特点 下面从两个方面讨论如何选择窗函数才能使平均能量更准 确反映语音信号的幅度变化 x n l 7 2 h n 图3 1 1 短时平均能量的方框图表示 1 窗口的形状 窗口有多种形状 如三角窗 汉宁窗 海明窗 布拉克曼窗和凯则窗等 2 7 1 它们都是对称其中心点的 这里我们仅讨论两种最常用的窗 即式 3 2 1 表 示的矩形窗和下式表示的海明窗 砸咄0 4 6 导篡外1 m z i 其他 矩形窗的频率响应为 1 9 甚 湖南大学硕士学位论文 n ls l n 叭e j f l t 2 丢 e j r 芳e j n 1 1 2 3 2 5 o s i n 兰 图3 1 2 a 给出了n 5 1 时矩形窗的幅频特性 这是一个具有线性 相位 频率 特性的低通滤波器的频率响应 它的第一个零幅值频率位置为 n 号 3 2 6 它对应于矩形窗的低通滤波器的归一化截止频率 其中f s l t 为采样频率 n 为窗口序列 1 n 长度 图3 1 2 b 给出了5 1 点海明窗的幅频特性 从图玄可 以看到 海明窗的带宽大约是同样宽度矩形窗带宽的两倍 这两种窗的衰减 基本上与窗的持续时间无关 因此 对语音信号的时域分析来说 选择不同的窗口形状特使能量的平 均结果不同 矩形窗的谱平滑性较好 但波形细节丢失 而海明窗则反之 2 窗口的长度 无论窗口形状如何 窗口长度n 都起决定性的作用 n 选得太大 滤波 器的通带变窄 波形振幅变化细节就看不出来 能量变得平滑 反之 n 选 得太小 滤波器的通带变宽 信号得不到足够的平均 得不到平滑的能量函 数 实际中 n 都相对于基音周期p 而言 一般n 一 1 7 p 而语音基音周期 是时变的 所以n 的选取很困难 对于8 k h z 采样率 通常取n 1 0 3 0 m s 8 0 2 4 0 样点1 短时平均能量通常有如下三个作用 1 给出了区分清音段与浊音段语音的基础 通常e 岁 e 2 大致定出浊音语音变为清音语音的时刻 或反之 3 对于高质量语音 高倍信噪比 能区分有无语音 3 5 2 短时平均幄度函数 因为短时平均能量e n 要进行平方运算 所以对于大电平信号 它就显得 过于灵敏 对于这种情况 可以采用另一种度量语音信号幅值变化的参量 叫做短时平均幅度函数 它加重了x n 中抽样到抽样的变化 其定义如下 m i x m k o n m 卜c o n 3 2 7 2 0 濑褒太擘碾士擎程论文 冀密现疆图如图3 1 3 搿示 魁一诧囊豢 姆一霓纛簟 图3 12 矩形窗 a 和海明窗 b 的幅频特性 罴爨这个参数爱 渡瓷零凌蠢夔m 不如致那样有骥显差别e 霉要淡明戆 怒 f 1 3 于m 和e 都要进行低通滤波 且等效的窝口长度是有限的 实际上完 全霹翔 图3 1 3 短时平筠糯度的方框图表示 抉速衰减鲶无限长度的蜜嚣数来代装 这令等效救低遽滤波鲍系绞函数 具有有理函数的影式 一个简单的窗函数形式为 一 一l 癌 0 3 2 8 2 o 0 一 獒中 0 z a 1 既露该赛对应豹z 交羧为 2 t 湖南大学珂 上学位论文 忡 南 小al 一忽 3 2 9 从这里很容易看到 频率响应w e j 7 具有所希望的低通特性 这样的滤波器 可以用简单
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年4月内蒙古哈伦能源集团有限责任公司招聘模拟试卷及答案详解(夺冠)
- 沧州市人民医院产科急诊超声考核
- 2025春季粤规院科技集团招聘考前自测高频考点模拟试题及完整答案详解1套
- 2025广东广州市增城区教育局招聘广州增城外国语实验中学教师10人(编制)模拟试卷及答案详解(名校卷)
- 张家口市人民医院个人持续学习与知识更新记录及测试
- 北京市人民医院组织架构与决策流程知识测试
- 重庆市人民医院儿童结石碎石技术考核
- 2025第二人民医院前庭康复治疗技能考核
- 2025湖南湘潭市市直学校人才引进45人考前自测高频考点模拟试题及答案详解1套
- 秦皇岛市人民医院故障识别处理考核
- 《环境影响评价》第一章 环境影响评价的概念课堂讲义
- 2024年中级注册安全工程师《安全生产法律法规》真题及答案
- ISO 22003-1:2022《食品安全-第 1 部分:食品安全管理体系 审核与认证机构要求》中文版(机翻)
- 外科学-第三十六章-阑尾疾病
- 八年级物理上册期中考试卷及答案【A4打印版】
- 防盗门订货合同范本
- 教科版科学四年级上册第一单元《声音》测试卷含答案(典型题)
- 《名著阅读 艾青诗选》核心素养课件1(第2课时)
- 人工智能在船舶工程中的应用展望
- 高中化学教师培训课件
- 锲而不舍成功从不言败主题班会课件
评论
0/150
提交评论