(信号与信息处理专业论文)基于压缩感知的语音信号建模技术的研究.pdf_第1页
(信号与信息处理专业论文)基于压缩感知的语音信号建模技术的研究.pdf_第2页
(信号与信息处理专业论文)基于压缩感知的语音信号建模技术的研究.pdf_第3页
(信号与信息处理专业论文)基于压缩感知的语音信号建模技术的研究.pdf_第4页
(信号与信息处理专业论文)基于压缩感知的语音信号建模技术的研究.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(信号与信息处理专业论文)基于压缩感知的语音信号建模技术的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京邮电大学学位论文原创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成 果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其它人已经发表或 撰写过的研究成果,也不包含为获得南京邮电大学或其它教育机构的学位或证书而使用过 的材料。与我一同工作过的同志对本研究所做的任何贡献均已在论文中作了明确的说明并 表示了谢意。 研究生签名: 日期: 南京邮电大学学位论文使用授权声明 南京邮电大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文 的复印件和电子文档,可以采用影印、缩印或其它复制手段保存论文。本文电子文档的内 容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以 公布(包括刊登)论文的全部或部分内容。论文的公布(包括刊登)授权南京邮电大学研 究生部办理。 研究生签名: 导师签名: 日期: 学科 、专业:工 学 、信号与信息处理 研 究 方 向:无线通信与信号处理技术 作 者:张健 指导教师:杨震 教授 题 目:基于压缩感知的语音信号建模技术研究 英文题目:research on modeling technique of speech signal based on compressed sensing 主 题 词:压缩感知;神经网络;观测序列;建模技术; keywords: compressed sensing; neural network; measurements sequence; modeling technique 南 京 邮 电 大 学南 京 邮 电 大 学 硕 士 学 位 论 文 摘 要硕 士 学 位 论 文 摘 要 南京邮电大学硕士研究生学位论文 摘要 i 摘摘 要要 随着传感系统获取数据能力的不断增强,人们对信息需求量的不断增加,基础的信 号处理框架需要的采样速率和处理速度要求也越来越高。 为了解决急剧增加的信号采样 处理压力,人们正在研究一种与传统的数据采样方法不同的新型感知采样模式,即压缩 感知理论。本文以传统压缩感知为基础,研究了如下几个问题: 首先,从传统的压缩感知理论出发,针对语音观测序列的时间序列特性、lpc 模型 适用性以及非线性特性的分析,得出语音观测序列是非线性相关的压缩时间序列的结 论。 其次,如果未来信号处理系统的输入,均基于压缩感知理论进行采样,代替传统的 奈氏采样,那么对于压缩感知采样得到的观察序列的建模技术,将是十分重要的信号处 理基础理论,本文正是基于此开展的深入研究。由于语音观测序列是非线性时间序列, 因此本文考虑采用非线性时间序列建模的几种经典方法, 首先根据神经网络预测方法的 优点,选择采用应用最为广泛的 bp 神经网络模型对语音观测序列进行预测,提出了基 于 bp 神经网络预测模型的压缩感知理论框架。通过实验仿真,分析了 bp 神经网络对 语音观测序列预测的精度,以及最终重构出来的语音信号的重构精度。 论文的第二大部分,考虑到压缩感知理论进入实际数字通信系统后,经过量化编码 这一过程后将不可避免的会引入量化噪声,因此本文着重分析了量化噪声对 bp 神经网 络建模预测精度的影响。首先给出了量化比特数与量化噪声方差的对应关系,以此提出 了一种直接添加量化噪声模拟量化过程中数据失真的方法。以这种方法为基础,本文做 了三个仿真分别研究了量化噪声对传统压缩感知的影响,基于 bp 神经网络预测模型的 压缩感知中仅有模型输入有失真以及模型输入和参数均有失真两种情况下, 重构信号的 信噪比随着量化噪声加入多少的变化趋势,为压缩感知的实际应用奠定基础。 关键词:压缩感知,神经网络,观测序列,建模技术 南京邮电大学硕士研究生学位论文 英文摘要 ii abstract with the growing ability of the sensor system to obtain data, people are increasing demand for information. signal processing framework based on the required sampling rate and processing speed requirements are also raised. to address the problem of dramatic increasing pressure in the signal sampling process, people are working on a new sensing sampling model, compressed sensing theory, which is different from the traditional data sampling. in this thesis, we researched on the following topics based on the traditional compressed sensing: first of all, we analyzed the time series features , lpc model applicability and the non-linear characteristics of the observation sequence following the traditional compressed sensing theory. then we concluded that the observation sequence is a kind of non-linear and compressed time series. secondly, if the inputs of the signal processing systems are all sampled based on the compressed sensing theory instead of the traditional nyquist sampling theory in the future, the modeling techniques for the observation sequence of compressed sensing will be a very important signal processing theory. the voice observation sequence is a kind of non-linear time series, so in this thesis we used several classical methods for non-linear time series modeling. at first, we applied the most widely used bp model to predict the observation sequence according to the advantages of the bp model and presented the compressed sensing theoretical framework based on bp neural network prediction model. then we analyzed the prediction accuracy of the observation sequence and the final reconstruction accuracy of the speech signal based on the bp model through simulation. in the second part of this thesis, we analyzed the influence of quantization noise on the bp neural network prediction accuracy. that is because when we introduce the compressed sensing theory into practical digital communication system, it will inevitably generate quantization noises after the quantization coding process. also, we finished three simulations to analyze the following topics respectively, which lay a foundation for the practical application of the compressed sensing: 1. the influence of the quantization noise on the traditional compressed sensing, 2. the variation trend of the snr of the reconstructed signal with the quantization noise under the following two conditions: only inputs of the compressed sensing which is based on bp neural network model are distorted ;inputs and model parameters are both distorted. 南京邮电大学硕士研究生学位论文 英文摘要 iii keywords:compressed sensing,neural network,measurements sequence,modeling technique 南京邮电大学硕士研究生学位论文 目录 iv 目目 录录 摘 要 . i abstract . ii 目 录 . iv 缩略语 . vi 第 1 章 绪论 . 1 1.1 传统采样技术面临的挑战 . 1 1.2 压缩感知技术 . 1 1.3 本文结构与安排 . 2 第 2 章 cs 基本理论和语音信号 cs 技术 . 4 2.1 压缩感知基本理论 . 4 2.1.1 信号的系数表示 . 4 2.1.2 cs 观测模型 . 5 2.1.3 cs 重构算法 . 6 2.2 语音信号的 cs 技术 . 7 2.2.1 klt 域上语音信号压缩感知理论 . 8 2.2.2 近似自相关观测的语音信号压缩感知 . 9 2.3 语音信号观测序列建模目的 . 10 2.4 本章小结 . 12 第 3 章 时间序列建模方法分析 . 13 3.1 时间序列与语音观测序列 . 13 3.2 语音观测序列 lpc 模型验证 . 15 3.2.1 lpc 模型基本原理 . 15 3.2.2 语音观测序列 lpc 适用性验证. 17 3.3 语音观测序列非线性检测 . 19 3.4 本章小结 . 22 第 4 章 语音观测序列非线性预测模型 . 23 4.1 人工神经网络 . 23 南京邮电大学硕士研究生学位论文 目录 v 4.1.1 人工神经元模型 . 23 4.1.2 人工神经网络的学习方式 . 25 4.1.3 人工神经网络用于非线性建模 . 26 4.2 bp 神经网络及其在时间序列预测上的应用 . 28 4.2.1 bp 神经网络模型 . 28 4.2.2 bp 神经网络设计的基本方法 . 30 4.2.3 bp 神经网络在时间序列预测上的应用 . 32 4.3 基于 bp 神经网络的语音观测序列预测 . 33 4.3.1 语音观测序列的 bp 神经网络预测方法 . 33 4.3.2 语音观测序列预测的实例 bp 神经网络模型 . 35 4.3.3 实验仿真及性能分析 . 36 4.4 本章小结 . 40 第 5 章 量化噪声对预测模型的影响分析 . 42 5.1 压缩感知观测序列样值的量化 . 42 5.2 传统压缩感知中量化噪声对信号重构的影响 . 43 5.2.1 均匀量化基本原理及噪声分析 . 43 5.2.2 实验仿真及结果分析 . 45 5.3 量化噪声对基于 bp 预测模型的压缩感知的影响 . 47 5.3.1 量化噪声引入 bp 预测模型 . 47 5.3.2 实验仿真及结果分析 . 48 5.4 本章小结 . 52 第 6 章 总结与展望 . 54 致 谢 . 56 参考文献 . 57 攻读硕士学位期间发表的论文 . 61 攻读硕士学位期间参与的科研项目 . 62 南京邮电大学硕士研究生学位论文 目录 vi 缩略语缩略语 aaft amplitude adjust ft 幅度调节傅里叶变换 ar auto regressive 自回归模型 arma auto-regressive and moving average 自回归滑动平均 bp error back propagation network 误差反向传播网络 cs compressed sensing 压缩感知 dcs distributed compressed sensing 分布式压缩感知 dct discrete cosine transform 离散余弦变换 dwt discrete wavelet transform 离散小波变换 ft fourier transform 傅里叶变换 klt karhunen-loeve transform 卡厄南-洛维变换 lpc linear prediction coding 线性预测分析 mp matching pursuit 匹配追踪 omp orthogonal matching pursuit 正交匹配追踪 pcm pulse code modulation 脉冲编码调制 rip restricted isometry principle 有限等距性 stomp stagewise orthogonal matching pursuit 分段正交匹配追踪 南京邮电大学硕士研究生学位论文 第一章 绪论 1 第第1章章 绪论绪论 本章旨在通过介绍本课题的研究背景、 压缩感知技术的基本理论及其在语音信号领 域的主要应用,并且引出本文主要的中心课题,即观测序列建模,最后概括本文各章节 的结构安排以及研究内容。 1.1 传统采样技术面临的挑战 众所周知,迄今为止对各种模拟信号的传统采样方法均遵循著名的香农采样定理: 即满足采样速率是信号最高频率两倍的条件时,可以完整重构模拟信号,不会造成信息 损失。事实上,这个准则适用于语音、视频、医学图像、无线电等等各种物理信号。 随着信息时代的到来, 信息通信技术突飞猛进, 传感系统获取数据能力的不断增强, 人们对信息需求量的不断增加, 基础的信号处理框架需要的采样速率和处理速度也越来 越高。如果依然采用奈奎斯特采样定理进行数据采样,将导致许多应用场合采样后的数 据量庞大,一方面导致后续的处理系统越来越复杂,另外一方面在通信等领域,人们还 需要对采样得到的含有很大冗余的数据进行压缩,大量的非重要的采样数据被抛弃,这 就造成了高速采样再压缩的过程中,有大量的采样资源是被浪费的。 举例而言,为了满足如今人们对高画质的追求,hdtv(high definition television,即 高清晰度数字电视)已经进入成为人们关注的焦点。但是伴随高画质的视觉效果而产生 的就是 hdtv 所需要的带宽问题,根据计算,hdtv 需要约 37mhz 的带宽53。如果按 照传统奈奎斯特采样定理对其进行采样,需要至少 75mhz 的采样率,在如此之高的采 样率下产生的数据量必然是非常庞大的, 这为后续信号处理的各个关键步骤造成了很大 处理压力。 因此, 以香农采样定理为指导的各种技术成为了影响目前信息领域进一步发展的瓶 颈之一,主要表现在两个方面: (1)数据获取和处理方面; (2)数据存储和传输方面1。 1.2 压缩感知技术 为了解决上述问题, 由 d.donoho (美国科学院院士) 与 e.candes(ridgelet, curvelet 创始人),以及 t.tao(华裔科学家)等人于 2004 年提出了一种新的压缩感知技术 (compressed sensing,简称 cs) 2,它是一种与传统的数据采样方法不同的新型感知采 南京邮电大学硕士研究生学位论文 第一章 绪论 2 样模式。压缩感知理论表明:一旦信号在经过某种变换(例如小波变换,傅里叶变换等) 后,体现出某种稀疏性或者是可压缩性,那么可以设计一个测量矩阵,在满足矩阵与变 换基不相关的条件下,用该矩阵测量(和压缩)信号,可以获得远低于奈氏采样率的数 据采样观察序列;压缩感知理论还证明,基于这些低速率的观察序列,采用求解优 化问题的方法,可以以很高的概率达到精确或近似重构出原始信号的目的。压缩感知理 论为语音、图像和通信信号的处理开辟了一个崭新的途径,因此目前已经成为人们研究 的热点。 压缩感知理论的前提条件是信号具有稀疏性或者可压缩性54, 这样就可以通过对较 少数据的采集,大大节省存储数据的空间或者通信的信道资源,同时利用各种逼近方法 实现信号的重构和恢复。压缩感知理论在采样的同时实现压缩目的理论框架,使得压缩 感知理论吸引了信号处理众多研究者的眼球,目前的应用研究领域涉及面很广,如压缩 感知雷达、dcs ( distributed compressed sensing) 理论、无线传感网络、图像采集设备 的开发、医学图像处理、生物传感、光谱分析、超谱图像处理及遥感图像处理等3。 考虑到语音信号尤其浊音在频域上具有良好的稀疏性或者可压缩性,所以可以将 cs 与语音信号相结合来探索语音信号处理领域的各种新方法4。 如果在数字语音通信系 统中应用压缩感知理论,根据目前的压缩感知理论,必须将得到的测量值(以下统称为 观测序列)在发送端进行一系列量化编码后,通过无线链路发送到接收端,作为压缩感 知理论中接收端重构原始信号的输入信号, 观测序列的长度已经远小于对原始信号基于 奈氏采样得到的序列长度。 对于旨在压缩传输信号量,降低传输处理压力的压缩感知理论而言,当运用到实际 时很可能达不到非常理想的压缩效果,也就是说不得不面对压缩比较高的情况。但是考 虑到语音序列符合 lpc 模型,以此类推,观测序列是观测矩阵与语音序列相乘的结果, 所以本文尝试对观测序列进行建模,一旦找到比较好的模型,就可以在发送端发送模型 参数取代观测序列,进行量化编码,通过无线链路发送到接收端,在接收端将参数代入 模型恢复出观测序列,最后利用恢复出来的观测序列重构原始信号。因此,对观测序列 进行建模的本质目的在于用模型参数取代原始观测序列,达到二次压缩传输信号效果。 1.3 本文结构与安排 第一章从急剧增加的信号采样处理压力的背景出发,引入传统的压缩感知理论,这 是本文课题的研究背景。 南京邮电大学硕士研究生学位论文 第一章 绪论 3 第二章首先对压缩感知的基本理论框架及其中几个关键的处理步骤进行了介绍, 然 后介绍了几种压缩感知理论应用到语音信号处理领域的情况, 最后基于传统的压缩感知 理论,提出对语音观测序列进行建模分析的目的。 第三章首先分析了语音观测序列与时间序列的关系, 得出了语音观测序列依然属于 时间序列范畴的结论,只不过是压缩后的时间序列。接着采用实验仿真的方式进行了语 音观测序列的 lpc 模型适用性验证,验证出 lpc 模型不再适用于语音观测序列,并且 做出推论,即此时的观测序列应该是非线性相关的,而不再呈现线性关系。第三章最后 利用非线性时间序列分析中的替代数据法对语音观测序列进行了非线性性检测, 得出语 音观测序列是非线性相关的结论。 本文的第四章, 根据各种非线性时间序列建模方法的特点决定采用神经网络预测模 型,然后介绍了人工神经网络的神经元模型、学习方法及其在非线性时间序列建模上的 应用。接着提出了本文的核心内容语音观测序列的 bp 神经网络预测建模方法。第 四章的第三节中分析了如何将 bp 神经网络模型用于预测语音观测序列,并给出了加入 语音观测序列建模和预测后的压缩感知理论框架。 最后详细介绍了笔者为了验证上述方 法的有效性而进行的实验仿真,并给出性能分析,最后得出结论:可以用 bp 神经网络 用于语音观测序列的预测, 能达到在保证一定恢复精度的条件下对语音观测序列进行二 次压缩的目的。 第五章中着重分析了量化噪声对 bp 神经网络预测精度的影响。首先给出了量化比 特数与量化噪声方差的对应关系, 以此提出了一种直接添加量化噪声模拟量化过程中数 据失真的方法。以这种方法为基础,笔者做了三个仿真分别研究了量化噪声对传统压缩 感知的影响,基于 bp 神经网络预测模型的压缩感知中仅有模型输入有失真以及模型输 入和参数均有失真两种情况下,重构信号的信噪比随着量化噪声加入多少的变化趋势。 第六章对全文进行了归纳,总结了本文的主要贡献,并对后续研究提出了展望。 本文的全部工作是在国家自然科学基金项目 压缩感知理论及其在语音编码领域关 键技术的研究 (编号 60971129)和重大基础研究 973 课题(编号 2011cb302903)的支 持下完成的。 南京邮电大学硕士研究生学位论文 第二章 cs 基本理论和语音信号 cs 技术 4 第第2章章 cs 基本理论和语音信号基本理论和语音信号 cs 技术技术 本章首先对压缩感知的基本理论框架及其中几个关键的处理步骤进行了介绍, 然后 介绍了几种压缩感知理论在语音信号处理领域的应用,最后基于传统的压缩感知理论, 提出对语音观测序列进行建模分析的目的。 2.1 压缩感知基本理论 2.1.1 信号的系数表示 可压缩信号 稀疏变换观测得到的m维向量重构信号 min| . . tcs xst axy yx t x 传输、存储 低速率压缩采样: cs yax 第一步 第二步 第三步 图 2-1 压缩感知理论框架 在 cs 理论中, 假设分析的信号都是具有稀疏性或者是可压缩性的, 为了简化分析, 在本文中信号看作一个 n 维向量x(1), x(2), x(3), , x(n), 即 x(n), n 1,2,3,n。 根据数学和信号处理理论, 许多自然信号都可以被一种基简明扼要的表示55, 这里, 用数学语言这样描述,信号 x(n)在一组正交基 12 ,. n 下可以被表示为: 1 n ii i x (2.1) 其中, i 为投影系数,则投影系数矢量 t x ,它将被用来很方便的表示原始 信号。 关于稀疏性,不论是成熟的傅里叶变换和小波变换,还是后来兴起的多尺度几何分 析(例如 contourlet42,curvelet43,bandelet44,ridgelet45等)3,科研人员的目的均在于 研究如何利用不同的函数空间,提供给信号一种更为直接简洁的分析方式,所有的变换 都为了发掘信号的个性特征,从而能够稀疏的表示它(即用更少的参数描述其特征) 。 文献2中对稀疏的定义是这样的: 信号 x(n)在正交基下的变换系数向量, 假如 当 0p2 和 0rn 时,这些系数满足: 南京邮电大学硕士研究生学位论文 第二章 cs 基本理论和语音信号 cs 技术 5 1/ |(| ) p p pi i r (2.2) 则说明系数向量在某种意义下是稀疏的。 当某个信号 x(n)在某种正交完备基上的变换系数,只有 k1 时,即网络输入 m 个历史数据,输出 12 ,., n mn mn m k xxx 的预 测值。实验证明多步预测用于时间序列预测的误差较大。这是因为网络运行调整权值和 阈值时,每次迭代都要累加前一次 k 个预测值的误差,从而造成网络难以收敛,甚至导 致网络发生振荡。 南京邮电大学硕士研究生学位论文 第四章 语音观测序列非线性预测模型 33 滚动预测又可称为迭代一步预测,是指先进行单步预测,再将网络输出的预测值反 馈给网络输入,输出作为输入一部分,用于下一步的预测。若开始预测时输入数据是实 际的时序观测值 1 ,., nnnm xxx ,输出是下一个时刻的预测值 1n m x ,将 1n m x 与 1,.,nn m xx 一起作为输入数据对 2n m x 进行估计, 得到输出的预测值 2n m x , 再将 2n m x 与 21 ,., nn m xx 作为输入数据时对 3n m x 进行估计,如此反复迭代,就得到对未来一段 时期的预测值。 文献31中所提到的基于 bp 神经网络的股票预测, 就是 bp 神经网络用于序列预测 的一个典型且成功应用,该文献通过仿真得出这样的结论:利用 bp 神经网络对股票价 格的短期预测很明显可以取得较好的效果,并且预测精度很高。 4.3 基于 bp 神经网络的语音观测序列预测 4.3.1 语音观测序列的 bp 神经网络预测方法 通过本章前一小节的介绍可以看出,利用 bp 神经网络对类似股票价格这样的时间 序列进行预测,往往能取得比较理想的预测效果,因此联想到将这种对时间序列进行预 测的方法用到语音观测序列的建模上,即利用 bp 神经网络模型对语音观测序列进行预 测。 利用 bp 神经网络进行语音观测序列预测的基本步骤: 准备训练输入输出序列:在发送端将语音观测序列分为两部分,用前一部分作为 bp 神经网络的模型输入,后一部分作为模型训练时的导师信号(期望信号) 。这两部分 序列的长度可以根据预测的精度需要调整,如果需要高精度的预测效果,那么要尽量增 长前一部分序列,即作为模型输入的序列长度,用大部分序列预测少部分序列;若对预 测精度要求不高,则可以缩短输入序列长度,即用小部分序列预测大部分序列。同时考 虑到顺序性对于时间序列的重要性,因此在分割语音观测序列时,为了保留其顺序性, 采用顺序分割观测序列的方式,以保证观测序列的顺序性。 训练:利用经典的 bp 神经网络模型,采用滚动预测的方法,用观测序列前一部分 作为训练输入,观测序列后一部分作为训练目标,在选定 bp 神经网络隐层节点时采用 了动态建模与预测的方法32,即:在训练过程中采用 3 到 12 这 10 种不同节点数分别建 模,训练完成后得到的模型,用前一部分预测后一部分观测序列,求出与原始观测序列 的误差值,选出误差最小的那一个模型作为该观测序列的实例模型。但是经过反复的动 南京邮电大学硕士研究生学位论文 第四章 语音观测序列非线性预测模型 34 态建模,发现 3 到 12 个不同节点建模效果中,很明显是隐含层节点个数越多,预测精 度越高,但是考虑到建模的最终目的是二次压缩,所以要综合考虑预测精度和模型参数 个数两个相互制约的因素,关于节点个数的选择见下文分析。 预测:当接收端接收到观测序列的前一部分以及传送过来的模型参数之后,就可以 将接收到参数代入 bp 神经网络模型,然后将语音观测序列的前一部分作为输入,采用 滚动预测的方式预测出后一部分语音观测序列,接着将两部分组成完整的语音观测序 列,最后利用 omp 算法重构出原始信号。 可压缩信号稀疏变换 观测得到的m维 向量 重构信号 t x min| . . t cs x st axy yx bp神经 网络训练 bp神经 网络预测 +y 输入信号 模型参数 x +y输入信号 模型参数 图 4-5 加入语音观测序列建模和预测后的 cs 理论框架 按照这样的步骤利用 bp 神经网络对语音观测序列进行预测的过程,可以看作是在 经典的压缩感知理论的基础上加入了语音观测序列模型训练和预测这两个过程, 因此基 于这种方法的压缩感知理论框架可以用图 4-5 表示。 本文提到的这种基于 bp 神经网络预测的建模方法与传统的语音 lpc 建模相比, 有 明显的不同。首先,传统的 lpc 建模是针对全部(一帧)语音,没有将一帧语音分前 后一半的概念;其次,lpc 模型参数需要全部(一帧)语音数据共同计算得到,有了这 个模型,再用某种激励信号(celp 编码中就是码字)作为模型输入,就可以合成出语 音来;所以传输的参数是模型参数和激励参数,不再是原始语音。当然,最佳激励,就 是原来模型的预测误差, 如果预测误差作为激励, 那么合成语音完全等价于原始语音 (合 成是预测的逆过程) ,因为预测误差远远小于原始信号的动态范围,所以说预测很成功, 因此可以这样建模,而基于 bp 神经网络预测的建模方法并不考虑所谓的模型激励,当 南京邮电大学硕士研究生学位论文 第四章 语音观测序列非线性预测模型 35 然也可以理解为保留了原始语音观测序列的前一半(或者是以部分)作为激励。所以在 通信应用场合,语音每帧的前一半观测序列,必须与神经网络权值一起量化编码传输, 接收端才能基于预测神经网络重构出语音观测序列。 4.3.2 语音观测序列预测的实例 bp 神经网络模型 众所周知,尽管 bp 神经网络是目前最为广泛,并且在非线性时间序列预测方面有 突出应用,但是对于不同性质的非线性时间序列而言,选取不同的实例 bp 神经网络模 型,所得到的预测效果往往有所不同。 本章第一节提到,区别同一类神经网络模型中各种具体的实例模型的因素包括:输 入输出节点个数、隐含层个数,隐含层节点个数,以及传输函数等。但是在利用 bp 神 经网络对非线性时间序列进行预测的方法中,如何确定一个 bp 神经网络实例模型的上 述参数,达到较为理想的预测效果,到目前为止还没有一套比较完善的理论,尤其是对 于语音观测序列这种特性分析不够透彻的非线性时间序列而言, 大多数情况下是靠研究 人员采用“试”的方式,也就是通过反复实验仿真的方式找到比较适合预测这种序列的 实例模型。 在本文中,运用 bp 神经网络对语音观测序列进行建模的本质目的在于语音观测序 列的二次压缩,因此这里我们定义二次压缩比: 1111 1 iimmim nnkkkkkkkk l (4.23) 其中l表示通过奈氏采样之后的语音帧的帧长,表示 cs 压缩比,因此l其实 表示的是语音观测序列的长度,n表示前一部分观测序列(也就是需要发送到接收端作 为 bp 模型预测输入的观测序列)长度, i k表示第i个隐含层的节点个数,那么 1 nk表 的就是输入层和第一个隐含层之间权值的个数, 1ii kk 表示的就是第i个隐含层和第 1i个隐含层之间权值的个数。式中的分子表示通过 bp 神经网络建模之后需要发送到 接收端的数据个数, 而分母则表示传统压缩感知理论中需要发送到接收端的原始语音观 测序列的长度。通过化简可以得到二次压缩比如下: 111 (1)(1)(1)1 iimm nnkkkkk l (4.24) 根据二次压缩比的定义是可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论