




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
语音信号处理复习题1由下面的WAV文件读出语音的编码信息:524946461000000004001000E2FE0700A49A7B010100020064617461E7FEAF035741564544AC0000809A7B015FFF6501666D742010B1020042FF35FC区块说明(Chunkdescriptor)编码(Code)内容(Contents)批注(Notes)52494646RIFFA49A7B0124,877,732Chunksize(017B9AA4)16=24,877,73257415645WAVE编码(Code)内 容(Contents)批注(Notes)fmt子区块(fmtsub_chunk)666d7420fmt1000000016Sub_chunk_1size(00000010)16=1601001(0001)16=1,PCMformat(audio)02002Numberofchannels=(0002)16=244AC000044,100Samplingrate(0000AC44)16=44,10010B10200176,400Bytes/second=(0002B110)16=176,40004004Blockalign=(0004)16=4100016Bits/sample=(0010)16=16编码(Code)内容(Contents)批注(Notes)数据子区块(datasub_chunk)64617461data809A7B0124,877,696Size:(017B9A80)16=24,877,69642FF35FCL=65,346,R=64,565(FF42)16=65,346(FC35)16=64,565E2FE0700L=65,250,R=7(FEE2)16=65,250 (0007)16=7E7FEAF03L=65,255,R=943(FEE7)16=65,255 (03AF)16=9435FFF6501L=65,375,R=357(FF5F)16=65,375 (0165)16=3572画出语音信号的产生模型,简述语音的产生过程。
直流气流 交流气流 速度波 声压波_亘 色蜀一遛 d嘴唇I "声音能源激励源谐振源辐射源四,完整的语音信号的数学模型冲激序列
发生器声门脉冲_A模型vS基音周期厂线性系统
声道冗名)冲激序列
发生器声门脉冲_A模型vS基音周期厂线性系统
声道冗名)辐射模型
心随机噪声发生器清/浊音开美传■输函数定乩协双H(m)=G(w)V(a)火3)语音的形成过程一空气由肺部排入喉部,经过声带进入声道,最后由嘴辐射出声波,形成语音。3为生么语音信号要进行“短时〃分析。答:语音信号特性是随时间变化的,是一个非平稳的随机过程,但在一个短时间范围内其特性根本保持不变,即语音信号具有“短时平稳性〃,因而可将语音信号看成准平稳过程,对其进行短时分析.4语音信号的时域分析方法有那些?答:短时能量,短时平均过零率,短时自相关函数5语音信号频率范围是多少?答:语音信号的频率大约在20Hz~20KHz。6什么是浊音的基音频率(F0)?男性、女性和儿童的F0大致分布在什么范围。答:浊音的基音频率(F0):声带张开和闭合一次的时间的倒数。由声带的尺寸、特性和声带所受张力决定。F0的大小决定了声音的上下,称为音高。男性的F0大致分布在:60-200Hz,女性和儿童的F0大致分布在:200-450Hz7可以认为多长的时间范围内,语音信号是平稳信号。答:10-30ms8语音的采样率为8kHz;纯语音在进行计算机录入时,一般采样率在15kHz~20kHz左右;音乐的采样率可以高达44kHz。9如何利用语音信号的时域分析方法进行清、浊判断。答:1、短时能量分析依据:是基于语音信号幅度随时间变化】清音段幅度小,其能量集中高频段;浊音段幅度较大,其能量集中低频段;2、 平均幅度分析的依据:清音段幅度小,浊音段幅度较大。3、 短时平均过零率:浊音平均过零率低,集中在低频段;清音过零率高,集中在高频段。4、短时自相关函数:浊音语音的自相关函数具有一定的周期性;清音语音的自相关函数不具有周期性,类似噪声,有点如语音信号本身
10通过对语音信号进行分析,可以提取到那些特征参数〔列举出三个以上)。答:短时能量和短时平均幅度,短时平均过零率,短时自相关函数11人的发音器官包括那些。答:人体发音器官一肺、气管、喉〔包括声带[和声道。12、 傅立叶分析在信号处理中有什么意义?答:1、它是分析线性系统和平稳信号和稳态信号特性的强有力手段。2、 以复指数函数为基函数的正交变换,理论完善,计算方便,概念容易理解。3、 傅里叶分析可以使信号的某些特性变得很明显。语音信号的频谱具有非常明显的语言学意义,可以获得重要的语音特征〔如共振峰频率和带宽等),13文语转换系统〔TTS[属于那种语音合成系统。答:规那么语音合成系统14语音的共振峰是如何形成的?答:气流流过声道时犹如通过了一个具有某种谐振特性的腔体,放大某些频率,在频谱上形成相应位置的峰起,称为共振峰。15同态信号处理也称为同态滤波,画出同态滤波中特征系统框图xjn)xjn)16语音合成的分类及特点,举出一个语音信号参数合成的例子。1、 波形合成法特点:简单/小词汇(报站器)2、 参数合成法特点:可以合成大词汇(字典)3、 规那么合成法特点:实现难度较大如TTS系统〔文语转换系统)17画出实现语音信号时频语音增强功能的框图。主输入信号参者信号消噪
自适应主输入信号参者信号消噪
自适应增强语音18什么是语音信号的短时〃处理方法。答:语音信号的能量是一种随时间变化的信号,可能是浊音鼓励也可能是清音鼓励,浊音的基音周期以及信号幅度等语音参数也都对时间变化,但这种变化时缓慢的,在一小段时间内10-30ms,语音信号近似不变。于是,我们把变化的语音信号分成一些相继的段时间段来处理。而每一段时间具有固定的特性,这种方法称为“短时〃处理方法。19语音信号短时能量分析的用途答:1、区分清音段与浊音段; 2、区分声母和韵母;3、 在高信噪比下,区分无声与有声的分界;4、 区分连字的边界; 5、用于语音识别。
20短时自相关函数的物理意义,性质,作用。答:物理意义确定两个信号在时域内的相似性,用于研究信号本身。表示方法序列经过一个冲激响应为h序列经过一个冲激响应为hk(n)的数字滤波器滤波即得到短时自相关函数。R赢)=肾x(m')x(m-k》(n-m)(!)对称性5R〔k〕=R〔-k〕 在k=0处为最大值,即对于所有k来说,|R(k)|WR(0)对于确定信号,值R(0[对应于能量,而对于随机信号,R(0[对应于平均功率作用:区分清/浊音浊音语音的自相关函数具有一定的周期性。清音语音的自相关函数不具周期性,类似噪声,与其本身相似。估计浊音语音信号的周期,即估计基音周期。21利用短时自相关函数进行语音分析时要注意的问题N值至少要大于基许周期的一…倍,否则将找不到第"个最大值FTnN值也戛尺可能要小;用为语音信号的特姓是变化的,如N过大将影响如时性'•由于基音周期的范田很宽,所以应使窗宽I兀-配于预期的基音同期 |22语音信号傅里叶分析的作用〔p41〕在语音信号处理中,傅立叶表示在传统上一直起主要作用。其原因一方面在于稳态语音的产生模型由线性系统组成,此系统被一随时间作周期变化或随机变化的源所鼓励,因而系统输出频谱反映了鼓励与声道频率响应特性。另一方面,语音信号的频谱具有非常明显的语言声学意义,可以获得某些重要的语音特征。同时,语音的感知过程与人类听觉系统具有频谱分析功能是密切相关的23短时傅里叶变换的滤波器的解释。一、的另一种解释(带限信号-时域卷积)1Z . .xn{m)=——|另("勺"稣d®=x(m)^v(n-m)当将a?看成一个参变量走(世)就只是口的函数+R孔(必)=£1心一小OK*用孔(必)=£1心一小OK*用=—B短时频谱的线X性滤波表示败8)是窄带低通滤波器=X(F7)U心)双贡一皿令win)假设口二株 乙爪(g")°x(心厂如2 〕)Xa{eJ^)=X(次奸电)JF(r招)将攻)的频潜向左搬移了皿,或等效将(^频率上的频涪搬移到了零频幸处。因此为使卷出瀚有:恐} >政G是窄带低通滤友器24取样率的根本概念〔1)时域取样率的根本概念。当山为固定值时那此)是一个冲激响应为阪的的滤波器的输出,若将攻的博里叶变换记为政皿对于大多数窗函数来说,矶产)具有低通滤波器的特性,若它的带宽为目田,2)则具有与窗相同的带宽“根据采样定理,%(的)的时域采样率至少为2#才不至于发生混督现象c低通滤波器的带宽是由它的第一个零点位置决定的’因一为是W(»)t0<77<JV-1的傅里叶变换,因而岳勺取值决定于窗口序列的长度M口形状o所以斗{5) 在时域内的最小取样率$玖二箜〔2)频域取样率的根本概念。当〃为固定值时一.也(“是以2工为周期的尊的连续函数,需在2兀长度间隔内平样声用下述一组频率值来取样:触=警一立=01…,£=]L为取样率以便利用这些频率值上的&®勺来恢复*(”),利用傅立叶变换的角度解释。设窗为时间受限,贝勺反变换也在时间上受限,则在频率域内用至少两倍于它的”时间宽度”的速率来抽样,而兀®啪傅立叶反变换是x(m)w(.rHE),此信号宽1S为H由抽样定理,必须在"?jtIf频率上用下一组频率来抽样 保=示厂k=0:N-1故频域最小取样数即为窗宽§R户N。〔3)总取样率的根本概念
工〔小)的忌抽样率SR=SRt•SRf=2矿N(抽样/秒J在大多数实际窗中,3可以表示为乙人幡倍数,其中%是落&J的抽样频率,即日=。务(Hz)其中,c是比例常数,上式代入上式中,得S&=2C「s(采样/秒)国■渺口为与一般取样频率相比而得到的“过速率采样比”.25从如下语音信号的短时谱中能得到什么信息?答:1、快速变化,由鼓励信号引起的;2、慢速变化,声道滤波器的共振峰引起的;3、采用汉明窗得到的短时频谱较较矩形窗平滑。26倒谱分析的作用答:〔1)区分清/浊音〔2)求浊音的基音周期,可以得到浊音的鼓励信号。〔3)得到声道的冲激响应h(n)27简述语音信号的特点,基频、共振峰是什么含义?答:特点:语音一般由清音和浊音组成,语音信号具有短时平稳性。基音频率:浊音的声带振动根本频率。是声带张开和闭合一次时间的倒数。共振峰:当元音鼓励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。共振峰为频谱中明显的几个凸起点,它的出现频率与声道的谐振频率相对应。28线性预测的根本思想。答:一个语音的抽样能够用过去假设干个语音抽样的线性组合来逼近。通过时实际语音抽样和线性预测抽样之间差值的平方和〔在一个有限间隔上[到达最小值,即进行最小均方误差的逼近,能够决定唯一的一组预测数据,而预测系数就是线性组合中所用的加权系数。29线性预测分析如何用于语音编码和语音合成。答:编码:预测误差e(n)就是鼓励信号G*u(n),预测系数{ak}就是声道虑波器的系数{dk}.ak=dk,e(n)=G*u(n)线性预测分析可以对生成模型的增益参数G和滤波器系数{dk}进行直接和高效率的计算。合成:诺音x<n)诺音x<n)30简述矢量量化的过程。答:〔书上定义):将语音信号波形的K个样点的每一帧,或有K个参数的每一参数帧,构成K维空间中的一个矢量,然后对这个矢量进行量化。(课件上说):当给矢量量化器输入一个任意矢量Xi进行矢量量化时,矢量量化器首先判断它属于哪个子空间,然后输出该子空间的代表矢量Yj.矢量量化过程就是用Yj代替Xi的过程。Yj=Q(Xi)1<j<J 1<i<N31通常线性预测分析设定的模型是什么模型。答:全级点模型。32什么是矢量的失真测度?常用的失真测度有哪些答:失真测度〔距离测度)就是将输入矢量Xi用码本重构矢量Yj来表征时所产生的误差或失真的度量方法,它可以描述两个或多个模型矢量之间的相似程度。常用的失真测度为欧氏距离测度。33矢量量化器最正确设计的两个条件?答:最正确划分,最正确码本34初始码书的生成方法随机选取法:从训练序列中随机选取J个矢量作为初始码字,从而构成初始码本。分裂法:求出S中全体训葬片列的质心然后在S中找一个与此质心的失真测縻最大的矢量A 一>A"冉在s中找一个与-V-的失真测度最大的矢量 J以一和-L为一基准*根据龈邻近准则,进彳亍S的划分'得到两个于集卜3&…求拄成心:(4)对这两个子集分另可按可样方法谖行处理°-叮以得至四个于集.依次类推,经过「次分裂,得到」=?■个于集、分别求子集的质心-得到J个初始码字r构成初船码本_、35短时能量和短时过零率的的用途。答:短时能量:1、区分清音段与浊音段;2、区分声母和韵母;3、在高信噪比下,区分无声与有声的分界;4、区分连字的边界;5、用于语音识别。过零率: 1、区分清音和浊音:浊音平均过零率低,集中在低频端;轻音过零率高,集中在高频端。 2、从背景噪声中找出是否有语音,以及语音的起点。36对语音信号进行处理时为什么要进行分帧。答:语音信号短时平稳,要将语音信号划分为很多短时的语音段,而每个短时的语音段称为一个分析帧。这样,对语音信号进行分针处理就相当于对特征固定的持续信号进行处理。经过处理,语音信号就已经被分割成一帧一帧的加过窗函数的短时信号,然后再把每一个短时语音帧看成平稳的随机信号,利用数字信号处理来提取语音特征参数。37为什么端点检测有重要意义?答:端点检测:从包含语音的一段信号中确定出语音的起点和终点。有效的端点检测不仅能使处理的时间减到最小,而且能排除无声段的噪声干扰。实验说明:端点检测的正确与否影响到识别率的上下。语音端点检测的方法:短时能量和短时过零率。38什么叫LBG算法,怎样设计初始码本,并用来训练码本。LBG算法是一种递推算法,从一个事先选定的初始码本开始迭代。把训练序列按照码本中的元素根据最邻近准那么分组,对每一分组找质心,得到新的码本,又作为初始码本,再进行分组,重复上述过程,直到系统性能满足要求和不再有明显的改良为止。(2) 世整本汕W讦第-步:初始化一给定全部参考矢量集合M设定失真控制口限G,算法最大迷代次数」以及初始码本■;}-" r:'八K;'},设置总失真"叫-s,初绐迭代次数最大涉代次数为匚第二步:选代.(1)根据最邻近准则将S分成J个于集、C2)订算总失真h—X -侦■产T)算新码字:匐--个码字为其对成于集的放(4)讦算相对失真改谖量、3”与失真-控制门限比较,kA转入〔5);土S马专入(6)qIS)若m大于Lr则转人(6)r否则m十「转入〔1)【6)彳畀钮I晟芝琴的袒『书 V| 八 J39为什么说语音信号可以看成隐马尔科夫过程,隐马尔科夫过程有哪些模型参数。HMM包含两个随机过程,三个概率矩阵,一个输出概率答:隐马尔可夫模型:只能观察到输出符号序列(ab),而不能观测到状态之间如何转移(状态转移概率)和状态的分布(状态的概率)。而语音信号是一个可观察的序列:它是由大脑中的思维(不可观测)及语言需要和语法知识〔不可观测[所发出的参数流。
LHMM包含两个随机询程:S)马尔可夫链;一个随机过程描述的状态(第,寿去)和状态转移序列C状态转移序列&&s2 S]&&&和&&&食等);(2)…个随机过程描述状态和观察值乏间的统计对应关系(每次转移时输出的捋号组成的符号序列,如,°2,HMM包含三个概宰矩阵:尸1=:L1 每个状态存在的概率矩阵玖P2P33-O.00□.50.4P2P33-O.00□.50.400.60状态之间转胞;
的概宰矩阵P2转移中输■出将号的概率矩阵F3一个输出概率:将每-种可能路径的的输出,概率相加得到的总的榴•率值作为籍出概.宰、40列举常用语音编码速率的值。答:64kbit/s;PCM;答:64kbit/s;PCM;32kbit/s;ADPCM;4.8kbit/s;CELP; 2.4kbit/s;LPC声码器41波形编码、参数编码与混合编码各有什么优缺点。答:波形编码:话音质量高,编码速率高。参数编码:编码速率低,自然度低,对环境噪声敏感。混合编码:质量高和速率低.42在语音编码中,如何使用自适应技术。答:利用自适应的思想改变量化间隔〔量阶)的大小,即用小的量化间隔去编码小的差值,使用大的的量化间隔去编码大的差值43语音合成的目的是什么?它主要分为哪几类?比拟它们的优缺点。答:目的:让机器说话,到达一定的音质与可懂度〔或产生与人类通信相关的语音)〔1)、波形合成法。优点:合成音质好; 缺点:存储空间大。〔2)、参数合成法。优点:存储空间小; 缺点:合成音质较差。〔3)、规那么合成法。优点:可以合成无限词汇,存储量小;缺点:合成音质效果较差44在TTS系统中,如何进行语音合成中的韵律控制。答:韵律特征包括声调、语气、停顿方式、发音长短等。这些通过基频、音长、音强等参数来表达,通过控制这些参数到达对韵律控制。包括基音同步帧周期的调整、合成语音幅度的调整、声调曲线的修正等。45语音识别系统由那几部份组成.〔从语音识别的框图预处理:语音信号的放大、防混叠滤波、自动增益控制、模数转换、消除噪声、端点检测。语音特征参数包括:短时平均能量、短时过零率、频谱、三个共振峰频率〔F1、F2、F3的频率值、带宽、幅值)、线性预测系数、LPC倒谱和Mel倒谱等。组成进行说明> r专家
组成进行说明> r专家模式匹配:将未知语音的特征参数与模板参数逐一进行比拟与匹配,判决的依据是失真测度最小的准那么。专家知识库:用来存储各种语言学知识,如汉语声调变调规那么、音长分布规那么、同音字判别规那么、构词规那么、语法规那么、语义规那么等。识别决策:是最后一步,也是系统识别效果的最终表现。根据假设干准那么及专家知识,判决选出可能结果中最好的结果,由识别系统输出。46为什么语音识别时需要做时间规整?答:语音信号具有很强的随机性,不同的发音习惯,发音时所处的环境不同,心情不同都会导致发音持续时间长短不一的现象。如单词最后的声音带上一些拖音,或者带上一点呼吸音,此时,由于拖音或呼吸音会被误认为一个音素,造成单词的端点检测不准,造成特征参数的变化,从而影响测度估计,降低识别率,因此在语音识别时,首先有必要对语音信号进行时间规整。47说话人识别的目的及分类。答:目的:确认说话人〔即证实说话的人是否是所要求的那个人[或者从某个的人群集合中识别出那个说话人。分类:说话人确认和说话人识别。主要用于身份的验证。48什么叫加性噪声和乘性噪声。为什么加性噪声的处理是语音增强的根底。答:按噪声和信号相关的性质可将噪声分为加性噪声和乘性噪声。加性噪声是指噪声和信号相关性是加和关系;〔如冲激噪声、周期噪声、宽带噪声等)乘性噪声是指噪声和信号相关性是乘积关系;〔如残响基传输网络的电路噪声)对加性噪声进行处理,从带噪声语音信号中提取尽可能的纯洁的原始语音,改善语音质量提高语音可懂度,是语音增强的有效的根本方法。49减谱法的实现框图及工作过程。—1~ 谱幅度的估值49减谱法的实现框图及工作过程。—1~ 谱幅度的估值IDFTDFT纯噪声d'(n)工作过程:将含噪语音信号和有声、无声判别得到的纯噪声信号进行DFT变化,从含噪语音谱幅度的平方中减去纯噪声的谱幅度的平方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业并购交易合同修订及调整协议
- 离婚双方无子女财产分配及子女监护权约定
- 安全员证续期网络考及答案
- 2025年大学瑜伽课程题库及答案
- 基于自适应学习系统的计算机课程教学研究
- 2025年新能源产业质量追溯体系与产业链协同创新报告
- 展示台 饲养达人评选会说课稿-2025-2026学年小学劳动粤教版劳动与技术四年级-粤教版(劳动与技术)
- 城区建筑竞赛方案设计案例
- 建环专业考试题及答案
- 2025年数学几何竞赛真题及答案
- 医学信息检索与利用智慧树知到答案章节测试2023年杭州医学院
- 黑底搭配大气企业宣传商业计划书商务通用PPT模板
- GB/T 17608-2006煤炭产品品种和等级划分
- GB/T 16866-2006铜及铜合金无缝管材外形尺寸及允许偏差
- 量子信息与量子计算课件
- 沪教五年级数学上册第一单元测试卷
- 地下停车库设计统一规定
- 综合实践课《绳结》教学设计
- 建筑装饰设计收费管理规定
- 电子课件-《市场营销》-A45-2298完整版教学课件全书电子讲义(最新)
- (整理)ASME-B161.34规定的标准磅级阀门(常用材料)额定工作压力和试验压力
评论
0/150
提交评论