全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于非线性变换法语谱图的伪彩色显示 摘 要:鉴于人眼对彩色的分辨率远远高于灰度差分辨率的特点,提出了一种利用c#程序实现伪彩色显示的新方法,该方法通过非线性映射变换函数,建立频谱幅度与颜色的对应关系,从而实现伪彩色显示,并将其用于语谱图显示及语音信号处理界面设计中。该方法编程简单,界面设计灵活,对设备的要求较低,在普通PC机上即可实现。关键词:语谱图; 伪彩色; 灰度; 调色板; 映射变换Speech spectrogram display in pseudo-color using a new non-linear transform methodAbstract: Considerating the human eye to color resolution is much higher than gray-scale difference, proposed a new method to show the spectrogram by c# procedure, which focus on the mapping transformation function and build the relationship between spectral magnitude and color, so made pseudo-color display come true. We also used it for speech spectrogram display and audio signal processing interface design. This method programming simple, interface design flexible, less demand on the equipment, can realized in ordinary PC.Keywords: speech spectrographic, pseudo-color, gray-scale,palette, mapping transformation1 引言语音的时域分析及频域分析是语音分析的两种主要方法,而这两种单独分析的方法均有其局限性:在语音的时域分析中,对语音信号的频率特征没有直观的了解;而频域分析出的特征又没有语音信号随时间的变化关系1。因此从事语音研究的人们致力于研究语音的时间依赖于傅立叶分析的方法。这种时间依赖于傅立叶分析的显示图形称作语谱图(speech spectrogram),早在1941年由贝尔实验室的研究人员发明,得到语谱的灰度图像。但是这种灰度图像的分辨率和视觉效果不尽如人意,随着技术的发展,人们尝试语谱图的彩色显示的实现。本文利用c#编制程序,设计界面,采用非线性映射变换函数实现语谱图的伪彩色显示,同时为了达到更好的分析、学习效果,我们不仅设置了对照实验组,还添加了语音播放功能,可以做到边观测语谱图边听相应的语音。该方法简单,对设备要求低,显示效果良好。语谱图综合了频谱图与时域波形的优点,充分展示了语音频谱随时间的变化情况,除此之外,语谱图还呈现出丰富的纹理特征,因此在聋人语训、声纹鉴定、车型识别、数字音频水印等方面具有广泛的研究意义。2 语谱图产生原理由于语音信号是一种短时平稳信号,可以在每个时刻用其附近的短时段语音信号分析得到一种频谱,将语音信号连续地进行这种频谱分析,可以得到一种二维图谱,这种二维图谱可以表达三维信息,它的横坐标表示时间,纵坐标表示频率, 每个像素的灰度值大小反映相应时刻和相应频率的能量密度,这种时频图称为语谱图。语谱图依据时间分辨率及频谱分辨率可以分为窄带语谱图和宽带语谱图两种,窄带语谱图用于获得较高的频率分辨率,而宽带语谱图用于获得较高的时间分辨率2。语谱图的产生基于短时傅立叶变换3,定义如下:(1)其中n为时域采样点序号,)是窗函数,在求短时频谱时通常采用的是汉明窗,一方面是因为汉明窗在频率范围中的分辨率高,另一方面它的旁瓣衰减大,具有频谱泄露少的优点。类似的还可以定义离散的短时傅立叶变换,令 ,有 (2)由功率谱函数(能量密度谱函数)的定义,短时功率谱和短时傅立叶变换有如下关系:(3)或: (4)不难证明是x(n)的短时自相关函数的傅立叶变换, (5)其中用时间n作为横坐标,k作纵坐标,将的值表示为灰度级所构成的二维图像就是语谱图,通过变换,能得到语谱图的dB表示7。3 伪彩色映射变换方法伪彩色处理是将灰度图像线性或非线性映射到一定的调色板上,以达到彩色显示效果的处理方式。由于人眼对彩色的分辨率远远高于对灰度差的分辨率,所以可用于识别灰度差较小的像素。通过伪彩色处理,可以得到具有较高分辨率和较好视觉效果的图像。图像伪彩色处理的关键在于调色板的编码方法,在RGB空间常用两种方法进行调色板的编码,即:灰度分割法和灰度级-彩色变换法。灰度分割法形成的调色板色彩给人的感觉不是连续的,因此在RGB空间一般都采用灰度级-彩色变换法进行调色板编码,即:对灰度图像中的每一个像素点,取得该点的灰度值,通过红、绿、蓝变换函数,产生RGB色彩空间的三个分量,从而只要保证变换函数连续,则调色板彩色编码就是连续的8。因此灰度级-彩色变换法的关键在于红、绿、蓝变换函数的构造。3.1 传统的伪彩色映射变换传统的映射变换函数6如图1所示:图1:典型的线性映射变换函数曲线图1中R、G、B分别表示伪彩色灰度值,x表示原始灰度图像的灰度值,前三幅图像分别为红、绿、蓝三种变换函数,最后一幅是把三种变换画在一张图上,这种映射关系可以使不同的灰度对应不同色彩,呈现一一映射关系。灰度最大值L=255,将低于L/4的所有灰度映射成饱和度线性增加的绿色,将L/4到L/2之间的所有灰度映射成饱和度线性减少的蓝色,在L/2到3L/4之间的灰度映射成饱和度线性增加的红色,在3L/4到L之间的灰度映射成饱和度减少的绿色, 并且只有在0、L/2、L处出现纯基色(分别表示B、G、R),其他灰度将合成多种不同的颜色;但是这种线性变换存在一定得局限性5,表现在:(1)低阶灰度转换的绿色与高阶灰度转换的绿色容易混淆;(2)由于在0、L/2、L处存在纯基色,其周围一定范围内的彩色太暗,从而无法区分开。 3.2 非线性伪彩色映射变换鉴于传统方法的局限性,本文提出一种非一一映射的方法,利用如下函数关系式(6)(7)(8), (6) (7) (8)式中,可以得到归一化的非线性映射映射变换函数曲线,如图2所示:图2:归一化的非线性映射变换函数曲线图2中L=255,x为初始灰度值,R、G、B分别表示变换后归一化的伪彩色灰度值。为了达到更好的显示效果,通过函数关系式(9),可以使RGB三分量的伪彩色灰度值分布在0-255灰度范围内。(9)式中R、G、B分别为图2中归一化伪彩色灰度值,R、G、B为最终所得的伪彩色灰度值。将256个灰度级等分成四个子区间, 在这些子区间内映射变换后的R、G、B分别由最小值线性变换为最大值,再变换为最小值, 此过程如图3所示:图3:由灰度到彩色的非线性映射变换函数曲线在图3的变换过程中,不同的灰度值可能会映射为同种颜色, 但它使得图像的对比度大大增强, 从而使得原灰度图像内部被掩盖的细节信息变得清晰可见6 。从图中也可反映出颜色的渐变过程,灰度值为0时对应黑色(能量最低),继而随着灰度值的增大依次由蓝色(L/4)渐变为绿色(L/2),再渐变为红色(3L/4),按照原理最后可能会呈现紫色(即:红色与蓝色的混合色),与后面语谱图显示的实验结果相对应,由于语音能量主要集中在低频区域,随着频率的升高,能量值减小,最后趋于零,反映在语谱图中,频率轴自上而下灰度值逐渐增大,颜色的渐变过程与图3一致。4 5 6 结论本文采用灰度级-彩色变换法,通过一种非线性映射变换函数,建立起频谱幅度与颜色的对应关系,从而实现语谱图的伪彩色显示;同时,为了达到更好的分析学习效果,还添加了语音播放功能,能够做到观测语谱图的同时,播放相应的语音,实现“可视语言”在PC机上的快速、精确显示。实验结果表明,与传统线性变换方法相比,本文非线性变换方法得到的语谱图显示效果良好,同时声音播放清楚,为进一步的音频分析做好了铺垫,具有广泛的实际应用意义。参考文献:1 KANAMORI H.Sha
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 保育保教评估指南
- 小龙虾产业介绍
- 青少年运动训练
- 太阳风暴科普讲解
- 涂料企业安全管理介绍
- 无痛人工流产科普
- 数字化种植导板
- 建设工程代建协议书
- 担保协议书模板
- 2025-2026学年安徽省马鞍山市初三历史上册期中考试试卷及答案
- 社区眼科知识培训课件
- 2025贵州黔南州荔波县面向社会招聘城市社区工作者7人考试参考试题及答案解析
- 银行从业资格2025年法律法规模考训练冲刺试卷(含答案)
- 2025年宁夏中考英语试卷附答案
- 2025年教育系统学校中层后备干部选拔考试题(含答案)
- 塑料吹瓶生产工艺技术指导手册
- 第11课西汉建立和“文景之治”课件-七年级历史上册新教材
- 2025年成考英语试卷及答案
- 2025年专升本计算机基础模拟试题及答案(操作系统深度解析)
- 2025年上海市大数据中心工作人员公开招聘考试参考题库及答案解析
- 容貌焦虑讲解课件
评论
0/150
提交评论