版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于 Matlab 环境下的语音、图像、 频信号的基础知识班级:信 1104学号:20112785姓名:吕微彪语音信号的表示:语音既是人得发音器官发出来的一种声波, 它就是其他各种声音一样, 也具 有声音的物理属性。它具有以下一些特性:(一音质。它是一种声音区别其他声音的基本特性。(二音调,就是声音的高低。音调取决于声波的频率:频率快则音调高,频率 慢音调低(三声音的强弱。音强及音量,又称响度,它是由声波震动幅度决定的。(四声音的长短,也称音长,它取决于发音持续时间的长短。语音信号最主要的特性是随时间而变化的, 是一个非常平稳的随机过程。 但 是, 从另一方面看, 虽然语音信号具有时变特性,
2、但在短时间范围内其个性基本 保持不变。 在没有完成状态转变时, 可近似认为它不变。 因而我们可以采用平稳 过程的分析处理方法处理语音。 语音信号分析可分为时域, 频域, 倒频域等方法。 时域分析具有简单, 运算量小物理意义明确等优点; 更为有效的分析多是围绕频 域进行的, 因为语音中最重要的感知特性反映在其功率谱中而相位变化只起很小 作用。 语音信号的短时谱分析是以傅里叶变换为核心的, 其特征是频谱包络与频 谱细微结构以乘积的方法混合在一起,另一方面是可用 FFT 进行高速处理。语 音信号处理基本分两种分析方法:数字信号处理和模拟信号处理语音信号的格式:音频格式是指要在计算机内播放或是处理音频
3、文件,是对声音文件进行数、 模转换的过程。音频格式最大带宽是 20KHZ ,速率介于 4050KHZ之间,采 用线性脉冲编码调制 PCM ,每一量化步长都具有相等的长度音频文件格式常见的特点有:要在计算机内播放或是处理音频文件, 也就是 要对声音文件进行数、 模转换, 这个过程同样由采样和量化构成, 人耳所能听到 的声音,最低的频率是从 20Hz 起一直到最高频率 20KHZ , 20KHz 以上人耳是 听不到的,因此音频文件格式的最大带宽是 20KHZ ,故而采样速率需要介于 4050KHZ之间,而且对每个样本需要更多的量化比特数。音频数字化的标准 是每个样本 16位 -96dB 的信噪比,
4、 采用线性脉冲编码调制 PCM , 每一量化步长 都具有相等的长度。在音频文件的制作中,正是采用这一标准。音频格式包括:CD WAVE AIFF AU MPEG MP3 MPEG-4 MIDI WMA RealAudio VQF OggVorbis AMR。其中最常用的有 MP3, CD , WMA , APE。吧, WAV 格式的声音文件质量和 CD 相差无几,也是目前 PC 机上广为 流行的声音文件格式,几乎所有的音频编辑软件都 “ 认识 ”WAV 格式。 比较作为数字音乐文件格式的标准, WAV 格式容量过大,因而使用起来很不方便。因此,一般情况下我们把它压缩为 MP3或 WMA 格式。
5、压缩方法有无损压 缩,有损压缩,以及混成压缩。 MPEG,JPEG 就属于混成压缩,如果把压缩的数 据还原回去,数据其实是不一样的。当然,人耳是无法分辨的。因此,如果把 MP3, OGG 格式从压缩的状态还原回去的话,就会产生损失。然而, APE 格式 即使还原,也能毫无损失地保留原有音质。所以, APE 可以无损失高音质地压 缩和还原。在完全保持音质的前提下, APE 的压缩容量有了适当的减小。拿一 个最为常见的 38MBWAV 文件为例, 压缩为 APE 格式后为 25MB 左右, 比开始 足足少了 13MB 。而且 MP3容量越来越大的今天, 25M 的歌曲已经算不上什么 庞然大物了。以
6、 1GB 的 mp3来说可以放入 4张 CD ,那就是 40多首歌曲,已 经足够了!MP3支持格式有 MP3和 WMA 。 MP3由于是有损压缩,因此讲求采样率, 一般是 44.1KHZ 。 另外, 还有比特率, 即数据流, 一般为 8-320KBPS 。 在 MP3编码时,还看看它是否支持可变比特率(VBR ,现在出的 MP3机大部分都支 持,这样可以减小有效文件的体积。 WMA 则是微软力推的一种音频格式,相对 来说要比 MP3体积更小。 图像表示 :每个图像的像素通常对应于二维空间中一个特定的 ' 位置 ' ,并且有一个或者 多个与那个点相关的采样值组成 数值 。 根据这
7、些采样数目及特性的不同数字图像 可以划分为:二值图像 (Binary Image: 图像中每个像素的亮度值 (Intensity仅可以取自 0到 1的图像。 灰度图像 (Gray Scale Image,也称为灰阶图像 : 图像中每个像 素可以由 0(黑 到 255(白 的亮度值表示。 0-255之间表示不同的灰度级。 彩色 图像 (Color Image:每幅彩色图像是由三幅不同颜色的灰度图像组合而成,一 个为红色, 一个为绿色, 另一个为蓝色。 伪彩色图像 (false-color multi-spectral thematic 立体图像 (Stereo Image:立体图像是一物体由不同
8、角度拍摄的一对图 像,通常情况下我们可以用立体像计算出图像的深度信息。 三维图像 (3D Image:三维图像是由一组堆栈的二维图像组成。每一幅图像表示该物体的一个 横截面。 数字图像 也用于表示在一个三维空间分布点的数据,例如计算机断层 扫描(:en:tomographic, CT 设备生成的图像,在这种情况下,每个数据都称 作一个体素。图像格式:目前比较流行的图像格式包括光栅图像格式 BMP 、 GIF 、 JPEG 、 PNG 等, 以及矢量图像格式 WMF 、 SVG 等。视频表示:将一系列静态影像以电信号方式加以捕捉,纪录,处理,储存,传送,与重 现的各种技术。连续的图像变化每秒超过
9、 24帧(frame 画面以上时,根据视觉暂留原理, 人眼无法辨别单幅的静态画面; 看上去是平滑连续的视觉效果, 这 样连续的画面。视频格式:MPEG 也是 Motion Picture Experts Group 的缩写。这类格式包括了MPEG-2 和 MPEG-4在内的多种视频格式。ASF 是 MICROSOFT 为了和 Real player 竞争而发展出来的一种可以直接在 网上观看视频节目的文件压缩格式。WMV 一种独立于编码方式的在 Internet 上实时传播多媒体的技术标准, WMV 的主要优点在于:可扩充的媒体类型、本地或网络回放、可伸缩的媒体类 型、流的优先级化、多语言支持、
10、扩展性等。n AVI是 New AVI 的缩写,是一个名为 Shadow Realm 的地下组织发展起 来的一种新视频格式。 它是由 Microsoft ASF 压缩算法的修改而来的, 可以这样 说, NAVI 是一种去掉视频流特性的改良型 ASF 格式。DivX 这是由 MPEG -4衍生出的另一种视频编码 (压缩 标准, 也即通常所说 的 DVDrip 格式,它采用了 MPEG4的压缩算法同时又综合了 MPEG-4与 MP3各方面的技术,说白了就是使用 DivX 压缩技术对 DVD 盘片的视频图像进行高 质量压缩, 同时用 MP3或 AC3对音频进行压缩, 然后再将视频与音频合成并加 上相
11、应的外挂字幕文件而形成的视频格式。 其画质直逼 DVD 并且体积只有 DVD 的数分之一。RMVB 这是一种由 RM 视频格式升级延伸出的新视频格式, 它的先进之处在 于 RMVB 视频格式打破了原先 RM 格式那种平均压缩采样的方式,在保证平均 压缩比的基础上合理利用比特率资源, 就是说静止和动作场面少的画面场景采用 较低的编码速率,这样可以留出更多的带宽空间。FLV 就是随着 Flash MX 的推出发展而来的新的视频格式,其全称为 Flashvideo 。是在 sorenson 公司的压缩算法的基础上开发出来的。MP4手机常用视频3GP 手机常用视频AMV 一种 mp4专用的视频格式信号
12、的运算1、利用 funtool 进行信号运算在函数运算控制窗口中,有 4个输入框供用户对要操作的函数进行输入。这 4个输入框分别是 f 、 g 、 x 、 a ,其中:f 为图形窗口 1输入的控制函数,其默认值 为 x ; g为图形窗口 2输入的控制函数,其默认值为 1;x 为函数自变量的取值范 围,其默认值为 -2*pi,2*pi;a为输入常数,用来进行各种运算,其默认值为 1/2。 函数图形计算器有 4行 7列共 28个按钮,每一行代表一类运算:函数自身的运 算;函数与常数之间的运算;两函数间的运算与对于系统的操作。1函数自身的运算在函数运算控制窗口的第一行命令按钮用于函数自身的运算操作。
13、 每一按钮的命 令功能如下:df/dx:计算函数 f 对 x 的导函数。 int f:计算函数 f 的积分函数。simple f:对函 l 数 f 进行最简式化简。 num f:取函数表达式 f(x的分子, 并赋予给 f 。 den f:取函数表达式 f(x的分母,并赋予给 f 。 1/f:求函数 表达式 f(的倒数函数。 finv f:求函数表达式 f(x的反函数。在计算 int f或 finv f时,若因为函数的不可积或非单调而引起无特定解,则函数 栏中将返回 NaN ,表明计算失败。2函数与常数之间的运算在控制窗口的第二行命令按钮用于函数与常数之间的运算操作, 每一按钮的命令 功能如下f
14、+a:计算 f(x+a f-a:计算 f(x-a f*a:计 算 f(x*a f/a:计算 f(x/a fa:计算 f(xa f(x+a:计算 f(x+a f(a*x:计算 f(ax3两函数间的运算在控制窗口的第三行命令按钮用于对函数 f 与 g 常数之间的各种运算操作。 每一 按钮的命令功能如下 :f+g:计算两函数 f 与 g 之和,并将其和赋值给 f 。 f-g:计算两函数 f 与 g 之差,并将其差赋值给 f 。 f*g:计算两函数 f 与 g 之积,并将其积赋值给 f 。 f/g:计算两函数 f 与 g 之比,并将其商赋值给 f 。 f(g:计算复合函数 f(g4系统操作按钮在窗口的
15、第四行命令按钮用来对符号函数图形计算器进行各种操作。 每一按钮的 命令功能如下:insert:把当前图窗 1中的函数插入到计算器内含的典型函数表中。 cycle:在 图形窗口 1中依次演示计算器内含的典型函数表中的函数图形。delete:从计算器内含的典型函数演示表中删除当前的图形窗口 1中的函数。reset:重置符号函数计算器的功能。 help:符号函数图形计算器的在线帮 助。 demo:演示符号函数图形计算器的功能。 close:关闭符号函数图形 计算器 .2、向量表示法进行信号运算当在 Matlab 中用向量表示信号时,反褶、移位、尺度变换等运算是对时间自变 量进行运算,需要对时间向量
16、t 进行加减乘除操作;而对于两个信号向量或多个 信号的运算,则需要进行信号向量间的加减乘除及乘方等操作。1向量与常数的运算、向量与常数的加减乘除及乘方运算如下,其中 a 为常数, X 为向量X+a:向量与常数的加运算, X 向量中的每个元素都加上相同的常量 a ; X-a:向量与常数的减运算, X 向量中的每个元素都减去相同的常量 a ; a*X:向量与常数的乘运算, X 向量中的每个元素都乘以相同的常量 a ; X/a:向量 与常数的除运算, X 向量中的每个元素都除以相同的常量 a ; a./X:常数与向 量的点除运算,常量 a 除以 X 向量中的每个元素;X.a:向量与常数的点乘方运算,
17、 X 向量中的每个元素为幂底数的 a 次幂; a.X:常数与向量的点乘方运算,以 X 向量中的每个元素为幂指数的 a 的乘方2向量间的运算向量间的加减乘除运算如下,其中 X、Y 为向量 lX+Y:向量的加法运算,X、Y 向量中的相应元素相加; lX-Y:向量的减法 运算,X、Y 向量中的相应元素相减; l X.*Y:向量的点乘运算,X、Y 向量中 的相应元素相乘; l X./Y:向量的点除运算,X、Y 向量中的相应元素相 除; l X*Y:向量的矩阵乘运算,与矩阵相乘相同; l X/Y:向量的矩阵除运 算,与矩阵相除相同; 图像运算: 1. 数据类型及图像类型间的基本转换函数 数据类转换:B
18、= data_class_name(A; IPT 图像数据类型转换函数 2. 图像的灰度直方图(H 是图像 a.bmp 的数据矩阵 imhist(H;%显示 a 的直方图 histeq(H; %将图像 a 进行直方图均衡化 adapthisteq(H; %将图像 a 进行直方图均衡化 3. 图像的点运算 点运算是通过对图像中每个像素值进行计算,改善图像显示效果的操作,也称对 比度增强或对比度拉伸或灰度变换。可以表示为 B(x,y=f(A(x,y.进行逐点运算, 输入映射为输出,不改变图像像素的空间关系。 Y=aX+b %线性点运算 Y=X+aX(max(X-X %非线性点运算 4. 代数运算 代数运算是指对两幅输入图像进行点对点的加、减、乘或除运算而得到输出图像 的 运 算 。 四 种 图 像 代 数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年宁波财经学院单招综合素质考试题库附答案详解(能力提升)
- 2026年山西药科职业学院单招职业适应性考试题库附答案详解(考试直接用)
- 2026年广东科学技术职业学院单招职业倾向性测试题库及答案详解(网校专用)
- 2026年广东舞蹈戏剧职业学院单招职业技能考试题库参考答案详解
- 2026年山西警官职业学院单招职业适应性测试题库含答案详解(突破训练)
- 2026年山西省长治市单招职业倾向性测试题库带答案详解(培优b卷)
- 2026年山西铁道职业技术学院单招综合素质考试题库带答案详解(预热题)
- 小店报销制度
- 消防安全互助协防制度
- 压路机安全管理制度
- 2026春教科版科学二年级下册教学计划及进度表
- GB/T 24016-2026环境管理环境报告鉴证指南
- 2026广西玉林市老年大学招聘编外人员1人考试参考试题及答案解析
- 2026年工地复工复产方案(5篇)课件
- 2025版《煤矿安全规程》学习辅导课件(地质防治水部分解读)
- 《客房服务与管理》全套教学课件
- 建筑工程应急体系构建
- 学生校园欺凌治理工作教育培训和预防预警机制
- 综合医院骨质疏松多学科门诊(MDT)诊疗方案
- 2026年高考物理二轮复习策略讲座
- 《Office 2021基础与应用》课件-项目1 初识文档
评论
0/150
提交评论