版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目一
音频的基础知识任务1了解声音任务2了解音频任务1了解声音任务引入小华最近对声音产生了浓厚的兴趣,有鸟叫的尖锐声,有乐器的低沉声,这些声音是怎么产生的呢?有什么特性呢?知识准备任何物体由静态到动态转变后,都会使人听到声音,发出这种声音的物体就是声源,它的传播形式主要是通过声波进行。声音是一种摸不着的东西,主要通过在空气中运行,如说话的声音、钢琴的弹奏声、二胡的弹唱声等,然后传到人的耳朵里,才能听到这些声音。声音的音波有高有低,有快有慢。在声音的属性中,主要通过声音的频率和振幅来展现和描述音波的属性,声音中的频率大小与声音的音高对应,振幅与声音的大小对应。所以,在平常听到的所有声音中,它是包含了声音频率在内的,一般人的耳朵可以听到的声音频率范围为20-20000Hz,某些动物的耳朵可以听到高达170000Hz的声音,海里的某些动物还可以听到15~35Hz范围内的小声音。如图所示以波浪线的形式表现了声音频率振动的波形,波形的零点线表示静止中的空气压力,当声音波动为停止状态到达最低点时,代表空气中的压力较低;当声音波动为振动状态到达最高点时,代表空气的压力较高。
声波一、声音的特性我们可以从两个层面来看待声音特性,一是声音本身的物理特性,二是人们对声音的听觉特性,它又被称作“心理声学”。声音的物理特性从声波本身着眼,而听觉特性以人的主观听感为研究对象,二者的内容是完全不同的。1.物理特性物理特性包括声音的频率、振幅、波长、相位、谐波、包络,以及声波的传播特性。2.听觉特性听觉特性包括鸡尾酒会效应、掩蔽效应、哈斯效应,以及频率与响度的关系。二、声音的类别随着物理声学研究的深入和技术手段的完善,科学家发现人的主观听觉与声音的物理特性是有所差异的,并由此发展出生理声学、心理声学和音乐声学。下面主要向读者介绍声音类别的相关知识。1.响度级与响度2.频率与音高3.谐波与泛音4.音色与音质三、声音的分类声音根据不同的依据有不同的分类方法。1.按照频率分类按照声波的频率不同,声音可以分为人耳可听声、超声波和次声波3种。2.按照内容分类声音按照内容可大致分为语音、效果声、乐音和噪声4种。3.按照存储形式分类(1)模拟音频(2)数字音频教字音频文件又可分为波形文件和MIDI文件。(1)波形文件(2)MIDI文件任务2了解音频任务引入小华想要处理音频,准备选择Audition作为入门软件,必须得对音频有所了解。那么音频都有哪些参数?常见的音频文件有哪些格式?知识准备音频是指人耳可以听到的声音频率在20Hz~20kHz之间的声波。
如果在计算机加上相应的音频卡—就是我们经常说的声卡,我们可以把所有的声音录制下来,声音的声学特性如音的高低等都可以用计算机硬盘文件的方式储存下来。反过来,我们也可以把储存下来的音频文件用一定的音频程序播放,还原以前录下的声音。从信息论的观点来看,描述信源的数据是信息和数据冗余之和。音频信号在时域和频域上具有相关性,也即存在数据冗余。将音频作为一个信源,音频编码的实质是减少音频中的冗余。根据编码方式的不同,音频编码技术分为三种:波形编码、参数编码和混合编码。一般来说,波形编码的话音质量高,但编码速率也很高;参数编码的编码速率很低,产生的合成语音的音质不高;混合编码使用参数编码技术和波形编码技术,编码速率和音质介于它们之间。通常我们采用的是脉冲代码调制编码,即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。一、音频参数1.比特率比特率也叫码率,是指音乐每秒播放的数据量,单位用bit表示,也就是二进制位。2.采样频率采样频率是指每秒钟取得声音样本的次数。3.采样位数采样位数也叫采样大小或量化位数。4.通道数即声音的通道的数目。常见的有单声道和立体声(双声道),现在发展到了四声环绕(四声道)和5.1声道。5.帧音频的帧的概念没有视频帧那么清晰,几乎所有视频编码格式都可以简单的认为一帧就是编码后的一副图像。二、音频前后处理音频处理是指对PCM数据(也叫线性数据)进行处理,从而达到想要的效果,如回声消除。对音频编码前的PCM数据进行处理叫音频前处理,主要用于语音中,来去除各种干扰,使声音更清晰,主要有回声消除、噪声抑制、增益控制等。对音频解码后的PCM数据进行处理叫音频后处理,主要用于音乐中,来产生各种音效,使音乐更动听,主要有均衡器、混响等。三、音频传输这里主要是指网络传输,通过网络把音频数据传给对方。语音和音乐两种场景下有明显的区别。对于语音来说,实时性要求很高,主要用RTP/UDP做承载,由于UDP是不可靠传输,会丢包乱序等,影响语音质量,所以要采取相应的措施,主要有PLC(丢包补偿)、FEC(前向纠错)、重传等。对于音乐来说,以前是播放本地音乐文件,近些年随着网络带宽的加大,可以播放云端的音乐文件了。播放时要把音乐文件传给播放器,一般是边播放边下载,播放音乐对实时性要求不高,一般用HTTP/TCP做承载,也就不存在丢包乱序等问题了。四、数字音频的编码与压缩为了便于计算机存储、处理或在网络上进行传输,经过编辑后的音频数据,还必须按照某种要求与格式进行编码和压缩。1.编码目前采用的编码方式有多种,脉冲编码调制(PulseCodeModulation,PCM)是一种把模拟信号转换成数字信号最基本的编码方式,它将信号的强度依照同样的间距分成若干段,然后用独特的数码记号(通常是二进制)来编码。2.压缩压缩的目的是为了减少数据量,提高传输速率,压缩编码的基本指标之一是压缩比,它是指同一段时间间隔内的音频数据量在压缩前后的大小之比。压缩比越大,丢失的信息越多,信号还原时失真也越大。压缩编码的方式包括无损压缩和有损压缩。(1)无损压缩(2)有损压缩五、常见的音频文件格式1.CD格式标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的。2.WAVWAV是微软公司开发的一种声音文件格式,它符合PIFFResourceInterchangeFileFormat文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台及其应用程序所支持。3.AIFFAIFF是音频交换文件格式的英文缩写,是Apple公司开发的一种音频文件格式,被MACINTOSH平台及其应用程序所支持,NETSCAPE浏览器中LIVEAUDIO也支持AIFF格式。4.MP3MP3指的是MPEG标准中的音频部分,也就是MPEG音频层。5.WMAWMA(WindowsMediaAudio)格式是来自于微软的重量级选手,高保真声音通频带宽,音质更好,后台强硬,音质要强于MP3格式,更远胜于RA格式,它和VQF格式一样,是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右,WMA的另一个优点是内容提供商可以通过DRM(DigitalRightsManagement)方案如Windows
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 内蒙古杭锦旗城镇初级中学2026届初三年级模拟考试生物试题试卷含解析
- 2026年玄武岩材料耐腐蚀性能使后期防腐成本降低80%经济性测算
- 2026年波罗的海干散货指数与全球原材料贸易跟踪
- 2025年临床医学阶段测试试卷
- 软件公司客服部门负责人面试问题与技巧
- 日化产品市场推广岗位应聘全攻略
- 企业并购法务专员的面试问题与技巧
- 区块链技术原理及应用案例
- 会议议程范本
- 互联网公司软件工程师面试宝典
- 2025中国国新招聘笔试参考题库附带答案详解
- 2026法律基础常识试题及答案
- 2025年幼儿园初级保育员证考试试题和答案
- 航空航天飞控系统设计手册
- 2026年福建省烟草专卖局第二批招聘(127人)考试参考试题及答案解析
- - 育才中学2026学年春季第二学期初二年级地理实践活动与知识应用教学工作计划
- 2026年永州职业技术学院高职单招职业适应性测试模拟试题带答案解析
- 肥胖课件之针灸治疗
- “十五五规划纲要”解读:双碳引领绿色发展
- 建筑施工安全管理细则范本
- 海信集团AI面试求职者常见疑惑解答
评论
0/150
提交评论