wav音频格式.doc_第1页
wav音频格式.doc_第2页
wav音频格式.doc_第3页
wav音频格式.doc_第4页
wav音频格式.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

wav音频格式.doc.doc 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

电话录音采用什么文件格式?小灵呼电话录音系统LV包括呼叫中心系统的录音功能均采用WAV格式作为文件存储,其实WAV格式也分2、4倍压缩率及线性无压缩之分,参见电话录音压缩率说明,我们可以看到a率、u率、adpcm、8位pcm,16位pcm均可采用WAV格式存储,可见采用WAV格式存储并不一定很占空间,它还是可以采用压缩格式的。电话录音采用WAV有什么好处?WAV是Windows世界里最通用最流行的语音压缩存储格式,采用此格式存放录音文件,可以被大多数播放软件播放,而不局限于通过小灵呼软件界面播放。WAV文件格式介绍文件是Windows标准的文件格式,WAV文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。RIFF是英文Resource Interchange FileFormat的缩写,每个WAV文件的头四个字节便是“RIFF”。WAV文件由文件头和数据体两大部分组成。其中文件头又分为RIFFWAV文件标识段和声音数据格式说明段两部分。WAV文件各部分内容及格式见附表。常见的声音文件主要有两种,分别对应于单声道(11.025KHz采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。采样率是指:声音信号在“模数”转换过程中单位时间内采样的次数。采样值是指每一次采样周期内声音模拟信号的积分值。对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH); 而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位和低八位分别代表左右两个声道。WAV文件数据块包含以脉冲编码调制(PCM)格式表示的样本。WAV文件是由样本组织而成的。在单声道WAV文件中,声道0代表左声道,声道1代表右声道。在多声道WAV文件中,样本是交替出现的。WAV文件格式说明表文件头偏移地址字节数数据类型内 容00H4charRIFF标志04H4longint 文件长度08H4charWAV标志0CH4charfmt标志10H4过渡字节(不定)14H2int格式类别(10H为PCM形式的声音数据)16H2int单声道为1,双声道为2通道数18H2int采样率(每秒样本数),表示每个通道的播放速度1CH4long波形音频数据传送速率,其值为通道数每秒数据位数每样 本的数据位数8。播放软件利用此值可以估计缓冲区的大小22H2每样本的数据位数,表示每个声道中各个样本的数据位数。如果有多 个声道,对每个声道而言,样本大小都一样。 24H 4 char 数据标记符data 28H 4 long int 语音数据的长度PCM数据的存放方式:样本1 样本28位单声道 0声道 0声道8位立体声 0声道(左) 1声道(右) 0声道(左) 1声道(右)16位单声道 0声道低字节 0声道高字节 0声道低字节 0声道高字节 16位立体声 0声道(左)低字节 0声道(左)高字节 1声道(右)低字节 1声道(右)高字节PCM数据的存放方式:WAV文件的每个样本值包含在一个整数i中,i的长度为容纳指定样本长度所需 的最小字节数。首先存储低有效字节,表示样本幅度的位放在i的高有效位上, 剩下的位置为0,这样8位和16位的PCM波形样本的数据格式如下所示。样本大小数据格式最大值最小值8位PCMunsigned int225016位PCMint32767 多媒体技术近年来发展很快,较好品质的声卡可以提供16位的立体声及44KHZ的播放录制能力,它不仅可以提供原音逼真的取样,其合成的音质也十分理想,有的声卡还加入了数字信号处理器,可编程控制的DSP具有强大的运算能力,它可以用来作声音信息的压缩和一些特殊效果的处理。具有此功能的声卡提供的WAV文件提供的语音信息可以满足语音特征识别的要求。RIFF概念在Windows环境下,大部分的多媒体文件都依循着一种结构来存放信息,这种结构称为资源互换文件格式(Resources lnterchange File Format),简称RIFF。例如声音的WAV文件、视频的AV1文件等等均是由此结构衍生出来的。RIFF可以看做是一种树状结构,其基本构成单位为chunk,犹如树状结构中的节点,每个chunk由辨别码、数据大小及数据所组成。块的标志符(4BYTES)数据大小 (4BYTES)数据 图一、 块的结构示意图辨别码由4个ASCII码所构成,数据大小则标示出紧跟其后数据的长度(单位为Byte),而数据大小本身也用掉4个Byte,所以事实上一个chunk的长度为数据大小加8。一般而言,chunk本身并不允许内部再包含chunk,但有两种例外,分别为以RIFF及L1ST为辨别码的chunk。而针对此两种chunk,RIFF又从原先的数据中切出4个Byte。 此4个Byte称为格式辨别码,然而RIFF又规定文件中仅能有一个以RIFF为辨别码的chunk。RIFF/LIST标志符数据1大小数据1格式/列表类型数据图二、RIFF/LIST块结构只要依循此一结构的文件,我们均称之为RIFF档。此种结构提供了一种系统化的分类。如果和MS一DOS文件系统作比较,RIFFchunk就好比是一台硬盘的根目录,其格式辨别码便是此硬盘的逻辑代码(C:或D:),而L1STchunk即为其下的子目录,其他的chunk则为一般的文件。至于在RIFF文件的处理方面,微软提供了相关的函数。视窗下的各种多媒体文件格式就如同在磁盘机下规定仅能放怎样的目录,而在该目录下仅能放何种数据。WAV文件格式WAVE文件是非常简单的一种RIFF文件,它的格式类型为WAVE。RIFF块包含两个子块,这两个子块的ID分别是fmt和data,其中fmt子块由结构PCMWAVEFORMAT所组成,其子块的大小就是sizeofof(PCMWAVEFORMAT),数据组成就是PCMWAVEFORMAT结构中的数据。标志符(RIFF)数据大小格式类型(WAVE)fmtSizeof(PCMWAVEFORMAT)PCMWAVEFORMATdata声音数据大小声音数据 图三、WAVE文件结构PCMWAVEFORMAT结构定义如下:TypedefstructWAVEFORMATwf;/波形格式;WORDwBitsPerSample;/WAVE文件的采样大小;PCMWAVEFORMAT;/WAVEFORMAT结构定义如下:typedefstructWORDwFormatag;/编码格式,包括WAVE_FORMAT_PCM,WAVEFORMAT_ADPCM等WORDnChannls;/声道数,单声道为1,双声道为2;DWORDnSamplesPerSec;/采样频率;DWORDnAvgBytesperSec;/每秒的数据量;WORDnBlockAlign;/块对齐;WAVEFORMAT;data子块包含WAVE文件的数字化波形声音数据,其存放格式依赖于fmt子块中wFormatTag成员指定的格式种类,在多声道WAVE文件中,样本是交替出现的。如16bit的单声道WAVE文件和双声道WAVE文件的数据采样格式分别如图四所示:16位单声道:采样一采样二低字节高字节低字节高字节16位双声道:采样一左声道右声道低字节高字节低字节高字节 图四、WAVE文件数据采样格式 WAV文件格式实例分析:0 1 2 3 4 5 6 7 8 9 A B C D E F00000000H00000010H00000020H00000030H00000040H52 49 46 46 0A06010057415645666D7420120000000100020044AC000010B1020004001000000066616374040000007641000064617461D805010000000000FFFF0000FEFFFEFF 00000000FEFFFEFF0000偏移地址字节数数据类型内容文件头00H4char“RIFF”; RIFF标志04H4long int0x00 01 06 0A(注意数据存储顺序); 文件长度08H4char“WAVE”; WAVE标志0CH4char“fmt ”; fmt标志,最后一位为空10H4long int0x12; sizeof(PCMWAVEFORMAT)14H2int1(WAVE_FORMAT_PCM);格式类别,1表示为PCM形式的声音数据16H2int2;通道数,单声道为1,双声道为218H2int44100;采样频率(每秒样本数)1CH4long int0x10B10000; 每秒数据量;其值为通道数每秒数据位数每样本的数据位数8。播放软件利用此值可以估计缓冲区的大小。20H2int数据块的调整数(按字节算的),其值为通道数每样本的数据位值8。播放软件需要一次处理多个该值大小的字节数据,以便将其值用于缓冲区的调整。22H2每样本的数据位数,表示每个声道中各个样本的数据位数。如果有多个声道,对每个声道而言,样本大小都一样。50H4char“data”; 数据标记符54H4long int0x00 01 05 D8; 语音数据大小在Windows环境下,大部分的多媒体文件都依循着一种结构来存放信息,这种结构称为资源互换文件格式(Resources lnterchange File Format),简称RIFF。例如声音的WAV文件、视频的AVI文件等等均是由此结构衍生出来的。RIFF可以看做是一种树状结构,其基本构成单位为chunk,犹如树状结构中的节点,每个chunk由辨别码、数据大小及数据所组成。 辨别码由4个ASCII码所构成,数据大小则标示出紧跟其后数据的长度(单位为Byte),而数据大小本身也用掉4个Byte,所以事实上一个chunk的长度为数据大小加8。一般而言,chunk本身并不允许内部再包含chunk,但有两种例外,分别为以RIFF及LIST为辨别码的chunk。而针对此两种chunk,RIFF又从原先的数据中切出4个Byte。 此4个Byte称为格式辨别码,然而RIFF又规定文件中仅能有一个以RIFF为辨别码的chunk。 只要依循此一结构的文件,我们均称之为RIFF档。此种结构提供了一种系统化的分类。如果和MS一DOS文件系统作比较,RIFFchunk就好比是一台硬盘的根目录,其格式辨别码便是此硬盘的逻辑代码(C:或D:),而LISTchunk即为其下的子目录,其他的chunk则为一般的文件。至于在RIFF文件的处理方面,微软提供了相关的函数。视窗下的各种多媒体文件格式就如同在磁盘机下规定仅能放怎样的目录,而在该目录下仅能放何种数据。 WAV为WAVEFORM(波形)的缩写。在声音文件的结构中,RIFF的格式辨别码为WAVE。整个文件由两个chunk所组成:辨别码fmt (注意,后面有一个空格)及data。 在fmt 的chunk下包含了一个PCMWAVEFORMAT数据结构,其定义如下: typedef struct pcmwaveformat - tag WAVEFORMAT wf ; WORD wBitsPerSample; PCMWAVEFORMAT; typedef struct waveformat - tag WORD wFormatTag ; WORD nChannels; DWORD nSamplesPerSec; DWORD nAvgBytesperSec; WORD nBlockAlign; WAVEFORMAT; 其意义分别为: wFormatTag:记录着此声音的格式代号,例如WAVE_FORMAT_PCM,WAVE_F0RAM_ADPCM等等。 nChannels:记录声音的频道数。 nSamp1esPerSec:记录每秒取样数。 nAvgBytesPerSec:记录每秒的数据量。 nBlockA1ign:记录区块的对齐单位。 wBitsPerSample:记录每个取样所需的位元数。dataChunk包含真正的声音数据。Window目前仅提供WAVE_FORMAT_PCM一种数据格式,所代表的意义是脉派编码调变(Pu1se Code Modulation)。针对此格式,Windows定义了在data的chunk中数据的存放情形,图2中列出了四种不同频道数及取样所需的位元数以及位元位置的安排。 RIFF 频道0 频道0 频道0 频道0 xxxx nChannels=1,wBitsPerSample=8 WAVE 频0(左) 频道1(右) 频道0(左) 频道1 (右) fmt nChannels=2,wBitsPerSample=8 sizeof(PCMWAVEFORMAT) struct of PCMWAVEFORMAT 频道0(低位) 频道0(高位) 频道0(低位)频道0(高位) data nChannels=1,wBitsPerSample=16 xxxx 频道0(低位) 频道0(高位) 频道0(低位)频道0(高位) (低位) (高位) (低位) (高位) wave form data nChannels=2,wBitsPerSample=16 图1 WAV文件结构 图2 PCM文件中位元安排方式 第一排表示单声道8位元,第二排表示双声道8位元,第三排表示单声道16位元,第四排表示双声道16位元。8位元代表音量大小由8个位元所表示,16位元则代表音量大小由16个位元所表示。理论上8位元可以表示0255,16位元可表示065536

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论