语音通信系统设计毕业论文.doc

上传人：简*** IP属地：湖北上传时间：2020-04-14 格式：DOC 页数：80 大小：489KB 积分：9.6 举报 版权申诉

已阅读5页，还剩75页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

盐城工学院本科生毕业设计说明书 2010 语音通信系统设计毕业论文目录 1 绪论 1 1 1课题背景及意义 1 1 2 课题现状 1 1 3 开发平台开发技术 1 2 系统需求分析及要求 3 2 1 语音通信系统需求分析 3 2 2 系统的功能要求 3 2 3 系统性能要求 3 3 系统整体设计 4 4 各模块详细设计 7 4 1 音频编解码 7 4 2 音频采集及回放 13 4 3 网络的传送和接收 22 4 4 界面设计 35 5 测试 42 5 1 模块测试 42 5 2 功能测试 42 结论 47 致谢 48 附录 49 程序核心代码 49 1 绪论 1 1课题背景及意义即时聊天工具是一种可以让使用者在网络上实时通讯的工具大部分的即时通讯工具提供了状态信息的特性如显示联络人名单联络人是否在线及能否与联络人交谈等目前在互联网上受欢迎的即时通讯软件包括百度QQ MSN Messenger Yahoo Messenger AOL Instant Messenger NET Messenger Service Jabber ICQ等在本设计中将讨论一种基于MFC Socket的局域网通信工具的设计与实现方法基于Socket的局域网通信软件可以为局域网提供一种良好安全快速的通信机制在局域网内部通信教学讨论等应用中都具有一定的实用价值它同时很好地诠释了Socket通信的原理基于Socket的局域网通信软件应用范围广阔不但可以处理传统的通信需求而且也能扩展以适应新型的网络应用如网络教育数据影音传输等拥有广泛的应用前景 1 2 课题现状基于局域网的即时通信工具实际上是互联网即时通信工具的一个小规模版本广域网上的即时通信工具如今一般采用UDP或者 TCP协议体系来实现开发技术已经比较成熟比如较早的ICQ MSN Messenger YAHOO通等国外开发的产品还有国产的有名的QQ 新浪UC LAVA LAVA等这些工具统统都实现了广域网上的即时通信尽管都是即时通信实现了即时聊天以及文件传输的主要功能但是也各有各的特色比如ICQ的巨大客户群 MSN的个性化表情 YAHOO通的易操作性等而QQ也具有一个相当方便的屏幕截图功能另外就是所有上述软件都实现了网络即时的视频语音聊天功能这些软件在使用方面各有特色在实现方面也各有所长但由于这些产品正在商业运营阶段其实现方式属于商业机密具体细节不可能得知但是它在大的方面无非就是各种利用各种平台上的网络通信接口建构基于下层TCP IP 或者UDP IP协议的软件产品在局域网内这些功能的实现跟广域网相比更加简单因为局域网的网络结构本身比广域网要简单但是可以借此理解网络协议以及网络通信工具的实现原理所以仍然极具研究价值 1 3 开发平台开发技术 1 3 1 VC 6 0 简介我们通常所说的Visual C 实际上是一个完善的非常强大的C 程序开发环境它的名字是 Microsoft Developer Studio 二者之间的细小差别并不重要通常这两个术语可以互换但如果你不围绕Developer Studio 来进行学习就不能有效地使用Visual C Developer Studio 听起来很像Visual Studio 但它们之间没有关系它包含 C 编译器调试器应用程序框架生成器项目管理器设计和实现菜单等资源的编辑器等等 Visual C 是一个功能强大的可视化应用程序开发工具用于Windows环境下32位的应用程序的开发是计算机界公认的最优秀的应用开发工具之一在提供可视化的编程方式的同时 Visual C 也适用于编写直接对系统底层操作的程序生成代码的质量也优于其它的开发工具在Visual C 环境下利用Microsoft的基本类库MFC Microsoft Foundation Class Library 可以使用完全的面向对象的方法来进行Windows 95 98 NT应用程序的开发使得Windows程序员从大量的复杂劳动中解救出来体会到真正的程序语言的强大功能和良好的灵活性 Visual C 编程是一个面向对象的程序设计方法同传统的结构化程序设计方法相比它缩短软件的研制时间提高软件的开发效率使程序员可以更好地理解和管理庞大而复杂的程序面向对象的程序设计吸取了结构化程序设计的精华它利用了人们根据对事物分类和抽象的倾向引入了类和对象的概念具有封装性数据抽象继承和多态的特点与结构化程序设计不同的是面向对象程序设计是用类抽象代表现实的实体用类之间的继承关系表示程序设计的抽象过程函数只是对数据的操作没有数据的概念而类是数据和数据操作的集合由于面向对象的程序设计方法非常近现实所以越来越流行 Visual C 中集成了大量的最新技术如ActiveX COM等技术程序开发人员可以紧紧地把握住软件开发技术发展的方向开发出功能强大的应用程序 Visual C 还提供了丰富的技术资源 MSDN Microsoft Develop Network 提供了强大的联机帮助支持同时还可以通过访问Microsoft的网上站点来获得最新的技术文档 1 3 2 Windows Socket 网络编程 Windows Sockets 规范是以U C Berkeley 大学BSD UNIX 中流行的Socket 接口为范例定义了一套开放的支持多种协议的 Microsoft Windows 下的网络编程接口并不是一种网络协议它不仅包含了人们所熟悉的Berkeley Socket 风格的库函数也包含了一组针对Windows 的扩展库函数以使程序员能充分地利用Windows 消息驱动机制进行编程 Windows Sockets 规范本意在于提供给应用程序开发者一套简单的API 使应用程序开发者能够使用并且网络软件供应商能够实现的一套库函数调用和相关语义现在的Windows Sockets已经基本上实现了与协议无关你可以使用Windows Sockets来调用多种协议的功能但较常使用的是TCP IP协议 Socket实际在计算机中提供了一个通信端口可以通过这个端口与任何一个具有Socket接口的计算机通信应用程序在网络上传输接收的信息都通过这个Socket接口来实现微软为VC定义了Windows Sockets类如CAsyncSocket类和派生于CAsyncSocket 的CSocket类它们简单易用 2 系统需求分析及要求 2 1 语音通信系统需求分析随着现代计算机技术的不断发展多媒体已经成为现代计算机不可缺少的功能而计算机的音频视频功能是其中最为重要的部分而随着网络的不断发展网络已经成为人们最重要的交流方式之一计算机硬件的更新非凡是海量存储设备和大容量内存在PC机上的实现对音频媒体进行数字化处理早已经成为可能现在企业机关学校都建立起了局域网虽然可以通过文件共享的方式进行通讯但单使用这种方式非常不方便在网上邻居里只能看到机器名不清楚对方是谁也不知道对方机器里有什么资源可以共享尤其当局域网的机器很多时这种方式就更加麻烦了而文字聊天方式比较单一缺乏真实感所以语音通信就有了必要但是语音传输需要有很大的网络带宽对于拨号上网用户语音传输仍然是奢侈品不过对于局域网和宽带用户来说是很不错的选择本系统就是研究的基于局域网的语音传输并以语音聊天为例给出了实例语音聊天方式一般有两种一种是专门的语音聊天室采用Web方式 B S结构另外一中则是类似于QQ MSN等聊天工具采用C S结构本设计是采用的后者 TCP IP网络中两个进程间的相互作用的主机模式是客户机服务器模式该模式的建立基于以下两点 1 非对等作用 2 通信完全是异步的客户机服务器模式在操作过程中采取的是主动请示方式首先服务器方要先启动并根据请示提供相应服务综上所述做一个语音通信软件是有必要的也是能够实现的 2 2 系统的功能要求在线朋友指的是在所有使用本系统在局域网上进行信息传递的用户局域网中在线用户之间的语音聊天就是指在线双方互相传递语音信息的功能 1 在聊天窗口为基础建立与服务器端的连接 2 与对方连接以后开始语音聊天 3 想结束语音聊天时按结束键就能与对方断开连接即结束语音聊天 2 3 系统性能要求 1 时间性能要求在实际应用中由于客户端的大量频繁的访问服务器响应时间应该尽可能缩短对于有特殊需求的应用还要求达到实时响应 2 存储性能要求根据应用中的实际情况配置适当容量的存储设备特别是音频存储设备容量方面要适当得配置 3 稳定性安全性要求要求软件尽可能的稳定对于一般的应用系统对安全性要求不高对于特殊的应用还需要在安全性方面加以保证所以要相应提高服务器端的配置 3 系统整体设计要实现点对点语音通信原理非常简单只要针对一个点实现话音的实时采集处理播放同时能进行可靠的传送和接收这样两点一连便可通话对于前者采用Windows 的低层音频服务比较合适因为低层音频服务中的回调机制为我们提供了很大的方便当应用程序不断向设备驱动程序提供音频数据时设备驱动程序控制音频设备在后台完成录音和放音的具体操作通过回调机制我们又可以检测到什么时候用完一个数据块并及时传送下一个数据块从而保证了声音的连续有了这种实时采集回放功能后接下来的工作就是在网络上传送话音数据在点对点网络传输方面选择面向连接的TCP IP协议 TCP IP传输协议自动处理分组丢失和交付失序问题这样我们不用为这些问题操心只需很好地利用这个连接在采集话音回放之前一方面将自己的话音传给网络另一方面接收网络传来的话音这样便实现了点对点语音通信其模块框图如图 3 1所示总体结构图为图3 2所示语音通信系统音频采集音频回放网络传输音频编解码图 3 1 模块框图图 3 2 总体结构图一个完整的音频通信系统程序要完成以下工作发送端完成音频采集压缩编码码流发送等接收端则要完成码流接收解码恢复音频回放等其总体程序流程图如图3 3所示程序开始启动音频输入输出呼叫对方连接成功连接失败压缩编码音频输出音频输入 Socket发送网络 Socket 接收程序退出图 3 3 总体程序流程 4 各模块详细设计 4 1音频编解码 4 1 1音频编解码介绍自然界中的声音非常复杂波形极其复杂通常我们采用的是脉冲代码调制编码即PCM编码 PCM通过抽样量化编码三个步骤将连续变化的模拟信号转换为数字编码 1 采样率和采样大小位 bit 声音其实是一种能量波因此也有频率和振幅的特征频率对应于时间轴线振幅对应于电平轴线波是无限光滑的弦线可以看成由无数点组成由于存储空间是相对有限的数字编码过程中必须对弦线的点进行采样采样的过程就是抽取某点的频率值很显然在一秒中内抽取的点越多获取得频率信息更丰富为了复原波形一次振动中必须有2个点的采样人耳能够感觉到的最高频率为20kHz 因此要满足人耳的听觉要求则需要至少每秒进行40k次采样用40kHz表达这个40kHz就是采样率我们常见的CD 采样率为44 1kHz 光有频率信息是不够的我们还必须获得该频率的能量值并量化用于表示信号强度量化电平数为2的整数次幂我们常见的CD位16bit的采样大小即2的16次方采样大小相对采样率更难理解因为要显得抽象点举个简单例子假设对一个波进行8次采样采样点分别对应的能量值分别为A1 A8 但我们只使用2bit的采样大小结果我们只能保留A1 A8中4个点的值而舍弃另外4个如果我们进行3bit的采样大小则刚好记录下8个点的所有信息采样率和采样大小的值越大记录的波形更接近原始信号 2 有损和无损根据采样率和采样大小可以得知相对自然界的信号音频编码最多只能做到无限接近至少目前的技术只能这样了相对自然界的信号任何数字音频编码方案都是有损的因为无法完全还原在计算机应用中能够达到最高保真水平的就是PCM编码被广泛用于素材保存及音乐欣赏 CD DVD以及我们常见的WAV文件中均有应用因此 PCM约定俗成了无损编码因为PCM代表了数字音频中最佳的保真水准并不意味着PCM就能够确保信号绝对保真 PCM也只能做到最大程度的无限接近我们而习惯性的把MP3列入有损音频编码范畴是相对PCM编码的强调编码的相对性的有损和无损是为了告诉大家要做到真正的无损是困难的就像用数字去表达圆周率不管精度多高也只是无限接近而不是真正等于圆周率的值 3 音频压缩技术要算一个PCM音频流的码率是一件很轻松的事情采样率值采样大小值声道数 bps 一个采样率为44 1KHz 采样大小为16bit 双声道的PCM编码的WAV文件它的数据速率则为 44 1K 16 2 1411 2 Kbps 我们常说128K的MP3 对应的WAV的参数就是这个1411 2 Kbps 这个参数也被称为数据带宽它和ADSL中的带宽是一个概念将码率除以8 就可以得到这个WAV的数据速率即176 4KB s 这表示存储一秒钟采样率为44 1KHz 采样大小为16bit 双声道的PCM编码的音频信号需要176 4KB的空间 1分钟则约为10 34M 这对大部分用户是不可接受的尤其是喜欢在电脑上听音乐的朋友要降低磁盘占用只有2种方法降低采样指标或者压缩降低指标是不可取的因此专家们研发了各种压缩方案 4 频率与采样率采样率表示了每秒对原始信号采样的次数我们常见到的音频文件采样率多为44 1KHz 这意味着什么呢假设我们有2段正弦波信号分别为20Hz和20KHz 长度均为一秒钟以对应我们能听到的最低频和最高频分别对这两段信号进行40KHz的采样我们可以得到一个什么样的结果呢结果是 20Hz的信号每次振动被采样了40K 20 2000次而20K的信号每次振动只有2次采样显然在相同的采样率下记录低频的信息远比高频的详细这也是为什么有些音响发烧友指责CD有数码声不够真实的原因 CD的44 1KHz采样也无法保证高频信号被较好记录要较好的记录高频信号看来需要更高的采样率于是有些朋友在捕捉CD音轨的时候使用48KHz的采样率这是不可取的这其实对音质没有任何好处对抓轨软件来说保持和CD提供的44 1KHz一样的采样率才是最佳音质的保证之一而不是去提高它较高的采样率只有相对模拟信号的时候才有用如果被采样的信号是数字的请不要去尝试提高采样率 5 流特征随着网络的发展人们对在线收听音乐提出了要求因此也要求音频文件能够一边读一边播放而不需要把这个文件全部读出后然后回放这样就可以做到不用下载就可以实现收听了也可以做到一边编码一边播放正是这种特征可以实现在线的直播架设自己的数字广播电台成为了现实 4 1 2 PCM编码和WAVE音频格式 1 PCM编码 PCM 脉冲编码调制是Pulse Code Modulation的缩写前面的文字我们提到了PCM大致的工作流程我们不需要关心PCM最终编码采用的是什么计算方式我们只需要知道PCM编码的音频流的优点和缺点就可以了 PCM编码的最大的优点就是音质好最大的缺点就是体积大我们常见的Audio CD就采用了PCM编码 2 WAVE 这是一种经典的音频文件格式由微软开发 WAV是一种文件格式符合 PIFF Resource Interchange File Format规范所有的WAV都有一个文件头这个文件头音频流的编码参数 WAV对音频流的编码没有硬性规定除了PCM之外还有几乎所有支持ACM规范的编码都可以为WAV的音频流进行编码很多朋友没有这个概念我们拿AVI做个示范因为AVI和WAV在文件结构上是非常相似的不过AVI多了一个视频流而已我们接触到的AVI有很多种因此我们经常需要安装一些Decode才能观看一些AVI 我们接触到比较多的DivX就是一种视频编码 AVI可以采用DivX编码来压缩视频流当然也可以使用其他的编码压缩同样 WAV也可以使用多种音频编码来压缩其音频流不过我们常见的都是音频流被PCM编码处理的WAV 但这不表示WAV只能使用PCM编码 MP3编码同样也可以运用在WAV中和AVI一样只要安装好了相应的Decode 就可以欣赏这些WAV了在Windows平台下基于PCM编码的WAV是被支持得最好的音频格式所有音频软件都能完美支持由于本身可以达到较高的音质的要求因此 WAV也是音乐编辑创作的首选格式适合保存音乐素材因此基于PCM编码的WAV被作为了一种中介的格式常常使用在其他编码的相互转换之中例如MP3转换成WMA 3 PCM编码的WAV PCM编码的WAV文件是音质最好的格式 Windows平台下所有音频软件都能够提供对它的支持 Windows提供的WinAPI中有不少函数可以直接播放wav 因此在开发多媒体软件时往往大量采用wav 用作事件声效和背景音乐 PCM编码的wav可以达到相同采样率和采样大小条件下的最好音质因此也被大量用于音频编辑非线性编辑等领域其特点是音质非常好被大量软件所支持适用于多媒体开发保存音乐和音效素材所以本设计选用WAV格式的音频进行录制和播放 4 1 3 G729编解码本设计使用G729编解码标准对音频进行音频编解码在Visual C 环境中直接调用G729库来对音频数据进行处理 4 1 3 1 G729编解码标准 20世纪80年代末为满足长途通信的需求 ITU制订8kbps的高质量低延时的语音编码标准 1 技术指标采样率 8kHz 码率 8kbps 2 技术特点采用代数码本码书简单无需存储恢复音质清晰分析窗采用混合窗 LSP参数采用两级矢量量化基音分析采用开环基音分析和自适应码本搜索结合低运算复杂度高精度采用10ms分析帧编码时延小 3 应用状况被广泛应用于IP电话视讯电话视讯会议系统等 4 技术框架如图 4 1所示图4 1 G729编解码技术框架 4 1 3 2 G729编解码 C 实现核心代码音频解码 pragma comment lib G729a 构造函数 CAudioCode CAudioCode va g729a init encoder 初始化编码器 va g729a init decoder 初始化解码器析构函数 CAudioCode CAudioCode 编码音频数据 BOOL CAudioCode EncodeAudioData char pin int len char pout int lenr 编码成功与否标记 BOOL bRet FALSE 无效输入或输出 if pin len SIZE AUDIO FRAME pout goto RET 分块进行编码 va g729a encoder short pin BYTE pout va g729a encoder short pin 160 BYTE pout 10 va g729a encoder short pin 320 BYTE pout 20 va g729a encoder short pin 480 BYTE pout 30 va g729a encoder short pin 640 BYTE pout 40 va g729a encoder short pin 800 BYTE pout 50 编码长度 if lenr lenr SIZE AUDIO PACKED 编码成功标记 bRet TRUE RET 返回 return bRet 音频解码 BOOL CAudioCode DecodeAudioData char pin int len char pout int lenr 解码成功与否标记 BOOL bRet FALSE 无效输入或输出 if pin len SIZE AUDIO PACKED pout goto RET 分块解码 va g729a decoder BYTE pin short pout 0 va g729a decoder BYTE pin 10 short pout 160 0 va g729a decoder BYTE pin 20 short pout 320 0 va g729a decoder BYTE pin 30 short pout 480 0 va g729a decoder BYTE pin 40 short pout 640 0 va g729a decoder BYTE pin 50 short pout 800 0 解码长度 if lenr lenr SIZE AUDIO FRAME 设置解码成功标记 bRet TRUE RET return bRet 4 2 音频采集及回放本设计采用基于WaveX 低级音频API 采集音频及实时播放的技术利用双多缓冲技术和网络拥塞控制策略可很好的控制音频的实时性和连续性双多缓冲技术可以很好的实现声音的快速连续采集和实时顺畅播放 4 2 1 方案选择音频的采集WINDOWS 下音频的采集播放有三种模式 1 通过高级音频函数媒体控制接口MCI 1 2 设备驱动程序 2 低级音频函数MIDI Mapper 低级音频设备驱动 WaveX API 3 利用DirectX 中的DirectSound 使用MCI 的方法极其简便灵活性较差因此较难推广使用低级音频函数的方法相对来说难一点但是能够对音频数据进行灵活的操控而采用DirectSound 的方法控制声音数据灵活效果比前二者都好但实现起来是三者中最难的其三者的关系如图4 2所示图 4 2 三者关系低层音频服务及重要的数据结构低级音频服务控制着不同的音频设备这些设备包括 WAVE MIDI 和辅助音频设备如果想编写一个功能较强大的音频处理程序那就必须使用低级音频函数和多媒体文件I O来控制音频设备的输入和输出因为低级音频函数可直接与音频驱动程序交互通过窗口消息或回调 CALL BACK 函数来管理音频数据块的记录和播放控制非常灵活重要的一点是低级音频函数为我们提供了一个设备无关的接口低层音频服务及重要的数据结构低级音频服务控制着不同的音频设备这些设备包括 WAVE MIDI 和辅助音频设备低级音频服务包括如下内容 1 查询音频设备 2 打开和关闭设备驱动程序 3 分配和准备音频数据块 4 管理音频数据块 5 应用MMTIME 结构 6 处理错误 4 2 2 相关数据结构 1 WaveX 低级音频函数的相关声明和定义在mmsystem h 头文件和Winmm lib 库中所以如果程序中用到这些函数必须包含mmsystem h 这个头文件同时导进Winmm lib 库如下 include mmsystem h pragma comment lib Winmm lib 2 声音在采集和播放的时需要有一些统一的格式包括音频格式类型声道采样率等信息下面的数据结构具体描述了该格式 wFormatTag 是音频格式类型 nChannels 是声道数 nSamplesPerSec 是采样频率 nAvgBytesPerSec 是每秒钟的字节数 nBlockAlign 是每个样本的字节数 wBitsPerSample 是每个样本的量化位数 cbSize 是附加信息的字节大小 3 音频数据块有一个头结构这个结构包含了音频数据缓冲的地址大小已录音数据大小等信息和其他各种控制标志这个结构适用于音频的输入录音和输出播放缓冲中详细信息包括 lpData 是指定的缓冲块地址 dwBufferLength 是指定的缓冲块大小 dwBytesRecorded 是已录音数据大小 dwUser 是用户数据 dwFlags 是控制标志表明缓冲的使用状态 dwLoops 是音频输出时缓冲数据块循环的次数 lpNext 和reserved 是系统保留数据在程序实现时通过设置或修改这个结构的相关参数来实现对音频输入和输出缓冲区的控制 4 2 3 音频采集 4 2 3 1 音频采集原理电脑依靠声卡来处理声音 Windows把声卡看作是录音和放音设备的组合体录音时首先要准备一个录音队列队列中包含录音的基本参数比如录音数据缓冲区的地址缓冲区的大小等为了使录音过程平滑的进行队列中至少包含两个以上数据缓冲区当一个缓冲区录完后 Windows系统会给应用程序发送一个录音结束的消息并自动开始转入下一个缓冲区进行录音应用程序收到该消息后应该释放含有录音数据的队列并取出该队列所指向的缓冲区的声音数据然后将该缓冲区再次加入录音队列以便继续进行录音 Windows就是这样利用这些数据缓冲区进行周而复始的录入工作采集声音时缓冲满了会有一个消息程序在响应这个消息需要几毫秒几十毫秒甚至更多的时间假设为Xms 如果只使用一个缓冲程序必须在响应完该消息才再次采集声音那么在这Xms 的时间里没有采集到任何声音声音的播放也是一样的道理这样声音就会不连续因此双缓冲或多缓冲技术是必要的让输入和输出设备可以循环使用这些缓冲当程序在响应某块缓冲数据已满或播放完毕消息时声卡可以继续往下一块缓冲添加数据或播放下一块缓冲的数据如此循环保障声音的连续性其基本原理图如图4 3所示图 4 3 音频采集原理图 4 2 3 2 音频采集具体流程在使用音频设备之前必须打开设备驱动程序为可靠起见在播放和记录音频之前要确定系统音频设备的能力在用完之后必须关闭音频设备音频采集流程图如图4 4所示具体流程如下 1 查询设备数目和能力因为计算机的硬件和性能各不相同所以在音频采集前首先要检测有无音频录制设备通过使用waveOutGetNumDevs和waveOutGetDevCaps来获取波形输出设备的个数和能力只有在确定设备存在之后才可以打开设备使用设备 2 打开波形输出设备在使用录入设备前必须打开音频录入设备这里可以调用waveOutOpen为进行重放操作打开特定的波形设备该函数打开与指定的设备相关联的设备并以给出指定内存句柄的方法返回打开波形设备的句柄当有多种波形输出设备时建议使用WAVE MAPPER常数作为设备ID 这使waveOutOpen函数会自动挑选最适合播放给定的数据格式的设备 3 准备音频数据块在录制时音频录入会产生大量的数据所以我们要为这些数据分配缓冲区在波形重放之前要准备好音频数据块将数据块传递给设备驱动程序就实现了重放使用的函数是waveOutPerpareHeader 4 开始录制经过以上步骤后一切准备就绪调用WaveInStart就可以开始录制当一个缓冲区使用完后音频驱动程序就调用上述在打开录入设备时指定的回调函数在用完数据块之后必须用waveOutUnPrepareHeader函数来清除对波形数据块的准备再将数据读出然后再把该缓冲区添加给驱动程序图4 4 音频采集流程图 4 2 3 3音频采集核心代码 WaveIn CPP class CWaveIn public 线程处理 static DWORD WINAPI AudioInThreadProc LPVOID lpParameter public 获取数据 virtual void GetData char pBuffer int iLen 启动录音 BOOL StartRec 停止录音 BOOL StopRec 获取实例 inline DWORD GetInstance 获取采样位数 inline WORD GetBit 获取采样速率 inline DWORD GetSample 获取频道数 inline WORD GetChannel 设置采样位数 inline void SetBit WORD wBit 设置采样速率 inline void SetSample DWORD dwSample 设置采样速率 inline void SetChannel WORD wChannel 获取错误信息 inline MMRESULT GetLastMMError CString GetLastErrorString 构造函数 CWaveIn 析构函数 virtual CWaveIn protected 打开设备 BOOL OpenDev 关闭设备 BOOL CloseDev 停止线程 BOOL StopThread 启动线程 BOOL StartThread 准备缓存 BOOL PerPareBuffer 释放缓存 BOOL FreeBuffer 开始录音 BOOL OpenRecord 结束录音 BOOL CloseRecord protected 用户实例数据 static DWORD s dwInstance protected 频道数 WORD m wChannel 采样速率 DWORD m dwSample 采样位数 WORD m wBit protected 音频输入设备句柄 HWAVEIN m hIn 函数调用返回信息 MMRESULT m mmr 回调函数指针 DWORD m dwAudioInId 线程句柄 HANDLE m hAudioIn WAVEHDR结构缓存指针 WAVEHDR m pHdr 线程启动标志 BOOL m bThreadStart 设备打开标记 BOOL m bDevOpen 内存分配标记 BOOL m bAllocBuffer 录音开始标记 BOOL m bRecord 4 2 4 音频回放 4 2 4 1音频回放原理经过处理过的语音数据通过音频处理传送到这个模块当接收到语音数据以后它将经过录音的语音数据进行放音然后把内存释放出来以备保存其他缓冲区里保存的声源信息由于声音数据具有很强的前后相关性数据量大实时性强又由于声音是连续的通常把其称之为连续型时基媒体类型因此需要释放内存当缓冲区接收到声源以后要是内存不够的话就不能及时把全部语音数据保存并传送所以经过这个模块以后就得把录音内存释放掉好让上一个模块及时得到完成其基本原理图如图4 5所示图4 5 音频回放原理图 4 2 4 2 音频回放具体流程缓冲区中数据播放完成后系统会向应用程序发送放音完成的消息应用程序可以重复前面的工作先释放完成的队列然后向缓冲区加入新的声音数据并再次将该缓冲区加入放音队列让该队列继续工作音频回放流程图如图4 6所示具体流程如下 1 管理波形重放在使用低级音频函数播放音频时应用程序必须不断地向设备驱动程序提供数据块直到播放结束 WINDOWS提供两种方法管理波形重放一是使用窗口消息管理二是使用低级回调函数管理另外通过使用waveOutPause waveOutRestart和waveOutReset来进行暂停重新启动和停止播放 2 关闭波形设备用完设备之后必须调用waveOutClose函数关闭波形输出设备以便其他程序可以使用设备图4 6 音频回放流程图 4 2 4 3音频回放核心代码 class CWaveOut public 线程处理 static DWORD WINAPI AudioOutThreadProc LPVOID lpParameter public 根据文件设置格式 BOOL SetFormatByFile CString file 播音 BOOL Play char buf UINT uSize 开始播音 BOOL StartPlay 停止播音 BOOL StopPlay 获取缓存数目 inline int GetBufferNum 减少缓存数目 inline void BufferSub 增加缓存数目 inline void BufferAdd 获取实例 inline DWORD GetInstance 获取采样位数 inline WORD GetBit 获取采样速率 inline DWORD GetSample 获取频道数 inline WORD GetChannel 设置采样位数 inline void SetBit WORD wBit 设置采样速率 inline void SetSample DWORD dwSample 设置频道数 inline void SetChannel WORD wChannel 获取错误信息 inline MMRESULT GetLastMMError CString GetLastErrorString 构造函数 CWaveOut 析构函数 virtual CWaveOut protected 打开设备 BOOL OpenDev 关闭设备 BOOL CloseDev 停止线程 BOOL StopThread 启动线程 BOOL StartThread protected 用户实例数据 static DWORD s dwInstance protected 频道数 WORD m wChannel 采样速率 DWORD m dwSample 采样位数 WORD m wBit protected 函数调用返回信息 MMRESULT m mmr 播音设备句柄 HWAVEOUT m hOut 线程句柄 HANDLE m hAudioOut 回调函数指针 DWORD m dwAudioOutId 缓存数目 int m iBufferNum 重要部分 critical section CCriticalSection m csLock 线程启动标志 BOOL m bThreadStart 播音设备打开标志 BOOL m bDevOpen 线程处理 friend DWORD WINAPI AudioOutThreadProc LPVOID lpParameter 4 3 网络的传送和接收网络的传输和接收部分是本设计最重要的模块对于主机1传送到主机2的音频数据信息这条数据通路主机1为客户端主机2为服务端而对于主机2传送到主机1的音频数据信息这条数据通路主机2为客户端主机1为服务器端双方通话时主机1和主机2同时既处于服务器状态又处于客户端状态即通话状态主机1呼叫主机2时主机1进入客户端状态主机2收到呼叫信息进入服务器端状态若主机2同意通话则两机都进入通话状态双方可以通过上述两条数据通路进行网络通话若有一机挂断两机都返回侦听状态等待呼叫或被呼叫 4 3 1 TCP IP 体系结构与特点 4 3 1 1 TCP IP体系结构 TCP IP协议实际上就是在物理网上的一组完整的网络协议其中TCP是提供传输层服务而IP则是提供网络层服务 TCP IP包括以下协议结构图如图4 7 图 4 7 TCP IP结构图 IP 网间协议 Internet Protocol 负责主机间数据的路由和网络上数据的存储同时为ICMP TCP UDP提供分组发送服务用户进程通常不需要涉及这一层 ARP 地址解析协议 Address Resolution Protocol 此协议将网络地址映射到硬件地址 RARP 反向地址解析协议 Reverse Address Resolution Protocol 此协议将硬件地址映射到网络地址 ICMP 网间报文控制协议 Internet Control Message Protocol 此协议处理信关和主机的差错和传送控制 TCP 传送控制协议 Transmission Control Protocol 这是一种提供给用户进程的可靠的全双工字节流面向连接的协议它要为用户进程提供虚电路服务并为数据可靠传输建立检查大多数网络用户程序使用TCP UDP 用户数据报协议 User Datagram Protocol 这是提供给用户进程的无连接协议用于传送数据而不执行正确性检查 FTP 文件传输协议 File Transfer Protocol 允许用户以文件操作的方式文件的增删改查传送等与另一主机相互通信 SMTP 简单邮件传送协议 Simple Mail Transfer Protocol SMTP协议为系统之间传送电子邮件 TELNET 终端协议 Telnet Terminal Procotol 允许用户以虚终端方式访问远程主机 HTTP 超文本传输协议 Hypertext Transfer Procotol TFTP 简单文件传输协议 Trivial File Transfer Protocol 4 3 1 2 TCP IP特点 TCP IP协议的核心部分是传输层协议 TCP UDP 网络层协议 IP 和物理接口层这三层通常是在操作系统内核中实现因此用户一般不涉及编程时编程界面有两种形式一是由内核心直接提供的系统调用二使用以库函数方式提供的各种函数前者为核内实现后者为核外实现用户服务要通过核外的应用程序才能实现所以要使用套接字 socket 来实现 Socket与TCP IPc协议的关系如图4 8 图 4 8 Socket与TCP IPc协议 4 3 1 3 Windows Socket VC 对网络编程的支持有socket支持 Winlnet支持 MAPI和ISAPI支持等其中Windows Sockets API是TCP IP网络环境里也是Internet上进行开发最为通用的API 最早美国加州大学Berkeley分校在UNIX下为TCP IP协议开发了一个API 这个API就是著名的Berkeley Socket接口套接字在桌面操作系统进入Windows时代后仍然继承了Socket方法从表4 1中可以看出主要的WinSock API函数表4 1 WinSock API函数函数功能 WSAStartup 连结应用程序与 Windows Sockets DLL 的第一个函数 WSACleanup 结束 Windows Sockets DLL 的使用 socket 建立Socket closesocket 关闭某一Socket bind 将一本地地址与一个SOCKET描述字连接在一起 listen 设定 Socket 为监听状态准备被连接 accept 接受某一Socket的连接要求以完成面向连接的客户端 Socket 的连接请求 connect 要求连接某一Socket到指定的网络上服务端 recv 从面向连接的 Socket 接收信息 send 使用面向连接的 Socket 发送信息 WSAAsyncSelect 要求某一 Socket 有事件 event 发生时通知使用者套接字 Socket 是一种双向的通信接口可以通过这个端口与任何一个具有Socket端口的计算机通信套接字是网络通信的基础 Socket在Windows以句柄的形式被创建使用Socket进行网络通信必须包含下面的几种信息双方认可的协议本地主机的IP地址本地进程的协议端口对方主机的IP地址对方进程的协议端口 Socket可分为 1 数据报套接字 Datagram Sockets 对于在TCP IP上实现的WinSock 数据报套接字使用用户数据报协议 UDP 数据报套接字提供了一种不可靠的非连接的数据包通信方式 2 流式套接字 Stream Sockets 流式套接字使用传输控制协议 TCP 流式套接字可以将数据按顺序无重复地发送到目的地它提供的是一种可靠的面向连接的数据传输方式不管是对单个的数据报还是对数据包流式套接字都提供了一种流式数据传输在TCP IP网络中两个进程间的相互作用的主机模式是客户机服务器模式 Client Server model 该模式的建立基于以下两点 1 非对等作用 2 通信完全是异步的客户机服务器模式在操作过程中采取的是主动请示方式首先服务器方要先启动并根据请示提供相应服务过程如下 1 打开一通信通道并告知本地主机它愿意在某一个公认地址上接收客户请求 2 等待客户请求到达该端口 3 接收到重复服务请求处理该请求并发送应答信号 4 返回第二步等待另一客户请求 5 关闭服务器而客户方过程为 1 打开一通信通道并连接到服务器所在主机的特定端口 2 向服务器发送服务请求报文等待并接收应答继续提出请求 3 请求结束后关闭通信通道并终止其中基本的套接字有以下几种 1 创建套接字 socket 功能使用前创建一个新的套接字格式 SOCKET PASCAL FAR socket int af int type int procotol 参数 af 通信发生的区域 type 要建立的套接字类型 2 指定本地地址 bind 功能将套接字地址与所创建的套接字号联系起来格式 int PASCAL FAR bind SOCKET s const struct sockaddr FAR name int namelen 参数 s 是由socket 调用返回的并且未作连接的套接字描述符套接字号其它没有错误 bind 返回0 否则SOCKET ERROR地址结构说明 struct sockaddr in short sin family AF INETu short sin port 16位端口号网络字节顺序 struct in addr sin addr 32位IP地址网络字节顺序 char sin zero 8 保留 3 建立套接字连接 connect 和accept 功能共同完成连接工作格式 int PASCAL FAR connect SOCKET s const struct sockaddr FAR name int namelen SOCKET PASCAL FAR accept SOCKET s struct sockaddr FAR name int FAR addrlen 4 监听连接 listen 功能用于面向连接服务器表明它愿意接收连接格式 int PASCAL FAR listen SOCKET s int backlog 5 数据传输 send 与recv 功能数据的发送与接收格式 int PASCAL FAR send SOCKET s const char FAR buf int len int flags int PASCAL FAR recv SOCKET s const char FAR buf int len int flags 参数 buf 指向存有传输数据的缓冲区的指针 6 关闭套接字 closesocket 功能关闭套接字s 格式 BOOL PASCAL FAR closesocket SOCKET s 4 3 1 4 MFC CAsyncSocket 编程为简化套接字编

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

语音通信系统设计毕业论文.doc

文档简介

温馨提示

最新文档

评论

语音通信系统设计毕业论文.doc

文档简介

温馨提示

最新文档

评论

相关文档