




已阅读5页,还剩58页未读, 继续免费阅读
(系统工程专业论文)以太网数字语音广播系统的设计与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西南交通大学硕士研究生学位论文第l 页 摘要 以太网数字语音广播系统作为一种新的公共广播系统,具有传输距离远,音质效果 好,安装简单,扩展性好等传统的公共广播系统所无法比拟的优势,不仅可以实现语音 信号的实时播放,并且可以实现广播系统的全局广播和区域广播功能,具有广阔的市场 和发展前景。 论文首先确定了系统的整体方案,对系统服务器和系统终端的功能需求进行了详细 分析,对系统设计与实现过程中所涉及的关键技术进行了深入剖析;其次,根据系统的 功能需求,对系统服务器和系统终端的总体流程以及各部分功能进行了详细设计;然后, 根据系统服务器和系统终端的设计,对系统服务器和系统终端各功能的具体实现过程进 行了详细阐述。整个设计实现过程包括采用双缓冲技术,利用w a v e 音频函数在p c 机 上实现语音数据的采集;将采集到的语音数据进行分割并封装成特殊结构的语音数据包; 应用c s o & e t 类函数将语音数据包以口单播包或者广播包的形式发送给系统终端;利用 c f i l e 类函数将采集到的语音数据保存在w a v 文件中;系统终端的地址与地理位置信 息在系统服务器端的存储配置;终端e a u s y a r m 8 9 6 2 将接收到的语音数据存储在循环队 列中并发送给音频解码芯片v s l 0 0 3 ;v s l 0 0 3 将数字语音数据进行d a 转换后进行播放; 利用系统终端对特殊结构语音数据包的判断实现区域广播功能等。 论文最后对系统的基本功能及实时性能等各项功能指标进行了测试、分析。结果表 明,该系统具有较好的实时性,完全能够实现语音信号的实时广播,并能够实现广播系 统的全局广播和区域广播功能。 关键词:以太网;数字语音广播;语音解码;区域广播 西南交通大学硕士研究生学位论文 第1i 页 a b s t r a c t a sak i n do fn e wp as y s t e m ( p u b l i ca d d r e s ss y s t e m ) ,t h ed i g i t a la u d i ob r o a d c a s ts y s t e m b a s e do ne t h e r n e th a sm o r ea d v a n t a g e st h a nt h et r a d i t i o n a lp as y s t e ma n dv a s tm a r k e ta n d d e v e l o p i n gp r o s p e c t , n o to n l yi tc a np l a yt h es o u n di nr e a lt i m e ,b u ta l s oi tc a r lp l a yt h es o u n di n g l o b a lf i e l da n dr e g i o n a lf i e l d f i r s t l y , t h ed e s i g np r o p o s a lo ft h es y s t e mi sd e t e r m i n e di n t h i st h e s i s ,t h ef u n c t i o n r e q u i r e m e n t so ft h es e r v e ra n dt e r m i n a lo ft h es y s t e ma r ea n a l y z e di nd e t a i l ,t h ek e y t e c h n o l o g i e si nt h ep r o c e s so fd e s i g n i n ga n dr e a l i z i n ga r ed i s c u s s e d s e c o n d l y , t h eo v e r v i e w f l o wa n dt h ef u n c t i o no fe a c hp i n to ft h es e r v e ra n dt e r m i n a la r ed e s i g n e da c c o r d i n gt ot h e f u n c t i o nd e m a n d so ft h es y s t e m a g a i n , t h ep r o c e s so f r e a l i z i n gt h ef u n c t i o no fe a c hp a r to f t h e s e r v e ra n dt e r m i n a lb a s e do nt h ed e s i g no ft h es y s t e mi sa n a l y z e di nd e t a i l t h ew h o l ed e s i g n p r o c e s si n c l u d e sa c q u i s i f i o n i n gd i g l t a la u d i od a t ao nt h ep cw i t hd o u b l e - b u f f e rt e c h n o l o g y , s e g m e n t i n gt h ed i g i t a la u d i od a t aa n de n c a p 姒a 血gt h e ma ss p e c i a ls t r u c t u r eo fv o i c ep a c k e t s ; d e l i v e r i n gt h ed i g i t a la u d i od a t aa si pu n i c a s to rb r o a d c a s tp a c k e t st ot h et e r m i n a lu n i t ;s t o r i n g t h ed i g i t a la u d i od a t ai naw a v f i l e ;s t o r i n gt h ei pa d d r e s sa n dt h eg c o g r a p h i c p o s i t i o no ft h e t e r m i n a li nt h es e r v e ro ft h es y s t e m r e c e i v i n ga n ds t o r i n gt h ed i g i t a la u d i od a t ai nt h et e r m i n a l u n i te a s y a r m 8 9 6 2 ;t r a n s m i t i n gt h ed i g i t a la u d i od a t ab e t w e e nt h ee a s y a r m 8 9 6 2a n dt h e a u d i od e c o d ec h i pv s10 0 3 ;c o n v e r t i n gt h ed i g i t a la u d i od a t at oa n a l o gs i g n a l si nt h ev s10 0 3 a n db r o a d c a s t i n g ;j u d g i n gt h es p e d a ls t r u c t u r eo fv o i c ep a c k e t sb yt h es y s t e mt e r m i n a lt o r e a l i z et h er e g i o n a lb r o a d c a s t i n g a l lt h ef u n c t i o n a lp a r a m e t e r so ft h eb a s i cp e r f o r m a n c ea n dt h er e a l - t i m ep e r f o r m a n c eo f t h es y s t e ma r et e s t e da n da n a l y z e di nt h el a s t t h et e s tf o rt h ed i g i t a la u d i ob r o a d c a s ts y s t e m b a s e do ne t h e r n e tv a l i d a t e st h ed e s i g na n di n d i c a t et h a tt h ea u d i od a t at a nb eb r o a d c a s t e di n t i m et oa 1 1t h et e r m i n a lu n i t so rp a r t so ft h e ma tt h es a l t l et i m e k e yw o r d s :e t h e m e t ;d i g i t a la u d i ob r o a d c a s t i n g ;a u d i od e c o d e ;r e g i o n a lb r o a d c a s t i n g 西南交通大学四南爻通大罕 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并 向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授 权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用 影印、缩印或扫描等复印手段保存和汇编本学位论文。 本学位论文属于 1 保密口,在年解密后适用本授权书; 2 不保密一使用本授权书。 ( 请在以上方框内打v ) 学位论文作者签名:j 司红趁 日期:f d 歹五名吃 鼍 ,d 吾 轹 秒 签 : 师 期 老 日 导措 西南交通大学硕士学位论文主要工作( 贡献) 声明 本人在学位论文中所做的主要工作或贡献如下: 1 制定系统的设计方案,完成音频解码模块硬件电路的设计及p c b 图的绘制, 并完成电路板的制作与调试。 2 完成系统服务器软件的编码与调试工作,实现语音信号的采集、存储及网络传 输;终端采用c 语言完成嵌入式应用软件的编码与调试,实现语音信号的同步广播功 能。 本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所得的成 果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰 写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中作了明确说明。 本人完全了解违反上述声明所引起的一切法律责任将由本人承担。 学位论文作者签名:i 虱缸垂生 日期:矽虮莎z 西南交通大学硕士研究生学位论文第1 页 1 1 课题的研究背景及意义 第1 章绪论 该课题来源于以太网数字音频公共广播系统的研究。 公共广播( p u b l i c a d d r e s s ) 是在有限的范围内为公众服务的广播,通常设置在机关、 企业、学校、社区、大厦、超市及各种场馆之内,用于发布新闻和内部信息、作息信息、 提供背景音乐以及用于寻呼和强行插入灾害性事故紧急广播等,因而成为城乡及现代都 市中各种公共场所不可或缺的组成部分【。 传统的公共广播系统,普遍采用模拟音频信号,广播受到电压、功率、阻抗等因素 影响,传输距离短,频率低,容易受干扰,系统扩展性差。它们在广播过程中采用模拟 信号的总线传输模式,在应用上存在着很多的缺点和局限性: 1 模拟音频信号电平的衰减随传输距离的增加而增加,使信号的信噪比和系统的 音频响应越来越差,通道之间的串音越来越大。随着传输距离的增加,音质变差的问题 无法克服【2 】。 2 同一总线内的广播信息无法实现动态分组广播和单点广播,智能程度差。 3 布线缺乏灵活性,并且必须铺设专用的音频线路,目前尚无通用的可遵循的标 准 3 1 。 随着现代化城市建设的进步,现代化建筑向大型化、智能化、综合化方向的快速发 展,现代大型建筑智能公共广播系统的管理变得越来越先进,对系统功能及可靠性的要 求越来越高,同时“在紧急情况下的安全保障问题”越来越受到重视,传统的公共广播 模式远远不能满足现在高速交流的信息时代对广播系统的要求。为了适应广播系统的各 种新要求,以太网数字音频公共广播系统诞生了【4 】。 以太网数字音频公共广播系统主要是指以以太网为传播介质提供音频服务的广播系 统,将音频信号以标准i p 包的形式在以太网上进行传送,是一套纯数字网络传输的 音频广播系统。该技术主要采用以太网络技术,将音频信号以特定的网络协议在以太网 中传送,彻底解决传统广播系统中存在的音质不佳、容易受干扰、维护管理复杂、互动 性能差等问题。同时,采用多路定向寻址等技术实现对广播节目播出和接收的智能化管 理,可实现选择全部、部分或特定区域进行定向分组广播,分组授权调用接收或强制接 收等,突破了传统模拟广播系统只能对全部区域进行公共广播的局限 5 】。 以太网数字音频公共广播系统可以很好地利用以太网解决音频信号远距离传输难 题,并且允许设计者创建大型网络结构来实现数以千路的数字音频信号在以太网上传输。 通过以太网数字音频公共广播系统,大型项目中设计复杂管线所产生的麻烦就迎刃而解 西南交通大学硕士研究生学位论文第2 页 了【4 】。 以太网数字音频公共广播系统是完全不同于传统广播系统、调频寻址广播系统和数 控广播系统的产品,它具有以下的一些优势: 1 以太网在传输音频信号的同时还可以传输控制信号,从而对系统的分组模式和 重复信息、文本信息、邮件信息等进行智能化管理。 2 安装维护便捷。以太网数字音频公共广播系统的终端可以方便的嵌入到原有的 网络系统中,省却了线缆的铺设和传输设备的安装。 3 以太网系统的综合布线技术、传输模式和传输协议均有可遵循的国际标准,从 而保证了系统的可靠性、灵活性、兼容性和可扩展性。 4 以太网设备价格较低,将其引入到广播系统,则很多原有的网络设备可以直接 使用,不存在兼容问题,使广播系统的造价大为降低【3 】。 作为一种新的广播系统,以太网数字音频公共广播系统具有广阔的市场和发展前景, 可广泛应用于车站、机场、码头、大厦、大型商场等公共场合的广播,具有传输距离远, 音质效果好,安装简单,扩展性好等优点,同时也可以实现全局广播和区域广播功能。 例如基于校园网络的数字音频广播系统,可以实现话筒实时播音,进行校园实时信息、 通知、新闻播音和分区播音等功能,充分利用了现有网络资源,避免了重复架设线路的 麻烦,实现了广播与计算机网络的多网合一【4 1 。 1 2 以太网数字音频公共广播系统国内外研究现状 以太网数字音频公共广播系统作为现代广播系统的一个重要组成部分,在许多领域 都得到了广泛应用。以太网数字音频公共广播系统以其良好的互通性、低成本的造价、 可靠性、稳定性、可预见的发展速度和良好的商业运作机制迅速地占领了以太网音频传 输市场。以太网网络广播已经是事实上的先进广播的行业标准1 4 。 目前比较成熟的以太网数字音频公共广播系统有两类主流技术:基于专用的以太网 音频数据传输技术的公共广播系统和借助现成局域网构建的公共广播系统【l 。 1 2 1 基于以太网音频数据传输技术的公共广播系统 基于以太网的专用音频数据传输技术主要有四种:c o b r a n e t 、e t h c r s o u n d 、d a n t e 和 a n e t t m 。 1 c o b r a n c t 音频数据传输技术 c o b r a _ n e t 是美国尖峰音频( p e a k a u d i o ) 公司的数字音频网络技术,利用成熟的快速 以太网技术传输和分配实时、非压缩( p c m ) 的数字音频信号。c o b r a _ n e t 使用星型或连 星型网络结构,所有的c o b r a n c t 设备通过以太网交换机或者集线器连接在一起( c o b r a n e t 西南交通大学硕士研究生学位论文第3 页 网络数据无法穿过路由设备) ,与标准以太网设备结构一致【7 】。 在1 0 0 m 快速以太网下c o b r a n e t 可以单向传输6 4 路4 8 幻吃、2 0 b i t 的音频信号( 单 通道时传输的数据量为4 8 k h z x 2 0 b i t - - - o 9 6 m b f 凼) ,由于大部分c o b r a n e t 设备具有同时发 送和接收网络数据的能力,所以每个c o b r a n e t 设备能享受双向1 0 蝴的带宽,这样 c o b r a n e t 设备实际享受的带宽达到了2 0 0 m ,也就是说一根5 类双绞线上可以传输1 2 8 路音频信号。除音频信号外,c o b r a n e t 还可以传输r s 4 8 5 串口通信数据及其他非同步m 数据,并且支持s n m p 简单网络管理协议【8 9 1 。 c o b r a n e t 采用的是将数据封装在帧中进行传输,设备之间通过m a c 地址的方式来 进行数据传送,可以单播,也可以多播,这同标准以太网所定制的数据传输模式相类似, 因此c o b r a n e t 可以和其他以太网设备共用一个网络。 c o b r a n e t 是一种硬件、软件和网络协议的组合体,可以提供高质量的音频数据传输, 但是在实际应用中仍存在如下一些问题 1 0 1 :成本昂贵,只能用于高端系统中;属于准专 用音频网络技术;数据传输的延时有待改善,这在现场应用中是一个致命的缺陷。 c o b r a n e t 具有较好的功能性和扩展性,但延时性能稍差,一般采用固定安装的方式, 适合用于大型扩声系统。应用c o b r a n e t 技术的代表是美国百威的媒体矩阵( m e d i a m a t r i x ) 系列产品,典型案例包括2 0 0 0 年悉尼奥运会、2 0 0 4 年雅典奥运会、迪斯尼乐园、爱尔兰 都柏林机场、上海f 1 国际赛车场和上海科技馆等均应用c o b r a n e t 技术实现以太网数字 音频广播。 2 e t h e r s o u n d 音频数据传输技术 e t h e r s o u n d 是法国d i a g r a m 公司开发的基于以太网的低时延、高通道数、双向同步 音频数据传输技术,传输能力为单方向可以传输6 4 路2 4 b i t 、4 8 k h z 采样的p c m 音频数 据,不支持传递串口信号以及其他口数据。e t h e r s o u n d 重点放在同步信号传输和控制上, 并避免对专业音频应用做多余的功能,其硬件设计极为简单,数据处理极快,采用低电 平以太网机架结构,而不是采用标准p ,进一步减小了系统延时。e t h e r s o u n d 被设计成 一种重点放在低延迟和采样精确同步的高质高效音频传送网,满足了专业音频应用的要 求【8 ,l l j 2 1 。 e t h e r s o u n d 网络结构采用菊花链的形式或者星型网络的形式或者二者的混合形式, e t h e r s o u n d 网络的数据传输不是采用m a c 寻址方式实现的,这样避开了以太网封装、解 封装过程,使得网络延时大大缩短,但是e t h e r s o u n d 网络不允许存在其他非e t h e r s o u n d 网络设备,网络的功能扩展性受到制约。 e t h e r s o u n d 在组网方面比较快速,延时短,但功能性、扩展性相对较弱,适合应用于 现场演出。应用e t h e r s o u n d 技术的典型系统有d i a g r a m 的l x 6 4 6 4 e s 系统、y a m a h a 的m a p l e t r e e 数字告示系统等。 西南交通大学硕士研究生学位论文第4 页 3 d a n t e 音频数据传输技术 d a n t e 是a u d i n a t e 于2 0 0 3 年推出的数字音频传输技术,基于口以太网,被认为是 o s i 第四层传输技术,以m 数据结构在以太网中传递实时音频信号。d a n t e 在传输音频 数据时使用u d p ,在以太网传输的音频路由上使用p ,一般称为以太网上的u d p i p 协 议。音频信号需要通过专用转换器转换成t c p i p 网络信号并传送到网络中,音频信号以 数据包的形式在网上路由到任意的输出转换器,并转换成模拟信号提供给扬声器或者记 录设备。 d a n t e 继承了c o b r a n e t 和e t h e r s o u n d 所有的优点,同时具备自身独特的优势【1 3 】: ( 1 ) 更小的延时:在1 0 0 m 网络带宽,总传输音频通道为3 个时,延时仅为3 4 筇。 ( 2 ) 采用匝e e l 5 8 8 精密时钟协议进行时钟同步。 ( 3 ) 采用z e r o e o n f ( z e r oc o n f i g u r a t i o nn e t w o r k i n g ) 技术,简化网络的运行模式,同时省 略了复杂的手工网络配置。 ( 4 ) 网络的高兼容特性,允许音频信号和控制数据以及其他不相干的数据流共享在同 一个网络中。 ( 5 ) 为了避免意外导致的音频传输中断,d a n t e 系统可以设定多重自我修复机制。 4 a - n e t t m 音频数据传输技术 a - n e t t m 是美国越h o m 公司研制的数字音频传输技术,是继c o b r a n e t 和e t h e r s o u n d 后数字音频传输技术的另一个领航者。a - n e t t m 基于以太网的物理层,使用标准的c a t 5 e 线缆和r j - 4 5 端子,专门针对数据密集型音频流的传输。a - n e t t m 采用数字形式分配音 频,可以传输多通道数据,拥有无压缩( 误码率低) 、超短延时( 整个系统0 8 毫秒) 、传 输距离远( 点对点设备间1 5 0 米) 以及优化的时钟表现( 极小的抖动和漂移失真等) 等 特点,适用于音频信号源较多( 8 路以上话筒或线路) ,信号源和控制室、监听室、录音 室、演播室的距离较远,追求高品质信号传输及个人调音监听的场所【6 】。 目前,a - n e t t m 技术己在全球广泛领域应用,有超过4 0 0 0 0 个成功案例,服务网络 遍及4 5 个国家。 1 2 2 借助现成局域网构建的公共广播系统 借助现成局域网构建的以太网数字音频公共广播系统一般应用t c p i p 协议,采用数 字音视频压缩方式保证音视频信号实时、高速传输,并且占用带宽较少。 借助现成局域网构建的以太网数字音频公共广播系统在建设成本、系统维护、抗干 扰能力、应用便易性方面有具大的优势,但是由于以太网是种异步技术,不能百分之 百的保证某一数据包的及时送达,因此,借助现成局域网构建的以太网数字音频公共广 播系统在音频数据传输的稳定性和实时性方面有较大缺陷。借助现成局域网实现的以太 西南交通大学硕士研究生学位论文第5 页 网数字音频公共广播系统主要有迪士普公司的m a g 5 0 0 0 系列、美国s o u n d i p 以太网公共 广播系统等。 由于采用现成局域网构建以太网数字音频公共广播系统不需要专门构建网络,开发 成本低,易于研究,目前国内的各种技术文献中主要是对这种以太网数字音频公共广播 系统的基本功能实现进行分析讨论,并提出了一些不同的实现系统基本功能的方法:傅 越千、周慧瑶等人提出在系统初始化时,由系统终端向服务器发送注册信号,确认自身 的位置和参数,然后由服务器发送控制信号控制系统终端加入或者离开组播组的方式实 现系统的区域广播功能【3 1 4 】;李明、袁洪杰提出通过在服务器端建立一张包括所有播放终 端的编号、实际地址、口地址、m a c 地址、开启密码、终端播放器状态及过滤方式等信 息的映射表来维护播放终端的状态以实现区域广播功能 1 5 】等。 1 3 课题的主要研究工作 1 3 1 课题研究的主要目标、内容与方法 该课题借助现有局域网设计实现一个以太网数字语音广播系统,利用e a s y a r m 8 9 6 2 强大的以太网处理功能,通过u d p 传输方式实现远程、实时的发送语音信号。系统主要 包括用于语音数据采集发送的系统服务器和用于语音数据接收播放的系统终端两部分, 需要研究以下内容: 1 根据实际需求,设计系统整体框架 包括给系统终端的音频解码模块选择具体的音频解码芯片,并研究芯片的d a t a s h e e t 以及功能的具体实现方法,然后根据音频解码芯片的d a t a s h e e t 设计音频解码模块原理图, 生成p c b 图,制出实际的p c b 电路板并对硬件系统进行调试,使硬件系统能够正常运行。 2 用于语音数据采集的系统服务器的设计 包括如何应用v c + + ,利用w a v e 音频a p i 函数和s o c k e t 函数实现语音数据采集与 网络传输:利用p c 机的话筒作为语音采集设备,实现语音数据的采集及语音文件的保存 并将采集到的语音数据p c m 码流以p 单播包或广播包的方式发送到以太网上,通过u d p 方式实时传输语音数据包。 3 用于语音数据接收播放的嵌入式系统终端的设计 包括对u c o s 一口实时操作系统源码进行分析,掌握基于c o s i i 操作系统的多 任务程序设计方法;掌握l m 3 s 8 9 6 2 芯片内核中的各个功能寄存器及工作原理与实现方 法:对t c p i p 协议进行学习,掌握u d p 数据传输以及u d p 广播的实现;掌握s p i 总线 时序及数据传输格式;解决如何实现语音数据的顺序接收及存储并在m c u 和语音解码芯 片间实时传输语音数据。 西南交通大学硕士研究生学位论文第6 页 1 3 2 课题需解决的关键问题 1 语音广播的实时性 系统实现语音广播存在一定的延时,总共由三部分组成:语音数据采集过程中的延 时;语音数据传输过程中的延时;系统终端语音数据存储播放过程中的延时。三部分延 时中,语音数据采集过程中的延时是可控部分。录音数据缓冲区的大小决定了语音数据 采集过程中的延时大小,为了使该延时最小,需要在保证录音数据不丢失的情况下使录 音数据缓冲区尽可能的小。 2 如何提高语音播放质量 影响语音播放质量的两个因素为语音数据采样率和采样位数的大小以及语音数据网 络传输效果。语音数据采样率越高,音频保真度越高,而采样位数越大分辨率也就越高, 所以系统需要应用高采样率实现音频保真度。语音数据的网络传输采用u d p 方式,由于 u d p 的不可靠性,在数据传输过程中可能会造成语音数据包的丢失,如何减小语音数据 包丢失对语音数据传输的影响,提高语音数据传输质量,是影响系统播放效果的关键。 3 如何实现多路分区播音,即区域广播 将采集到的语音数据经过处理后封装为特殊结构的d 语音广播包,采用u d p 传输 方式发送给系统各终端,由系统终端根据p 语音广播包的包头来决定是否播放语音数据, 通过系统终端的自身判断来实现区域广播。 1 4 论文的组织安排 第1 章绪论。介绍课题的选题背景及意义,分析以太网数字音频公共广播系统的国 内外研究现状,阐述本文的研究内容、方法及需解决的关键问题。 第2 章系统服务器端设计与实现。给出系统总体框架与系统服务器端的功能需求, 对系统服务器进行分析,并详细阐述系统服务器的设计与实现过程。 第3 章系统终端设计与实现。给出系统终端的功能需求并对系统终端进行分析,介 绍系统终端硬件和软件的设计与实现过程。 第4 章系统测试与结果分析。对系统的基本功能以及系统的实时性等指标进行测 试,并对测试结果进行分析。 西南交通大学硕士研究生学位论文第7 页 第2 章系统服务器端设计与实现 2 1 系统总体框架 本系统采用的是c s 框架结构,由基于p c 机的系统服务器端采集、存储和传输语音 数据,并控制整个系统的运行;由基于e a s y a r m 8 9 6 2 的嵌入式系统终端接收来自以太网 的语音数据,并通过音频解码芯片v s l 0 0 3 数模转换以后进行播放。以太网数字语音广播 系统是基于以太网实时传输语音数据实现语音信号远程同步播放的系统。该系统由系统 服务器端和系统终端两部分组成,其中系统服务器端为语音数据采集发送模块,系统终 端又分为语音数据接收模块和音频解码模块两部分。 本系统可以实现语音信号的远程实时传输,并且系统终端接入简单,只要有一个以 太网接口,就可以在以太网范围内任意位置同步接收语音信号。系统的总体框架见图2 1 : 语音 寝据米集友迭犋坎诸首数琚馁收模块晋频解妈模块 e a s y a r m 8 9 6 2 以 v s l 0 0 3 p c 机 太e t h e r n e ts p i 音频解码芯片 播放器1 网 1 f 仕n r 意mz 7 法竹池 图2 1 以太网数字语音广播系统总体框图 2 2 系统服务器端分析 系统服务器端实现语音数据的采集、存储、网络传输,并且能够控制整个系统的运 行,实现区域广播功能。系统服务器端的开发环境为m i c r o s o f tv i s u a ls t u d i o2 0 0 8 ,通过 s d k 平台中w a v e 音频a p i 函数实现语音数据的采集,采用m f c 中的c s o c k e t 类函数 实现语音数据的网络传输,并将采集到的语音数据存储在w a v 音频文件中,下面分别对 这几种技术进行分析。 2 2 1w a v e 音频a p i 函数 w a v e 音频a p i 函数是w i n d o w s 提供的底层音频处理函数,直接与音频驱动程序相 连,可对音频数据进行处理,功能强大,是所有音频功能的基础。使用底层w a v e 音频 处理函数可以获得用户所需的声音处理效果,实现声音的录取与播放。 应用w a v e 音频a p i 函数实现声音录制的主要流程如图2 2 所示: 西南交通大学硕士研究生学位论文第8 页 图2 - 2 声音录制的主要流程 在w a v e 音频a p i 函数的应用中涉及到的几个基本概念如下【3 0 】: 概念1 :定义波形数据格式 t y p e d e f s t r u c t w o r d w f o r m a t t a g ; w o r d n c h a n n d s ; d w o r d n s a m p l e s p e r s e c ; d w o r d n a v g b y t e s p e r s e c ; w o r d n b l o c k a l i g n ; w o r d w b i t s p e r s a m p l e ; w o r d c b s i z e ; ) w a v e f o r m a t e x ; 具体参数解释如表2 1 所示: 表2 - 1波形数据格式参数含义 参数含义 w f o r m a t t a g波形数据的格式,定义在m m r e ( 2 h 文件中 西南交通大学硕士研究生学位论文第9 页 表2 1 ( 续) 鲁曼曼i ;_ i ii i i m 鼍曼蔓皇曼曼皇曼曼舅曼曼鼍曼曼曼量曼蔓 参数 含义 n c h a n n e l s波形数据的通道数:单声道或立体声 n s a m p l e s p e r s e c n a v g b y t e s p e r s e c r d 3 1 0 c k a l i g n w b i t s p e r s a m p l e e b s i z e 采样率,对于p c m 格式的波形数据,采样率有8 0k n z , 1 1 0 2 5 j 【舷,2 2 0 5k h z ,4 4 1 k h z 等 数据率,对于p c m 格式的波形数据,数据率等于采样 率乘以每个样点字节数 每个样点字节数 采样精度,对于p c m 格式的波形数据,采样精度为8 或1 6 附加格式信息的数据块大小 概念2 :定义指向波形数据缓冲区的设备头结构 t y p e d e f s t r u c t l p s t r l p d a t a ; d w o r d d w b u f f e r l e n g t h ; d w o r d d w b y t e s r e c o r d e d ; d w o r d d w u s e r ; d w o r d d w f l a g s ; d w o r d d w l o o p s ; s t r u c tw a v e h d r _ t a g 幸l p n e x t ; d w o r dr e s e r v e d ; w a v e h d r ; 各参数含义如表2 2 所示: 表2 - 2 设备头结构参数含义 参数含义 l p d a t a d w b u f f e r l e n g t h d w b y l :e s r e c o r d e d d w u s e r d w f l a g s d w l o o p s l p n e x t 、r e s e r v e d 波形数据缓冲区的首地址 波形数据缓冲区的长度 当设备用于录音时,标志已经录入的数据长度 用户数据 波形数据缓冲区的属性 循环播放的次数,仅用于播放控制中 保留值 西南交通大学硕士研究生学位论文第1o 页 概念3 :消息处理函数 用于录音的设备消息包括三种: m 2 v i 砌o p e n : 设备的打开。 i v i mw i md a t a : 数据的采集及操作。 m mw i mc l o s e :设备的关闭。 相应的用于播放的设备消息分别为m mw o mo p e n 、 m mw o mc l o s e 。 消息处理是消息自我驱动的,不需要人为干预。比如:当打开设备时,系统会自动 调用m mw i mo p e n ,当将数据添加到缓冲区,而缓冲区满时,系统会自动调用 m mw i md a t a ,需要做的,就是对该消息对应的消息处理函数编写相应的代码。 在程序中将要用到的几个主要的w a v e 音频a p i 函数及其功能如表2 3 示: 表2 3w a v e 音频函数及其功能 函数功能 w a v e l n g e t n u m d e v s 0 w a v e l n o p e n 0 w a v e l n p r e p a r e h e a d e r 0 w a v e l n a d d b u f f e r 0 w a v e l n s t a r t 0 w a v e l n s t o p 0 w a v e l n u n p r e p a r e h e a d e r 0 w a v e l n c l o s e 0 查询是否有用于录音的设备 打开录音设备,用w a v e f o r m a t e x 结构指 定音频格式 用w a v e h d r 结构的l p d a t a 成员指定波形数 据缓冲区首地址 将准备好的波形数据缓冲区送给录音设备 开始录音 停止录音( 一定要缓冲区满了才能返回) 停止录音( 随时可以停止录音) 关闭录音设备 录制声音数据时如果数据缓冲区已满,系统将发送m m w i m d a t a 消息给应用程 序,应用程序接收到这个系统消息后,就可以从消息带回的参数中得到指向波形数据缓 冲区首地址的指针,从而读出缓冲区的数据,并对数据进行处理。在将该缓冲区中的数 据读完后需要调用w a v e h a d d b u 舒e r o 函数将缓冲区重新送给录音设备,循环利用【3 2 】。 2 2 2c s o c k e t 类函数 在应用t c p i p 协议进行网络通信时,t c p 和u d p 会遇到同时为多个应用程序进程 提供并发服务的问题。多个t c p 连接或多个应用程序进程可能需要通过同一个t c p 协议 端口传输数据。为了区别不同的应用程序进程和连接,许多计算机操作系统为应用程序 与t c p 口协议交互提供了称为套接字( s o c k e t ) 的接口,用于区分不同应用程序进程 西南交通大学硕士研究生学位论文第1 1 页 间的网络通信和连接。 采用s o c k e t 实现网络通信的基本流程如图2 3 所示: 服务器端客户端 图2 - 3s o c k e t 通信流程图瞰1 应用s o c k e t 实现网络通信,可以工作在两种方式下,即t c p 和u d p 两种工作方式。 图2 3 中虚框部分为采用t c p 方式通信时包含的过程,采用u d p 方式通信时不需要此步 骤完成连接。并且在两种通信方式下,客户端都可以不用给s o c k e t 绑定p 地址和端口号。 c s o c k e t 是m f c 在c a s y n c s o c k c t 基础上派生的一个同步阻塞s o c k e t 的封装类,和 标准s o c k e t 函数实现相同的功能,其对应的函数及功能如表2 4 所示: 表2 _ 4 标准s o c k e t 函数与c s o c k c t 类成员函数对应关系 标准s o c k e t 函数c s o c k c t 类成员函数功能 西南交通大学硕士研究生学位论文第12 页 表2 - 4 ( 续) 量曼鼍_ i i i i i 曼曼曼曼 标准s o c k e t 函数c s o c k e t 类成员函数功能 c s o c k e t 类函数使用过程中需要注意一下两点: 1 在使用m f c 编写s o c k e t 程序时,必须要包含 头文件。 2 a f x s o c k e t i n i t 0 函数的使用。在使用c s o c k e t 函数前一定要先调用该函数,否则 使用c s o c k e t 函数会出错;并且该函数还有一个重要的使用方式,就是在某个线程下使 用c s o c k e t 函数前一定要调用,就算主线程调用了该函数,在子线程下使用c s o c k e t 函 数前也要先调用该函数,否则会出错【3 7 】。 2 2 3w a v 文件格式分析 w a v 文件作为多媒体中使用的声波文件格式之一,它是以r i f f 格式为标准的。r i f f 是英文r e s o u r c ei n t e r c h a n g ef i l ef o r m a t ( 资源交互文件格式) 的缩写,每个w a v 文件的 头四个字节便是”r i f f ”。r i f f 文件结构可以看作是树状结构,其基本构成是称为“块 ( c h u n k ) 的单元,每个块由“标识符”、“数据大小”及“数据”所组成,块的结构如图 2 _ 4 所示: 块的标识符( 4 b y t e s ) 数据大小( 4 b y t e s ) 数据 图2 _ 4 块的结构不葸图 从上图可以看出,其中“标识符 为4 个字符所组成的代码,如”r i f f ”、”l i s t ”等 指定块的标志d ;数据大小用来指定块的数据域大小,它的尺寸也为4 个字符;数据用 来描述具体的声音信号,它可以由若干个子块构成,一般情况下块与块是平行的,不能 相互嵌套,但是有两种类型的块可以嵌套子块,他们是”r i f f ”或”l i s t ”标志的块,其中 r i f f 块的级别最高,它可以包括u s t 块。另外,r i f f 块和u s t 块与其他块不同,r i f f 块的数据总是以一个指定文件中数据存储格式的四个字符码( 称为格式类型) 开始,如 w a v 文件有一个”w a v e ”的格式类型。l i s t 块的数据总是以一个指定列表内容的4 个字 符码( 称为列表类型) 开始,例如扩展名为”a v i ”的视频文件就有一个”s t r l ”的列表类型。 r i f f 和l i s t 的块结构如下: 西南交通大学硕士研究生学位论文第13 页 r j f f l i s t 标识符 数据块大小 格式y l j 表类型 数据块 数据 图2 - 5r i f f l i s t 块结构 w a v 文件是非常简单的一种r i f f 文件,它的格式类型为”w a v e ”。w a v 文件由文 件头和数据体两大部分组成。其中文件头又分为r i f f w a v e 文件标识段和声音数据格 式说明段两部分。r i f f 块包含两个子块,这两个子块的d 分别是”t i n t ”和”d a t a ”,其中”t i n t ” 子块由结构p c m 啪f o 眦所组成,其子块的大小就是 s i z e o f ( p c m w a v e f o r m a t ) ,数据组成就是p c m w a v e f o r m a t 结构中的数据。w a v 文件的结构如下图2 6 所示: 标识符( r i f f ) 数据大小 格式类型( “w a v e ”) “f m t ” s i z e o f ( p c m w a v e f o r m a t ) p c m w a v e f o r m a t d a t a 声音数据大小 声音数据 图2 - 6 w a v 文件结构图 p c m w 艄慢f o r m a :r 结构定义如下: t y p e d e f s t r e e t w j 气v e f o r m a tw f ; 波形格式 w o r d w b i t s p e r s a m p l e ;w a v 文件的采样大小 ) p c m w a v e f o r m a t ; w 越僵f o r m a t 结构定义如下: t y p e d e f s t r u c t 西南交通大学硕士研究生学位论文第1 4 页 w o r d w f o r m a t a g ; 编码格式,包括w a v ef o r m a tp c m 和w 斛e f o r m a ta d p c m 等 w o r d n c h a n n l s ; 声道数,单声道为l ,双声道为2 d w o
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年教具及类似用具合作协议书
- 2025年斗轮堆取料机项目合作计划书
- 2025年教师编制考试必背教育心理学重点复习题库完整版【答案】
- 恒生科技园一期二标段项目主体结构实体检测方案
- 2025办公室文员年度工作计划
- 2025年金属焊接材料项目建议书
- 2025年港口业投资项目发展计划
- 2025年电梯、自动扶梯及升降机合作协议书
- 2025年血型分析仪器试剂项目合作计划书
- 智慧校园背景下的在线互动课堂建设
- 大乐透旋转矩阵表
- 23式观音拳拳谱及动作分解
- PDCA循环管理培训PPT课件:降低采集血标本不合格率
- 南瑞继保PCS9700综自监控和远动系统维护操作手册.
- 市政道路雨季施工方案
- 保健食品良好生产规范GB 17405—1998
- 2006年东风雪铁龙c2原厂维修手册al4变速箱
- 重症胰腺炎的护理查房
- 板框压滤机吊装方案
- 初一英语上册第一单元的测试题
- 红旗中学塑胶跑道工程监理细则
评论
0/150
提交评论