已阅读5页,还剩5页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
嵌入音频在电视播出系统中的原理及应用随着数字电视技术的发展,数字播控中心也成为各电视台建设的重点,这也是从模拟向数字化过渡的特殊时期,不可能从采编到播出全部实现数字化,特别是音频系统,从模拟音频到数字音频,再到数字音频的嵌入,这是一个非常繁琐的过程,下面从实际到理论就这个过程作一下介绍。一. 音频嵌入技术在电视播出系统中的应用对于视频、伴音分离的系统,在电视信号模数转换和传输的过程中,视频和音频不同的处理方式和特点,导致视频滞后于音频,图像和声音不协调和谐的问题也显得比较明显。 在电视节目播送中,视频信号制约于相应的音频信号,达到互相同步,或利用数字视频信号对数字音频信号加以携带,形成一个有机统一的整体(音频嵌入技术),同时又能安全的解出,以使观众得到声画同步的完美的电视图像,是我们在数字电视播出系统设计中,极为关心的问题。以我们部门为例,简单解释一下音频信号的流程:将模拟音频转换为AES/EBU数字音频,AES/EBU数字音频通过板卡嵌入到SDI数字视频当中,为了能够调节输出伴音,又将带嵌入音频的SDI信号分解成SDI视频和AES/EBU数字音频,再将AES/EBU数字音频通过一个D/A转换成模拟音频进行音量调整,然后经A/D转换成AES/EBU数字音频,再嵌入到SDI视频中输出,这是目前音频嵌入式播出系统的普遍模式。音频嵌入式电视播出系统,相对于音视频分离模式的系统,有着很多优点。一般来说,音频嵌入模式适合于较大型系统中的各种切换,达到灵活轻便。切换中的音视频的协调统一,是靠程序控制中央处理器的统一指令完成的,而中央处理器的程序设计很容易实现,运作简单、实用、可靠。对于小型系统,音频嵌入也有一定的使用价值,当然要看设备系统的性能价格比和需要而确定。 二. 数字音频信号1.AES/EBU数字音频 1992年,美国音频工程师协会(AES) 和欧洲广播联盟(EBU)共同制定了数字音频的接口标准,即AES/EBU数字音频格式。在这个基础上,国际电信联盟将其归纳为ITU-R BS647-2号建议书广播演播室数字音频信号的接口。AES/EBU的构成:由两个信号通道组成。这两个声道可作为立体声的左、右声道,可作为独立的声道,可将两声道传输同样的声音,把一个AES/EBU信号作为单声道使用。在视频领域,我们对视频的取样为8比特或10比特,而对于音频来讲,10比特是远远不够的,它不能满足声音的动态范围及信躁比的要求。因此对于音频的取样为16-24比特。每一个取样组成一个32位的副帧,前4位为通道状态识别位,指示后面的音频数据是哪一个通道的音频数据,其后4位的辅助数据(可以用它扩展AES/EBU为24比特)然后是20位的音频取样数据,音频取样数据之后是一位音频取样有效位,用来指明音频取样的比特位数是否有效。在其之后用户比特位用于携带其它信息,例如:时码。第31位为音频通道状态位,它可以携带与信号有关的重要信息:例如取样频率、声道类型、辅助比特的应用方式等,最后一位CRC奇偶效正位,用于对总的数据通道数据状态进行误码检测。2.AES/EBU数据结构(如图2): 由192个副帧进一步组成一个数据帧,每一个数据帧的起始点由第一副帧的前4位的状态位来表述,即前置位表述为“Z”。而其他副帧前置位表述为代表通道状态的“X”或“Y”. 3.AES/EBU数字音频的优点: AES/EBU数字音频信躁比高,传输质量好。是独立的音频通道,便于做音频处理(调音处理)对于75欧的AES/EBU数字音频系统,可用原有模拟视频系统替代。三. 嵌入数字音频 在电视领域,音频信号出现“唇音”是我们非常关注的问题。所谓的“唇音”指的是由于视频信号和音频信号传输路径不同,因此信号的延时也不同,这样就造成了声音和图像出现延时差。在分离的视、音系统中需要一些音频延时器予以克服。而在数字视频SDI的传输的同时,我们可以利用SDI信号的辅助数据区,把数字音频信号嵌入到SDI信号中一起传输,从根本上消除了的除了“唇音”问题。这也就是传输音频信号的第3种格式嵌入音频格式。1.嵌入数字音频的位置 在模拟视频中存在着行、场消隐期。在行、场消隐期内并不存在着有效图象信号。对于数字视频信号,也对应存在这样一个时间区间,这个区间被称为行、场的辅助数据区。行辅助数据区由SMPTE(活动图像和电视工程师协会)定义为“HANC”(Horizontal Anicillary Date),场辅助数据区由EBU定义为“VANC”(Vertical Anicillary)。我们清楚地知道,分量数字视频格式的有效行中,625/50制共有1728个取样字(525/60制为1716个取样字),其中对Y、Cb和Cr取样有1440个取样字(01439)。而对行消隐期间的取样可安排288个取样字(525/60制为276个取样字)。数据传送中,每行的消隐期间的数据是相同的,对于数字化来说就是所谓的“冗余”部分,在标准中用“SAV”和“EAV”予以界定并作为接收端恢复的标志,就不再需要传送同步和色同步信息了。那么在“EAV”和“SAV”之间就可用来放置288个字(525/60制为276个),作为辅助数据(包括“EAV”和“SAV”的8个字)。因此,模拟视频中的行消隐期间,在数字视频中被称为行辅助数据区“HANC”(Horizontal Anicillary Data)。同样,模拟视频中的场消隐期间,在数字视频中被称为场或帧辅助数据区,由EBU定义为“VANC”(Vertical Anicillary Data)。我国广播电影电视行业标准GY/T160-2000数字分量演播室接口中的附属数据信号格式,是等效采用ITU-RBT1364建议书标准,规定了数字分量演播室应用的嵌入到视频数据信号中的辅助数据格式(图3)。根据SMPTE 291M标准定义的辅助数据包和空间的格式: (1)在每个数据包的最前面,有一个包头(ADF)。对于分量系统是由3个字组成,它们为:000H、3FFH、3FFH。 (2)其次是表明辅助数据之内容的数据识别码ID(DID),用于组织嵌入音频所使用的数据包。 (3)在数据识别码之后是数据包号码(DBN),接收设备可根据包号码的连续性来判别是否丢失数据。 (4)数据包号码之后1个字称之为数据计数字(DC),用来表明包中数据总和。 (5)在数据计数字之后就是数据区,有255个字。 (6)最后是数据效验位(Checksum)。 分量视频数据信号的辅助数据区,可用来传输数字音频等辅助数据信号。辅助数据信号以数据包的形式运载,每个包都带有自身的包头标识,在辅助数据区内,不可随意放置。依据标准规定,插入在数字视频的串行数据流中,可以同时发送多达16个通道,(8个AES/EBU数据流通道)20或24比特的声音信号。但必须紧接在EAV后面,不能有一个码字的空隙。误码检测信号EDH(SMPTE RP165定义)被放置在行辅助数据区的第5或315行(625/50制),但必须紧邻在“SAV”前面,同样不能有一个码字的空隙。行辅助数据区的剩余部分,可安排其它数据使用。 数字音频插入的规则: (1)第5、318行用于插入EDH的数据。 (2)第6、319行不插入任何数据,专门用于SDI的切换区。 (3)第7、320行空一行,不插入音频数据。第8、321行用于插入音频控制数据:该音频控制包包含以下信息:音频的帧数、取样的频率、有效通道和视、音的相对延时,对于48KHZ的工作方式下,音频控制数据包的是可选择的,而对于其它频率,必须传送音频控制数据。 在广播电视系统中,数字音频的取样频率通常采用48KHz(其它取样频率有32KHz和44.1KHz),在每秒25帧的扫描系统中,一个视频帧的音频样值数为48000/251920,即一个视频帧内有整数个音频样值,这时音频的取样频率能和视频时钟保持同步,可称为同步音频。在数字音频中,通常将由同一AES/EBU音频源中得到的两个音频通道称为一个通道对,由两个通道对组成一个音频组。这样,一个音频组可以有4个音频通道。音频组的编号为1至4,通道编号为1至16。通道1至4为第1组,通道5至8为第2组,依次类推。2.嵌入音频 目前辅助数据最大的用途是放置音频,然而被放置的音频称为嵌入音频。采用音频嵌入方案的电视系统,最大的好处是解决了电视信号在传输中的声画同步、协调的问题。由于嵌入音频后的视频信号可用一根电缆同时传送音视信号,还简化了设备系统。被嵌入的音频信号是以块(或称段)为单位,打包传送的。一个块由192个连续帧组成,每个帧包含有相关的两个子帧,每个子帧(32比特)表示一个音频通道,放置一个音频取样字,因此一个数字音频码流可以作为立体声、双声道模式使用。 每个子帧定义为32比特,其中前置码占有4比特,音频数据为24比特,在数据位后的4比特,分别是有效标志位V(Validity),用户数据位U(User Data),通道状态位C(Channel Status Data)和子帧的奇偶校验位P(Parity)。帧的传输速率与源取样频率要严格对应。如果音频取样频率为48KHz,一帧的取样时间为20.83s,每一子帧的取样时间就是10.415s。帧传输速率与源取样频率要严格对应。嵌入音频实质上是采用时分复用的方式,将数字音频数据作为附属数据与数字视频数据合为一路数据信号。嵌入音频放置在行辅助数据区内(HANC),按照SMPTE272M标准的规定,在行辅助数据区内最多可嵌入16个通道的音频数据,16个通道划分为4组,每组含有4个(即两对)音频通道。为此需要使用两种用来传送AES/EBU音频信息的附属数据包,即音频数据包和音频控制包。这两种音频包均应符合下表所示的附属数据包的格式,它们之间的差别仅在于用户数据部分和相关的标识符。音频数据包中携带有数字音频的样值数据,按照标准规定,它放置在CB/CR色差信号并行数据流的行附属数据区内。音频控制包中所含数据则用于音频数据流的解码处理,每场仅传送一次。有关音频数据的嵌入过程和这两种音频包的具体结构,下面分别予以介绍。音频数据包图4表示了音频数据的嵌入过程。为简明计,这里只画出了一个通道对(AES/EBU 1为第一通道对,AES/EBU 2为第二个通道对)中一个通道的嵌入示意,通道对3、4的嵌入完全相同。音频控制包 音频控制包的作用是为接收端提供必要的解码信息,如音频通道对的取样频率和同步异步指示、通道的有效性指示以及通道对音频/视频时延等。它的结构如图5所示。音频控制包位于场消隐切换点之后的第二个行辅助数据区内,即位于奇数的第8行和偶数场的第321行。每场传送一次, 音频控制包中含有音频帧序号、取样频率和各通道音频/视频间的相对时延等信息,对于48KHz同步运行模式,音频控制包的传送是可选的,但对其他运行模式,则是必需的。五. 总结及展望 纵观当今科学技术的发展,速度之快、变化之大都是前所未有的。高新技术的发展也同样地冲击着广播电视领域,我们广播电视工作者对其在引进、开发和应用方面,进行了积极的探索和实践,取得了扎实的成果,并在许多方面都获得成功应用的经验。高新技术的进步给广播电视带来了严峻的挑战和激烈的竞争,同时又提供了巨大的发展机遇。我们相信在新的世纪里,电视高新技术必将更广泛、更迅速地发展和普及,其
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB1408T 003-2020 葡萄(鲜食)生产技术规程
- 急腹症患者的护理本土化
- 奥迪伪造销售合同
- 商业砼销售合同
- (正式版)DB3201∕T 1093-2022 《水培树式甘薯生产技术规程》
- 护理人员的职业素养与道德
- (正式版)DB22∕T 2466-2016 《土壤中丙环唑残留量的测定 气相色谱-质谱法、》
- 2026年黑龙江黑河五大连池招募医疗保障志愿者20人易考易错模拟试题(共500题)试卷后附参考答案
- 装修工程监理外包协议书
- 2026年黑龙江建三江第二高中招考易考易错模拟试题(共500题)试卷后附参考答案
- 【答案】《体育健康课程乒乓球》(西南交通大学)章节期末慕课答案
- 【答案】《模拟电子电路实验》(东南大学)章节期末慕课答案
- 化工安全与环保
- 附睾炎的课件
- 空气源热泵课件
- 书店消防知识培训
- 《传染病防治法》学习
- CSCO肿瘤患者静脉血栓防治指南
- 2024-2025年五年级下册太原市数学期末考试卷
- 河间英华五升六数学试卷
- DB42T 1253-2017 桥梁拆除技术规范
评论
0/150
提交评论