




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、音视频实时通讯的应用场景已经随处可见,从“吃鸡 ”的语音对讲、直播连麦、直播答题组队开黑,再到银行视频开户等。对于开发者来讲,除了关注如何能快速实现不同应用场景重点额音视频通讯,另一个更需要关注的可能就是“低延时 ”。但是,到底实时音视频传输延时应该如何“低 ”,才能满足你的应用场景呢?延时的产生与优化在聊低延时之前,我们先要讲清延时是如何产生的。由于音视频的传输路径一样,我们可以通过一张图来说明延时的产生:在音视频传输过程中,在不同阶段都会产生延时。总体可以分为三类:T1 :设备端上的延时 音视频数据在设备端上产生延时还可以细分。设备端上的延时主要与硬件性能、采用的编解码算法、音视频数据量相
2、关,设备端上的延时可达到30200ms ,甚至更高。如上表所示,音频与视频分别在采集端或播放端产生延时的过程基本相同,但产生延时的原因不同。音频在设备端上的延时:? 音频采集延时:采集后的音频首先会经过声卡进行信号转换,声卡本身会产生延时,比如 M-Audio声卡设备延迟1ms,艾肯声卡设备延迟约为 37ms;? 编解码延时:随后音频进入前处理、编码的阶段,如果采用 OPUS标准编码, 最低算法延时大约需要2.560ms;? 音频播放延时:这部分延时与播放端硬件性能相关。? 音频处理延时:前后处理,包括AEC, ANS, AGC等前后处理算法都会带来算 法延时,通常这里的延时就是滤波器阶数。在
3、10ms 以内。端网络延时:这部分延时主要出现在解码之前的jitter buffer 内,如果在抗丢包处理中,增加了重传算法和前向纠错算法,这里的延时一般在20ms 到200ms 左右。但是受到jitter buffer 影响,可能会更高。视频在设备端上的延时:? 采集延时:采集时会遇到成像延迟,主要由 CCD相关硬件产生,市面上较好 的CCr秒可达50帧,成像延时约为20ms,如果是一秒2025帧的CCD, 会产生 4050ms 的延时;? 编解码延时:以H.264为例,它包含I、P、B三种帧(下文会详细分析),如果是每秒30 帧相连帧,且不包括B 帧(由于B 帧的解码依赖前后视频帧会增加延
4、迟),采集的一帧数据可能直接进入编码器,没有B 帧时,编码的帧延时可以忽略不计,但如果有 B帧,会带来算法延时。? 视频渲染延时:一般情况下渲染延时非常小,但是它也会受到系统性能、音画同步的影响而增大。? 端网络延时:与音频一样,视频也会遇到端网络延时。另外,在设备端,CPU缓存通常会同时处理来自多个应用、外接设备的请求,如 果某个问题设备的请求占用了 CPU,会导致音视频的处理请求出现延时。以音频为 例,当出现该状况时,CPU 可能无法及时填充音频缓冲区,音频会出现卡顿。所以设备整体的性能,也会影响音视频采集、编解码与播放的延时。T2 :端与服务器间的延时影响采集端与服务器、服务器与播放端的
5、延时的有以下主几个因素:客户端同服务间的物理距离、客户端和服务器的网络运营商、终端网络的网速、负载和网络类型等。如果服务器就近部署在服务区域、服务器与客户端的网络运营商一致时,影响上下行网络延时的主要因素就是终端网络的负载和网络类型。一般来说,无线网络环境下的传输延时波动较大,传输延时通常在10100ms 不定。而有线宽带网络下,同城的传输延时能较稳定的低至5ms10ms 。但是在国内有很多中小运营商,以及一些交叉的网络环境、跨国传输,那么延时会更高。T3 :服务器间的延时在此我们要要考虑两种情况,第一种,两端都连接着同一个边缘节点,那么作为最优路径,数据直接通过边缘节点进行转发至播放端;第二
6、种,采集端与播放端并不在同一个边缘节点覆盖范围内,那么数据会经由“靠近 ”采集端的边缘节点传输至主干网络,然后再发送至“靠近 ”播放端的边缘节点,但这时服务器之间的传输、排队还会产生延时。仅以骨干网络来讲,数据传输从黑龙江到广州大约需要30ms,从上海到洛杉矶大约需要110ms130ms 。在实际情况下,我们为了解决网络不佳、网络抖动,会在采集设备端、服务器、播放端增设缓冲策略。一旦触发缓冲策略就会产生延时。如果卡顿情况多,延时会慢慢积累。要解决卡顿、积累延时,就需要优化整个网络状况。综上所述,由于音视频在采集与播放端上的延时取决于硬件性能、编解码内核的优化,不同设备,表现不同。所以通常市面上
7、常见的“端到端延时”指的是 T2+T3延时低右!话质量可靠不论是教育、社交、金融,还是其它场景下,大家在开发产品时可能会认为“低延时 ”一定就是最好的选择。但有时,这种 “追求极致 ”也是陷入误区的表现,低延时不一定意味着通讯质量可靠。由于音频与视频本质上的差异,我们需要分别来讲实时音频、视频的通讯质量与延时之间的关系。音频质量与延时 音频采样示意图影响实时音频通讯质量的因素包括:音频采样率、码率、延时。音频信息其实就是一段以时间为横轴的正弦波,它是一段连续的信号(如上图)。? 采样率:是每秒从连续信号中提取并组成离散信号的采样个数。采样率越高,音频听起来越接近真实声音。? 码率: 它描述了单
8、位时间长度的媒体内容需要空间。码率越高,意味着每个采样的信息量就越大,对这个采样的描述就越精确,音质越好。假设网络状态稳定不变,那么采样率越高、码率越高,音质就越好,但是相应单个 采样信息量就越大,那么传输时间可能会相对更长。对照我们之前的公式,如果想要达到低延时,那么可以提高网络传输效率,比如提 高带宽、网络速度,这在实验室环境下可以轻易实现。但放到生活环境中,弱网、 中小运营商等不可控的问题必定会影响网络传输效率,最后结果就是通讯质量没有 保障。还有一种方法,就是降低码率,那么会损失音质。视频质量与延时影响实时视频质量的因素包括:码率、帧率、分辨率、延时。其中视频的码率与音 频码率相似,是
9、指单位时间传输的数据位数。码率越大,画面细节信息越丰富,视 频文件体积越大。帧:正如大家所知,视频由一帧帧图像组成,如上图所示为H.264标准下的 视频帧。它以I帧、P帧、B帧组成的GOP分组来表示图像画面(如下图): 帧是关键帧,带有图像全部信息;P 帧是预测编码帧,表示与当前与前一帧( I 或 P 帧)之间的差别;B 帧是双向预测编码帧,记录本帧与前后帧的差别。帧率:*它是指每秒钟刷新的图像帧数。*它直接影响视频的流畅度,帧率越大,视频越流畅。由于人类眼睛与大脑处理图像信息非常快,当帧率高于24fps 时,画面看起来是连贯的,但这只是一个起步值。在游戏场景下,帧率小于 30fps 就会让人
10、感到画面不流畅,当提升到60fps 时会带来更实时的交互感,但超过75fps 后一般很难让人感到有什么区别了。分辨率:是指单位英寸中所包含的像素点数,直接影响图像的清晰度。如果将一张640 x 480 与 1024 x 768 的视频在同一设备上全屏播放,你会感到清晰度明显不同。在分辨率一定的情况下,码率与清晰度成正比关系,码率越高,图像越清晰;码 率越低,图像越不清晰。在实时视频通话情况下,会出现多种质量问题,比如:与编解码相关的画面糊、不 清晰、画面跳跃等现象,因网络传输问题带来的延时、卡顿等。所以解决了低延时, 只是解决了实时音频通讯的一小部分问题而已。综上来看,如果在网络传输稳定的情况
11、下,想获得越低的延时,就需要在流畅度、视频清晰度、音频质量等方面进行权衡。不同场景下的实时音视频 我们通过下表看到每个行业对实时音视频部分特性的大致需求。但是每个行业,不 仅对低延时的要求不同,对延时、音质、画质,甚至功耗之间的平衡也有要求。在 有些行业中,低延时并非永远排在首位。游戏场景在手游场景下,不同游戏类型对实时音视频的要求不同,比如狼人杀这样的桌游,语音沟通是否顺畅,对游戏体验影响很大,所以对延时要求较高。其它类型游戏具体如下方表格所示。但满足低延时,并不意味着能满足手游开发的要求。因为手游开发本身存在很多痛点,比如功耗、安装包体积、安全性等。从技术层面讲,将实时音视频与手游结合时,
12、 手游开发关注的问题有两类:性能类与体验类。? 性能类:包括SDK包大小、流量使用情况、CPU与内存占用率、功耗? 体验类:包括网络延迟、回音消除、抗杂音能力等 在将实时音视频与手游结合时,除了延时,更注重包的大小、功耗等。安装包的大 小直接影响用户是否安装,而功耗则直接影响游戏体验。社交直播场景目前的社交直播产品按照功能类型分有仅支持纯音频社交的,比如荔枝FM;还有音视频社交的,比如陌陌。这两类场景对实时音视频的要求包括:直播答题场景在直播答题场景中,对实时音视频的要求主要有如下两点:? 音视频质量:与视频直播类似,画面与音质决定了用户的直观体验? 直播与题目同步:直播画面与题目的同步我们以
13、前经常能看到主持人说完一道题,题目却还没发到手机上,最后只剩3 秒的答题时间,甚至没看到题就已出局。该场景的痛点不是低延时,而是直播音视频与题目的同步,保证所有人公平,有钱分。K 歌合唱场景天天K歌、唱吧等K歌类应用中,都有合唱功能,主流形式是 A用户上传完整录 音,B 用户再进行合唱。实现实时合唱的主要需求有如下几点:在这个场景中,两人的歌声与音乐三者之间的同步给低延时提出了很高的要求。同时,音质也是关键,如果为了延时而大幅降低音质,就偏离了K歌应用的初衷金融场景 对于核保、银行开户来讲,需要一对一音视频通话。由于金融业特殊性,该类应用 对实时音视频的需求,按照重要性来排序如下: 在这个场景
14、中,低延时不是关键。重要的是,要保证安全性、双录功能和系统平台 的兼容。在线教育在线教育主要分为两类:非K12 在线教育,比如技术开发类教学,该场景对实时音视频的要求主要有:? 音视频播放流畅:直播音视频画面不会出现卡顿、画面模糊等情况? 回放功能:一些有价值的演讲,或技术门槛较高的内容都需要有回放功能很多非 K12 教学发生在单向直播场景下,所以延时要求并不高。另一类是K12 在线教育,比如英语外教、部分兴趣教学,通常会有一对一或一对多的师生连麦功能,它对直播场景的要求包括:在 K12 的在线教育中,师生的连麦在低延时方面有较高的要求。如果会涉及跨国 的英语教学,或需要面向偏远地区学生,那还要考虑海外节点部署、中小运营商网 络的支持等。在线抓娃娃 在线抓娃娃是近期新兴热点,主要依靠实时音视频与线下娃娃机来实现。它对实时 音视频的要求包括:瓶颈与权衡 产品的开发追求极致,需要让延时低到极限。但理想丰满,现实骨感。我们曾在上 文提到,延时是因多个阶段的数据处理、传输而产生的。那么就肯定有它触及天花 板的时候。我们大胆假设,要从北京机场传输一路音视频留到上海虹桥机场。我们突破一切物理环境、财力、人力限制,在两地之间搭设了一条笔直的光纤,且保证真空传输(实际上根本不可能)。两地之间距离约为1061 km 。通过计算可知,传输需要约35ms。数据在采集设备与播放设备端需要的采集
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高校安全警示教育课件
- 新疆生产建设兵团兴新职业技术学院《环境工程基础实验》2023-2024学年第二学期期末试卷
- 南京旅游职业学院《香料化学》2023-2024学年第二学期期末试卷
- 日照市岚山区2025届数学五下期末联考模拟试题含答案
- 内蒙古自治区乌海市第三中学2025届初三3月份月考试卷数学试题含解析
- 吉林省松原市高中2025届高三第四次模拟物理试题含解析
- 江苏省百校大联考2024-2025学年高考历史试题原创模拟卷(八)含解析
- 柳州职业技术学院《柔力球》2023-2024学年第一学期期末试卷
- 西京学院《植物学实验》2023-2024学年第一学期期末试卷
- 通辽市重点中学2024-2025学年初三下学期实验班第二次月考数学试题含解析
- 七下9《木兰诗》一轮复习检测小卷(附答案)
- 综采工作面乳化液泵检修工技能理论考试题库150题(含答案)
- 26 跨学科实践“制作能升空的飞机模型”(教学设计)2024-2025学年初中物理项目化课程案例
- 数控刀片合金知识
- 2025届上海市(春秋考)高考英语考纲词汇对照表清单
- 内蒙古赤峰市松山区2023-2024学年八年级下学期期中考试数学试卷(含答案)
- 大型设备吊装地基处理方案
- 2025年公开招聘卫生系统工作人员历年管理单位笔试遴选500模拟题附带答案详解
- 智能垃圾桶产品介绍
- 2025深圳劳动合同下载
- 建筑工地住房安全协议书(2篇)
评论
0/150
提交评论