T764史上最完整技术资料.doc_第1页
T764史上最完整技术资料.doc_第2页
T764史上最完整技术资料.doc_第3页
T764史上最完整技术资料.doc_第4页
T764史上最完整技术资料.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ARM Mali T764史上最完整技术分析一、先进内存压缩技术 视频和图形是内存带宽的消耗重点。随着分辨率的不断提高(720P、1080P、2560*1920、2K、4K),内存带宽压力越来越大,但任何减少内存带宽的技术都会同时提高功耗。因此与桌面GPU动辄256bit甚至384bit的位宽、1.2-1.5GHz的高频显存相比,手持设备通常搭配 RAM 的是低功耗、窄带宽的 LPDDR 、 LPDDR2 等特殊内存普遍使用的是双32bit位宽、LPDDR2-800或1066左右的内存系统,总带宽普遍在10GB/s以内。没有高带宽就没有大容量纹理数据,也就不会有高画质。在内存带宽有限的限制下,移动GPU厂商关心重点是如何在尽可能小的带宽需求下提升GPU性能及画质。RK3288采用ARM Mali-T764 GPU!除了16个着色引擎外,另一大特色就是还引入了多项内存压缩技术,如ARM 帧缓冲压缩格式(ARM Frame Buffer Compression)、ASTC纹理压缩技术、以及Transaction Elimination智能消除技术。1、ARM 帧缓冲压缩格式(ARM Frame Buffer Compression)。 怎么节省带宽需求?先看一下GPU的工作流程:三角形SetupVertex Shader计算Rasterization(光栅化)Pixel Shader(fragment)计算后端处理输出,到FrameBuffer打包扔出去。以PowerVr之前的看家本领TBDR技术为例,可以在处理像素时把隐藏不显示的像素丢弃不管,后来PowerVR SGX 6又引入了PVR的帧缓存压缩技术。现在ARM也跟上了,如Mali-T764就支持ARM 开发了 ARM 帧缓冲压缩格式(ARM Frame Buffer Compression)。 ARM 帧缓冲压缩格式最大特点是引入了Transaction Elimination智能消除技术,该技术能够提供快速、实时的无损压缩与解压缩,最大限度地减少SoC 内不同 IP 块之间的数据传输量,在减少了整个系统的带宽同时将相应功耗降低至多达50% 。带宽有了明显下降。与此相关的功耗节约完全取决于SoC的设计和使用的内存系统,但在移动系统中,带宽消耗的功率通常可达到 150mW每GB/s。2、支持ASTC 纹理压缩技术除了支持ARM 帧缓冲压缩格式外,Mali-T764第二项秘技就是ASTC 纹理压缩技术。ASTC技术是OpenGL ES 3.0引入的新纹理压缩技术。我们都知道,OpenGL、OpenGL ES和DirectX APIs均支持3D纹理,但它们的利用率并不高。原因不难解释它们较占空间。256x256的RGB纹理较小,未压缩情况下占据192KiB空间。要在3D中获得同样的像素解决方案,要求纹素为256x256x256,其所占空间较大,为48MiB。对于多数应用程序而言,这已经“太大”。显然,我们不是要求压缩技术支持3D纹理,而是要让3D纹理能够被压缩。因此,之前不少压缩方案都是通过简单地压缩2D切片已可以全面支持3D。比如256x256x256,我们简单地将它作为256个独立的切片,每条切片均为256x256像素点,然后单独压缩每条切片,并将它们连成矩阵,但这样做在性能和质量两方面存在弊端。而ASTC技术引入了一种新理念压缩数据中一个128比特的单元块可以覆盖一个3D足迹(从3x3x3像素点到6x6x6像素点,梯度在二者之间)。这相当于将比特率从4.7调低至 0.56比特每像素。由于单元块是立方体(或接近立方体,类似于4 x 4 x 5的规格也可操作),无论从哪个方向看,它们都是相似的。通过切片方法查看,几乎完全消除了性能方面的较大差异。ASTC允许压缩任何纹理。目前常用的格式(S3TC、PVRTC、ETC1 和 RGTC)仅提供有限数量的比特率,颜色组件数量的选择也不多。ASTC 几乎可提供所需要的任何比特率,以及喜欢的任何颜色组件数量,可以选择标准(8 位)或 HDR(浮点),所有这一切的质量只有 BPTC 等外来高端格式才能与之匹敌。这意味着,开发人员将第一次能够考虑将应用程序使用的所有纹理都进行压缩。覆盖面上毫无“漏洞”;无论像素格式或质量要求为何,ASTC 都有与之匹配的格式,进一步减少了Mali GPU的内存带宽和内存占用,并同时提高了移动设备的电池续航时间,带来“永远连线、持续运作”的体验。结合这两招秘技,ARM宣称可以节省50%的带宽, Mali-T764的能效、性能相比四核Mali-T604提升大约400!这让32bit lpddr2带动2560*1920高分屏成为可能,特别是采用Mali-T764的RK3288结合双通道内存甚至直奔向4K最强显示规格可以通过HDMI2.0接口同时支持本地4K视频播放及外置4K显示器。而视频解码方面,RK3288更是提供了硬件H.265解码,在未来超高清视频播放方面再次领先其对手。3、Transaction Elimination智能消除技术相对于ARM 帧缓冲压缩格式,Transaction Elimination智能消除技术是一项有意思的技术,它可以智能消除渲染区块的重复渲染问题,真正实现按需渲染。借助Transaction Elimination智能消除技术,每次 GPU 解析一整个区块的颜色样本时,它会计算出一个签名,并将各个签名写入到与输出颜色缓冲区关联的列表。下一次渲染到该缓冲区时,在解析各个区块后,它将新的签名与旧签名对比。如果签名没有变化,就会跳过写出该区块,因为像素已发生变化的可能性是非常、非常小的。举个例子,在玩愤怒的小鸟的过程中,当我们瞄准弹弓时,运动很少,只需要写入一些区块。当我们发射小鸟时,整个画面平移,许多区块会变化,但我们最终依然能跳过大约 50% 的区块写操作。最后,当小鸟击中时,滚动变慢并且最终停止,活动区块的数量逐渐消失。图:瞄准,TE功能可以免除 96% 的区块写操作。 图:飞行中的小鸟。此时有许多背景运动,但TE依然能够消除近一半的区块写操作。 图:降落。随着物理引擎的收敛,越来越多的场景变为静态,不再需要将区块写入内存。经过以上一系列的处理,TE可以消除了大约 75% 的区块写回,可以将GPU 总带宽减少了近一半。二、全局时光引擎由于移动游戏发展迅猛,开发者正将受欢迎的PC和游戏机游戏引擎移植到移动环境,移动游戏现在可以具备先进的游戏特性,例如实时物理效果以及实时纹理生成。在这种趋势下专业性图形处理器能够为未来智能终端实现更高的性能,提供更高的图像质量,让玩家也能够获得更加逼真的游戏体验。Mali-T764显然就是这未来游戏准备的新引擎。RK3288上的Mali-T764使用ARM最新的第三代Midgard架构,采用统一渲染设计,不再区分PS、VS单元,Shader计算单元为可编程USSE2浮点单元,每个着色核心都能执行渲染任务,效率更高。更让人惊讶的是Mali -T764拥有16个着色器,每个着色器配有四个ALU簇,同时各个shader均拥有独立的线程调度,可对各自的管线分配来自各个线程的程序指令,从而使得各个管线可灵活用于执行来自各自线程的指令。另外它支持Enlighten全局实时光技术的游戏。Enlighten全局实时光技术是非常高端的游戏技术,以往都是运用在主机游戏之上,比如PS3,PS4,Xbox之内的游戏。目前Unity在最新的Unity 5中集成进去Geomerics Enlighten 的全局实时光引擎,这是为游戏带来实时、交互光线追踪的第一步,通过在编辑器的场景视图中显示最终游戏中光照的精确预览,此功能几乎可即时反馈全局光照的光照贴图的更改。利用此技术,美工可继续迭代和细化关卡外观,同时在背景中更新和烘焙最终光照贴图,从而大量减少调整场景艺术效果所需的时间。图: RK3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论