信息技术.沉浸式媒体的编码表示.第9部分基于几何的点云压缩标准立项发展报告_第1页
信息技术.沉浸式媒体的编码表示.第9部分基于几何的点云压缩标准立项发展报告_第2页
信息技术.沉浸式媒体的编码表示.第9部分基于几何的点云压缩标准立项发展报告_第3页
信息技术.沉浸式媒体的编码表示.第9部分基于几何的点云压缩标准立项发展报告_第4页
信息技术.沉浸式媒体的编码表示.第9部分基于几何的点云压缩标准立项发展报告_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息技术.沉浸式媒体的编码表示.第9部分:基于几何的点云压缩标准立项发展报告EnglishTitle:StandardizationDevelopmentReport:Informationtechnology—Codedrepresentationofimmersivemedia—Part9:Geometry-basedpointcloudcompression摘要随着三维数据采集技术和沉浸式显示设备的飞速发展,点云作为一种能够真实、准确地表达三维物体和场景空间结构及外观属性的数据格式,在自动驾驶、虚拟现实/增强现实、数字孪生、文化遗产保护及地理信息系统等领域展现出巨大的应用潜力。然而,海量的点云数据对存储、传输和处理带来了严峻挑战,点云压缩技术因而成为学术界和产业界的研究热点。在此背景下,国际标准化组织动态图像专家组在深入研究现有技术的基础上,于2023年3月31日正式发布了ISO/IEC23090-9:2023标准,即基于几何的点云压缩标准。本报告详细阐述了该标准的立项背景、技术路线、核心算法、主要技术内容及其对点云产业发展的深远影响。报告指出,G-PCC标准通过采用基于几何结构的编码框架,有效利用了点云数据中的几何相关性,在维持高压缩比的同时,显著提升了编解码效率和重建质量。该标准的发布标志着点云压缩技术从分散的研究走向了统一的标准化道路,为面向沉浸式媒体的各类应用提供了关键的技术支撑和互操作性保障,预计将在自动驾驶高精地图、沉浸式视频通信、工业数字化检测等领域发挥不可替代的核心作用。关键词点云压缩;G-PCC;ISO/IEC23090;沉浸式媒体;三维编码;几何结构;MPEG-I;标准立项EnglishKeywordsPointCloudCompression;G-PCC;ISO/IEC23090;ImmersiveMedia;3DEncoding;GeometricStructure;MPEG-I;Standardization正文1.引言:点云数据时代与标准化需求随着消费电子、激光雷达、摄影测量和深度传感器等技术的普及,对真实世界进行“复制”和“重建”的需求日益增长。点云,作为一种由大量离散点构成的三维数据集合,每个点由其三维空间坐标(X,Y,Z)及可选的属性(如颜色、反射强度、法向量等)组成,成为连接物理世界与数字世界的核心媒介之一。与传统二维图像或视频不同,点云提供了六自由度全视角的沉浸式体验,是下一代信息技术革命的关键技术之一。然而,一个典型的点云模型可能包含数百万甚至数十亿个点。以自动驾驶领域使用的高精地图为例,单帧(或一个局部区域)的点云数据量可达几十至几百兆字节。若不加压缩,海量的数据传输和存储将对网络带宽及存储硬件构成难以承受的压力。因此,开发高效的点云压缩技术成为行业应用的迫切需求。在此背景下,作为长期引领全球音视频编码技术发展的组织,ISO/IECJTC1/SC29/WG11(MPEG)于2017年启动了针对点云压缩的标准化探索,旨在制定一套国际统一、性能卓越、应用广泛的标准。经过多轮提案征集、核心实验和评估,最终形成了两类重要的压缩标准:一种为基于视频点云压缩,主要针对属性密集、具有较好纹理结构的动态点云;另一种即为本文重点阐述的基于几何点云压缩,主要针对几何信息占据主导地位、且点云分布较为稀疏的静态或动态点云场景。2.标准立项背景与目的G-PCC标准立项的深层背景源于以下几个关键驱动力:1.应用场景的多样性:G-PCC标准并非为单一应用设计,而是面向一个广泛的、具有巨大市场潜力的应用场景集合。这包括:*自动驾驶与机器人:激光雷达产生的体素化点云数据是环境感知的核心。*文化保护与数字资产:对文物、雕塑、建筑进行高精度三维扫描,实现数字化存档与修复。*地理信息与数字孪生:生成高精度地形、城市规划、基础设施的数字化模型。*沉浸式通信与社交:VR/AR头盔、全息显示设备为远程协作、虚拟社交提供支持。2.现有编码技术的局限性:传统的三维网格模型编码或基于平面的图像编码无法高效处理非结构化的、离散的点云数据。3.行业对互操作性的渴望:市场需要一种开放的、免授权费(或合理费率)的国际标准,以确保不同厂商、不同系统之间的点云数据能够无缝交换和共享。G-PCC应运而生,填补了这一空白。3.技术路线与核心算法解析G-PCC标准的核心创新在于其“基于几何”的编码理念。与V-PCC将点云投影到二维平面上进行处理不同,G-PCC直接对三维空间中的几何结构进行建模和编码。其主要技术流程如下:*预处理与几何量化:首先对原始点云进行去噪和坐标变换,并执行量化,将连续的空间坐标离散化为整数。这一步骤会引入少量信息损失,但显著降低了后续处理的复杂度。*几何结构化:这是G-PCC的核心步骤之一。标准采用了两种主要的结构化方法:*八叉树:对于具有稀疏、随机分布特性的点云(如LiDAR数据),采用递归的八叉树分割方式。将整个包围盒递归分割成八个子立方体(体素),直到达到预设的体素大小。每个体素包含了点(占满)或空(空闲)的信息。通过对占满节点的位置进行编码,可高效地表示几何信息。*三角面片(Trisoup):对于具有连续表面特性的点云(如扫描得到的3D模型),采用三角面片逼近点云表面。通过构建由一系列顶点和三角形面片组成的三维网格,对表面形状进行参数化编码。这种方法在保持几何精度方面表现优异,尤其是在低码率条件下。*属性编码:在完成几何信息的编码后,G-PCC需要对颜色、反射率等点属性进行编码。其核心是利用几何结构提供的邻域信息。例如,采用“区域自适应分层变换”方法,基于几何信息对点云进行层次划分,对属性信号进行小波变换,然后对变换后的系数进行量化和熵编码。*上下文建模与熵编码:所有的符号信息,包括八叉树节点占满位、三角面片的顶点位置、属性系数等,都经过高效的上下文模型和熵编码器(如算术编码器)进行无损压缩,进一步去除数据冗余。4.主要技术内容与特点解读ISO/IEC23090-9:2023标准明确规定了G-PCC的完整编码、解码流程和比特流语法。其核心技术内容可总结为以下特点:1.双模式几何编码:如上文所述,通过支持八叉树和三角面片两种几何编码模式,G-PCC能够自适应地适应不同类型的点云源,从而在不同应用场景下实现最优的率失真性能。这是该标准相较于其他压缩方案最显著的技术优势。2.支持体素化与连续表面:无论点云是离散的体素点云还是连续的3D扫描数据,G-PCC均能提供高效的编码方案。3.高效的重建质量:通过精细的量化控制、上下文建模以及属性预测/变换技术,G-PCC能够在极低的比特率下,重建出视觉质量可接受的点云模型,或在高比特率下实现近乎无损的精确重建。4.并行处理能力:标准设计考虑了现代GPU和多核CPU的并行处理能力,允许对几何结构和属性数据进行并行解码,以满足实时应用的需求。5.可伸缩性编码:G-PCC支持对点云进行空间可伸缩性和质量可伸缩性编码,允许从低分辨率到高分辨率、从粗糙质量到精细质量的渐进式解码,这在带宽有限的网络环境中尤为重要。6.全面的误码鲁棒性:标准定义了误码隐藏工具,能够在传输过程中发生部分数据丢失时,尽可能恢复出可用的点云数据,增强了在无连接网络(如5G)中的可靠性。5.标准发布的作用与影响ISO/IEC23090-9:2023的发布,对全球点云技术产业和数字经济生态产生了多方面的积极影响:1.统一技术规范:为全球点云压缩技术提供了唯一的技术基线。企业、研究机构和开发者可以依据此标准开发出互操作性强的产品和服务。2.降低开发成本:免去了各家企业重复摸索和开发专有算法的成本,加速了相关产品和服务的上市周期。3.推动产业发展:支撑了自动驾驶高精地图、元宇宙中的虚拟资产创建、工业数字化检测、文化遗产数字化等产业的规模化应用,降低了系统部署的门槛。4.促进国际合作:作为一项ISO标准,它为各国在智慧城市、数字治理等领域的合作提供了标准语言和技术框架。6.修订企事业单位或标委会介绍本标准的制定由国际标准化组织动态图像专家组(ISO/IECJTC1/SC29/WG11,即MPEG)主导。MPEG(MovingPictureExpertsGroup)介绍:MPEG成立于1988年,是国际标准化组织(ISO)与国际电工委员会(IEC)联合技术委员会(JTC1)下属的一个专业工作组(WG),正式编号为ISO/IECJTC1/SC29/WG11。该组织是全球范围内影响力最大、最负盛名的多媒体编码标准制定组织。MPEG的成员单位来自世界各地的数百家顶尖科技公司、研究机构、高校和电信运营商。其工作方式高度开放且严谨,遵循严格的“提案-评估-集成-验证-发布”流程。任何成员单位都可以提交技术提案,经过严格的客观测试和主观评价,最终决定采纳哪些技术。这种模式确保了最终形成的标准具有全球公认的最优性能、极高的质量和广泛的市场接受度。在G-PCC标准的制定过程中,MPEG发挥了不可替代的核心引领作用:*技术路线的确立:MPEG通过广泛的产业需求调研和学术界讨论,确立了“基于几何”与“基于视频”两条技术路线的分治策略,并主导了G-PCC的技术方向。*技术方案的集成与优化:MPEG组织了大量核心实验(CoreExperiments),召集来自全球的顶级编码专家,对八叉树、三角面片、属性编码等各个模块进行迭代式优化、比较和融合。许多来自成员(如华为、苹果、高通、三星、腾讯、FraunhoferHHI等)的核心专利技术被集成到标准框架中。*性能验证与评估:MPEG开发了一整套标准的客观评价指标(如点到点距离、点到面距离、PSNR等)和主观评价方法,确保了G-PCC在各种条件下都能达到率失真性能的业界最优。*互操作性保障:MPEG发布的《参考软件》(ReferenceSoftware)和《一致性测试》(ConformanceTesting)文本,为业界提供了唯一的“黄金标准”实现,确保了任何符合G-PCC标准的编解码器之间能够完全兼容。因此,可以说G-PCC标准的诞生,是MPEG这一全球顶级标准化组织在技术上持续创新、在流程上精益求精、在产业上推动落地的结果。它不仅是一个技术产物,更是一个全球多边科技合作与智慧结晶的产物。7.结论与展望ISO/IEC23090-9:2023(G-PCC)标准的正式发布,是点云压缩领域一项具有里程碑意义的成就。它成功地将基于几何结构的点云编码技术从学术研究转化为国际统一的工程实践标准,为海量的三维数据在沉浸式媒体、自动驾驶、数字孪生等前沿产业中的高效传输与存储提供了关键技术保障。该标准所蕴含的双模式几何编码、可伸缩性、属性预测等核心技术理念,深刻影响了后续的点云处理技术发展方向。展望未来,G-PCC标准的演进将主要沿以下路径展开:1.更高的压缩效率:随着传感器分辨率的指数级提升和对极致沉浸感的追求,未来标准将持续探索人工智能技术(如基于神经网络的点云压缩、生成式模型)与传统编码框架的深度结合,以实现压缩比的倍级提升。2.更强的实时性能:针对AR/VR头显、自动驾驶边缘计算等对时延极为敏感的应用场景,未来的版本将进一步优化算法,支持硬件加速和低时延模式。3.对新型属性与动态场景的支持:当前G-PCC主要支持静态或准静态点云。未来标准可能会扩展其对非刚性运动、时变属性(如温度、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论