版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ICS43.020CCSR85SHV2XGeneralcorpusforautomobiledrivingautomatIT/SHV2X1—2025前言 II III 2规范性引用文件 3术语和定义 4缩略语 5总体要求 6语料数据资源 6.1语料数据资源分类 6.2基本数据信息 6.3外部环境信息 6.4车辆信息 6.5时间戳信息 6.6采集任务信息 6.7坐标系信息 76.14轨迹导航数据 7数据采集要求 7.1采集过程要求 7.2数据传输及存储要求 7.3采集数据质量要求 8数据采集安全 8.1数据接入端 8.2数据采集端 8.3数据存储端 附录A(资料性)语料数据资源参考指标 9附录B(资料性)数据资源质量要求 参考文献 IIT/SHV2X1—2025《汽车驾驶自动化系统通用语料库》系列标准拟分为六个部分:——第1部分:总体要求;——第2部分:术语与定义;——第3部分:语料数据采集;——第4部分:语料数据清洗;——第5部分:语料数据标注;——第6部分:语料数据测试。本文件为第3部分。本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。本文件由上海市车联网协会提出并归口。本文件起草单位:上海库帕思科技有限公司、智能汽车创新发展平台(上海)有限公司、智己汽车科技有限公司、地平线征程(上海)科技有限公司、上海临港绝影智能科技有限公司、上海机动车检测认证技术研究中心有限公司、上海金桥智能网联汽车发展有限公司、北京一辅智行科技有限公司、上海优咔网络科技有限公司、亿咖通(上海)技术有限公司、滴水智行科技有限公司、上海航盛实业有限公司。本文件主要起草人:山栋明、黄海清、施佳樑、郭辉、周剑鸣、赵九花、贺锦鹏、蒋达夫、黄剑其、宾、董连飞、范昌琪。本文件首批承诺执行单位:上海库帕思科技有限公司、智能汽车创新发展平台(上海)有限公司、智己汽车科技有限公司、地平线征程(上海)科技有限公司、上海临港绝影智能科技有限公司、上海机动车检测认证技术研究中心有限公司、上海金桥智能网联汽车发展有限公司、北京一辅智行科技有限公司、上海优咔网络科技有限公司、亿咖通(上海)技术有限公司、滴水智行科技有限公司、上海航盛实业有限公司。IIIT/SHV2X1—2025人工智能是新一轮科技革命和产业变革的重要驱动力量,语料数据则是人工智能研究和应用不可或缺的资源,高质量的语料库更是人工智能赋能新质生产力的关键。随着端到端模型整合度越来越高,对训练语料的规模和质量要求也成倍增加,相对而言,国内车企普遍面临高质量训练数据稀缺、分布分散、一致性差、处理效率低下,数据采集成本较高(全量采集的数据存储、计算成本巨大,且原始数据中高价值信息占比可能不足1%),单款车型上路数量较少、数据采集规模不足,不同厂商、不同车型采集数据分散且难以形成规模效应。为了实现可靠的汽车驾驶自动化,大量准确的语料数据采集至关重要。数据是自动驾驶系统的基础,它能够帮助系统理解复杂的交通环境、做出明智的决策,并不断优化性能。通过对各种外部环境信息、车辆自身状态信息以及驾驶行为数据的采集和分析,为自动驾驶技术的发展提供有力支持。围绕“采、洗、标、测”一体化流程,制定《汽车驾驶自动化系统通用语料库》系列标准,本标准为语料数据采集部分标准。通过本标准的制定,统一的语料数据资源的格式和要求,构建可复用的标准化训练数据集,促进汽车驾驶自动化系统语料资源高效流通利用,降低业内企业重复采集、处理和管理数据的巨额成本,提升本市汽车企业竞争力且推进汽车产业健康发展。为未来端到端技术架构发展所需的数据提供基础支撑和高质量发展的要素型支撑和关键性举措以及高水平对外开放的战略性支撑。1T/SHV2X1—2025汽车驾驶自动化系统通用语料库第3部分:语料数据采集本文件规定了汽车驾驶自动化系统通用语料库的总体要求、语料数据资源、数据采集要求以及数据采集安全等方面的要求。本文件适用于企业、研究机构等对汽车驾驶自动化系统的研究、开发、维护、应用、评估。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。智能网联汽车自动驾驶数据记录系统汽车整车信息安全技术要求汽车事件数据记录系统北斗卫星导航术语汽车行驶记录仪大地测量术语天气类型国标编码测绘基本术语JT/T794—2019道路运输车辆卫星定位系统车载终端技术要求3术语和定义下列术语和定义适用于本文件。3.1语料数据资源dataresources以电子化形式记录和保存的具备原始性、可机器读取、可供社会化再利用的数据集合。3.2数据表征模式datarepresentationmodes计算机中存储和表达数据的形式或结构。4缩略语下列缩略语适用于本文件。5总体要求5.1语料数据资源2T/SHV2X1—2025汽车驾驶自动化系统通用语料库的语料数据资源应满足多模态、同步性、多样性、一定规模和质量的要求。5.2语料数据采集汽车驾驶自动化系统通用语料库的语料数据资源的采集方法应符合GB44497、GB39732、GB/T17159、GB/T14911以及《智能网联汽车时空数据安全处理基本要求》所规定要求。5.3语料数据安全汽车驾驶自动化系统通用语料库数据资源的采集方应在组织、人员、制度、平台等方面实施安全策略、执行覆盖资源数据和语料产品全生命周期的安全控制措施,对车辆采集、存储和传输的数据进行加密、认证等保护措施,确保数据的保密性、完整性和可用性,应执行并满足GB44495相关数据安全规定。6语料数据资源6.1语料数据资源分类汽车驾驶自动化系统通用语料库的语料数据资源应包含数据采集车辆定向采集数据和量产车回传数据内容应包含基本数据信息、外部环境信息、车辆主体信息、时间戳设定内容、采集任务描述、激光雷达数据、毫米波雷达数据、摄像头数据、声音信息、轨迹导航数据、IMU数据采集内容等。汽车驾驶自动化系统通用语料库的语料数据资源的数据种类、用途及数据来源详见表1。表1语料数据资源的数据种类、用途及数据来源123456786.2基本数据信息基本数据信息应包括唯一编号、提交人姓名、提交人单位、提交人邮箱、语料数据资源名称、声明等信息,见表2。表2语料数据资源包基本信息1233T/SHV2X1—202545称66.3外部环境信息外部环境信息应包括外部环境名称、环境类型、环境描述、天气、温度、湿度等,见表3所示。表3外部环境信息采集内容12345676.4车辆信息记录采集车辆信息,应包括车辆序列号、车辆型号、车辆名称、车辆状态、车辆位置、车辆信息等,见表4所示。表4车辆信息采集内容1234566.5时间戳信息对不同的数据进行采集时,应确保同一数据采集系统内部以及不同数据采集系统之间的时间的同步性,确保多传感器数据时间校准同步,时间戳信息见表5所示。表5时间戳信息126.6采集任务信息在进行数据采集任务时,应针对工作任务进行系统描述,记录的内容见表6所示。4T/SHV2X1—2025表6采集任务内容1任务ID2346.7坐标系信息汽车驾驶自动化中坐标系常见分为激光雷达坐标系、相机坐标系、车辆坐标系、站心坐标系以及表7汽车驾驶自动化训练中定义的坐标系类型Y轴方向12测345系车辆坐标系应符合GB39732-2020中对于车辆坐标系的定义。6.8IMU数据采集内容惯性测量单元是测量物体三轴角速度及加速度的装置。一般IMU包括三轴陀螺仪及三轴加速度计,部分IMU还包括三轴磁力计。IMU数据包括角速度零偏稳定性、加速度零偏稳定性、时间戳同步等。IMU采集数据应包括的信息内容和要求见表8所示。表8IMU数据采集信息1-234567性89用于标识车辆横摆角速度和车辆侧倾角速度方向的车辆坐标系应符合GB39732中对于车辆坐标系的定义。6.9图像数据5T/SHV2X1—2025图像表征的数据,简称图像数据,是以像素矩阵的形式存储,每个像素点包含颜色信息,适用于图像的存储和处理。图像数据资源的指标和要求见表9所示。表9图像数据资源的指标和要求12345676.10视频信息视频表征的数据,简称视频数据,是以一系列序列帧的形式存储,每个帧可以是图像表征,适用于视频内容的存储和处理。汽车驾驶自动化视频类型详见10所示。表10视频数据的指标和要求1234567视频数据来自车辆前视、侧视、后视摄像头的视频序列,用于物体检测、语义分割、道路检测、交通信号识别等。摄像头视频数据分类及说明见表11所示。表11视频数据分类表123456视频数据场景信息包含的天气条件、照明条件和道路类型等多种数据语义特征,汽车驾驶自动化数据语义特征见表12所示。表12视频数据语义特征表123456T/SHV2X1—20256相机水平视场角应能覆盖360°,应与汽车驾驶自动化数据集保持一致,多个视角内的目标可追踪,保持特征一致。6.11雷达数据本文件规定的雷达数据包括激光点云数据和毫米波数据。激光点云表征的数据,简称点云数据,通过雷达系统获取的三维空间信息集合,可通过发射激光束并接收反射回来的信号,精确测量物理的距离、形状和位置,构建三维环境模型。激光点云数据可分为360°机械激光雷达和固态激光雷达,360°机械激光雷达一般用于真值数据采集。360°机械激光雷达点云数据和固态激光雷达点云数据的指标和要求可参考附录A。相关激光点云数据需满足以上指标和要求,如出现以下情形,则不适合作为激光点云数据,详见表表13不适合作为点云数据资源的情形123456789毫米波数据,擅长测量目标的距离和速度,对金属物理比较敏感,在恶劣环境下也能较好工作。毫米波数据资源的指标和要求见表14所示。表14毫米波数据的指标和要求1234567896.12声音信息声音表征的数据,简称声音信息。是以音频和文字形式存储的音频对。声音信息应包含的内容见表7T/SHV2X1—2025表15声音信息数据应包含的内容123456.13CAN总线数据车辆为采集平台硬件基础,车辆的驾驶行为和车辆状态数据是重要组成部分之一,车辆总线可快速获取此类数据,车辆总线数据可参考附件A。6.14轨迹导航数据本文件规定的轨迹导航数据包括定位数据、轨迹数据等。轨迹导航数据的说明见表16所示。表16轨迹导航数据资源说明1234轨迹导航数据的资源分类详见表17所示。表17轨迹导航数据资源分类1237数据采集要求7.1采集过程要求在数据采集开始前以及结束后,应验证采集设备,确保采集设备处于正常工作状态,无故障,且验证采集数据的合理性、正确性。在将采集到的语料数据资源存入数据库前,应检查其格式的统一性和数据的完整性。7.2数据传输及存储要求语料数据资源的采集、传输、存储,应考虑传输通道与存储系统等的整体性能,以确保数据的完整性、准确性和安全性,避免数据丢失、数据损坏等情况的发生。对数据的存储介质、存储能力、存储覆盖机制应执行和满足GB44497以及GB/T19056相关数据存储格式和要求,同时还需要满足自然资发〔2024〕139号《自然资源部关于加强智能网联汽车有关测绘地理信息安全管理的通知》的要求。7.3采集数据质量要求采集数据的质量要求,应满足准确性、完整性、一致性、可溯源性、代表性和可移植性,具体要求可参考附录B。8数据采集安全8T/SHV2X1—20258.1数据接入端对于数据接入端,如传感器自带或外加加密模块,应采用硬件/软件加密后传输的方式增加数据安全性。8.2数据采集端对于数据采集端的加密,包括数据采集接口自带或外加加密模块,应在采集端进行硬件/软件加密后显示或存储。8.3数据存储端对于数据存储端,如语料数据资源存储器或存储平台,应采用以下方式进行加密:设置权限、源文件加密、自建格式等。9T/SHV2X1—2025语料数据资源参考指标A.1360°机械激光雷达点云数据指标和要求表18360°机械激光雷达点云数据指标和要求123456785°(-19°~-14°)6°(-25°-19°)9A.2固态激光雷达点云数据的指标和要求表19固态激光雷达点云数据指标和要求123456789A.3CAN总线数据指标和要求T/SHV2X1—2025表20车辆CAN总线数据指标和要求123456789态车辆必须至少包含油门刹车控制或者加减速控制中的一种完整纵向控制类型,上述信息为描述场景的必备要素,是场景应用的基础信息。采集的场景数据将至少包含上述信息,以满足后期场景数据处理的需求。T/SHV2X1—2025数据资源质量要求B.1准确性汽车驾驶自动化系统通用语料库数据资源的准确性要求应包括:(a)数据形式的合理性;(b)记录信息的准确性;(c)文字与数据描述应准确、清晰、无歧义;(d)应避免数据压缩等因素造成的数据不准确性。B.2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学校安全警示语大全
- 会展营销方案策划(3篇)
- 六一创意活动策划方案(3篇)
- 天津问答营销方案(3篇)
- 动漫节营销方案(3篇)
- 折扣机票营销方案(3篇)
- 文物沙龙活动策划方案(3篇)
- 景区夸张营销方案(3篇)
- 桥-泄露-应急预案(3篇)
- 水电后期施工方案(3篇)
- 陕西省宝鸡市2026届高考模拟检测试题(二)语文试题(含答案)
- 2026年公共数据与社会数据融合应用:数据基础设施与场景孵化协同机制
- 肺部真菌感染诊疗规范与临床实践
- 2025年贵州省高考物理试卷真题(含答案)
- 人教版统编六年级语文下册第二单元《口语交际:同读一本书》教学课件
- 2026贵州省气象部门第二批公开招聘应届毕业生22人笔试备考试题及答案解析
- 昆明市公安局盘龙分局2026年第一批勤务辅警招聘(120人)笔试模拟试题及答案解析
- 医院感染预防护理培训课件
- 医护一体化业务查房制度
- 第2课 幸福生活是奋斗出来的 课件+视频-2025-2026学年道德与法治三年级下册统编版
- 治疗性疫苗研发进展-洞察与解读
评论
0/150
提交评论