版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1T/GDITSXXX—XXXX车路云一体化公共数据治理技术规范本文件提供了智能网联汽车、路侧基础设施与云端系统一体化数据治理的总体架构、数据治理对象分类、数据治理内容、数据质量评价的工作过程建议。本文件适用于指导车路云一体化系统中智能网联汽车、路侧基础设施与云端应用系统所产生数据的治理工作。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T44109—2024信息技术大数据数据治理实施指南GB/T34960.5-2018信息技术服务治理第5部分:数据治理规范GB/T43697-2024数据安全技术数据分类分级规则GB/T35273-2020信息安全技术个人信息安全规范GB/T20282-2006信息安全技术信息系统安全工程管理要求GB/T22239-2019信息安全技术网络安全等级保护基本要求GM/T0054-2018信息系统密码应用基本要求GB/T37964-2019信息安全技术个人信息去标识化指南GB/T39335-2020信息安全技术个人信息安全影响评估指南GB/T20945-2013信息安全技术信息系统安全审计产品技术要求和测试评价方法3术语和定义GB/T44109—2024和GB/T34960.5-2018界定的以及下列术语和定义适用于本文件。3.1数据治理datagovernance对数据进行处置、格式化和规范化的过程。数据治理是数据和数据系统管理的基本要素,是数据资产管理的核心职能。3.2静态数据staticdata变化频率低于每日一次的数据。3.3动态数据dynamicdata变化频率高于或等于每日一次的数据。3.4元数据metadata定义和描述其他数据的数据。2T/GDITSXXX—XXXX4总体架构车路云一体化数据治理架构遵循数据生命周期管理理念,涵盖治理对象、治理过程与治理结果,其总体架构如图1所示。该架构核心包括:a)数据治理对象:涵盖静态数据与动态数据。b)数据治理过程:包含元数据管理、数据质量管理、数据安全管理等数据治理活动。c)数据治理结果:通过数据质量评价活动对治理成效进行度量与改进。图1车路云一体化数据治理架构5数据治理对象5.1数据治理对象分类原则车路云一体化数据治理对象可基于不同维度进行多层次、多角度分类,以适应不同治理场景的需求。本文件主要依据数据更新频率、数据结构形式和数据业务属性三个关键维度建立分类体系。根据数据变化的频次,将车路云一体化数据划分为静态数据和动态数据,直接关联治理策略。静态数据:指更新频率较低(通常不低于24小时)、相对稳定的基础性、背景性数据。动态数据:指更新频率高(通常高于24小时)、实时或准实时变化的业务运行与状态数据。5.1.1基于结构形式的静态数据分类根据数据自身的组织格式,将静态数据进一步划分为以下类型,关联数据的存储、解析和处理技术。结构化数据:指能够用统一的结构(如二维表)表示,其字段、类型和关系明确定义的数据。半结构化数据:指具有一定结构但格式不规则,需通过自描述标记(如JSON、XML)或特定解析规则才能提取信息的数据。T/GDITSXXX—XXXX3非结构化数据:指没有预定义数据模型或结构,格式多样(如文本、图像、视频)的数据。5.1.2基于业务属性的动态数据分类根据数据所描述的核心业务内容,将动态数据进一步划分为以下类型,关联数据的业务含义、使用场景和质量要求。运行状态类数据:描述车、路、云系统自身运行状况的数据。环境感知类数据:描述系统所处外部环境及其中实体状态的数据。控制应用类数据:描述系统间交互指令与控制策略的数据。服务类数据:描述与车辆运营、用户服务等相关业务活动的数据。5.2静态数据分类以下分类体系具有开放性,中,可根据治理需求,基于其他维度(如数据来源、数据敏感性等)进行进一步细分或交叉分类。5.2.1结构化数据主要用于描述车路云系统涉及的实体对象基本属性信息,主要包括但不限于:车辆基础数据包括车辆标识数据、车辆身份鉴别数据、车辆属性数据、车辆零部件数据。路侧设施设备基础数据包括路侧设备编号类数据、路侧设备鉴别数据、路侧设备属性数据、路侧设备安装位置及高程。云端基础数据包括云平台基础数据和通过云平台接入的其它基础信息类数据,其中云平台基础数据包括云端身份鉴别数据、云平台建设基本信息、云平台数据字典,其它基础信息类数据包括个体基础信息数据(驾驶员信息、乘客信息、货物信息、平台用户信息)、其它关联主体基础信息数据(供应商、运营商、服务商、监管机构)。5.2.2半结构化数据主要用于描述车路云系统涉及的地图等信息,主要包括但不限于:兴趣点数据包括兴趣点唯一标识数据、经纬度数据、兴趣点类型数据(如道路附属设施、建筑、汽车服务类设施、其它服务类主体)、兴趣点属性数据。路网数据包括车道唯一标识数据、车道要素数据、道路要素数据。区域数据包括区域唯一标识数据、区域类型数据、区域属性数据、区域邻接关系数据。5.2.3非结构化数据主要用于描述车路云系统涉及的交通规则等信息,主要包括但不限于:道路交通安全法、交通信号和标志法规、智能网联汽车管理法规、其它交通管理类法规所涉及的文本和图片数据。5.3动态数据分类5.3.1车路云运行状态类数据车路云运行状态类数据包括但不限于:车辆运行状态数据、路侧设备运行状态数据、云平台运行状态数据。车辆运行状态数据是指车辆行驶过程中车辆自身状态数据,包括车辆位置数据、车辆动力系统数据、车辆制动系统数据、车辆转向系统数据、车辆零部件状态数据、车辆电气系统数据、车辆驾驶行为数据、车辆通信数据、日志数据。T/GDITSXXX—XXXX4路侧设备运行状态数据是指路侧设备使用过程中设备自身状态数据,包括设备状态数据、设备配置数据、设备能耗数据、设备安全监控数据。云平台运行状态数据是指云平台使用过程中平台自身状态数据,包括系统性能数据、应用性能数据、资源使用数据、网络性能数据、存储性能数据、安全性能数据、用户活跃数据、日志数据。5.3.2车路云环境感知类数据车路云环境感知类数据包括但不限于:车辆感知数据、路侧设备感知数据、云端感知数据。车辆感知数据是指车载传感器感知的车辆周边环境数据,包括视觉感知数据、毫米波雷达感知数据、激光雷达感知数据、超声波雷达感知数据、环境传感器感知数据。路侧设备感知数据是指路侧设备感知的设备周边环境数据,包括视觉感知数据、毫米波雷达感知数据、激光雷达感知数据、雷视一体机感知数据、气象站感知数据、空气质量监测站感知数据、环境传感器感知数据。云端感知数据是指通过云服务获取的、来源于其它感知设备的感知类数据,包括个人移动设备感知数据、空中设备感知数据、用户上报和发布数据。5.3.3车路云控制应用类数据车路云控制应用类数据包括但不限于:车辆决策数据、路侧协同应用交互数据、云端管控数据。车辆决策数据是指改变车辆驾驶行为的数据,包括驾乘人员接管操作数据、驾驶自动化系统决策数据、驾驶自动化系统决策数据、车辆规划数据。路侧协同应用交互数据是指改变路侧设备应用状态的数据,包括信号灯控制数据、可变信息设备发布数据。云端管控数据是指在云端生成的向车辆和路侧设备推送的管控方案数据,包括交通事件及可变交通标志推送数据、安全预警消息推送数据、车速引导推送数据、网联式超级巡航控制数据、交通信号配时数据、路侧基础设施运维管理数据。5.3.4车路云服务类数据车路云服务类数据包括但不限于:车辆服务数据、运营服务数据、生活服务数据。车辆服务数据包括维保服务数据、加油服务数据、违章信息数据、保险服务数据。运营服务数据包括财务数据、订单数据、销售数据、供应链数据、人力资源数据。生活服务数据包括餐饮服务数据、购物服务数据、体育休闲服务数据、医疗保健服务数据、科教文化服务数据。6数据治理过程6.1元数据管理元数据管理旨在对车路云一体化数据进行清晰的描述、定位和管理,确保数据可知、可懂、可用。通过车路云一体化系统中的公共数据资产进行编目,明确数据的业务含义、技术格式、来源系统,形成数据资源目录。6.1.1元数据分类元数据应包括但不限于以下类别:a)技术元数据:描述数据的技术属性,包括但不限于:数据源信息(如:数据源系统名称、IP地址、接口类型);T/GDITSXXX—XXXX5数据结构(如:数据库表名、字段名、字段类型、长度、约束);数据存储信息(如:存储位置、存储格式、数据量、分区信息);数据流转信息(如:ETL作业、数据处理流程、血缘关系)。b)业务元数据:描述数据的业务含义和上下文,包括但不限于:业务定义(如:数据项的业务名称、业务解释、业务规则);业务责任人(如:数据所有者、业务部门);数据敏感性等级。c)管理元数据:描述数据的管理属性,包括但不限于:数据生命周期(如:创建时间、更新时间、保留期限、销毁条件);数据访问权限(如:可访问角色、授权策略)。6.1.2元数据管理活动a)元模型定义:设计符合车路云一体化领域特点的元数据模型。b)元数据采集与发现:通过自动化工具从各类数据源(如:车载终端、路侧设备、云平台数据库、数据文件)中采集技术元数据,并支持手动录入业务元数据和管理元数据。c)元数据维护:确保元数据的准确性、完整性和及时性,建立元数据变更流程,并与数据变更联动。d)数据血缘分析:支持可视化展示数据的来源、加工过程和去向,用于影响分析、故障溯源和数据可信度评估。e)数据目录服务:基于元数据构建可检索的数据资产目录,为用户提供数据发现、理解和申请使用的入口。6.2数据质量治理6.2.1静态数据治理6.2.1.1完整性治理对于存在字段缺失、数值缺失的数据应选择合适的缺失值填充方法,如表1所示。表1缺失值填充方法使用非空缺值的平均值、最大值、最小值、众数、某设定A字段为含空缺值字段,B字段为关联字段,则基于关联关系,由B字段推导出A字段内容。6.2.1.2准确性治理对于存在数值错误的数据应选择合适的错误值修正方法。表2错误值修改方法T/GDITSXXX—XXXX6将错误数值作为空缺值处理,使用缺失值填充6.2.1.3地图数据标定地图数据作为典型的静态、半结构化数据,其标定工作主要包括车道功能属性标定、车道通行能力标定等,标定方法见表3和表4。该方法也可适用于其他需要类似标定的空间数据。表3车道功能属性标定方法将车辆行驶轨迹数据与地图进行映射,通过车辆的左转、直行、右转等驾驶行为,基于特定视角拍摄路面无遮挡视频图像,识基于道路拓扑连接关系、车道数等道路基础属性,设定规则推断车道表4车道通行能力标定方法基于高峰时段的车辆轨迹数据计算车头时距,根据交通流基本理论,基于高峰时段的车流统计量取某分位数,根据统计流量分布特征,基于道路等级信息,根据特定等级道路设计标准规范,6.2.1.4交通规则语义化交通规则作为典型的静态、非结构化数据,应进行语义化,使交通规则文本数据、交通标识标牌图像数据能够被计算机理解和处理。表5交通规则语义化方法定义类型、属性和实例。例如,交通规则可分为使用逻辑判断描述交通规则。例如,如果车辆类型为货车且道路类型为城市构建实体、关系和属性三元组。例如红灯,表示,禁止通行)。6.2.2动态数据治理6.2.2.1感知数据语义化动态数据治理应针对车路云环境感知类数据开展语义化工作,使传感器采集的原始数据能够被计算机理解和处理。表6感知数据语义化方法对图像中每个像素进行分类,标注其所属物体类型。对点云中的每个点进行分类,识别其代表的物体类型。如T/GDITSXXX—XXXX76.2.2.2动态数据对齐由于车路云数据来源众多,动态数据治理应对不同来源数据进行时空粒度对齐。表7时空粒度对齐方法通过线性插值、样条插值等插值方法,生成指通过精准时间协议、无线卫星信号等硬件同步法通过双线性插值、最近邻插值等插值方法,将不同分辨率或通过特征匹配、迭代最近点等配准方法,实现不同视角或通过旋转、平移、缩放、投影等变换方法,实现不同通过动态时间规整、时空卡尔曼滤波等机器学习方法6.2.2.3一致性治理由于车路云数据的检测视角、检测对象、检测范围不同以及数据经过链路传输后可能存在偏差,因此动态数据治理应开展数据一致性校验工作。针对运行状态类数据和环境感知类数据,从不同检测视角对同一检测对象的状态进行一致性校验,如果数据一致则表明数据可信程度高,可以进行数据融合,如果数据不一致则表明存在数据检测异常,应考虑进行冲突值修正处理。针对运行状态类数据和控制应用类数据,按数据传递链路先后顺序进行一致性校验,如果数据一致则表明数据传输无误,如果数据不一致则表明存在数据传输异常,应考虑进行冲突值修正处理。表8冲突值修正方法设定A字段为数值冲突字段,B字段为关联字段,使用B字段数据及关联关系,推导A字段更可能的对于同一字段数值来自多个数据来源时,以更权威对于同一字段数据存在多条不同记录时,以内容相同的数量对于同一字段数据存在多条不同记录时,以时间6.3数据安全治理数据安全治理旨在确保车路云一体化公共数据在生命周期各环节的保密性、完整性和可用性,并满足个人信息保护和合规性要求。6.3.1安全分级依据GB/T43697-2024《数据安全技术数据分类分级规则》等相关标准对数据进行安全分级。依据GB/T35273-2020《信息安全技术个人信息安全规范》对于包含个人信息的数据进行单独标识和保护。6.3.2访问控制T/GDITSXXX—XXXX8依据GB/T20282-2006《信息安全技术信息系统安全工程管理要求》和GB/T22239-2019《信息安全技术网络安全等级保护基本要求》等相关标准对访问控制的详细规定,建立基于角色和数据的访问控制机制。a)建立基于角色(RBAC)或属性(ABAC)的访问控制模型,确保授权用户只能访问其职责所需的数据。b)访问控制策略应细化到表、字段级别,并对敏感数据的访问行为进行日志记录和审计。6.3.3数据加密与脱敏依据GM/T0054-2018《信息系统密码应用基本要求》、GB/T37964-2019《信息安全技术个人信息去标识化指南》和GB/T39335-2020《信息安全技术个人信息安全影响评估指南》,对敏感数据进行加密与脱敏处理。a)数据传输加密:数据在车-路-云之间传输时,应采用TLS/SSL等加密协议,确保传输安全。b)数据存储加密:对于敏感数据,应在存储时进行加密,加密算法应符合国家密码管理部门的要c)数据脱敏:在数据开发、测试、分析和共享场景下,应对敏感信息进行脱敏处理。脱敏方法包括:静态脱敏:对存储中的数据直接进行掩码、泛化、替换等处理;动态脱敏:在数据访问时根据策略实时进行脱敏。6.3.4数据安全审计与监控依据GB/T20945-2013《信息安全技术信息系统安全审计产品技术要求和测试评价方法》:a)记录并留存数据全生命周期的操作日志,包括但不限于:数据访问、修改、导出、销毁等行为。b)建立安全审计机制,定期对日志进行分析,发现异常数据访问行为和安全事件。7数据质量评价本章规定了针对车路云一体化公共数据特点的质量评价指标、评价流程及持续改进机制。7.1评价指标车路云一体化数据具有多源异构、强时序性、高实时性、时空关联紧密、价值密度高等特点,其质量评价需聚焦于数据在协同感知、智能决策与控制应用中的可信度与可用性。各指标的定义、计算方法及适用数据类别见表9。表中所列评价指标是针对车路云一体化典型应用场景提出的核心质量维度。在实际评价中,可根据具体业务需求和数据特点,增补其他相关质量指标。表9数据质量评价指标衡量来自车、路、云不同来源的感知数据或状态数据,对同一目标或同一场景的描述在时间戳和空间坐标上的一致程度。1.时间同步误差:不同数据源时间戳的差值。2.空间对齐误差:对同一目标位置估计的差异。3.设定合理阈值,计算超出阈值的数据比例。环境感知类数据、运行状态数据衡量数据从产生到被消费端使1.端到端延迟:数据生成时间戳与控制应用类数据、T/GDITSXXX—XXXX9用的端到端延迟,以及数据更新的频率是否符合控制类业务(如碰撞预警、信号灯协同)的实时性要求。应用处理完成时间戳的差值。2.数据新鲜度:当前时间与最新数据时间戳的差值。3.统计延迟在业务要求范围内的数据比例。安全预警数据、实时交通状态数据衡量单条数据或数据源的可靠程度。基于数据来源的权威性、设备健康状态、算法置信度、历史准确性等进行综合评估。1.来源权重:根据数据源的固有可靠性赋值。2.健康状态关联:数据产生设备的在线率、故障率等。3.置信度传递:感知算法输出的目标置信度。4.综合以上因素计算可信度分数。所有数据,尤其是用于安全控制决策的感知与状态数据衡量数据在特定业务场景下是否有效。1.数值范围校验:数据值是否在物在拥堵检测场景中,车速数据是否处于合理的拥堵车速范围内。)2.枚举值校验:数据值是否属于预定义的合
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 游戏美术设计师职位的常见面试问题
- 农业龙头企业综合竞争力自适应演化多组态路径研究-以山东省为例
- 文化创意产业项目策划入门手册
- 市场经理在京东区域市场的运营策略分析
- 雨课堂学堂在线学堂云《管理沟通实务(沈阳师范)》单元测试考核答案
- 农业科技发展与创新农业工程师手册
- 教育行业教学主管的招聘条件及要求
- 通信设备销售代表面试技巧
- 互联网公司行政管理工作面试问题
- 技术工程师项目进度管理手册
- 供排水维修安全培训
- GB/T 44957-2024人工影响天气作业点防雷技术规范
- 污水处理工安全培训
- 深圳大学《算法设计与分析》2021-2022学年期末试卷
- 西泠印社三年级下册书法教案
- DB35T 1985-2021 原发性肝癌临床数据集
- 既有建筑减震隔震加固技术规程
- 国家核安保技术中心社会招聘笔试真题2022
- 2023年陕西机电职业技术学院招聘考试真题
- 监理大纲工程监理方案技术标投标方案
- 机井承包合同范本版
评论
0/150
提交评论