《典型应用场景汽车大数据分类分级指南》_第1页
《典型应用场景汽车大数据分类分级指南》_第2页
《典型应用场景汽车大数据分类分级指南》_第3页
《典型应用场景汽车大数据分类分级指南》_第4页
《典型应用场景汽车大数据分类分级指南》_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1本文件提供了汽车大数据分类、分级流程和规则,给出了典型应用场景的汽车大数据应用建议。。本文件适用于汽车大数据的分类和分级。仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单GB/T43697-2024界定的以及下列术语和定义适用于本文件。通过汽车车载终端及其他方式采集的海量数据集合,包含原始数据及其衍生数据,涵盖基础属性类、车辆运行参数类、环境感知类、车辆控制类、用户个人信息类、应用服务类等多维度的数据。运用大数据技术与工具,执行数据生存周期相关的数据采集、数据传输、数据存储、数据处理(如计算、分析、可视化等)、数据交换、数据销毁等数据活动,以挖掘数据价值、支撑业务决策与优化的系根据汽车大数据(3.1)的属性或特征,将其按一定的原则和方法进行排列分组的过程。数据记录中可以命名的、不可分割的最小逻辑数据单位。典型应用场景汽车大数据分类分级流程包括汽车大数据分类、典型应用场景选取、汽车大数据分级共三个步骤,见图1。车辆运行参数类环境感知类用户个人信息类应用服务类影响对象及程度基础属性类车辆控制类汽车大数据分级数据价值汽车保险a)基础属性类数据:指车联网信息服务相关主体的基础属性数据,如车辆公告中的车辆品牌、型号、注册地、注册日期、车架号、车辆用途、控制器软硬件版本信息、维修记录等相关数据;c)环境感知类数据:指与车辆所处外部环境相关,包括车联网信息服务中与车辆进行通信或交互的外部设备、终端、行人等相关的数据信息。如车辆行驶过程中的位置、道路情况(例如高速公路、城市道路等)、路面情况(如是否湿滑、积水)、公共设施位置(如收费站、加油站)d)车辆控制类数据:指车辆核心动态行为的实时指令、以及车联网信息服务过程与对车辆操控直接相关的指令数据,主要包括核心车辆动态控制指令、底盘与稳定性控制系统指令、高级驾驶辅助系统执行指令、车辆状态与模式切换指令、协同控制与系统状态反馈、智能决策数据和远程操控类数据。如转向系统或驱动系统的精确控制指令、电子稳定程序对特定车轮的制动干预指令、在高速公路辅助等场景下系统自主生成并执行的综合性指令序列、改变车辆全局操控特e)用户个人信息类数据:指按照YD/T3746-2020中规定涉及的车联网产业相关的汽车厂商、零部件和元器件提供商、软件提供商、数据和内容提供商以及服务提供商在提供服务过程中收集的能够单独或与其他信息结合识别用户和涉及用户个人隐私的信息。如车联网应用服务中的业务订购及订阅关系信息、普通车联网服务中的身份标识及鉴权信息、账号密码等;f)应用服务类数据:指与车联网各主体间的信息交互密切相关,除了基础属性类数据、车辆运行参数类数据、环境感知类数据、车辆控制类数据、用户个人信息类数据之外,还包括与车联网信息服务相关的数据。如信息娱乐应用中的娱乐推送信息等相关数据。选取汽车保险、补能站点规划布局、智能交通共三个典型应用场景,通过在这些示范性场景中建立清晰、有效的汽车大数据分类分级标准,为其他场景提供可借鉴的模式和方法,见表2。4补能站点规划布局对应GB/T4754-2017中规定的货币金融服务、资本市场服务、保险业-其他金融业;“对应GB/T4754-2017中规定的电力、热力、燃气及水生产和供应业;对应GB/T4754-2017中规定的交通运输、仓数据价值计算方法为公式(1):ai—客观价值的权重系数(%);Ii——影响对象及程度单个维度的评分,百分制;E;——专家评分,该典型场景领域各个专家对场景数据项进行影响度打分,百分制;m专家数量。分别对数据价值、数据影响对象及程度,进行数据定级:高中低高低汽车大数据应建议说明高低高高手段进行数据项保护中低6汽车大数据应用建议说明中高等技术手段进行数据项保护低低低高等技术手段进行数据项保护a)客观价值的权重系数α1(%)、主观价值的权重系数α2(%),宜使1)基于客观价值和主观价值两个维度构建层次结构模型;家(建议不少于5名)对这两个指标进行两两比较,并给出相对重要性评分;评分通常采3)进行一致性检验,一致性检验步骤为计算每个指标的权重,计算一致性指标(CI),计算随机一致性指数(RI),计算一致性比率(CR),如果CR<0.1,则认为判断矩阵的一致性是4)确定每个维度的权重。具体示例见附录C。b)数据客观价值P₁,根据对应典型应用场景下的实际业务应用中每一个数据项对模型结果的贡献程度确定P1,具体确定规则描述如下:4)随后将排序结果平均划分为十等份,各分位数从高到低依次赋予100至10的分值,百分c)数据主观价值P₂,根据数据对该场景的业务应用、行业发展、产业生态等方面的价值评定,宜使用专家打分的方式确定P₂,具体确定规则描述如下:1)根据典型应用场景确定具有该行业专业知识和经验的专家,至少12名以上的专家(专家至少保证在该行业工作5年以上,熟悉场景的汽车大数据应用),保证在每个字段价值计分~100分之间),百分制;4)计算的平均分即可得到最终的主观价值评分。在使用公式(2)时,各项参数的确定规则如下。a)第i个评价指标变量权重θ,宜使用层次分析法确定θ,具体确定规则描述如下:8家(建议不少于5名)对这四个指标进行两两比较,并给出相4)确定每个维度的权重,具体示例见附录C。在使用公式(3)时,各项参数的确定规则如下。1)典型应用场景确定具有该行业专业知识和经验的专家,至少12名以上的专家(专家至少保证在该行业工作5年以上,熟悉场景的汽车大数据应用),保证在每个字段价值计算时分之间);3)每个字段的评分在去除最高和最低分后,取剩余专家样本的平均数;4)计算得到的平均数即为国家安全、行业安全、组织安全和个人权益的影响对象及程度评分。b)专家数量m,宜邀请至少12名以上的专家,同时专家至少在该行业工作5年以上,熟悉场景9)观测期内长(h)观测期内总观测期内观测期内VEH_1….………………赔付总金额(元)VEH_11300…·构建宜使用广义线性模型、XGboost模型、深度学习模型等回归分析模型,以下以XGboost模型为例进行介绍。以上述准备的车辆特征因子作为模型的特征值,以上述准备的车辆理赔数据集中的赔付金额为标签值,进行模型训练,如图B.1所示。yVEH_1………0…数据的客观价值计算可以有多种模型和方法,本文以SHAP值算法为例进行介绍。SHAP的核心是Shapley值,它来源于博弈论,用于公平地分配合作博弈中的收益或成本。在机器学习中,Shapley值被用来衡量每个特征对模型预测的贡献。对于一个模型的预测结果,Shapley值表示某个特征在所有可能的特征组合中的平均边际贡献(即衡量了在考虑所有其他特征的情况下,该特征对预测结果的“公平”贡献)。根据上述训练的模型进行shapley值解析,得到如图B.2所示结果。间累计里程早晚高峰行将排序后的全部模型特征因子结果平均划分为十等份,各分位数从高到低依次赋予100至10的分………·…………·……·.……a)根据典型应用场景确定具有该行业专业知识和经验的专家,至少12名以上的专家(专家至少保证在该行业工作5年以上,熟悉场景的汽车大数据应用),保证在每个字段价值计算时去掉1b)每位专家对典型应用场景中所涉及到的字段进行打分(要求全部字段尽可能均匀分布在10分~100分之间),百分制,主观价值专家评分标准参考,如表B.4所示;d)得到最终的主观价值评分。对场景核心功能不可推动行业技术/标准突破,显著提升行业效率或安全性,具有能构建跨领域协作平台,催生新业态或商业模式,显著优化对业务效果提升显著,是核心模型/服务的关键输入,缺失会导致效化或规模化应用,有促进跨企业/机构数核心支撑数据:业务依赖性强,对行业进步和对业务有重要辅助作程或提升次要指标推动局部标准统一或高价值服务,增强局高价值数据:对业务和行业有明确增益,具备生态拓展潜力对业务有可衡量的正向影响,但非核心环但创新性和普适性有限支持基础性合作需用价值,但对行业和生在特定条件下对业务但技术含量低或应用础应用场景,但缺乏独无显著技术或模式创新模糊,对行业和生态缺业务关联性极弱,应用导致数据壁垒或信康私问题,损害生态信需严格限制使用可能导致生态链断景中使用,需立即销毁裂专家1….车辆首次上线时间………5………………·……………观测期内充电最高频率下的起始SOC区间观测期内行车最高频率下的·………生产时间1专家1……a)基于客观价值和主观价值这两个维度构建层次结构模型:b)构建判断矩阵:判断矩阵是通过两两比较各因素的重要性来构建的。我们邀请一组专家对这两个指标进行两两比较,并给出相对重要性评分。评分通常采用“1-9”标度法,其中表示两个因素同等重要,“9”表示一个因素比另一个因素明显更重要,专家给出了以下两两比较的结131c)一致性检验:一致性检验的目的是确保决策过程中判断矩阵的合理性与可靠性,避免因主观判断不一致导致决策偏差,步骤如下:使用下面的公式(B.1)进行计算,得到每一项数据的综合评分,汇总后得到数据综合价值,如表车辆首次上线时间……低6.….…………观测期内充电最高频率下的起始SOC区间观测期内行车最高频率下的…··生产时间观测期内车辆最近上线时间…….….…注:对于业务逻辑高度相关的数据项(如充电次数与充电天数),其客观价值评分(P1)通常相同,主观价值评分(P2)的微小差异源于专家对汽车大数据应用场景的侧重不同,不影响最终分级结果。国家安全、行业安全、组织安全、个人权益的权重系数确定,宜使用层次分析法,具体方法步骤如工a)基于国家安全、行业安全、组织安全、个人权益这四个维度构建层次结构模型。目标层:综合效益评估;准则层:国家安全、行业安全、组织安全、个人权益。134523121证在该行业工作5年以上,熟悉场景的汽车大数据应用),保证在每个字段价值计算时去掉最~100分之间),百分制,四个维度的影响对象及程度专家评分标准参考,如表B.9造成全行业系统性崩溃;颠覆行业技术体系;触发国家级产业危机键基础设施毁灭性密泄露可锁定特定个体的核心生物特征及行为轨迹泄隐私完整性评分区间国防机密泄露造成全行业系统性崩溃;颠覆行业技术体机基础设施毁灭性损造成大规模人身伤亡或群体性权益侵害;引发社会恐慌或系统全;破坏重大国防项摆;重大商业机密泄露;关键设施永久性高敏感身份与位置数据关联泄露,或健康隐私暴露,导致人身胁重点工程安全;削弱关键领域国际竞争力破坏行业技术标准体产权被盗;品牌声誉可还原个人生活习惯的核心轨迹或私密通信暴露,或账户控制露重要基础设施运行脉衡;阻碍技术创新进造成持续运营中断(>72小时);重大财务损失;核心客户数驾驶特性,或直接导泄露基础测绘数据;影国家科技竞争力扰乱局部市场秩序;延缓技术迭代速度;增加行业合规成本造成短期运营中断(24-72小时);重要可间接定位到个人的车辆身份信息或碎片化隐私暴露,存在身设施运行争;造成技术专利纠 理数据泄露;系统局涉及普通行政管理信息;影响地方性公共事务造成工作流程延误;非核心信息泄露;低仅涉及公开政策信息;行业级影响;可通过常造成临时工作不便;公开信息被不当使无法关联具体个人的统计型数据或技术性完全公开的非敏感信息;符合国家数据开放开渠道可获取信息复用造成极小不便(如广被统计使用符合《数据安全法》的公开数据;经脱敏处理的宏观统计数据企业官网公开信息;无商业价值的基础数据1专家1……车辆首次上线时间…………………专家1……………·………·….·.………专家1…………….专家1………….………………..…….…专家1………………..…全全2·.……………使用正文6.3.3数据定级规则对数据价值和数据影响对象及程度进行分级判定。首先,在表B.6数据综合价值表的基础上对按照数据价值评分与级别的对应关系进行定级,得到表B.15数据价值评级结果。其次,在表B.14数据影响对象及程度评分的基础上,对数据影响对象及程度按照评分与级别的对应关系进行定级,得到表B.16数据影响对象及程度评级结果。高高….…高高…….高高………中中………中中·中中中中低低低……低………生产时间低观测期内车辆最近上线时间低………高高高高…………低低2-低低低低中低中低中低中低中高中低中低B中低低高低高低高低高中高低高低高中高低低低低低高低高低低低低低低低低低低低低低低高低4高高高高高高数高低中低高高高高高高高高高高高高高高高低高低高低高高高低中高高高高低中高中低中低B中低中高中高中高高高中高中低B中低B中高中高中高中高中低B6中低中低观测期内最近月充电过程平均最高温

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论