汽车智能座舱系统与应用 课件 5-3 实现数据的清洗与增强_第1页
汽车智能座舱系统与应用 课件 5-3 实现数据的清洗与增强_第2页
汽车智能座舱系统与应用 课件 5-3 实现数据的清洗与增强_第3页
汽车智能座舱系统与应用 课件 5-3 实现数据的清洗与增强_第4页
汽车智能座舱系统与应用 课件 5-3 实现数据的清洗与增强_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

能力模块五

掌握智能座舱中数据采集与处理技术的应用任务三

实现数据的清洗与增强在座舱视觉模块的开发过程中,直接抓取到的图像数据往往不能直接进行数据训练和使用,主管要求你对其先进行数据清洗和数据增强,完成数据整理工作。作为智能座舱开发助理,你需掌握数据清洗和增强的方法,有助于后续理解深度学习智能座舱的开发流程。任务引入Tasktointroduce01深度学习数据清洗与增强概述02深度学习数据清洗方法目录

CONTENTS03深度学习数据增强方法04了解深度学习本地训练部署深度学习数据清洗与增强概述PART0101深度学习数据清洗与增强概述数据在采集完之后,往往包含着噪声、缺失数据、不规则数据等各种问题,因此需要对其进行清洗和整理工作。例如,用搜索引擎采集猫的图片,采集到的数据可能会存在非猫的图片,这时候就需要人工或者使用相关的检测算法来去除不符合要求的图片。一般来说,数据清洗的原理为:利用有关技术,如统计方法、数据挖掘方法、模式规则方法等将脏数据转换为满足数据质量要求的数据。01深度学习数据清洗与增强概述数据增广是一种常用的增加训练样本的手段,图像增广在对训练图像进行一系列的随机变化之后,生成相似但不同的训练样本,从而扩大了训练集的规模。此外,应用图像增广的原因是,随机改变训练样本可以减少模型对某些属性的依赖,从而提高模型的泛化能力。例如,我们可以以不同的方式裁剪图像,使感兴趣的对象出现在不同的位置,减少模型对于对象出现位置的依赖。我们还可以调整亮度、颜色等因素来降低模型对颜色的敏感度。深度学习数据清洗的方法PART02

填充缺失数据工作通常以替代值填补的方式进行,它可以通过多种方法实现,如均值填补法使用数据的均值作为替代值。然而,该方法忽略了数据不一致问题,并且没有考虑属性之间的关系,属性间的关联性在缺失值估计过程中非常重要。02深度学习数据清洗的方法缺失数据处理

在数据挖掘方法中,关键是挖掘属性之间的关系,当进行缺失值替代时,利用这些关系非常重要。由此观点出发,填补的目的在于估计正确的替代值,并避免填充偏差问题。如果拥有合适的填补方法,则能得到高质量的数据,数据挖掘结果也会得到改善。02深度学习数据清洗的方法对多数据源和单数据源数据进行集成时,多个记录代表同一实体的现象经常存在,这些记录称为重复记录。同时,有些记录并非完全重复,其个别字段存在一定差别,但表示的却是同一对象,此类记录即为相似重复记录。相似重复记录检测是数据清洗研究的重要方面,在信息集成系统中,重复记录不仅导致数据冗余,浪费了网络带宽和存储空间,还提供给用户很多相似信息,起到误导作用。该类问题的解决主要基于数据库和人工智能的方法。相似重复对象检测

异常数据指数据库或数据仓库中不符合一般规律的数据对象又称为孤立点。异常数据可能由执行失误造成,也可能因设备故障而导致结果异常。异常数据可能是去掉的噪声,也可能是含有重要信息的数据单元。02深度学习数据清洗的方法异常数据处理

在数据清洗中,异常数据的检测也十分重要。异常数据的探测主要有基于统计学、基于距离和基于偏离3种方法。可以采用数据审计的方法实现异常数据的自动化检测,该方法也称为数据质量挖掘(DQM)。02深度学习数据清洗的方法数据逻辑错误指数据集中的属性值与实际值不符,或违背了业务规则或逻辑。如果数据源中包含错误数据,相似重复记录和缺失数据的清洗将更加复杂。在实际信息系统中,对于具体应用采用一定的方法解决数据逻辑错误问题,具有实际意义。不合法的属性值是一种常见的数据逻辑错误。逻辑错误检测02深度学习数据清洗的方法多包含大量空数据值的列,如个人对某些敏感信息回避,故意漏填部分信息包含过多或者过少的单一状态的列,如一对一关系的列,或者仅包含一个值的列远离或超出某列正态分布的记录,如出现负工资和课程零学时的问题不符合特定格式的行,如不同的日期格式同一记录的不同属性比较时,缺失意义的列,如客户选购某产品的日期早于该顾客的出生日期不一致数据

多数据源数据集成时,由于不同数据源对同一现实事物可能存在不一致的表示,从而产生不一致的是数据。不一致数据一般通过手工或者自动化方式检查。常见的不一致数据有:深度学习数据增强方法PART0303深度学习数据增强方法几何变化类

(一)翻转

翻转图像通常不会改变对象的类别,这是最早且最广泛使用的图像增广方法之一。翻转的方式有左右翻转与上下翻转。

使用下述代实现左右翻转,图片各有50%的几率向左或向右翻转,翻转后演示效果图如图所示。03深度学习数据增强方法几何变化类上下翻转的代码如下,与左右翻转相同的是,图像各有50%的几率向上或向下翻转。03深度学习数据增强方法几何变化类

(二)裁剪

随机裁剪一个面积为原始面积10%到100%的区域,该区域的宽高比从0.5~2之间随机取值。然后,区域的宽度和高度都被缩放到200像素。03深度学习数据增强方法几何变化类

通过对图像进行随机裁剪,使物体以不同的比例出现在图像的不同位置。这也可以降低模型对目标位置的敏感性。03深度学习数据增强方法几何变化类旋转:旋转操作是对翻转的进一步提升,一般以图像中心为旋转中心进行随机旋转(有正负角度约束),以此获得更多形态的图像数据。缩放变形:按照设定的比例缩小或放大图像数据,但该操作会改变图像大小,存在失真问题,但全卷积网络对于尺度没有严格要求。仿射:仿射类操作包括视觉变换操作和分段仿射操作,前者通过对图像应用随机的四点透视变换加以实现,后者则通过移动图像中点网格上的点及点周围区域加以实现。03深度学习数据增强方法颜色变化类

我们可以改变图像颜色的四个方面:亮度(brightness)、对比度(contrast)、饱和度(saturation)和色调(hue)。

03深度学习数据增强方法颜色变化类

随机更改图像的亮度代码如下,随机改变值是为原始图像的50%到150%之间,(brightness=0.5)。03深度学习数据增强方法颜色变化类

我们也可以随机更改图像的色调。了解深度学习本地训练部署PART04一、软件连通

点击汽车智能座舱系统实训台中的教学系统,选择“手势识别控制单元”(如图5-3-7所示),进入模块页面后,点击实例测试,打开摄像头,点击“建立通讯连接”,将软件与python进行通讯连接。04了解深度学习本地训练部署软件连接与内置数据集实力测试二、内置数据集实例测试

在软件内部,已经嵌入与手势识别相关的18类数据集,其中包括安静、打电话、OK、拳头、两指发誓、手势1-5、停止、摇滚、赞成等常见手势。在连通成功后可以直接进行测试。04了解深度学习本地训练部署软件连接与内置数据集实力测试04了解深度学习本地训练部署一、制作数据集单个行为数据集的制作过程是:①打开摄像头②填写该行为的名称(如打电话)③拍照截取该照片④数据类别默认放置在train中⑤点击“确认使用改数据”。自主创建与训练模型04了解深度学习本地训练部署二、数据集管理

新创建的图片数据可以在“数据集管理”页面中观察到,左侧栏为图片数据的默认路径:DataBase->AGR->train->(新创建的行为名称)->图片名称。在图片名称上,点击右键,可对新建的图片进行复制和删除。右侧为新拍摄的测试图片。自主创建与训练模型04了解深度学习本地训练部署三、训练模型

这一步骤主要是对自主创建/筛选出来的模型进行训练,整体操作页面如左图所示,训练模型的过程如下图所示。自主创建与训练模型04了解深度学习本地训练部署自主创建与训练模型四、模型训练测试

测试环节与内置的数据集测试的操作步骤相同,点击页面左边的“实例测试”,在模型选用上选择

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论