《人工智能基础》课件-6.1桃子识别数据集构建

上传人：青*** IP属地：福建上传时间：2026-04-26 格式：PPTX 页数：27 大小：14.04MB 积分：2.4 举报 版权申诉

已阅读5页，还剩22页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

任务6.1桃子识别数据集构建AI

INTElLIGENCECONTENTS任务6.1-目录任务导入任务分析知识技能任务实施01020304PARTONE任务导入01智慧农业的呼唤传统农业的痛点人工分拣效率低、成本高分拣标准主观性强，品质不稳定耗费大量人力，难以规模化AI技术的优势精准：基于数据算法，识别准确率高高效：7x24小时不间断工作，提升效率客观：消除人为因素，保证标准统一项目核心目标数据构建构建一个包含“完好桃子”、“非完好桃子”、“非桃子”三类样本的高质量图像数据集。模型训练基于构建的数据集，利用深度学习框架训练一个高精度的桃子识别模型。应用部署将模型部署到公有云平台，生成API接口，实现桃子识别的智能化应用。01任务导入

本项目以“桃子识别智能应用”为核心实践案例，结合深度学习图像分类基础理论与视觉应用部署技术，系统讲解从数据构建、模型训练到公有云部署及API调用的全流程。通过理论与实操结合，帮助学习者掌握将深度学习模型转化为实际视觉应用的核心能力，为后续复杂视觉应用开发奠定基础。PARTTWO任务分析02任务概述：构建高质量的“燃料”数据集的重要性数据集是AI模型的“燃料”和“食粮”，其质量直接决定模型性能上限。高质量数据是训练高精度、高鲁棒性模型的核心前提与基础。本任务目标完成桃子识别数据集从0到1的构建，覆盖全流程。最终交付一个符合工业标准的高质量数据集。高质量数据集的三大标准类别明确清晰划分完好、非完好及非桃子样本，保证分类边界明确。样本多样覆盖多品种、光照、角度和背景，提升模型泛化能力。标注准确每张图片标签均准确无误，确保模型训练的基础质量。核心目标：数据集是模型训练的“燃料”，高质量数据集需满足类别明确、样本多样、标注准确三大要求。本任务完成从数据收集到平台上传的全流程。构建包含“完好桃子”“非完好桃子”“非桃子”三类样本的数据集，总样本量≥500张，标注准确率100%，并成功上传至EasyDL平台PARTTHREE知识技能0303知识技能技术能力掌握核心开发语言与框架，具备独立解决复杂技术问题的能力。业务理解深入洞察行业动态与用户需求，确保技术方案与业务目标对齐。团队协作高效的沟通与协作能力，推动跨部门项目顺利进行，共同达成目标。目前，市面上的人工智能开发平台较多，其中包括百度AI开放平台、讯飞开放平台等。其中百度AI开放平台是较为典型的人工智能开发平台。EasyData平台是百度大脑推出的智能数据服务平台，面向各行各业有人工智能开发需求的企业用户及开发者提供一站式数据服务工具。该平台主要围绕人工智能开发过程中所需要的数据采集、数据清洗、数据标注等业务需求提供完整的数据服务。目前EasyData平台已经支持图像、文本、音频、视频4类基础数据的标注，也初步支持机器学习数据的存储。同时,EasyData平台已与EasyDL平台打通，可以将EasyData平台处理的数据应用于EasyDL平台的模型训练。EasyData智能数据服务平台主要提供数据采集、数据清洗、数据标注等数据服务。工欲善其事，必先利其器常用AI开发平台百度AI开放平台

提供丰富的API和EasyDL等开发工具。讯飞开放平台

在语音识别等领域有优势。GoogleAIPlatform

提供强大的TensorFlow支持。本项目工具：EasyDL零门槛AI开发：无需复杂算法知识。一站式服务：覆盖全流程工具链。数据采集：开源与实拍结合开源数据集获取ImageNet全球最大的图像识别数据库之一，包含海量桃子图片。百度飞桨数据集平台国内优秀平台，提供多种中文标注的数据集。自主拍摄补充拍摄设备普通智能手机或相机即可满足需求。拍摄要点覆盖多样场景、光照与角度，确保样本多样性。开源数据：人工智能模型训练后可能需要持续选代和优化模型效果，可以通过调用EaSyDL云服务接并开通该采集服务，将实际业务数据及识别结果可视化，根据识别结果准确度有效挖掘难例，获取对模型优化更有助益的高质量数据自主拍摄：该方案需使用本地采集设备，支持定时拍照、视频抽帧(支持自定义抽帧规则)等多种采集方式数据清洗：去粗取精清洗前：原始数据包含大量“噪音”，如模糊、重复数据模型训练效率低，易被错误信息误导清洗后：高质量数据数据质量高，特征清晰易识别提升模型训练效率与最终精度去模糊去重调整尺寸格式转换过滤清晰度较低的图像，保证数据质量过滤大量重复的图像，提高关键图像处理效率批量裁剪图像中的无关元素，提升数据质量将文本中的繁体字转为简体字，通常情况下使用简体字可以取得更好的模型效果数据标注：给数据“贴标签”什么是数据标注给原始数据（如图像）添加标签（Label）的过程，为模型提供“参考答案”。支持的标注类型图像分类：本项目使用，判断图像所属类别。物体检测：标注物体的位置和类别。图像分割：更精细的像素级标注。本项目标注工具使用百度EasyData平台，界面友好、支持协作与智能标注支持图像、文本、音频、视频4类基础数据的标注，还支持智能标注多人标注等方式，效率高。EasyData在线标注工具界面技术原理：卷积神经网络桃子识别的本质桃子识别本质上是一个图像分类任务。我们使用卷积神经网络(CNN)来解决这个问题。CNN工作原理卷积层：提取图像特征（如桃子的形状、颜色、纹理）。池化层：简化特征，减少计算量，提升泛化能力。全连接层：接收特征，输出最终分类结果。本单元借助EasyDL平台封装的预训练模型（如ResNet、MobileNet），无需手动搭建复杂网络，仅需通过数据集优化即可实现高精度识别完整开发流程桃子识别智能应用的开发遵循一个清晰的四层架构流程：数据层：构建高质量的桃子分类数据集，是整个系统的基础。模型层：使用EasyDL等工具训练和优化桃子识别模型。部署层：将训练好的模型部署到公有云，提供可访问的API服务。应用层：开发手机APP或网页应用，调用云端接口实现具体功能。PARTFOUR任务实施04大数据的特点Python环境访问Python官网，下载3.6及以上版本的安装包。运行安装包，勾选“AddPythontoPATH”，点击“InstallNow”完成安装打开命令提示符（Win）/终端（Mac），输入python--version验证安装成功PyCharm编辑器访问JetBrains官网（/pycharm/），下载社区版安装包，按引导完成安装VSCode：访问微软官网（/），下载对应系统版本，安装后在扩展商店搜索“Python”插件并安装VSCode编辑器访问百度AI开放平台，点击“注册”选择“个人开发者”，填写手机号、验证码，设置密码完成注册登录后完成实名认证（上传身份证信息），以解锁平台功能百度AI开放平台账号注册步骤1：数据收集与分类数据收集创建文件夹建立`peach_good`,`peach_bad`,`non_peach`三个子文件夹。手动分类将所有图片根据内容手动移动到对应的文件夹中，保证数据质量。文件夹分类示意图访问ImageNet官网，注册账号后搜索“peach”，筛选清晰度高、场景多样的图像下载访问百度飞桨数据集平台，搜索“桃子图像”，选择公开数据集下载数据质量：成功的基石我们需要避免的“不良数据”模糊图像清晰度太低，无法分辨细节。背景杂乱主体不突出，干扰信息过多。我们追求的“优质数据”清晰主体轮廓、纹理清晰可见。主体突出背景简洁，主体占据主要位置。步骤2：数据集打包打包要求压缩对象压缩包含三个分类文件夹的父文件夹。压缩格式必须使用标准的ZIP格式。文件命名建议使用英文命名，如`peach_dataset.zip`。避免嵌套压缩包大小≤5GB，避免嵌套文件夹结构（直接压缩根文件夹）打包工具Windows右键→发送到→压缩(zipped)文件夹。Mac右键点击文件夹，选择“压缩”。步骤3：平台上传登录平台访问百度AI开放平台，进入EasyDL定制化图像识别模块。创建数据集单击按钮“创建数据集”，输入数据集名称“peach_recognition_dataset”选择“图像分类”任务类型，填写数据集名称，选择任务类型为“图像分类”。上传数据选择“已标注数据”导入，上传ZIP文件，并勾选“以文件夹命名分类”。EasyDL平台创建数据集界面步骤4：数据集校验为什么要校验确保上传过程无误，标签与内容对应，是保证模型训练效果的最后一道防线。如何校验进入数据集管理页面，随机抽查至少20张图片，检查每张图片的标签是否准确无误。样本补充若某类样本量不足，点击“本地上传”补充10-20张图像，待处理状态变为“正常”后，手动标注标签并保存。任务总结数据集构建全流程数据收集开源数据+自主拍摄数据清洗去模糊、去重、调整格式数据

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《人工智能基础》课件-6.1桃子识别数据集构建

文档简介

温馨提示

最新文档

评论

《人工智能基础》课件-6.1桃子识别数据集构建

文档简介

温馨提示

最新文档

评论

相关文档