数据标注项目化教程 课件 项目二 图像标注-让机器“看懂”世界_第1页
数据标注项目化教程 课件 项目二 图像标注-让机器“看懂”世界_第2页
数据标注项目化教程 课件 项目二 图像标注-让机器“看懂”世界_第3页
数据标注项目化教程 课件 项目二 图像标注-让机器“看懂”世界_第4页
数据标注项目化教程 课件 项目二 图像标注-让机器“看懂”世界_第5页
已阅读5页,还剩111页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

项目二图像标注——让机器“看懂”世界深入图像标注核心,掌握实战任务技能目录图像数据基础(像素/分辨率/色彩通道)图像标注的重要性与核心价值标准化标注流程(5个环节)图像数据标注核心认知2.1画线标注(无人驾驶道路线标注)边界框标注(监控场景行人检测)关键点标注(人脸/手势关键点)多边形标注(精细抠图)属性标注(监控场景行人属性)OCR识别(票据标注)3D点云(点云物体单帧标注)图像标注典型实战任务案例2.2理论基础实战演练质量评估2.1图像数据标注核心认知了解图像数据基础,认识图像标注重要性,掌握标准化流程认识图像数据的关键要素01像素是图像基本组成单位,图像由规则排列像素构成,标注对象本质是划定像素区域。像素02分辨率指图像像素数量,高分辨率图像细节丰富,利于标注微小目标,是标注精度上限。分辨率03色彩通道描述像素颜色信息,灰度图像单通道,彩色图像有多通道,不同通道应用不同场景。色彩通道2.1.1图像数据基础像素定义像素(Pixel)是图像中最基本的组成单位。可以将一幅数字图像理解为由规则排列的小方格拼接而成的网格画面,每个小方格即为一个像素。每个像素都记录着其位置对应的颜色与亮度信息。当大量像素按照行列有序排列后,便构成了屏幕上可见的完整图像或视频画面。标注实践在标注工作中,标注员所框选、勾勒的对象,本质上都是在大量像素中划定具有语义意义的区域。标注的精度直接取决于对像素级别的操作准确性。像素网格可视化像素分辨率定义分辨率指图像或显示设备中的像素数量通常以横向像素数×纵向像素数表示。示例计算1920×1080=2,073,600像素分辨率决定图像的清晰度和可分辨细节,是标注精度的物理上限。标注精度影响高分辨率优势细节丰富,便于标注微小目标或精确勾勒边缘低分辨率限制细节减少,小目标难以辨认,边界标注易出误差不同分辨率对比细节缺失基本清晰细节丰富关键认知分辨率是标注精度的物理上限。低分辨率图像无法实现高精度的标注,因为缺失的像素信息无法通过后期处理恢复。在数据采集阶段就应确保足够的分辨率。分辨率灰度图像单通道构成灰度图像仅包含一个色彩通道,记录像素的亮度信息,用0~255的数值表示从纯黑到纯白的256个明暗层次。典型应用场景医学影像工业检测安防监控彩色图像标注优势在标注实践中,标注人员可借助颜色特征快速区分目标,从而提高标注效率与准确性。颜色信息是语义分割的重要线索。色彩模式理解图像标注对机器视觉的关键作用机器视觉模型视角机器眼中图像是三维数字矩阵,无标注时无法理解像素语义,标注为其附加结构化语义信息。01图像标注核心任务图像标注可确定目标区域、指明目标类型及属性、描述特定部位或结构,是模型训练起点。02对模型训练的影响标注准确度和细致程度决定模型学习质量,错误标注会降低预测准确性,增加修正成本。032.1.2图像标注重要性掌握图像标注的标准化流程制定《标注任务说明书》,明确目标与类别体系,规范命名,处理特殊情况,确保标注有据可依。统一任务规范1评估选择合适标注工具,进行初始化配置,设置权限和路径,保障工具稳定易用。配置工具环境2标注员按规范完成标注任务,可采用人机协同模式,利用AI预标注提高效率。标注执行3采用多级审核机制,标注员自检后由质检员检验,不合格样本需修改并重新审核。质检与审核4导出标注数据并转换格式,注意坐标转换和类别映射,划分数据集并提供说明文件。数据导出与格式转换52.1.3图像标注流程01统一任务规范任务规范是全部标注工作的基础,所有标注人员需严格遵循统一的《标注任务说明书》。标注目标与类别体系明确标注的整体目标与具体的类别体系,对每一类别进行清晰定义,并说明其适用范围与边界条件统一命名规范制定统一的命名规范,确保文件、标签和目录结构命名一致、无歧义特殊情况处理针对图像中常见的特殊情况,如目标被遮挡、截断、图像质量低、目标边界模糊等,事先制定详细处理规则02配置工具环境合理的工具选型与配置是提升整体标注效率的重要前提。标注工具选型根据任务类型和数据规模,评估并选择合适的标注工具LabelImgCVATLabelStudio工具初始化配置对标注工具进行初始化配置,包括预定义类别列表、设置操作快捷键及确定导出格式等协作环境配置根据项目需要配置用户权限、任务分派机制及数据存储路径,确保工具环境稳定、易用2.1.3图像标注流程03手动标注标注员根据规范,在图像上逐一完成矩形框、多边形或关键点等标注任务。标注质量三要素类别准确位置精确边界贴合常用标注类型矩形框多边形关键点AI半自动标注采用人机协同的半自动标注模式,利用预训练模型进行AI预标注,标注员随后对结果进行审核、修正与补充。AI预标注流程1利用预训练模型或初版模型对图像进行自动标注2标注员对预标注结果进行审核、修正与补充3对困难样本进行完全手动标注效率提升优势在大规模标注项目中,半自动标注可以显著减少重复性人工操作,全面提升标注效率与数据产出速度2.1.3图像标注流程04质检与审核质检环节是保障数据质量的关键步骤,通常采用多级审核机制,确保数据达到交付标准。第一级:标注员自检标注员完成标注后,自行检查标注结果的准确性、完整性和规范性第二级:质检员检验由质检员进行抽样检验或全量交叉检验核验标注结果准确性、完整性及与既定规范的一致性问题反馈与修正对于不合格样本,记录具体问题并返回标注员修改,修改后需重新审核05数据导出与格式转换在所有标注数据通过质检后,需将其从标注工具中完整导出,并转换为模型训练所需的格式。常用标注格式VOCXMLPascalVOC格式COCOJSONCOCO数据集格式YOLOTXTYOLO模型格式TFRecordTensorFlow格式数据集划分导出后的数据集应按以下比例进行划分:70%训练集20%验证集10%测试集2.1.3图像标注流程精确标注·智能未来精准标注像素级精度决定模型质量严格质控多级审核保障数据可靠高效流程标准化提升工作效率高质量的标注是AI模型性能的基石。

通过标准化的标注流程、严格的质量控制和持续的过程优化,我们为机器学习模型提供可靠的数据基础,共同推动人工智能技术的发展与应用。谢谢观看感谢学习图像标注核心知识与实战技能从基础认知到实战应用,掌握专业标注能力理论基础图像数据基础标注重要性实战技能8种标注任务全流程掌握质量意识标准化流程质量评估体系持续学习·精进技能专业认证·职业发展2.2图像标注典型实战任务案例通过多个实战任务,提升图像标注能力任务1画线标注——无人驾驶道路线标注01任务背景某科技公司研发导航辅助驾驶系统,需构建道路标线标注数据集,提升系统感知与决策能力。02任务分析制定标注规范,对各类道路场景标注不同道路线,为无人驾驶算法提供训练数据。03相关知识画线标注以线条为载体,有几何导向性强等特点,应用于自动驾驶、高精地图等场景。04任务实施登录数据堂平台,使用线工具标注车道线,可调整线条,通过质检后提交任务。05练习与实践完成数据堂平台上相关练习,掌握画线标注能力。06拓展知识了解标注质量评估参数,如准确率、召回率和F1分数,分析改进标注质量措施。任务1画线标注——无人驾驶道路线标注任务1画线标注——无人驾驶道路线标注任务背景项目目标某科技公司正研发城市导航辅助驾驶系统,为提升无人驾驶系统对复杂道路场景的感知与决策能力,需对实际道路采集的图像进行高精度语义与几何标注。核心指标30%复杂路口系统误判率降低5万+精细化道路线标注数据集15%道路线拓扑结构预测准确率提升战略意义1形成可迭代标准建立公司内部可迭代、可扩展的高精度标注标准与流程2奠定数据基础为后续研发更高阶城区领航辅助功能奠定数据基础3提升系统能力增强复杂道路场景感知与决策能力,降低误判率任务分析数据采集方案10个重点城市典型难点路段定向数据采集覆盖复杂路口、分岔路、高速场景等多种道路类型规范制定团队算法工程师质检专家产品经理联合制定标注规范,确保专业性与可行性标注内容实车道线虚车道线人行横道线停车线为"车道保持""分岔路决策"提供训练数据支撑精度要求标准≤5像素常规场景误差控制车道线、道路边界标注≤2像素高速场景误差控制更高精度要求特殊场景要求弯道与分岔路车道线需保证"消失点"对齐,确保几何连续性遮挡或破损区域补全误差不超过视觉合理范围,保持语义完整性任务1画线标注——无人驾驶道路线标注相关知识画线标注核心特点几何导向性强标注结果是连续或离散的线条,精准刻画目标的空间走向、轮廓边界或路径轨迹,既不会丢失连续信息,也不会耗费过多时间成本标注粒度适中既不会像点标注那样丢失连续信息,也不会像像素分割那样耗费大量时间成本,是效率与精度的最佳平衡点语义属性可附加除了线条的几何位置,还能为线条添加语义标签,如车道线的"虚实属性"、行政界线的"等级属性"连续性要求高标注的线条需符合目标的实际物理规律,画线要平滑过渡,不能出现突兀的断点或拐点,否则会直接影响算法训练效果任务1画线标注——无人驾驶道路线标注相关知识自动驾驶感知训练标注车道线,为算法提供数据支撑"车道保持""变道决策""分岔路决策"等核心功能核心价值:提升感知模型对道路拓扑结构的理解能力高精地图构建标注道路边界、车道线、分岔路、河流边界线、行政区域分界线、铁路及公路的走向线等核心价值:为自动驾驶提供厘米级精度的地图基础场景3生产线设备标注在工厂产线的视觉检测数据中,标注机械臂运动轨迹线、物料传输带的边界线核心价值:辅助视觉引导机器人的路径规划场景4医学影像标注在各种医疗影像中,标注器官轮廓线、病灶边缘线、血管走向线核心价值:为AI辅助诊断提供精准训练数据市政工程标注在城市地下管网的探测数据中,标注各种管道及电缆的走向线、井盖的位置边界线核心价值:支撑智慧市政的运维管理安防区域标注在监控视频画面中,标注"禁入区域线"、"人员流动轨迹线"等核心价值:辅助智能安防系统识别越界、异常行为画线标注应用场景场景1场景2场景5场景6任务1画线标注——无人驾驶道路线标注任务实施1登录平台登录数据堂平台后,单击"实验课程",在列表中找到实验"无人驾驶道路线标注"单击"进入实验"打开实验界面2选择工具在窗口下方工具栏的图形操作区域,单击"线"按钮,进入线工具绘制模式单击"线"按钮快捷键"1"任务1画线标注——无人驾驶道路线标注任务实施3开始标注选择图像左侧的实车道线,在起点处单击,向右上方移动鼠标蓝色线条贴合车道线,多次单击创建线条注意事项12观察蓝色线条是否贴合车道线,在合适位置再次单击3继续移动鼠标,通过多次单击创建贴合线条4滑动鼠标滚轮进行图像放大或缩小5按键盘空格键确认画线完成,线条变成黄色在右侧标签属性中选择"实车道线"任务1画线标注——无人驾驶道路线标注任务实施标注技巧放大检查:使用滚轮放大图像,确保线条精准贴合连续标注:长线条分段标注,每段控制在合理长度属性选择:标注完成后及时选择正确的标签属性标签属性说明标签属性是在制定任务规范时进行统一的,不同标注任务中标签属性也不同无人驾驶行人车辆检测行人车辆无人驾驶全品类精细标注路面人车建筑植被天空交通标志任务1画线标注——无人驾驶道路线标注任务实施4编辑与修改绘制完成后,如发现线条起始位置不合适或形态不贴合,可切换至编辑模式进行调整进入编辑模式单击"编辑"按钮或按快捷键"1"切换调整线条位置拖动蓝色圆圈改变点位,使线条更贴合删除线条若想删除某个标注线条,选中该线条后按Delete键即可删除任务1画线标注——无人驾驶道路线标注任务实施5整体检查与提交对当前图像的标注结果进行整体检查,确认没有遗漏目标后提交确认所有可见车道线均已标注检查线条是否精准贴合道路标线验证标签属性选择是否正确机器质检流程单击"提交,进入下一条"按钮后,进入机器质检流程,系统会对标注结果进行质量检查质检通过可以继续提交此任务并进入下一条标注任务质检不合格弹出提示,单击"修改本条"返回修正任务1画线标注——无人驾驶道路线标注实训任务根据上述方法,在数据堂实训平台上完成"无人驾驶道路线标注"的练习,掌握画线标注的核心能力登录平台完成标注通过质检学习目标理解标注规范掌握不同类型车道线的标注标准与精度要求熟练使用工具掌握线工具操作、编辑修改、属性选择等技能强化质量意识通过机器质检反馈,持续提升标注质量实践价值通过实际操作加深对标注规范、工具使用、质量控制的理解,为后续参与更复杂的标注任务奠定坚实基础练习与实践任务1画线标注——无人驾驶道路线标注拓展知识P准确率Precision衡量标注正确的样本占标注总数的比例,反映标注者对标注标准的理解程度计算公式Precision=正确标注数量/总标注数量示例:标注100个实体,80个正确→准确率=80/100=80%R召回率Recall衡量标注正确的样本占实际总数的比例,反映标注者是否存在遗漏情况计算公式Recall=正确标注数量/应标注实体总数示例:实际120个实体,正确标注80个→召回率=80/120=66.7%F1F1分数准确率和召回率的调和平均值,综合反映标注质量,值越接近1,标注质量越高计算公式F1=2×P×R/(P+R)示例:P=0.8,R=0.667→F1=2×0.8×0.667/(0.8+0.667)≈0.733指标分析与改进准确率较低表明对标注标准理解存在偏差,需加强培训召回率较低表明存在遗漏标注,需提升细致程度F1分数平衡综合评估,避免单一指标过高掩盖问题任务1画线标注——无人驾驶道路线标注谢谢观看感谢学习图像标注核心知识与实战技能从基础认知到实战应用,掌握专业标注能力理论基础图像数据基础标注重要性实战技能8种标注任务全流程掌握质量意识标准化流程质量评估体系持续学习·精进技能专业认证·职业发展2.2图像标注典型实战任务案例通过多个实战任务,提升图像标注能力任务2边界框标注——监控场景行人检测01任务背景某企业参与监控系统算法训练,需对监控视频帧中行人进行边界框标注,优化目标检测算法。02任务分析标注图像中所有可见人物,采用边界框方式,注意覆盖完整轮廓,按顺序标注降低漏标风险。03相关知识边界框标注操作简便,用于目标定位,遵循完整性、贴合度等原则,广泛应用于多领域。04任务实施登录数据堂平台,使用矩形工具框选行人,可调整框体,通过质检后提交任务。05练习与实践完成数据堂平台上相关练习,巩固图像画框能力。06拓展知识完成不同场景下的边界框标注任务,提高标注综合能力。任务2边界框标注——监控场景行人检测任务2边界框标注——监控场景行人检测任务背景任务目标在城市街道、路口、人行道等公共区域,通过摄像头采集的视频帧对画面中所有行人进行精准的边界框标注,明确每个"人体"目标的位置与范围,最终形成带有标注信息的图像数据集。应用场景优化目标检测算法对复杂场景下行人的识别、追踪能力,提升以下领域的智能化处理效率:智能交通管理公共安全监控自动驾驶系统智慧城市构建精准定位高效识别智能追踪任务分析任务2边界框标注——监控场景行人检测需要标注的行人类型行人站立或行走的人体骑行人骑自行车、电动车或摩托车的人体坐姿人物坐在长椅、自行车后座等位置特殊姿态弯腰、蹲下、伸手、低头等本任务标注规范要求1完整覆盖行人可见的身体轮廓2包括随身携带且与人体紧密相连的物品3遮挡时根据可见部位推断完整外轮廓4绘制完整矩形框标注顺序建议多目标场景中建议按固定顺序标注,降低漏标风险:自上而下从图像上方到下方依次标注自左至右从图像左侧到右侧依次标注相关知识任务2边界框标注——监控场景行人检测定义与特点边界框标注,又称矩形框标注,通过在目标物体外围绘制水平矩形,标定其空间位置与类别归属。该方法侧重于目标的有效定位与快速识别,对轮廓精度要求较低。操作简便易于上手标注直观清晰可见计算高效快速处理在目标检测中的作用在更加复杂的目标检测任务中,矩形框标注通常作为入门级标注方式,为后续更精细化的标注方法奠定基础。由于成本低,适用范围广,广泛应用于各类视觉任务,成为最主流的标注形式之一。广泛应用场景车辆行人检测安防监控人脸定位商品分析医学影像定位相关知识任务2边界框标注——监控场景行人检测矩形框标注基本原则完整性框体必须覆盖目标全部可见区域,对于画面内完整呈现的目标,不得因操作不当造成区域遗漏或对主体产生非必要的截断。贴合度框线应尽可能贴合目标最大外轮廓,减少多余背景。独立性每个目标独立绘制一个框,不得将多个目标包含在同一个框内,避免语义混淆。一致性同一任务中,各标注人员应保持统一的尺度、贴合策略与遮挡判断标准,以确保数据在模型训练中的稳定性与可靠性。遮挡处理当目标被遮挡时,可根据项目规范选择标注策略。如自动驾驶、安防等识别完整性要求较高的任务,应该合理推断遮挡部分,按目标完整外轮廓绘制边界框。在用于行为识别或局部关键区域的场景中,一般只需要标注目标的可见部分。任务实施1登录平台登录数据堂平台后,单击"实验课程",在列表中找到实验"监控场景行人检测标框"单击"进入实验"打开实验界面2选择工具在窗口下方工具栏的图形操作区域,单击"矩形"按钮,进入线工具绘制模式单击"矩形"按钮快捷键"1"任务1画线标注——无人驾驶道路线标注3放大图像向上滑动鼠标滚轮放大图像,观察窗口右下角显示比例,一般在100%-150%之间标注同时按鼠标左键和右键,可拖动图像方便观察任务实施4开始标注以目标左上角为起点单击鼠标再单击目标右下角完成矩形框绘制注意每标注完一个目标,在窗口右侧选择属性标签注意事项12矩形框边缘要很好地贴合人体3继续重复操作,不要遗漏任何目标4滑动鼠标滚轮进行图像放大或缩小5同时按鼠标左键和右键,可拖动图像按顺序进行标注,可从上到下,从左到右任务2边界框标注——监控场景行人检测任务实施5编辑与修改绘制完成后,如发现框体位置或大小不合适,切换至编辑模式进行调整进入编辑模式单击"编辑"按钮或按快捷键"1"切换选中目标框单击目标框,使该框周围显示黄色边缘删除目标框选中目标框后按Delete键即可删除任务2边界框标注——监控场景行人检测6整体检查与提交确认没有遗漏目标单击窗口右上角的“提交并进入下一条”按钮质检通过即可直接进入下一条,不通过则弹出提示框调整目标框位置单击框内部,并按住Shift键拖动改变目标框大小将鼠标移至框边缘或角点,当鼠标变为空心蓝色圆圈图标时,按住左键拖动即可调整完成数据堂实训平台上“实验课程”中“监控场景行人检测标框”练习,熟练掌握监控场景下对人体图片画框的方法,巩固图像画框的能力。完成数据堂实训平台上“实验课程”中“人脸检测标框”练习,对每张人脸图片,在脸部位置标注一个矩形框,脸部位置从额头到下巴,尽量紧贴图片中的人脸。数据堂平台“实验课程”——无人驾驶行人车辆检测同一张图像中用边界框标注不同目标,确定相应属性数据堂平台“实验课程”——无人驾驶街景行人标注标注高度大于25像素的人,包括多种行人类型数据堂平台“实验课程”——无人驾驶街景车辆标注标注高度大于25像素的车辆,包括8种不同类型持续提升通过基础练习巩固边界框标注技能,通过拓展任务挑战更复杂的标注场景,不断提升专业能力。持续练习,精进标注技能练习与实践拓展任务任务2边界框标注谢谢观看感谢学习图像标注核心知识与实战技能从基础认知到实战应用,掌握专业标注能力理论基础图像数据基础标注重要性实战技能8种标注任务全流程掌握质量意识标准化流程质量评估体系持续学习·精进技能专业认证·职业发展2.2图像标注典型实战任务案例通过多个实战任务,提升图像标注能力任务3简单关键点标注——人脸5关键点标注任务3简单关键点标注——人脸5关键点标注1任务背景某公司虚拟试妆平台特效贴合度差,需构建高精度人脸5关键点标注数据集提升模型精度。2任务分析制定标注规则手册,确保标注标准统一,目标是将定位误差降低至1.5像素以内。3相关知识人脸5关键点标注标定人脸核心特征点,有明确位置定义,用于人脸对齐等场景。4任务实施登录数据堂平台,依次标注5个关键点,可调整位置,通过质检后提交任务。5练习与实践完成数据堂平台上相关练习,熟练掌握关键点标注方法。6拓展知识了解数据标注相关法律法规和保密义务,掌握数据脱敏方法。任务背景&任务分析任务3简单关键点标注——人脸5关键点标注用户反馈的技术痛点某AR虚拟试妆APP上线后,用户反馈特效"贴合不准"、"会飘移"或"眨眼时错位",在侧脸、大笑或快速移动时尤为明显。单次使用时长下降40%购买转化率降低25%+技术团队问题诊断现有通用模型在复杂光线、多姿态和丰富表情下,对人眼、鼻尖、嘴角等核心特征点的定位存在2-5个像素的波动误差。这一微小误差在AR渲染中被放大,导致虚拟妆容"浮"在脸上。解决方案重新构建"高精度人脸5关键点标注数据集",将平均定位误差降低至1.5像素以内。任务目标1精度目标将5关键点在复杂场景下的平均定位误差降低至1.5像素以内2数据多样性涵盖年龄、性别、人种、姿态、表情、光照、遮挡等多维度3场景适应确保模型能稳定应对用户真实使用场景中的各种挑战标注质量保障措施制定详细的标注规则手册,对模糊情况进行明确定义多轮标注员培训与交叉校验,确保标注标准统一机器质检与人工审核相结合,保障数据标注质量相关知识任务3简单关键点标注——人脸5关键点标注关键点的定义与语义5KeypointsDefinitionandSemantics人脸5关键点标注旨在为图像中的单张人脸手动标定5个具有明确语义和稳定位置的核心特征点。这五个点在人脸上最稳定、最显著、最容易定位,即使在有表情变化、轻微遮挡或非正面角度下也相对容易识别,是构建人脸模型的"基石"。1左眼中心瞳孔几何中心2右眼中心瞳孔几何中心3鼻尖最凸出前端点4左嘴角上下唇相接拐点5右嘴角上下唇相接拐点标注原则与技巧眼中心:睁开时标瞳孔中心,闭合时标眼睑中心鼻尖:鼻子最凸出点,从侧面看最明显的点嘴角:沿自然唇线找拐点,不标在牙齿或内部遮挡处理原则依据可见结构和对称性合理推测被遮挡点位置完全无法推测时标记为"不可见"(需项目统一规则)确保数据集覆盖年龄、性别、人种、光照、姿态、表情等多样性核心目的通过5关键点建立基准坐标系,计算人脸朝向、角度和大致比例,实现人脸对齐,将不同姿态、大小的人脸归一化到标准正脸位置。技术价值这是提升后续算法性能的关键预处理步骤,为AR渲染、人脸识别、表情分析等应用提供精确的基准信息。任务实施任务3简单关键点标注——人脸5关键点标注完整操作步骤1登录并进入实验登录数据堂平台后,单击"实验课程",在列表中找到"人脸5关键点标注"实验,单击"进入实验"打开标注界面。2按固定顺序标注关键点依次单击以下5个位置完成标注(必须严格遵守顺序):左眼中心右眼中心鼻尖左嘴角右嘴角3编辑模式下调整位置选中关键点,将鼠标移至点位中心,当出现蓝色圆圈提示时,按住鼠标左键并同时按下Shift键拖动,即可移动至正确位置。4删除错误关键点选中错误关键点,按Delete键即可删除该点并重新标注。5提交并进入下一条确认所有关键点标注无误后,点击"提交,进入下一条"按钮。若机器质检通过则进入下一条,不合格可返回修改。完成数据堂实训平台上“实验课程”中“人脸5关键点标注”内全部练习,熟练掌握关键点标注的基本方法。练习与实践拓展知识任务3简单关键点标注——人脸5关键点标注数据安全三驾马车为应对数字时代系统性挑战,保障国家安全、经济发展、民生权益,我国颁布了三部核心法律:《网络安全法》保障网络安全,维护网络空间主权《个人信息保护法》保护个人信息权益,规范个人信息处理活动《数据安全法》规范数据处理活动,保障数据安全数据标注安全规范数据泄露风险数据标注工作涉及大量的敏感信息,包括个人隐私、商业机密等。这些数据在标注过程中可能面临泄露风险,在2023年,某知名数据标注公司因内部员工使用不安全的云存储服务,导致大量标注数据泄露,其中包括用户的个人身份信息和医疗记录,这一事件引发了公众对数据标注安全性的广泛关注。保密义务保密义务是指数据标注企业和标注人员在数据处理过程中,对接触到的敏感信息负有不泄露、不滥用的责任。这种义务不仅基于道德和职业伦理的要求,更是法律所规定的强制性要求。保密义务的目的是保护数据的机密性、完整性和可用性,防止数据被未经授权的访问、使用或披露。数据脱敏对敏感信息进行处理,使其在保留数据可用性的同时,无法识别或关联到特定个人或实体的过程,称为数据脱敏。在数据标注工作中,数据脱敏是保护个人隐私和商业秘密的重要手段,是遵守相关法律法规的重要措施,可避免因数据泄露导致的法律责任,有助于维护数据标注行业的声誉,增强公众对数据处理的信任。谢谢观看感谢学习图像标注核心知识与实战技能从基础认知到实战应用,掌握专业标注能力理论基础图像数据基础标注重要性实战技能8种标注任务全流程掌握质量意识标准化流程质量评估体系持续学习·精进技能专业认证·职业发展2.2图像标注典型实战任务案例通过多个实战任务,提升图像标注能力任务4复杂关键点标注——手势21关键点标注任务4复杂关键点标注——手势21关键点标注01任务背景某公司开发VR社交平台,需构建手部21关键点标注数据集提升手势识别算法性能。02任务分析目标训练高精度模型,覆盖复杂场景,依据解剖学知识推断被遮挡关节位置。03相关知识手势21关键点标注描述手部姿态,有广泛应用场景,如虚拟现实、全屋智能等。04任务实施登录数据堂平台,按顺序标注21个关键点,设置属性,可调整位置,通过质检后提交任务。05练习与实践完成数据堂平台上相关练习,标注手势图片关键点。06拓展任务完成人体、人脸等不同数量关键点标注任务,拓展标注能力。项目场景VRSocialPlatformProjectScenario某公司新项目是开发一款虚拟现实(VR)社交平台,用户可在虚拟空间中与朋友聚会、观看演出、创作内容。弹奏虚拟乐器捏合旋转3D模型挥手打招呼技术困境CurrentTechnicalLimitations自研第一代手势识别算法仅识别5种简单手势,稳定性与精度远未达产品化要求,无法支持精细交互。握拳点赞手掌张开精度不足稳定性差任务背景任务4复杂关键点标注——手势21关键点标注任务4复杂关键点标注——手势21关键点标注任务分析任务目标训练高精度深度学习模型训练出能在复杂VR场景下,实时、稳定、高精度预测单手21个三维关键点的深度学习模型。数据集必须精准覆盖的挑战快速运动模糊严重自遮挡(如握拳时手指被遮挡)复杂光影变化多样肤色与手型手持虚拟物体时的部分遮挡标注策略与要求采用行业广泛接受的手部21关键点模型,精细刻画手部骨骼关节与指尖位置依据解剖学知识和可见部分,合理推断被完全遮挡关节的最可能空间位置系统性地覆盖手部所有自由度的组合,包括各种弯曲角度、手指交叉等任务4复杂关键点标注——手势21关键点标注相关知识21个关键点的完整拓扑结构21KeypointsTopologyStructure手势21关键点标注旨在为一只人手精确标定21个具有明确解剖学意义的骨骼关节点,共同构成完整的手部骨架拓扑,能精确描述手部姿态、朝向和每根手指的弯曲状态。0手腕点位于手掌与手臂连接处的中心,作为手部骨架的根部参考点。20手指关键点5根手指各标4个点,共20个点,从手掌端到指尖依次标注。大拇指掌骨中心根部关节中间关节顶端中心1食指掌指关节近端指间关节远端指间关节指尖中心2中指掌指关节近端指间关节远端指间关节指尖中心3无名指掌指关节近端指间关节远端指间关节指尖中心4小指掌指关节近端指间关节远端指间关节指尖中心标注核心原则解剖学依据必须依据解剖学知识和可见部分,合理推断被遮挡关节位置。可见性判断根据实际遮挡情况为每个点配置"可见"或"不可见"属性。应用场景拓展智能家居控制通过特定手势控制全屋设备虚拟偶像驱动实时捕捉手势驱动虚拟形象医疗手术辅助非接触式操控医学影像手语翻译实时翻译手语为文字或语音1登录并进入实验登录数据堂平台,找到"手势21关键点标注"实验,单击"进入实验"打开标注界面。2放大并移动图像向上滑动鼠标滚轮放大图像,同时按住鼠标左键和右键拖动,使手部清晰完整地显示在画布中。3按导航顺序依次标注21个关键点使用"点"工具按窗口左侧显示的导航顺序依次单击以下位置:0:腕关节中心1-4:大拇指4点5-8:食指4点9-12:中指4点13-16:无名指4点17-20:小指4点4配置可见性属性切换至编辑模式,为每个关键点配置"可见"或"不可见"类别标签。被遮挡关键点必须设置为"不可见点"。5调整位置与删除操作编辑模式下可调整关键点位置(Shift+拖动)或删除(Delete键)。6提交并进入下一条确认无误后点击"提交,进入下一条"。若质检通过则进入下一条,不合格可返回修改。任务4复杂关键点标注——手势21关键点标注任务实施完成数据堂实训平台上“实验课程”中“人脸5关键点标注”内全部练习,熟练掌握关键点标注的基本方法。练习与实践任务4复杂关键点标注持续练习,精进标注技能拓展任务人体关键点标注体系HumanBodyKeypointsAnnotationSystem人体标注比手部或面部更复杂,因空间范围更大、遮挡更严重、姿态变化更剧烈。实际应用中,根据场景需求选择关键点数量:15-18关键点基础骨架级适用于基础姿态识别与运动分析22-26关键点增强骨架级用于互联网娱乐、动作捕捉等场景133+关键点高精度专业级用于电影特效、精细3D建模等专业领域人脸关键点标注标准FaceKeypointsAnnotationStandards5-6点基础定位级,用于人脸检测与对齐68点轮廓五官级,AR贴纸、虚拟试妆98/106/194点高精度密集点级,精细面部建模自定义特定任务级,如视线追踪、口型识别完成数据堂实训平台上“项目实训”中的“互联网娱乐人体关键点标注”,将图片中出现的人体,标注22个关键点。完成数据堂实训平台上“实验课程”中的“简单人脸106关键点标注”、“复杂人脸106关键点标注”,以及“项目实训”中的“互联网娱乐人脸关键点标注”。谢谢观看感谢学习图像标注核心知识与实战技能从基础认知到实战应用,掌握专业标注能力理论基础图像数据基础标注重要性实战技能8种标注任务全流程掌握质量意识标准化流程质量评估体系持续学习·精进技能专业认证·职业发展2.2图像标注典型实战任务案例通过多个实战任务,提升图像标注能力任务5简单多边形标注——监控场景行人检测抠图任务5简单多边形标注——监控场景行人检测抠图01任务背景某城市轨道交通集团研发视觉感知系统,需行人轮廓标注数据提升系统检测能力。02任务分析采用多边形标注方式,贴合行人身体轮廓,只标注可见区域,无需推断遮挡部分。03相关知识多边形标注精细描绘目标形状,是训练分割模型基础,应用于安防、医疗等领域。04任务实施登录数据堂平台,使用多边形工具标注行人,可调整顶点,通过质检后提交任务。05练习与实践完成数据堂平台上相关练习,掌握图像多边形标注。06拓展知识完成人体粗略和精细抠图标注练习,提升多边形标注技能。任务背景任务5简单多边形标注——监控场景行人检测抠图项目目标为支撑某城市轨道交通集团"智慧地铁"安全运营与客流智慧调控体系建设,需研发一套能够在复杂地铁监控场景下实现高精度行人检测、追踪与行为分析的视觉感知系统。当前挑战高峰时段大客流密集遮挡、光照不均、行人姿态多样,导致检测漏报与误报率较高。解决方案通过高精度的行人轮廓标注数据,提升模型在密集遮挡情况下的行人分离与识别能力。任务5简单多边形标注——监控场景行人检测抠图任务分析标注要求使用多边形工具紧密贴合每位行人的身体轮廓进行标注背包、围巾等显著附属物应包含在人体多边形内人体被遮挡的部分仅标注可见区域,无需推断应用价值精准客流统计异常行为预警热力图生成行人轨迹追踪核心目标实现从"看得见"到"看得清、看得懂"的跨越,全面提升地铁运营的安全性、效率与智能化服务水平。任务5简单多边形标注——监控场景行人检测抠图相关知识精细化标注方法多边形标注通过在一系列连续的顶点之间连接线段,勾勒出目标物体的精确轮廓,形成一个封闭的多边形区域。与矩形框标注只提供一个大致范围不同,多边形标注能比较精准地描绘出不规则物体的形状和边界。❌矩形框标注的局限•包含过多背景噪声•无法精确描述不规则形状•在密集遮挡场景下精度低✅多边形标注的优势•像素级精度定位•贴合物体真实轮廓•显著提升模型性能高等级视觉任务的基础在许多高等级的视觉任务中,仅仅知道物体"在哪里"(矩形框)是不够的,还需要知道物体"具体长什么样"(精确轮廓)。多边形标注提供了像素级的定位信息,是训练实例分割和语义分割模型所必需的数据基础。应用领域广泛安防与智慧城市行人检测、行为分析自动驾驶环境感知车辆、行人、交通标志识别医疗影像分析器官分割、病灶检测零售商品识别商品检测与结算工业缺陷检测产品质量控制地理信息系统土地规划与灾害评估任务5简单多边形标注——监控场景行人检测抠图登录数据堂平台,单击“实验课程”,在列表中找到实验“监控场景行人检测抠图”,单击“进入实验”按钮。登录平台1在窗口下方工具栏中,单击图形操作区域“多边形”按钮,进入多边形绘制模式,或使用快捷键1进行切换。选择工具2向上滑动鼠标滚轮放大图像,选择其中一个目标,沿着可见边缘依次单击放置定点,系统将自动连接相邻顶点形成多边形轮廓。在此过程中,要确保顶点贴合目标边缘,尽量减少无关背景的包含,如某一顶点位置不合适,可以按“Esc”键依次撤回刚刚创建的顶点。完成顶点绘制后,按空格键闭合多边形,形成封闭区域。标注目标3如发现某个多边形不合适,可在编辑模式下进行调整,选中需要调整的多边形,将鼠标移至想要调整的顶点或边框线上,当出现蓝色圆圈提示时进行拖动即可。若有错误或无须保留的多边形,可选中后按Delete键即可删除。编辑修改4确认所有目标标注无误后,单击“提交,进入下一条”按钮,如果机器质检通过,则进入下一条待标注图像,若标注不合格可以返回修改。提交质检5任务实施任务5简单多边形标注——监控场景行人检测抠图练习与实践完成数据堂实训平台“实验课程”中"监控场景行人检测抠图"练习,对每张图片的人体轮廓进行抠图,需紧贴人体,基本掌握图像的多边形标注。拓展任务完成数据堂实训平台“实验课程”中"人体粗略抠图标注"练习,对人体轮廓进行粗略抠图,抠图边缘要紧贴人体,

像素误差不超过5个像素。练习&拓展快捷键总结1切换到多边形工具Esc依次撤回刚创建的顶点空格闭合多边形,形成封闭区域Delete删除选中的多边形滚轮放大/缩小图像视图标注效率提示•合理使用快捷键可大幅提升标注效率•建议在标注前先熟悉所有快捷键操作谢谢观看感谢学习图像标注核心知识与实战技能从基础认知到实战应用,掌握专业标注能力理论基础图像数据基础标注重要性实战技能8种标注任务全流程掌握质量意识标准化流程质量评估体系持续学习·精进技能专业认证·职业发展2.2图像标注典型实战任务案例通过多个实战任务,提升图像标注能力任务6复杂多边形标注——无人驾驶全品类精细标注任务6复杂多边形标注——无人驾驶全品类精细标注任务背景某科技公司研发L4级自动驾驶系统,需全品类精细标注数据集提升模型场景理解力。1任务分析对街景图片多目标进行精细多边形标注,按顺序绘制,保证像素覆盖完整。2相关知识多边形标注质量影响模型性能,需注意类别边界、语义分割等要点,应用于多领域。3任务实施登录数据堂平台,使用多边形工具标注目标,设置属性,可调整多边形,通过质检后提交任务。4练习与实践完成数据堂平台上相关练习,对街景图片进行精细抠图。5拓展训练完成人体、服饰等不同类别抠图标注任务,提高多边形标注水平。6项目目标作为国内领先的自动驾驶解决方案提供商,正在全力研发面向城市开放道路的L4级全场景自动驾驶系统。当前瓶颈在高密度城区、复杂天气及强遮挡场景下,暴露出远端交通标志识别困难、特殊形态行人识别不稳定等问题。根因分析之前的数据集对背景及次要目标覆盖不足,导致模型对全局场景的理解力与泛化能力较低。解决方案发起"全品类精细标注专项",构建极致精细的街景语义分割数据集,重塑感知模型的"场景理解力"。任务背景任务6复杂多边形标注——无人驾驶全品类精细标注任务分析任务6复杂多边形标注——无人驾驶全品类精细标注标注类别🚗路面🚶人🚙车🏢建筑☁️天空🌳植被🚦交通标志特殊要求对类别"人"进行标注时,骑在自行车、电动车或者摩托车上的人体及其接触部分应包含在多边形内。建议按从上至下顺序绘制,以最大化利用图层叠加关系。绘制顺序建议天空建筑植被路面动态目标相关知识任务6复杂多边形标注——无人驾驶全品类精细标注多边形标注的质量直接决定了后续AI模型的性能上限1类别定义清晰定义每个类别的边界,避免标注混淆。典型问题•"车辆"是否包含自行车?•"植被"是否包含盆栽?•"人"是否包含广告牌人像?制定统一的类别界定标准2分割类型明确语义分割还是实例分割,确保标注一致性。语义分割同一类别的相连区域可作为一个多边形,如整片天空。实例分割每个独立物体单独绘制多边形,如五个人需五个多边形。3边缘案例制定边缘案例处理规则,确保特殊情况处理一致。遮挡处理仅标注可见部分,还是推断完整轮廓。模糊目标设定清晰度或像素大小下限。边界模糊如云朵、火焰等如何界定轮廓?复合物体如"骑行的人"整体标注还是分开。4操作技巧多边形必须紧贴物体边缘,精确控制轮廓。标注要点•曲线处要使用足够多的点保证平滑•直线处尽量用最少的点提高效率•避免过度密集的点导致不平滑•顶点落在边缘拐角上•模糊物体按主轮廓判断不能侵入物体内部不能包含过多背景5一致性保持跨图像、跨标注员的高度一致性。一致性维度•同一物体在不同图像中•不同标注员标注同一类别•轮廓精度保持一致•顶点数量合理范围•类别判断标准统一为什么重要?一致性差会导致模型学习到矛盾特征,严重影响模型泛化能力。实施步骤步骤1-2:进入实验登录平台,找到"无人驾驶全品类精细标注"实验,选择多边形绘制模式。步骤3:绘制与标注按从上至下顺序绘制,完成后及时在右侧标签属性中选择对应类别。步骤4-5:检查与调整标注所有目标后缩小图像检查遗漏,在编辑模式下调整或删除不合适的多边形。步骤6:提交审核确认无误后提交,机器质检通过后进入下一条。练习与实践完成"无人驾驶全品类精细标注"练习,对街景图片里面的路面、人、车、建筑、天空、植被、交通标志等目标进行精细抠图。拓展训练1人体五官部位精细抠图对图片中人脸的五官部位(头发、皮肤、眉毛、眼睛、鼻子等)做精细抠图。2人体服饰分割标注对图片中不同类别服装(上衣、下衣、鞋、眼镜、帽子、包等)进行抠图。3无人驾驶行人车辆抠图对街景图像中所有的行人和车辆进行抠图,包括:行人、骑车人、坐着的人、小型汽车、卡车、巴士、有轨电车、摩托车等。4无人驾驶可行驶区域标注对街景图像中的路面指示标志、道路线进行多边形标注以及类别属性标注,共8类路面指示标志、5类道路线。步骤&练习&拓展任务6复杂多边形标注——无人驾驶全品类精细标注谢谢观看感谢学习图像标注核心知识与实战技能从基础认知到实战应用,掌握专业标注能力理论基础图像数据基础标注重要性实战技能8种标注任务全流程掌握质量意识标准化流程质量评估体系持续学习·精进技能专业认证·职业发展2.2图像标注典型实战任务案例通过多个实战任务,提升图像标注能力任务7属性标注——监控场景行人属性标注任务7属性标注——监控场景行人属性标注1任务背景某商业集团部署顾客洞察系统,需行人属性标注数据增强模型“理解力”。2任务分析为行人绘制边界框并进行多维度属性标注,基于视觉证据判断,遵循隐私与伦理规范。3相关知识属性标注为目标添加语义标签,需定义清晰、保持一致性,应用于多行业。4任务实施登录数据堂平台,框选目标并填写属性标签,注意标注规范,通过质检后提交任务。5练习与实践完成数据堂平台上相关练习,掌握属性标注。6拓展任务完成人脸、行人等不同场景全属性标注任务,提升属性标注能力。任务背景任务7属性标注——监控场景行人属性标注某商业集团计划在其购物中心部署新一代“顾客全维度洞察系统”。现有客流系统仅能提供基础的"人数统计"功能,但顾客画像模糊,无法深入洞察顾客特征。只能回答"有多少人",无法回答"我的顾客是谁"核心痛点顾客画像模糊:无法识别是年轻情侣、带孩家庭还是银发族行为意图不明:顾客长时间徘徊意味着寻找困难或兴趣浓厚?异常行为发现:依赖保安人工发现,效率低且存在盲区升级目标构建真正的智慧商场训练能实时解读顾客视觉特征与状态的AI模型,实现从基础统计到智能洞察的跨越数据引擎打造通过对监控视频帧中的顾客进行精细化属性标注,增强模型的"理解力"业务价值实现精准营销与业态调整异常行为智能预警顾客体验优化严格遵守数据隐私与伦理规范任务分析任务7属性标注——监控场景行人属性标注标注需求性别预估年龄段:儿童、青少年、青年、中年、老年着装与外观:上、下装纹理及主色、衣着风格是否佩戴装饰物:眼镜、口罩、帽子等同行类型:单独、情侣、带儿童、朋友群组是否携带购物袋:若品牌logo清晰亦可标注针对商业场所监控图像中商场主通道、中庭、楼层走廊等视角,标注员需为画面中的每位顾客绘制精准的矩形边界框,并且进行多维度属性标注。注意力方向:观看橱窗、看导视牌、使用手机所有属性判断必须基于无歧义的视觉证据,对无法确认的属性标注为“未知”。严格遵守数据隐私与伦理规范:所有标注数据脱敏处理,仅用于群体分析,不进行任何个人身份识别。标注过程需遵循公司制定的《视觉数据合规使用准则》相关知识(属性标注定义)任务7属性标注——监控场景行人属性标注什么是属性标注?属性标注是指在图像中标注出目标物体的位置后,进一步对其内在特征、状态或类别进行精细化描述的标注过程。它为目标添加了丰富的语义标签,让AI系统能够深度理解目标特性。基础标注回答•"目标在哪里?"(边界框位置)•"目标是什么?"(物体类别)属性标注回答"这个目标具体是什么样的?"(丰富的语义标签)核心价值属性标注极大地增强了AI系统对世界的深层理解能力,使机器不仅能识别物体,更能理解其特征、状态与属性,从而实现更智能的决策与交互。1语义增强2精准识别3智能决策标注示例商业场景行人•性别:男•年龄段:青年•上衣:白色纯色T恤•下衣:黑色长裤•眼镜:无•行为:行走应用价值训练可靠属性识别模型的关键:高质量的属性标注是模型准确识别的基础提升AI系统语义理解:让机器理解目标的深层特征与状态支撑智能决策:为业务分析与智能决策提供数据基础相关知识(属性标注原则)任务7属性标注——监控场景行人属性标注01定义清晰无歧义属性的定义要清晰无歧义,例如"红色"需明确包含粉红、深红等边界颜色,最好提供可视化示例。示例:"红色"应包含大红、朱红、粉红、深红等所有红色系颜色02覆盖全面且互斥同一维度下的属性值应覆盖所有可能情况,且彼此互斥不重叠,确保每个目标都有唯一对应的属性值。示例:年龄段分为儿童、青少年、青年、中年、老年,覆盖全年龄层03基于可见证据标注员必须只根据图像中清晰可见的部分进行判断,对于被遮挡、模糊无法确认的属性,应标为"未知"或"难以辨认"。禁止:猜测或推测无法看清的属性特征04标注员一致性不同标注员对同一目标的同一属性判断应一致,这需要通过详细的规范、培训和校准测试来实现。方法:统一培训+校准测试+定期审核合理粒度原则属性并非越细越好,需要根据业务需求定义合理的粒度。过细的标注会大幅增加成本且可能对模型训练无益,应在标注精度与标注成本之间找到最佳平衡点。平衡考量标注成本模型效果业务价值相关知识(属性标注应用场景)任务7属性标注——监控场景行人属性标注增强AI系统深层理解能力属性标注应用极为广泛,极大地增强了AI系统对世界的深层理解能力,从商业分析到智能安防,从自动驾驶到内容审核,都离不开高质量的属性标注支撑。智慧零售与商业分析通过顾客属性分析(年龄、性别、着装风格、行为状态),实现精准营销、业态优化和顾客画像构建,提升商业运营效率与顾客体验。典型应用:客流分析/热力图生成/停留时间统计智能安防与公共安全通过行人属性识别(性别、年龄、着装特征、携带物品),快速定位可疑人员,预防安全事件,提升公共区域的安全防护能力。典型应用:嫌疑人追踪/异常行为预警/失踪人员查找自动驾驶与智慧交通标注行人、车辆、交通标志的属性(姿态、方向、类型、状态),为自动驾驶系统提供精准的感知能力,确保行车安全。典型应用:行人意图识别/车辆类型判断/交通标志识别内容审核与搜索过滤对图像或视频中的人物、场景进行属性标注,实现内容审核、智能推荐和精准搜索,提升内容管理效率。典型应用:敏感内容识别/人脸识别/场景分类工业自动化质检标注产品缺陷的类别、程度、位置等属性,实现自动化质检与分拣,提升生产效率和产品质量。典型应用:缺陷分类/严重程度分级/自动分拣互动娱乐与元宇宙标注人物表情、动作、姿态等属性,驱动数字人、虚拟角色,实现沉浸式互动娱乐体验。典型应用:表情驱动/动作捕捉/虚拟形象生成应用价值总结属性标注技术已渗透到各行各业,成为推动AI产业化落地的重要基础能力。通过精细化的属性标注,AI系统能够实现从"看见"到"看懂"的跨越,为各行各业的智能化转型提供强大动力。登录数据堂平台后,单击“实验课程”,在列表中找到实验“监控场景行人属性标注”,单击“进入实验”打开实验界面登录平台1“矩形”工具框选图像中的目标,适当放大图像,尽量使边框贴合目标边缘,框选完成后在窗口右侧填写标签属性。标注目标2继续框选其它目标并且选择恰当的标签属性,此时需注意本任务的规范中已明确:被遮挡的目标要露出30%以上才可以进行标注,标注时要预估被遮挡的部分;如果属性列表中没有合适的选项,要选择“其他”。标注完成3框选完成后向下滑动鼠标滚轮缩小图像,观察是否已包含所有目标。如有错误,进行修改。编辑修改4确认所有目标标注无误后,单击“提交,进入下一条”按钮,如果机器质检通过,则进入下一条待标注图像,若标注不合格可以返回修改。提交质检5任务实施任务7属性标注——监控场景行人属性标注练习与实践1.通过完成数据堂实训平台上的"监控场景行人属性标注"练习,标框并同时标属性,对每个人体标注6个核心属性,基本掌握属性标注的核心技能。2.在数据堂实训平台的“实验课程”中,通过依次完成“人脸属性快判”、“人脸多属性标注”和“车辆属性标注”三个实验,可以逐步理解属性标注在实际任务中的多样性与灵活性,认识到在不同应用需求下,属性标注的内容设计、标注角度和评判标准往往需要因场景而异。学习收获理解多样性与灵活性:认识到在不同应用需求下,属性标注的内容设计、标注角度和评判标准往往需要因场景而异。掌握多场景技能:从行人到人脸再到车辆,逐步掌握不同对象类型的属性标注方法。建立系统思维:理解属性标注的整体逻辑,形成系统化的标注知识体系。练习&拓展任务7属性标注——监控场景行人属性标注拓展训练1完成数据堂实训平台上“项目实训”中“互联网娱乐人脸全属性标注”练习,将图片中出现的人脸,画框并标注各种属性:性别、年龄段、人种、带帽状态、戴眼镜状态、背景状态、人脸朝向等。2智能安防行人全属性标注完成数据堂实训平台上“项目实训”中“智能安防行人全属性标注”练习,对监控场景下采集的图像,将图片中的行人标框并进行全属性标注。该任务要求只标注站着或走着的人、骑车人、推车和拉杆箱,遮挡或截断超过50%及以上的不标注。互联网娱乐人脸全属性标注谢谢观看感谢学习图像标注核心知识与实战技能从基础认知到实战应用,掌握专业标注能力理论基础图像数据基础标注重要性实战技能8种标注任务全流程掌握质量意识标准化流程质量评估体系持续学习·精进技能专业认证·职业发展2.2图像标注典型实战任务案例通过多个实战任务,提升图像标注能力任务8OCR识别标注——OCR票据标注任务8OCR识别标注——OCR票据标注任务背景某科技公司开发智能报销系统,需票据文本标注数据训练高精度OCR识别模型。1任务分析定位文本块并转录内容,关键字段准确率要求高,对特殊情况做特殊标记。2相关知识OCR标注是为识别模型准备数据,有严格规范,应用于金融、政务等多领域。3任务实施登录数据堂平台,使用斜矩形工具框选字符串并填写属性,可调整框体,通过质检后提交任务。4练习与实践完成数据堂平台上相关练习,掌握OCR文字识别标注。5拓展任务完成安防车牌、中英文场景等不同票据OCR识别标注任务,提高OCR标注能力。6任务背景任务8OCR识别标注——OCR票据标注某科技公司正在为大型集团客户开发一个智能报销系统。在处理海量纸质票据时,财务人员需手动将票据信息逐项录入ERP系统,一张票据平均耗时2-3分钟,录入效率低下且十分容易出错。对于拥有数千名员工的集团,月度票据处理人力成本极高。传统人工录入的痛点效率低下:单张票据平均耗时2-3分钟,财务人员工作量大错误率高:手动录入容易出错,一个数字或字母错误都可能导致严重后果成本高昂:数千名员工的大型集团月度票据处理人力成本极高解决方案训练高精度高效率的OCR结构化识别模型,构建基础训练数据集,对数十万张各类票据图像进行文本检测、识别与关键字段结构化标注。所有数据在加密环境中处理,严格遵守《数据安全法》任务分析任务8OCR识别标注——OCR票据标注系统上线后手机App拍照上传便捷操作,随时随地,系统自动识别并提取结构化字段2秒自动提取极速识别,即刻完成成本降低90%+降本增效,数字化转型,实现全自动录入文本定位使用边界框精准定位图像中的每一个文本块,确保框体紧密贴合文字边缘包含所有字符,不包含多余背景内容转录准确转录文本内容,关键字段(金额、发票代码、税号等)转录与结构化准确率要求大于99.5%关键字段准确率≥99.5%特殊情况对于模糊、破损、遮挡的文本,标记为"不可识别";对于手写体等变体,需提供典型样例标记清晰,便于模型学习相关知识任务8OCR识别标注——OCR票据标注OCR技术定义OCR(OpticalCharacterRecognition,光学字符识别)是为训练或评估光学字符识别模型而进行的数据准备过程。它是让机器获得"阅读"能力的基础工程,是数字化的桥梁。一个数字或字母的错误都可能导致严重后果,所以必须建立严格的双人复核机制核心价值与意义将海量非结构化的图像信息,转化为可检索、可分析、可流程化的结构化数据,是驱动各行各业降本增效和数字化转型的关键技术之一。可检索可分析可流程化高质量OCR标注的挑战字体千变万化不同字体、字号、粗细、倾斜角度,增加识别难度多语言混合中英文、数字、特殊符号混合,需要准确分类版式复杂表格、分栏、不规则排列,需要理解文档结构字段理解需理解文档类型,正确分配字段含义标注规范:框体需紧密贴合文字边缘,对于倾斜、弯曲等不规则文本,需使用四边形或多边形框质量管控:建立严格的双人复核机制,确保标注质量任务8OCR识别标注——OCR票据标注相关知识OCR技术已渗透到各行各业从简单的图片转文字,到复杂的文档理解与自动化,其价值在于将海量非结构化的图像信息转化为可检索、可分析、可流程化的结构化数据,是驱动各行各业降本增效和数字化转型的关键技术之一。金融与财税票据识别、银行单据处理、发票信息提取、财务报表分析,提升财务工作效率政务与法律证件识别、档案数字化、合同文本提取、法律文书处理,实现政务自动化物流与零售运单识别、快递单号提取、商品标签扫描、库存管理,加速物流流转医疗健康病历数字化、处方识别、医学文献提取、健康码识别,提升医疗服务质量智慧教育试卷扫描评分、教材数字化、笔记识别、学术文献处理,推动教育智能化工业物联网铭牌识别、设备编号提取、产品标签扫描、质量追溯,助力工业4.0日常生活应用拍照翻译名片识别二维码识别便签提取任务8OCR识别标注——OCR票据标注1登录平台登录数据堂平台,单击"实验课程",找到"OCR票据标注"实验,单击"进入实验"2框选字符串使用"斜矩形"工具框选字符串,选择语言类别,录入文字内容3标注全部重复上一步骤,将图像中所有的字符串标注完毕4调整优化在编辑模式下调整多边形,删除错误或无须保留的标注5提交审核确认所有标注无误后,单击"提交,进入下一条"斜矩形工具操作详解1定位左上角在字符串的左上角单击鼠标,确定第一个顶点2定位右上角在字符串的右上角单击鼠标,确定第二个顶点3定位左下角在字符串的左下角单击鼠标,确定第三个顶点,完成框选4填写属性在窗口右侧选择语言类别,录入具体的文字内容任务实施任务8OCR识别标注——OCR票据标注普通矩形工具局限性分析角度受限:只能绘制横平竖直的矩形,无法适应倾斜的文字背景干扰:会包含大量多余背景,影响识别精度文字遗漏:对于弯折、不平整的票据,无法完整包裹文字适用场景:仅适用于拍摄角度端正、票据平整的理想情况斜矩形工具核心优势角度适配:可绘制任意角度的矩形,完美贴合倾斜文字精准框选:紧密贴合文字边缘,不包含多余背景场景适应:适用于拍摄角度不正、票据弯折等复杂场景推荐使用:在OCR票据标注任务中,斜矩形工具更为方便高效典型应用场景对比拍摄角度不正由于拍摄时手机倾斜,导致票据上的字符串呈现倾斜状态斜矩形工具可完美贴合倾斜文字票据弯折不整纸质票据弯折或放置不平整,导致文字呈现弯曲或波浪形斜矩形工具灵活调整,适应弯折任务实施基础实践掌握OCR文字识别的基本标注方法OCR票据标注对每张票据的每个有语义字符串画四边形框并录入文字目标:掌握基础操作进阶实践理解不同场景下的标注差异与技术要点OCR表格框线标注OCR车牌识别标注OCR自然场景图片标注目标:理解场景差异高级实训熟练掌握OCR识别标注的操作方法智能安防车牌标注OCR识别中英文场景OCR识别复杂票据标注目标:精通操作技能练习&拓展核心价值:OCR技术是数字化的桥梁,将海量非结构化图像信息转化为可检索、可分析、可流程化的结构化数据99.5%+准确率要求数十万标注样本量任务8OCR识别标注——OCR票据标注谢谢观看感谢学习图像标注核心知识与实战技能从基础认知到实战应用,掌握专业标注能力理论基础图像数据基础标注重要性实战技能8种标注任务全流程掌握质量意识标准化流程质量评估体系持续学习·精进技能专业认证·职业发展2.2图像标注典型实战任务案例通过多个实战任务,提升图像标注能力任务9点云标注——点云图物体单帧标注任务9点云标注——点云图物体单帧标注任务背景某科技公司推进无人驾驶系统研发,需点云标注数据使系统具备识别道路参与者能力。1任务分析使用专业工具标注点云图中车辆,保证标注准确性,影响模型性能。2相关知识点云标注为三维点云数据赋予标签,复杂且重要,应用于自动驾驶、仓储物流等领域。3任务实施登录数据堂平台,调节点云图视角,使用3D框标注车辆,设置属性并调整,通过质检后提交任务。4练习与实践完成数据堂平台上相关练习,学习点云图基础标注能力。5拓展知识了解传统标注局限性,认识AI辅助和自动化标注技术,展望未来标注范式。6任务背景任务9点云标注——点云图物体单帧标注多传感器融合技术某科技公司致力于推进L4级无人驾驶系统的研发,该系统依赖多传感器融合技术。激光雷达通过发射激光束并接收反射信号,实时获取周围环境的三维点云数据,为车辆提供精确的空间轮廓和距离信息。语义标注的必要性原始点云数据本身不具备语义信息,必须通过人工标注与算法训练,才能使自动驾驶系统具备识别车辆、骑行人等道路参与者的能力。标注质量直接决定AI模型的识别精度。点云标注启航计划公司数据标注团队启动专项计划,旨在培养新人标注工程师掌握点云数据处理与标注的核心技能,为L4级自动驾驶研发提供高质量训练数据。任务9点云标注——点云图物体单帧标注任务分析标注工具使用专业的点云标注工具,对实际路采的激光雷达点云图像进行标注,确保数据真实性和标注准确性。识别目标识别点云图中所有车辆对应的点云簇,包括小汽车、卡车、公交车等不同类型的车辆。3D边界框使用3D边界框精确标注车辆的位置、尺寸与朝向,为AI模型提供完整的空间信息。精度要求:直接影响模型性能标注结果的准确性将直接影响到后续自动驾驶车辆检测模型的性能。每一个3D边界框的位置、尺寸、朝向都必须与实际目标完全匹配,任何偏差都会被模型学习并放大。因此,每一帧标注都需做到细致、规范、一致,确保训练数据的高质量。细致每个点云簇精确识别,边界框与目标完全贴合规范遵循统一标注标准,属性设置符合规范要求一致

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论