版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录1快捷键及按钮介绍 21.1快捷键总结 21.2部分按钮功能说明: 32数据制作 42.1标注: 42.2制作训练数据集: 52.3AI自动标注与AI辅助标注 62.3.1预识别(AI自动标注方法1): 62.3.2SVIP识别(AI自动标注方法2) 62.3.3整图识别(AI自动标注方法3): 72.3.4AI辅助标注: 72.4视频抽帧 93训练与模型转换 113.1训练 113.2模型转换 124报错或闪退处理方法 134.1闪退处理方法 134.2报错处理方法 13
1快捷键及按钮介绍1.1快捷键总结快捷键和组合快捷键上一张:Q下一张:E标注:W删除:左键选中标注框+D放大:ctrl+上滑动滚轮缩小:ctrl+下滑动滚轮适中:ctrl+中键复制粘贴:crtl+C,ctrl+V拖动图片:放大状态下拖动整个图片,ctrl+鼠标左键;多边形标注过程中为【鼠标中键】。加入/移出背景:B编辑标注框属性:选中标注框+鼠标右键标注框重命名:左键选中标注框+R隐藏标注框:选中标注框+右键,选则隐藏,或者选中矩形+V显示隐藏的标注框:选中隐藏标签(在右上角有的),鼠标移入图片中后单击右键或者选中矩形+V。删除类别:选中右上角标签类别,单击右键撤回:ctrl+Z(有时候多按几下)标注模式改变:选择标注方式,左键单击图片区域即为确认标注模式。在右下角图片地址区域,按住ctrl(shift)+左键可以多选地址,此时按鼠标右键可以删除选择的地址,或者删除地址以及图片(是真的会删除所选图片的)在右上角所有类别栏,按住ctrl/shift+左键可以多选类别。按住右键可以编辑多选类别,包含更改类别颜色、删除类别、隐藏类别。单选类别新增重命名。单图识别/AI辅助分割:A。按钮ESC:退出AI辅助分割删除图片:G
1.2部分按钮功能说明::打开文件夹。选择图像所在的文件夹:标注。单击开始标注。:放大、缩小、适应窗口。:整图识别/AI辅助标注。功能见AI辅助标注:亮度对比对调节。调节图像亮度和对比度(不改变原图像):选择。多边形标注模式下,单击进入框选模式,可以框选多个点进行删除。有2种框选模式,从上往下和从下往上,区别自行体会。:设置。:刷新。分为只刷新当前显示和重新加载所有图像。:导入标签。一键从其他地方导入标签,有三种导入方式,分别为跳过、覆盖、合并。跳过则会跳过已有标签,其他同理,通过设置切换导入方式。注意:导入标签是将标签导入到当前标签文件夹下面,且导入的标签文件夹中需要含有classes.txt文件,不然类别显示会有问题。:备份标签。将当前标签备份到一个新文件夹中。:帮助。查看操作手册。标签统计:可以统计已标注标签的数目调整标签:可以调整标签顺序、增加或删除标签。进出背景:可以把当前图像放入或移除背景。也可以当作快速清除所有标签使用(按两下)。放入背景的图像右侧地址底色是蓝色。快捷键为B。
2数据制作2.1标注:打开文件夹:点击打开文件夹按钮,选择包含图片的文件夹。选择标注模式:根据自己的任务选择对应的标注模式,标注模式有水平矩形、斜矩形、多边形、特征点和分类,分别对应YOLO的普通检测、OBB检测、实例分割(segment)、关键点检测(Pose)、图像分类(cls)。标注:水平矩形标注:点击标注按钮或者按快捷键(W)进入标注模式,此时鼠标变成十字形;在图中单击鼠标左键按住不松,拖动鼠标松开左键后输入类别即可完成标注。斜矩形标注(obb):按W进入标注模式,在途中单击左键按住不松,移动鼠标(这是矩形的第一条边),松开左键后再次单击左键并拖动到指定位置(这是矩形的第二条边),松开后输入类别完成标注。微调角度:选中斜矩形(单击矩形变蓝)后滚动滚轮即可微调。多边形标注(seg):按W进入标注模式,鼠标变成十字形并无十字提示线,单击鼠标左键即可标点,当标点三个或以上时自动构成封闭多边形,单击右键输入类别结束标注。注意:在此标注模式下按中键可以拖动放大状态下的图片,按ctrl+Z回退。关键点标注(pose):按w进入标注模式,首先和水平标注一样先绘制水平外接矩形,然后鼠标变成大剑的形状,继续在绘制的矩形内按鼠标左键进行标注关键点;按鼠标右键输入类别结束标注。注意:在此标注模式下,选中标注完的矩形,选中关键点(按住左键特征点变红)再按鼠标右键(或者按空格)可以编辑关键点。选中标注矩形,在标注矩形内按住左键(不选中关键点)再按鼠标右键(或者空格建)可以插入新的关键点。分类标注(cls):按W矩形标注分类或者更改当前分类。按D删除当前分类。注意:在切换标注模式后,要用鼠标点击一下图片,软件的快捷方式才会起作用。2.2制作训练数据集:当标注完成后,在此标注模式下,点击数据分配按钮,进入分配界面,输入训练集与验证集的比例(背景图片会全部存入训练集),输入名称点击确认,等待片刻完成制作。简单随机分配:按照图片的名称排序,并根据自定义比例,按照比例分配训练集和验证集。优化分配:考虑类别数量,尽可能保证分配后的类别数量保持自定义比例。(简单随机分配考虑的是图像名称,优化分配同时将考虑类别数量)2.3AI自动标注与AI辅助标注2.3.1预识别(AI自动标注方法1):此功能为辅助标注功能,当有了模型权重文件后(.pt文件)使用此功能快速完成标注。点击预识别按钮,选中模型种类(有普通检测、obb检测、seg、pose、cls)和模型路径,设置参数(基本保持默认,v5以上的模型可以把批次设大点16或者32)点击开始按钮开始识别。停止按钮会停止当前识别过程。预识别前记得备份已标注的标签文件,不然会全部清空。注意:预识别前先切换标注模式与模型一致。2.3.2SVIP识别(AI自动标注方法2)此功能专门为需要从视频、屏幕、摄像头等资源或设备中获取数据,并进行快速自动标注。也可以进行模型可视化识别效果显示,帮助直观判断模型效果。同时还用于保存目标截图功能。在上图中,数据来源source:输入0(或者其它数字)表示采用当前自带的摄像头;输入screen表示识别当前整个屏幕;输入screenx0y0x1y1表示识别当前屏幕以左上角(x0,y0)右下角(x1,y1)的矩形区域。输入screenn或者screennx0y0x1y1表示识别第n块显示屏(指定区域)。输入文件夹绝对路径,表示识别该文件夹内的图片或者视频。间隔:输入n,表示只识别索引为n的整数倍数的图片(视频帧)(11月3号更新)Classes:输入0或者0,1,2…或者012…表示只识别类别索引为0或012…的目标。勾选保存可视化结果:会保存当前的识别结果,包括标注框和置信度。勾选保存标签及图片:会保存识别的标签与对应的图片(识别图片时不保存对应的图片)勾选保存目标截图:会保存标注框内的截图(部分标注模式无法保存)。勾选实时显示:会弹出一个实时显示识别结果的窗口。2.3.3整图识别(AI自动标注方法3):整体识别是识别当前/所选图像整张图内的所有目标,区别于AI辅助标注。加载模型(如果没加载)。点击“设置”按钮,选择模型和设置相关参数。识别当前图像。按快捷键“A”,识别当前图像(第一次识别时间要长一点大概3s,后面就好了基本上几十毫秒一张)识别多张图像。在右下角选中要识别的图像地址,按A。多选图像地址可以按ctrl/shift+左键。2.3.4AI辅助标注:在水平矩形、斜矩形、多边形标注模式下,可以设置AI辅助标注。该功能可以帮助用户快速标注目标,与整图识别不同,该功能一次只能识别一个目标而不是整张图像的所有内容。但其精准度较高。步骤:勾选“AI辅助”检查是否加载AI模型(设置中检查)按标注按钮(快捷键W)绘制提示框/提示点按A(多边形标注下,右键分割目标点击命名)。说明:提示框/提示点:提示框:按W后绘制提示框框选目标(和水平矩形绘制方法一样)。提示点:分为2种提示点,左键后立即松开生成“正样本”提示点(绿色),右键生成“负样本”提示点(红色)。“正样本”提示点表示该点所在目标是需要识别的目标,反之“负样本”提示点则表示不需要。提示框和提示点可以同时存在也可以只存在某一个。但是如果都不存在就按A进行识别则会识别整张图像,此时消耗时间较长且无意义。提示点并不是越多越好,有时提示点多了反而效果会变差,需自行体会。提示框并不需要精准的框选目标,只需要把目标包含在框内即可,可以有些许间隙。多边形标注模式下需要手动确认分割目标(识别完成后右键单击分割目标选择命名或者删除)。斜矩形标注模式下,有最小外接矩形和对称轴外接矩形两种标注方式。对称轴外接矩形会以目标的对称轴(近似)为中心轴生成外接矩形。这两种标注模式对于不同的目标有不同的效果,自行选择即可。当然也不一定百分百符合预期,需要人工调整。图中,红框为提示框,绿点为“正样本”提示点,红点为“负样本”提示点。(这里只是展示提示框/提示点,这张图实际只需要绘制提示框或者“正样本”提示点即可达到预期效果)。建议:在AI辅助标注中,先只用“正样本”提示点或者提示框。如果不理想再使用提示框+提示点以及“负样本”提示点模式。AI辅助标注模型为软件目录中的weights文件夹的SAM文件夹中的模型。2.4视频抽帧单击视频抽帧按钮后选择视频所在的文件夹进入抽帧界面。左侧区域:开始帧与结束帧:抽取整段视频中的某一段视频时使用,例如开始帧为10,结束帧为100,则表示抽取整段视频中的第10帧到第100帧之间的所有帧。单击视频按“A”或“D”自动输入当前帧到“开始帧”或“结束帧”。如果输入的结束帧小于等于开始帧表示不抽取某段视频,例如结束帧输入1则表示不抽取一段视频。间隔:当输入开始帧小于结束帧时,表示会抽取一段视频,此时输入间隔,表示每隔几帧抽取一帧,例如开始帧=10,结束帧=100,间隔=2,则会抽取第10、13、16……从第10帧开始每隔2帧抽取一帧直到第100帧为止。提取当前帧:表示当前帧最终会被提取出来,即使它不在开始帧与结束帧之间。快捷键为空格。标记了提取当前帧的帧左上角会有标记。可以同时标记多帧。确定:开始提取帧。根据开始帧、结束帧、间隔以及提取当前帧等设置提取所需要的帧。创建文件夹:当勾选创建文件夹后,会为每一个视频创建一个单独的文件夹,提取的帧会存在这个单独文件夹中,文件夹名称为视频名称_当前帧_结束帧_间隔的格式。未勾选时,不同视频所提取的图像均存在同一个文件夹中(result文件夹)。视频抽帧界面快捷键:数字1:上一个视频。数字3:下一个视频。Q:上一帧。E:下一帧。A:开始帧。D:结束帧。空格:提取当前帧。3训练与模型转换3.1训练点击训练按钮进入训练窗口。选择试用平台,有五种,(一定要与自己的标注模式对应)。预训练模型选择官方发布的对应的模型或者自己已经训练过得到的模型,注意:需要对应平台。Cfg(可以不选):cfg和预训练模型必须至少选择一个。Cfg是自己设计的模型,也可以选择官方发布的cfg。模型中不能包含自己设计的模块只能使用yolo11官网项目代码中已有的模块。【新手禁选】训练数据选择:选择随机分配后得到的数据(注意是v5还是v8及以上的),选择那个xxx.yaml文件,如果数据被移动过位置,那就需要更改xxx.yaml文件中的path路径,分类状态下选择包含train文件夹和val文件夹的那个文件夹。训练次数:一般选300,预训练时可以少于300。训练批次:根据自己显卡显存设置,可以先默认8看显存够不够,如果还有多于显存可以设置大一点,如果显存不够设置小一点。采用gpu训练时出现训练速度很慢的情况一般是显存爆了,需要降低批次。图像大小:默认即可训练设备:采用gpu训练输入0或者0,1,后者是多gpu模式。输入cpu则采用cpu训练。出现cuda不能使用的错误请使用cpu训练。优化器:默认即可。Workers:加载数据所用进程数,根据自己cpu设置,适当设置可以加快训练时数据加载速度。早停:默认100,可以自行设置,早停是模型效果没长进后最长训练次数,超过该次数模型会停止训练,用来防止过拟合用的。项目地址和名称:训练后保存结果的位置,默认在文档文件夹下的yolo文件夹中。超参数设置:里面包含多种超参数设置,一般保持默认即可,特殊项目可自行设置,具体参数意思网上自己查。单击开始训练,等待片刻即可训练,单击结束等待片刻后会结束训练。示例:3.2模型转换把pt模型转换成其它模型。目前在v5平台上支持转换
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- (新)手术室医院感染管理工作计划
- 2026年广告评估冷链运输合同
- 2026年保险运营跨境物流服务协议
- 2026年钢铁检测系统集成协议
- 村居联防联治工作制度
- 村残疾人协会工作制度
- 预防犯罪五项工作制度
- 领导带班值班工作制度
- 鸭苗放养人员工作制度
- 肇庆市广宁县2025-2026学年第二学期三年级语文第七单元测试卷(部编版含答案)
- 广东省广州市黄埔区第八十六中学2024-2025学年八年级下学期4月期中物理试题(含答案)
- 2026年广东食品药品职业学院单招职业技能测试题库附参考答案详解(a卷)
- 深海采矿生态修复技术的可行性研究
- GB/T 45899-2025麻醉和呼吸设备与氧气的兼容性
- 《陆上风电场工程概算定额》NBT 31010-2019
- DZ∕T 0142-2010 航空磁测技术规范(正式版)
- 二次安全措施票培训
- 残疾学生送教上门备课、教案
- 口腔前台接诊流程和话术培训
- 保洁礼节礼仪培训
- 土建劳动力计划表劳动力安排计划及劳动力计划表
评论
0/150
提交评论