《人工智能导论(第2版)》课件-附录_第1页
《人工智能导论(第2版)》课件-附录_第2页
《人工智能导论(第2版)》课件-附录_第3页
《人工智能导论(第2版)》课件-附录_第4页
《人工智能导论(第2版)》课件-附录_第5页
已阅读5页,还剩32页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

使用LabelMe标注图像1.安装LabelMe1.打开AnacondaNavigator,选定环境,例如“ai”,单击后面的三角形图标,选中:“OpenTerminal”2.在打开的命令窗口中,输入安装命令:pipinstalllabelme3.安装结束以后,输入命令:labelme2.导入图像执行标注安装辅助编程插件1.VSCode辅助编程插件AI辅助编程工具的出现,正在重塑传统的编程教学模式,它们不仅能够自动生成代码,还为学习者提供实时的代码建议、错误修正和算法优化,大大降低了编程学习的门槛CodeGeeX作为国产AI编程助手的佼佼者,由清华大学知识工程组研发,具有鲜明的本土化优势。它支持中英双语交互,对中文技术文档有更好的理解能力,特别适合母语为中文的学习者使用下面以CodeGeeX为例,讲解这一插件的安装和使用方法2.安装CodeGeeX3.使用CodeGeeX4.新建文件,使用注释生成代码5.提示词生成代码并保存为文件常用数据集1.常用数据集机器学习工具sklearn内置了多个经典数据集。这些数据集涵盖了回归和分类两大机器学习任务,每个数据集都有其特定的应用场景和特点通过sklearn.datasets模块可以方便地加载这些数据集,下面分别介绍常用的回归和分类数据集数据集是机器学习的基础,如同模型的“燃料”;高质量、有代表性且经过清洗的数据,直接决定了模型的学习效果和最终性能上限2.回归问题数据集每个样本有10个特征数值,这些特征数值是患者的生理指标,例如年龄、性别、体重指数、血压等。标注是患者一年后的病情进展指标,是一个连续数值糖尿病数据集是一个经典的回归数据集,用于预测糖尿病患者一年后的病情进展。该数据集包含442个样本数据下列代码中,第一行是注释,后面是代码生成插件CodeGeeX根据这个注释自动生成的代码:#导入糖尿病数据集,打印前五行数据和标注fromsklearn.datasetsimportload_diabetesdata=load_diabetes()print(data.data[:5])print(data.target[:5])2.回归问题数据集这个数据集的核心问题是:给定一个人的体重、腰围和脉搏(数据X),能否预测他做引体向上、仰卧起坐和跳跃的能力(标注Y)Linnerud体能数据集是一个多输出回归数据集,主要用于研究人体生理指标与运动能力之间的关系。该数据集包含20名中年男性的体重、腰围和脉搏三个生理指标和引体向上、仰卧起坐和跳跃次数三个运动能力指标,所有数据均为连续型数值#导入linnerud体能数据集,数据保存到变量X,标注保存到变量y,#并打印数据和标注的前5个fromsklearn.datasetsimportload_linnerudX,y=load_linnerud(return_X_y=True)print(X[:5])print(y[:5])该数据集规模有限,但其多输出特性使其成为研究特征与多目标变量间复杂关系的典型案例2.分类问题数据集每个样本记录了一朵鸢尾花的四个特征:萼片长度、萼片宽度、花瓣长度和花瓣宽度,以厘米为单位。标注是鸢尾花的品种类别,用0、1、2分别对应上述三个品种鸢尾花数据集是机器学习领域最具代表性的分类数据集之一,包含150个样本,分为三个类别:山鸢尾、变色鸢尾和维吉尼亚鸢尾,每类50个样本#加载鸢尾花数据集,查看前5条数据和标注fromsklearn.datasetsimportload_irisdata=load_iris()print(data.data[:5])print(data.target[:5])2.分类问题数据集每个样本有30个特征,这些特征描述了细胞核的特征,例如半径、纹理、周长、面积、光滑度等。标注是0或1,0表示恶性,1表示良性乳腺癌数据集是一个经典的二分类数据集,用于预测乳腺肿瘤是良性还是恶性。该数据集包含569个样本#加载乳腺癌,查看前2条数据和标注fromsklearn.datasetsimportload_breast_cancerdata=load_breast_cancer()print(data.data[:2])print(data.target[:2])生成回归流程代码1.回归问题和回归数据集机器学习工具sklearn中内置的糖尿病数据集和Linnerud体能数据集都是回归数据集,可以用于训练回归模型sklearn中内置的数据集都已经做了标注。导入以后,需要随机打乱次序,然后划分训练集和测试集回归问题预测连续值,例如,预测鱼的重量,预测气温,预测房价都是回归问题2.训练回归模型的步骤调用工具定义的函数,导入数据和标注1.导入数据集首先对数据和标注同步随机排序,然后划分数据集,形成训练集数据,训练集标注,测试集数据,测试集标注,下图是对糖尿病数据集的划分2.划分数据集2.训练回归模型的步骤机器学习工具为每种机器学习方法定义了专门的类,先确定好回归算法,例如线性回归法,然后使用对应的类创建对象3确定机器学习方法并创建对象调用定义好的函数创建对象,使用训练集数据和标注训练模型,得到模型参数4.使用训练集数据和标注训练模型2.训练回归模型的步骤使用训练好的模型对测试集数据执行预测,形成预测结果5.预测测试集数据通过比较测试集标注和预测结果评估预测模型性能一种朴素的评估方法是打印输预测结果和测试集标注进行直观比较,但是这种方法依赖人工判断,难以量化整体性能,尤其在数据量大时容易遗漏细节有两种常用的评估方法:平均绝对误差和平均平方误差,前者是对每个数据的标注和预测结果相减以后取绝对值,然后对整个测试集计算平均值。后者是对标注和预测结果相减以后求平方,再计算平均值6.评估预测模型3.编写注释生成代码#导入sklearn糖尿病数据集#随机打乱数据集,同时确保数据和标注的对应关系#将数据集分为训练集和测试集#导入线性回归模型#训练模型#预测测试集#分别打印预测和真实值的前5个结果#计算平均绝对误差生成分类流程代码1.分类问题和分类数据集机器学习工具sklearn中内置的鸢尾花数据集和乳腺癌数据集都是分类数据集,可以用于训练分类模型sklearn中内置的数据集都已经做了标注。导入以后,需要随机打乱次序,然后划分训练集和测试集分类问题预测离散值,例如,预测手写数字是0-9的哪个类别,预测病人是否有乳腺癌,预测图像上是哪种类别的物体,都是分类问题2.训练分类模型的步骤调用工具定义的函数,导入数据和标注1.导入数据集首先对数据和标注同步随机排序,然后划分数据集,形成训练集数据,训练集标注,测试集数据,测试集标注,下图是对鸢尾花数据集的划分2.划分数据集2.训练分类模型的步骤机器学习工具为每种机器学习方法定义了专门的类,先确定好分类算法,例如逻辑回归分类法,然后使用对应的类创建对象3确定机器学习方法并创建对象调用定义好的函数创建对象,使用训练集数据和标注训练模型,得到模型参数4.使用训练集数据和标注训练模型使用训练好的模型对测试集数据执行预测,形成预测结果5.预测测试集数据2.训练分类模型的步骤通过比较测试集标注和预测结果评估预测模型性能,分类预测结果的评估方法有混淆矩阵和精度得分等方法6.评估预测模型右图是二分类问题混淆矩阵示意图。混淆矩阵的主对角线第一行第一列、第二行第二列是预测正确统计结果,而其他位置是预测错误的统计结果精度是预测所有类别的准确程度,是预测正确的总数占测试集总数的百分比,即:精度=(TP+TN)/(TP+FN+FP+TN)3.编写注释生成代码#导入sklearn鸢尾花数据集#随机打乱数据集,同时确保数据和标注的对应关系#将数据集分为训练集和测试集#导入逻辑回归分类模型#训练模型#预测测试集#分别打印预测和真实值的前5个结果#计算混淆矩阵和精度部署和使用物体检测模型1.物体检测技术回顾单元3任务1学习了物体检测技术,并使用在线开放平台实现了图像中检测物体这一课将部署一个训练好的物体检测模型,通过编写代码,实现物体检测2.深度学习模型的训练和部署深度学习模型的训练和部署是人工智能应用中的两个关键环节,它们对计算资源的需求存在显著差异。训练一个高性能的深度学习模型往往需要海量的数据和强大的计算能力以物体检测为例,主流的模型如YOLO或FasterR-CNN在训练阶段通常需要数万甚至数百万张标注图像,以及多块高性能GPU进行数小时乃至数天的持续运算当前流行的大型语言模型(LLM),如DeepSeek系列、GPT系列,在训练时更是需要TB级别的文本数据和几十万块GPU的算力支持,训练周期可能长达数周甚至数月,耗资巨大与训练过程形成鲜明对比的是,训练好的模型在部署和使用阶段对硬件的要求则大幅降低。这是因为模型推理过程主要是前向计算,不需要进行复杂的反向传播和参数更新。经过优化的模型甚至可以在没有GPU的普通笔记本电脑或嵌入式设备上流畅运行2.YOLO物体检测模型的部署YOLO(YouOnlyLookOnce)系列模型是当前最流行的开源目标检测模型之一,官方GitHub仓库能下载训练好的模型YOLO模型下载后通常会包含两个关键文件:.weights文件和.cfg文件,它们分别承担不同的功能.weights文件是模型的核心部分,存储了训练后得到的全部权重参数,包括卷积核的数值、偏置项等,这些参数决定了模型如何对输入图像进行分析和预测。这个文件本质上包含了模型从训练数据中学到的"知识",是模型能够准确检测物体的关键所在.cfg文件则是模型的配置文件,以纯文本形式定义了整个神经网络的结构。它详细描述了模型的每一层设置,包括卷积层、池化层、路由层等各种层的类型、参数和连接方式。例如,文件中会明确指定每一层的卷积核数量、尺寸、步长等关键参数,还会定义YOLO特有的锚框(anchors)参数2.任务分析鱼重量数据集保存在一个EXCEL文件中,例如“fishWeight.xls”。从表上可以看到,鱼的种类是字符串类型,必须专门安排一行注释把它转换为整数,即类别代号。然后划分数据集,如下图所示:这样就可以根据划分好的鱼类数据集,数据是:鱼的类别代号、长度1、长度2、长度3、高度、宽度,标注是重量3.任务实施鱼重量预测是一个回归问题,可以使用线性回归法训练预测模型。数据保存在EXCEL文件中,需要安装读取EXCEL文件的工具包,例如xlrd,目前的Python版本需要安装xlrd版本大于等于2.0.1。下列命令可以实现安装:pipinstallxlrd>=2.0.1可以在VSCODE中,通过注释生成代码,先读取数据,然后生成训练预测鱼的重量的完整代码训练CNN模型预测手写数字1.手写数字数据集和LeNet-5网络MINST数据集包含60,000个0-9手写数字图像,图像大小为28X28像素LeNet-5是经典卷积神经网络架构,主要用于手写数字识别任务,为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论