人工智能的评估模型_第1页
人工智能的评估模型_第2页
人工智能的评估模型_第3页
人工智能的评估模型_第4页
人工智能的评估模型_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能的评估模型评估介绍在评估中

本阶段,我们将探讨评估人工智能模型的不同方法。模型评估是一个不可或缺的过程。

这是模型开发过程的一部分。它有助于找到最能代表我们数据的模型,并且

如何

出色地

被选中的

模型

会奏效

未来什么

评估?评估

过程

理解

可靠性

任何

人工智能

模型,

基于

输出

经过

喂养

将测试数据集输入模型并与实际答案进行比较。

评估方式可以多种多样。

根据模型类型和用途的不同,采用不同的技术。请记住,不建议这样做。

使用我们构建模型时所用的数据来评估模型。这是因为我们的模型将简单地……

记住整个训练集,因此总能预测出任何点的正确标签。

训练

放。

已知

作为

过度拟合。当模型既不能从训练数据集中学习,也不能很好地泛化到测试数据集上时,就称为欠拟合。完美拟合是指模型从训练数据中识别出模式,但最终不会记住更细微的细节。这样一来,就能确保模型具有普适性,并能准确预测其他数据样本。0304模型

评估

术语这

设想想象

向上

一个

人工智能

基于

预言

模型

哪个

到过

已部署

一个

森林

该地区易发生森林火灾。现在,该模型的目标是预测森林火灾是否会发生。

无论是否逃出森林。现在,为了解该模型的效率,我们需要检查……

它所做的预测是否正确,取决于具体情况。因此,我们需要满足两个条件:

思考:预测与现实。预测是机器给出的输出结果,

现实情况是指做出预测时森林中的真实场景。现在让我们来看看……

各种各样的

组合

我们可以

这些

状况。案件

1:

那里

一个

森林火灾?这里,

我们

图片

一个

森林

破碎的

出去

森林。

模型

预测

一个

是的

这意味着发生了森林火灾。预测与实际情况相符。因此,这种情况是

称为

作为

真的

积极的。案件

2:

那里

一个

森林火灾?这里

那里

森林

因此

现实

不。

案件,

机器

预测

正确地

否。

所以,

这种情况

被称为

作为

真的

消极的。案件

3:

那里

一个

森林火灾?实际情况是,这里并没有森林火灾。但机器错误地预测有森林火灾发生。

一个

森林

火。这

案件

被称为

错误的

积极的。案件

4:

那里

一个

森林火灾?这里,

一个

森林

破碎的

出去

森林

因为

哪个

现实

是的

机器

错误地预测为“否”,这意味着机器预测没有森林火灾。

所以,

本案

变成

错误的

消极的。困惑

矩阵预测与现实的比较结果可以记录在我们称之为……的记录中。

混淆矩阵。混淆矩阵可以帮助我们理解预测结果。让

我们

现在拿一个

困惑

矩阵:预言

现实可能

容易地

一起映射

帮助

困惑

矩阵。评估

方法森林场景:认为

模型

总是

预测

那里

火。

现实,

那里

一个

2%

机会

森林

打破

出去。

案件,

为了

98

案例,

模型

将要

没错,但……

那些

2

案例

哪个

那里

曾是

一个

然后是森林火灾

模型预测

火。这里,真阳性率=0

真阴性=98

全部的

病例数=

100所以,

准确性

变为:(98)

+

0)

/

100

=

98%对于人工智能模型来说,这是一个相当高的准确率。但这个参数对我们来说毫无用处,因为实际情况并非如此。

火灾发生地点并未被考虑在内。因此,有必要考虑其他因素。

范围

哪个

考虑

这样的

案例

也一样。森林场景:假设该模型总是预测存在

无论实际情况如何,这都是一场森林火灾。在这种情况下,所有积极因素都将被考虑在内。

也就是说,区分真阳性(预测=是且实际情况=是)和假阳性(预测=是)。

现实

=

不)。

案件,

消防员

将要

查看

为了

全部

时间

如果

警报

曾是

真的

或错误。假设一个模型具有100%的精度。这意味着,无论机器何时说:

一个

火,

那里

实际上

一个

(真的

积极的)。

相同的

模型,

那里

一个

稀有的

非凡的

案件

在哪里

那里

曾是

实际的

系统

可以

不是

探测

它。

案件

一个

错误的

消极的

健康)状况。

精确

价值

不是

做作的

经过

因为

不是

前线

进入

帐户。

精确

然后是

好的

参数

模型性能如何?现在我们注意到,精确率和召回率的分子是相同的:True

优点。

分母,精度

计数

错误的

优点

尽管

记起

需要

错误的

缺点

进入

考虑。哪个

指标

重要的?选择精确率还是召回率取决于模型所处的条件。

已部署。

一个

案件

喜欢

森林

火,

一个

错误的

消极的

成本

我们

一个

很多

风险

也。

想象

警报

存在

即便

什么时候

有一个

森林

火。

所有的

森林

可能

烧伤

向下。假阴性结果可能造成危险的另一个例子是病毒爆发。想象一下,一种致命病毒……

开始

传播

模型

哪个

据称

预测

一个

病毒性的

暴发

未检测到

它。

病毒

可能会传播

广泛地

感染

很多

人。另一方面,有时假阳性造成的损失可能比假阳性更大。

负面因素。采矿就是一个例子。想象一下,一个模型告诉你,在某个点存在宝藏。

你继续深入调查,结果却发现是虚惊一场。这就是假阳性案例。

(预测)

那里

宝藏

但是那里

没有

宝藏)

非常

昂贵。同样地,我们考虑一个预测邮件是否为垃圾邮件的模型。如果该模型总是预测邮件是垃圾邮件,那么它就不是垃圾邮件。

如果邮件是垃圾邮件,人们就不会查看,最终可能会丢失重要信息。

这里

错误的

积极的

状况

(预测)

邮件

作为

垃圾邮件

尽管

邮件

不是

垃圾邮件)

一个

高的

成本。综上所述,我们必须指出,如果我们想知道我们的模型性能是否良好,

我们需要这两个指标:召回率和精确率。在某些情况下,精确率可能很高。

低的

记起

或者

低的

精确

高的

记起。

自从

两个都

措施

重要的,

那里

一个

需要

参数

这需要精度

记起

进入

帐户。让

我们

探索

我们的变化

拥有

F1

分数:精确记起F1

分数低的低的低的低的高的低的高的低的低的高的高的高的在

结论是,我们可以

一个

该模型有

好的

如果表现

F1

分数

为了

模型是

高的。1.Rajat建立了一个模型来预测印度板球运动员在即将到来的比赛中的表现。他收集了球员在球场、投球手、对手球队和健康状况等方面的表现数据。他的模型具有良好的准确率和精确度。以下哪个说法是错误的?收集到的有关体育场、保龄球手、对手球队和健康状况的数据称为测试数据。用于检验人工智能模型准确性和精确度的数据是测试数据。在数据采集阶段获取训练数据和测试数据。训练数据总是比测试数据大。2.陈述1:人工智能模型给出的输出被称为现实。陈述2:真实情况被称为预测。(a)陈述1和陈述2都正确(b)陈述1和陈述2均不正确(c)陈述1正确,但陈述2错误(d)陈述2正确,但陈述1错误3.F1分数衡量的是以下两者之间的平衡:(a)准确度和精确度(b)精确率和召回率(c)召回率和准确率(d)回忆与现实

练习作业:4.Sarthak开发了一个人脸口罩检测系统,为此他收集了数据集,并使用整个数据集训练模型。然后,他使用相同的数据集评估模型,结果始终正确,但无法处理未知数据集。请说出这个概念的名称。5.哪个评价参数考虑了所有正确的预测?6.以下哪种情况会导致较高的误报成本?(a)病毒爆发(b)森林火灾(c)洪水(d)垃圾邮件过滤器7.根据以下数据绘制混淆矩阵•真阳性数=100•真阴性数量为47•假阳性数量=62•假阴性数量=2908.人工智能模型对他们最近推出的一款新型手机做出了如下销售预测:确定模型做出错误预测的总数。(ii)计算精确率、召回率和F1分数。

计算给定问题的准确率、精确率、召回率和F1分数。情景一:学校经常出现缺水的情况。在一些地方,学校缺水问题十分普遍且突出。因此,我们设计了一个人工智能模型来预测学校近期是否会出现缺水情况。该模型的混淆矩阵如下:情景二:如今,我国部分地区的洪灾问题日益严重。洪灾不仅会破坏当地环境,还会迫使人们离开家园,迁徙他处。为了应对这一问题,我们开发了一种人工智能模型,可以预测是否存在洪灾风险。该模型的混淆矩阵如下:设想

3:人们经常会遇到突如其来的暴雨。人们洗衣服,然后把衣服晾晒在室外。

干燥

到期的

意外

雨,

他们的

工作

获得

浪费了。

因此,

一个

人工智能

模型

到过

创建

哪个

预测

如果

那里

或不。

困惑

矩阵

相同的

是:设想

4:如今,交通拥堵已成为我们生活中司空见惯的一部分。居住在城市地区意味着……

交通

每个

每一个

时间

得到

出去

路。

大多,

学校

学生

选择

为了

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论