人工智能基础与应用教程 课件 第2章 人工智能核心技术_第1页
人工智能基础与应用教程 课件 第2章 人工智能核心技术_第2页
人工智能基础与应用教程 课件 第2章 人工智能核心技术_第3页
人工智能基础与应用教程 课件 第2章 人工智能核心技术_第4页
人工智能基础与应用教程 课件 第2章 人工智能核心技术_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章人工智能核心技术CONTENTS目录01

本章学习目标02

机器学习:AI的核心支撑技术03

深度学习:AI突破的关键驱动力04

自然语言处理:人机语言交互的桥梁05

计算机视觉:机器“看”世界的技术06

语音识别:让机器听懂人类语言CONTENTS目录07

大模型:AI能力涌现的新形态08

其他人工智能相关技术09

本章小结本章学习目标01本章导读:AI核心技术的发展脉络

AI技术革命的时代背景从早期编程任务到自主决策系统,AI正引领新一轮技术革命,通过关键技术实现数据自动学习与智能决策本章核心技术模块概览涵盖机器学习、深度学习、自然语言处理、计算机视觉、语音识别、大模型及其他相关技术,全面呈现AI技术框架学习目标:明确本章掌握要点核心关系与分类逻辑理解AI与机器学习的包含关系,掌握机器学习核心分类(监督、无监督、半监督学习)的含义技术原理与结构认知掌握典型机器学习算法、人工神经网络基本结构、计算机视觉工作原理,了解自然语言处理主要任务类型前沿技术与拓展认知认识大模型核心特点及分类,了解语音识别原理、脑机接口与知识图谱等相关技术基本概念机器学习:AI的核心支撑技术02机器学习概述:定义与核心能力

机器学习的定义与核心目标是让计算机从数据中自动学习并预测决策的技术,核心目标是无需明确编程即可识别模式规律,构建适配新数据的模型

机器学习的核心能力与应用场景具备自适应、自动化和泛化能力,广泛应用于图像识别、自然语言处理、推荐系统、自动驾驶等领域机器学习与AI的关系:分支与核心实现手段

机器学习与AI的包含关系机器学习是AI的重要分支和核心实现手段,AI是更广泛的研究领域,包含多种技术方法

机器学习的典型应用案例覆盖推荐系统(如视频商品推荐)、自然语言处理(如Google翻译、Siri)、计算机视觉(如自动驾驶障碍物识别)等六大领域机器学习的发展历程:从理论到深度学习大模型

早期思想与理论基础(1940—1960年)以图灵测试、赫布型学习规则、感知机模型为标志,奠定神经网络发展基础知识工程与符号主义(1960—1980年)聚焦基于规则的专家系统,经典算法如K近邻、决策树在此阶段提出统计学习与神经网络突破(1980—1990年)反向传播算法解决多层神经网络训练问题,支持向量机、贝叶斯网络等技术涌现数据驱动与集成学习兴起(2000年起)互联网普及带来海量数据,集成学习(随机森林、AdaBoost)与非监督学习(PCA、K-means)得到发展深度学习崛起(2010年起)ImageNet竞赛中卷积神经网络夺冠,循环神经网络、生成对抗网络、强化学习(AlphaGo)取得突破性进展现代机器学习与AI广泛应用(2020年起)Transformer模型引领NLP飞跃,多模态学习、自动化机器学习兴起,伦理与公平性成为研究热点机器学习技术分类:三大核心学习方式

监督学习:依赖标注数据的训练方式利用输入与输出配对的标注数据训练,分为分类(如水果识别)与预测(如房价预测)问题

无监督学习:挖掘数据内在结构的学习方式无需标签数据,通过关联学习(如社交好友推荐)与聚类学习(如银行客户分群)分析数据模式

半监督学习:融合标注与无标注数据的学习方式利用少量有标签数据与大量无标签数据构建模型,在NLP、医学图像分析等标记成本高的场景中价值显著常见机器学习算法(一):线性回归与K近邻

线性回归:连续型输出的线性建模假设目标值为特征线性组合,通过最小化均方误差找到最佳拟合直线,如房地产公司用“售价=4×房屋面积”预测房价

K近邻算法:基于距离的分类回归方法通过测量特征距离分类,K值选择敏感,优点是简单易实现、支持多分类,缺点是计算量大、对参数敏感常见机器学习算法(二):决策树与支持向量机决策树:可解释性强的树形分类模型以属性为结点构建分类模型,叶子结点表征类别,如贷款审批模型通过年龄、房产、收入等特征决策,可解释性好支持向量机:最大化间隔的分类器核心是找到特征空间中间隔最大的线性分类器,通过核技巧实现非线性分类,支持向量为距离超平面最近的训练样本点常见机器学习算法(三):集成学习与随机森林

集成学习:结合弱分类器提升性能通过集成多个弱分类器提高整体模型准确率,随机森林是其典型应用,采用有放回抽样与随机特征选择增强泛化能力

随机森林的预测策略分类任务采用多数投票法,回归任务取预测值平均值,可同时处理分类与回归问题,如预测房价、温度等连续数值深度学习:AI突破的关键驱动力03深度学习概述:定义与核心优势

深度学习的定义与核心逻辑是机器学习的重要分支,以人工神经网络为核心,模拟人脑神经元连接方式,从原始数据中自动提取多层次抽象特征

深度学习与传统机器学习的区别传统机器学习依赖人工设计特征,深度学习自动提取特征,在处理高维、复杂数据(图像、文本、语音)时表现更出色深度学习与AI、机器学习的关系三层技术的包含关系深度学习是机器学习的子领域,机器学习是AI的分支,三者呈“深度学习→机器学习→AI”的包含关系深度学习的崛起意义早期AI依赖人工规则,传统机器学习处理高维数据能力有限;2012年以来,深度学习模型推动AI从实验室走向产业应用,如自动驾驶、智能语音助手人工神经网络:深度学习的核心结构

人工神经网络的生物灵感与结构灵感来自人脑神经元,由输入层、隐藏层、输出层组成,输入层接收外部数据,隐藏层核心处理信息,输出层生成最终结果

神经网络的主要类型分为前馈型(无反馈,如卷积神经网络)和反馈型(有反馈,如Hopfield网络),具备非线性、并行处理、容错性等特征卷积神经网络:擅长图像任务的深度学习模型

卷积神经网络的架构与数据传递输入图像经卷积层、池化层处理得到特征图,最后通过全连接层输出分类结果,如识别鸡排、鸡腿、鸡翅的图像分类实例

核心组件的功能解析卷积层提取局部特征并共享权重,池化层降低特征图大小增强鲁棒性,全连接层连接特征提取与分类/回归阶段生成对抗网络:生成逼真数据的创新模型生成对抗网络的核心框架由生成器(G)和判别器(D)组成,G生成模拟数据,D判别数据真假,通过对抗训练提升生成数据的逼真度生成对抗网络的工作原理以图像生成为例,G接收随机噪声生成图像,D判断图像是否真实,二者博弈使G生成的图像逐渐逼近真实数据自然语言处理:人机语言交互的桥梁04自然语言处理概述:交叉领域与核心任务

NLP的交叉领域属性是计算机科学、AI与语言学的交叉领域,目标是让计算机理解、生成和交互自然语言,实现人机自然交流

核心任务分类:理解与生成自然语言理解包括词性标注、信息抽取、分词、文本分类等;自然语言生成包括机器翻译、语音识别、问答系统、自动摘要等机器翻译:跨语言沟通的技术实现

机器翻译的定义与优势利用计算机技术自动转换源语言与目标语言,核心优势是高效性与低成本,现代技术已接近人工翻译效果

技术演进的三个阶段从基于规则(依赖语法规则与词汇库)、基于统计(分析双语文本统计关系)到基于神经网络(Transformer模型提升准确性),神经机器翻译成为当前主流智能问答:所问即所得的交互体验

智能问答的核心目标区别于搜索引擎返回链接,直接提供准确简洁的答案,实现“所问即所得”,如回答“地球直径”直接返回具体数值智能问答系统的主要类型包括基于知识库(依赖预定义知识库)、基于检索(从文本数据检索片段)、基于对话(多轮交互理解上下文)、基于生成(实时生成答案)四类系统计算机视觉:机器“看”世界的技术05计算机视觉概述:定义与人类视觉的差异

计算机视觉的定义与核心功能使计算机从图像、视频中获取信息的技术,在自动驾驶、安防监控、医疗诊断等领域发挥重要作用,赋予机器洞察世界的能力

与人类视觉的对比分析人类视觉通过长期环境训练分辨物体,计算机视觉通过大量图像数据快速训练,在检测细微缺陷、高精度识别任务中超越人类计算机视觉的工作原理与核心任务

工作原理的两大核心技术依赖机器学习(从数据中学习视觉信息上下文)与卷积神经网络(分解图像像素,通过卷积运算提取特征)实现图像理解

计算机视觉的核心任务包括图像分类与识别、物体检测与分割、人体分析、三维计算机视觉、视频理解与分析五类,覆盖从静态图像到动态视频的处理语音识别:让机器听懂人类语言06语音识别概念与原理语音识别的定义与多学科属性让智能设备听懂人类语音的技术,涉及数字信号处理、AI、语言学等多学科,应用于自动客服、语音翻译等领域基于模式匹配的核心原理本质是基于语音特征参数的模式识别,流程包括预处理(分帧、加窗等)、特征提取(MFCC等参数)、模式匹配(失真判决准则识别)语音识别技术的主要类型

模型匹配法与概率统计方法模型匹配法包括动态时间规整(非线性规整技术)、矢量量化(信号压缩技术);概率统计方法包括高斯混合模型、隐马尔科夫模型

判别器分类方法包括支持向量机、人工神经网络、深度神经网络等,深度神经网络替换GMM模型建模观测概率,提升识别性能大模型:AI能力涌现的新形态07大模型的特点与发展历程大模型的核心特点具备巨大规模(数十亿参数)、涌现能力(突破规模后产生复杂能力)、多任务学习、大数据训练、强大计算资源依赖等特点大模型的发展历程从早期理论探索(1940—1960年)、深度学习兴起(2006年起)、迈向更大规模(2015年后)到超大规模模型时代(2018年至今),参数从数十亿增长到上万亿大模型的分类与常用模型大模型的主要分类按输入数据类型分为语言大模型(处理文本,如GPT系列)、视觉大模型(处理图像,如ViT系列)、多模态大模型(处理多类型数据,如DALL·E)常用大模型的生态布局涵盖OpenAI、Google、百度、阿里巴巴等机构的模型,如ChatGPT-4.0推理能力强、文心一言结合中文语境、通义千问代码能力突出其他人工智能相关技术08脑机接口与知识图谱技术

脑机接口技术:脑与外部设备的直接连接在人或动物脑与外部设备间建立直接通道,实现信息交换,应用于神经康复、残疾辅助、人机交互等领域

知识图谱:结构化的语义知识库以结点和边组成图结构,描述概念及其相互关系,实现语义表示与推理,应用于数据挖掘、信息检索、智能问答等领域人机交互与自主无人系统技术

人机交互:优化系统与用户的交互关系研究系统与用户交互关系的学科,通过用户界面设计、AI技术等优化交互体验,提升人机交互的方便性与高效性

自主无人系统:无需人工干预的自主运行借助先进技术实现

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论