版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
机器学习概述第1章数据驱动自动学习智能决策章节导航01什么是机器学习定义、核心概念与传统编程的区别02机器学习的主要类型监督学习、无监督学习、半监督学习、强化学习03机器学习的应用领域图像识别、数据分析、推荐系统04发展历程与当前趋势从萌芽期到大模型时代的演进1.1什么是机器学习核心定义
机器学习赋予计算机从数据中自动学习的能力,无须明确编程指令核心映射函数f:X→Y建立输入特征到输出目标的映射关系传统编程vs机器学习传统编程•明确规则•人工编写•确定性结果机器学习•原始数据•数据驱动•概率性预测垃圾邮件过滤模型分析数万封邮件关键词频率,学习区分垃圾邮件的概率阈值金融风控使用XGBoost模型,通过用户收入、负债比等特征计算信用评分典型任务分类、回归、聚类、降维1.2.1监督学习定义利用标注数据集进行训练,学习输入到输出的映射函数监督学习数学表达式y=f(x;θ)+εθ:模型参数|ε:噪声项回归模型示例ŷ=w₁x₁+w₂x₂+b多元线性回归预测模型分类任务输出离散类别例:ResNet对ImageNet进行1000类物体识别回归任务输出连续值例:股票价格预测、房价预测
典型应用示例ResNet图像识别在ImageNet竞赛中实现1000类物体识别,准确率大幅提升金融预测模型使用多元线性回归预测股票价格、期货走势局限性•依赖大量标注数据,标注成本高•难以处理未知类别(开放集识别问题)1.2.2无监督学习定义利用未标注数据训练,发现数据潜在结构或模式无监督学习数学表达式X={x₁,x₂,...,xₙ}X:输入数据集(无标签)核心目标通过学习数据分布或结构来揭示内在规律聚类任务将数据划分为若干组,同组内相似性高,不同组相似性低降维任务将高维数据映射到低维空间,保持原有数据结构
典型应用示例电商平台客户分群按购买行为和浏览习惯对顾客进行分类,提供个性化推荐PCA数据可视化主成分分析用于数据可视化或噪声过滤,揭示数据结构局限性•缺乏明确的评估标准,模型性能难以量化•对数据分布假设较强,可能无法适应复杂数据结构1.2.3半监督学习定义结合监督学习和无监督学习特点,利用少量标注数据和大量未标注数据半监督学习数学表达式
核心目标通过未标注数据提升模型的泛化能力
典型应用示例医学影像分析标注每张影像成本很高,半监督学习可有效利用未标注影像数据,提高模型泛化能力自然语言处理在文本分类任务中,标注大量文本数据成本较高,可利用未标注文本数据提升模型性能局限性•对未标注数据质量依赖性高,噪声数据可能影响模型性能•在标注数据极少的情况下,模型可能难以收敛1.2.4强化学习定义通过与环境交互,不断试错学习策略,以最大化累积奖励
强化学习数学表达式
最大化累积奖励的期望值
关键概念策略π—选择动作的规则
典型应用示例AlphaGo围棋通过自我对弈训练,击败人类世界冠军李世石OpenAIFive在Dota2游戏中战胜人类业余冠军战队自动驾驶通过与道路环境交互学习驾驶策略机器人控制优化工业生产和复杂操作任务局限性•训练过程需要大量交互数据,计算成本高•在复杂环境中,模型可能难以收敛或陷入局部最优1.3机器学习的应用领域图像识别自动驾驶识别行人、车辆、交通信号灯等道路目标安防监控人脸识别、异常行为检测、智能监控医疗影像辅助诊断、病灶检测、影像分析数据分析金融预测分析历史数据,预测股票、期货价格走势电商营销分析用户行为,预测需求,精准营销推荐数据挖掘从大规模数据中提取有价值的模式和洞察推荐系统视频推荐抖音个性化视频推荐,提升用户观看体验商品推荐电商平台的个性化商品推荐服务音乐推荐基于用户偏好,智能推荐音乐内容1.4.1机器学习的发展历程萌芽期1950-1970年代1950图灵测试机器能否思考的哲学基础1957感知机神经网络的开端1967K-NN算法基于实例的学习方法朴素贝叶斯统计学习理论兴起黄金期1980-1990年代1982Hopfield网络能量函数稳定的神经网络1986反向传播算法神经网络训练的突破1995支持向量机SVM最优分类算法1997随机森林集成学习的先驱复兴期2000-2020年2006深度置信网络DBN深度学习时代开启2012AlexNetImageNet竞赛里程碑2016AlphaGo击败人类围棋冠军2017Transformer架构大语言模型核心组件大模型时代2020至今2020GPT-31750亿参数,强大生成能力2021AlphaFold2蛋白质结构预测突破2023ChatGPT/LLaMA多模态任务展现强大泛化能力迈向AGI通用人工智能的探索1.4.2机器学习的当前趋势大模型与少样本学习•GPT-4参数规模达1.8万亿•零样本学习、少样本学习技术成熟•解决标注数据稀缺问题多模态学习•整合文本、图像、视频、音频•CLIP模型实现文本与图像联合表示•应用于智能助手、医疗诊断可解释性与可信AI•SHAP、LIME量化特征贡献•提升模型透明度•关注公平性、鲁棒性强化学习广泛应用•游戏领域扩展到现实任务•机器人控制、自动驾驶•工业优化决策边缘计算与联邦学习•模型部署到设备端•保护数据隐私•分布式训练优化
未来发展方向:在保证性能的同时提升模型的可解释性、可信度与效率,推动AI技术落地应用本章总结核心概念机器学习赋予计算机从数据中自动学习的能力建立输入到输出的映射函数f:X→Y
数据驱动学习,无需明确编程指令四种学习类型•监督学习•无监督学习•半监督学习•强化学习三大应用领域•图像识别•数据分析•推荐系统发展趋势大模
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中八年级《道德与法治》上册第一单元“成长的节拍”整体教学设计
- 初三物理中考二轮复习专题:物态变化与内能易错点深度剖析与能力建构教案
- 游泳池专项施工方案
- 初中八年级地理(人教版)核心素养知识清单
- 桥梁应急抢修演练脚本
- 八年级地理中图版(2024)上册《世界气候类型·空间秩序与人地关系》导学案
- 八年级历史与社会下册《双雄革故 俄域新风──俄国改革》教学设计
- 《‘多’姿‘多’彩的世界-多边形与圆的本质探索》导学案(北师大版·七年级上册)
- 2026年国际汉语教师资格考试(对外汉语教学理论)试题及答案
- 2026年【G1工业锅炉司炉】考试题库(附答案)
- 水运工程结构防腐蚀施工规范 JTS-T 209-2020
- 2025年企业内部员工信息安全制度手册
- 私人办理转学协议书
- 脑机接口科普
- 2025年广东省自考《审计学原理06069》真题和答案
- 血行播散型肺结核护理查房
- 北京市城市协管员笔试题库及答案
- 上海第三女子初级中学七年级下册数学期末试卷真题汇编解析版
- 韩语文化学习的心得体会
- 小儿人工洗胃法的护理
- 医院保洁服务体系与实施策略
评论
0/150
提交评论