机器学习与应用课件第1章机器学习概述

上传人：h*** IP属地：山东上传时间：2026-06-02 格式：PPTX 页数：49 大小：1.77MB 积分：15 举报 版权申诉

已阅读5页，还剩44页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第1章

机器学习概述

从基础原理到核心算法与产业应用目录CONTENTS01机器学习导论介绍机器学习的定义、核心思想及其与人工智能的关系，帮助学习者建立对该领域的基本认知与整体框架，理解其解决问题的底层逻辑。02核心概念与理论深入探讨模型评估指标、偏差与方差的权衡法则，以及过拟合与欠拟合的成因与解决策略。掌握这些关键理论是构建高性能模型、避免常见陷阱的重要基础。03机器学习的主要类型系统讲解监督学习、无监督学习、强化学习等主流范式，对比不同学习方式的核心特征与数据要求。了解各类方法的适用场景，为后续算法选择提供清晰的判断依据。04关键算法详解详细解析从线性回归、决策树等经典传统算法，到神经网络、卷积网络等深度学习核心模型的运行原理。结合数学推导与直观案例，理解算法如何从数据中学习规律并做出预测。05机器学习项目实践介绍标准的CRISP-DM跨行业数据挖掘标准流程，从业务理解、数据获取与预处理，到模型构建、评估与部署。指导学习者如何从零开始，规范地完成一个机器学习应用项目的全流程。06应用领域与未来趋势展示机器学习在金融风控、智慧医疗、自动驾驶、推荐系统等行业的实际落地案例，直观感受技术价值。同时展望大模型、小样本学习等前沿方向，探讨机器学习未来的发展潜力与变革性影响。01机器学习导论IntroductiontoMachineLearning机器学习的定义与核心思想定义机器学习是一门研究如何通过计算手段，利用经验来改善系统自身性能的学科。其核心是从数据中自动学习内在规律，并构建对应的“模型”，从而让系统能够对新的、未知的数据做出精准的预测或合理的决策，是人工智能实现智能化落地的核心技术支撑。核心思想核心是让计算机像人类一样从经验中自主学习。传统编程是开发者编写固定的规则代码，计算机严格执行指令；而机器学习则是人类提供目标数据与预期结果，让计算机通过算法自动挖掘数据间的关联，总结出适用于同类问题的规则，完成从“人工设定规则”到“机器自主习得规则”的模式升级。通俗理解如果把传统编程比作“手把手教计算机怎么做”，需要详细列出每一步操作指令；那么机器学习就像是“给计算机看大量例子”，让它通过观察这些实例的特征和结果，自己归纳出解决问题的方法。就像教孩子认识猫，不需要描述所有细节，只需展示多只猫的图片，孩子就能学会识别新的猫。核心认知：机器学习本质是数据驱动的智能进化，它摆脱了传统编程对人工规则的强依赖，让系统具备了从经验中自我优化的能力。这种模式让计算机不再只是执行指令的工具，而是能像人一样从数据中发现规律、应对未知，成为解决复杂现实问题、推动人工智能技术落地应用的关键逻辑。与人工智能（AI）的关系人工智能(AI)人工智能是旨在创造能够模拟、延伸和扩展人类智能的宏大技术目标。它是一个极为宽泛的领域，并不局限于单一方法，而是涵盖了机器学习、专家系统、计算机视觉、自然语言处理等多个技术研究方向。机器学习(ML)机器学习是实现人工智能的核心技术与主要途径，相当于AI的“核心引擎”。它赋予了计算机从海量数据中自动发现规律、学习模式并做出预测的能力，让系统无需显式编程就能适应新环境和解决新问题。深度学习(DL)深度学习是机器学习领域中至关重要的分支，其灵感源于人脑的神经网络结构。通过构建深层的人工神经网络，它能够自动学习数据中更复杂、更抽象的特征模式，是当前推动图像识别、语音处理等AI技术突破性发展的关键前沿手段。核心关系总结三者是层层递进的包含关系：人工智能⊃机器学习⊃深度学习。其中，深度学习是解决复杂任务的强大技术工具，而机器学习则是达成人工智能宏大愿景的核心技术路径，三者共同构成了现代智能技术的发展基石。机器学习的三要素数据(Data)机器学习的基础与核心燃料，是模型训练的原材料。数据的质量高低、样本数量的多寡直接决定了模型能力的理论上限。没有高质量、有代表性的数据输入，再先进的算法也无法训练出精准且泛化能力强的模型，数据的有效性是整个机器学习流程的先决条件。模型(Model)对数据中潜在规律的抽象数学表示，是学习算法从海量数据中挖掘出的“知识”载体。它本质上是一种映射关系，能够捕捉输入特征与输出结果之间的内在逻辑。训练好的模型如同具备了特定的判断能力，可用于对未知的新数据进行推理、分类或预测，是解决实际问题的核心工具。算法(Algorithm)驱动模型学习的核心“引擎”，是用于训练和优化模型的具体计算方法与执行过程。不同的算法对应着不同的优化策略和学习路径，通过不断迭代调整模型的参数，让模型逐步拟合数据中的规律。算法的选择直接影响模型的训练效率和最终效果，是连接原始数据与有效模型的关键桥梁。三者协同逻辑：算法在海量数据上执行训练过程，通过持续的运算与参数迭代生成具备知识能力的模型；而训练完成的模型则利用学到的规律，对新的未知数据进行推理和预测。这三者形成了“数据输入—算法加工—模型输出”的完整闭环，缺一不可，共同构成了机器学习解决实际问题的核心运作体系。三要素详解：数据(Data)核心定义数据是机器学习的基础和核心燃料，是模型进行学习的核心原材料。它就像传统工业中的原料一样，其本身的质量高低与数量规模，直接决定了最终训练出的模型性能上限，是算法发挥作用的前提条件。主要类型结构化+非结构化包含数值型（如年龄、收入）、类别型（如性别、职业）等结构化数据，也涵盖文本、图像、音频等复杂的非结构化数据，不同类型决定了预处理与建模的不同方式。关键重要性遵循“Garbagein,garbageout”原则，高质量、有代表性且无偏见的数据是构建高性能模型的核心前提。数据清洗、预处理和特征工程更是机器学习全流程中不可或缺且至关重要的核心环节。核心思想：质量优于单纯数量数据的质量远比单纯的数量更关键，低质量数据只会训练出无效模型。但在保证数据质量达标的前提下，更多的有效数据通常意味着模型能学习到更全面的规律，进而具备更强的泛化能力和预测准确性。工程落地的核心挑战在实际机器学习项目开发中，数据相关工作往往占据了大部分周期，包括处理缺失值、剔除异常数据、标准化数据格式，以及通过特征工程挖掘数据背后的潜在价值，这些步骤的执行效果直接决定了模型最终上线后的实际业务表现。三要素详解：模型与算法模型(Model)模型是对数据中潜在规律的抽象数学表示，本质上是一个映射函数y=f(x)，能够将输入特征x转化为输出预测y。优秀的模型具备良好的泛化能力，能够处理从未见过的新数据，在未知场景中保持稳定的预测性能。算法(Algorithm)算法是训练和优化模型的核心执行逻辑，相当于机器学习的“学习引擎”。它定义了从数据中提取模式的步骤，通过迭代调整模型参数，持续最小化预测结果与真实值的误差，让模型逐步收敛到最优状态以解决特定问题。模型类型模型的选择需适配具体业务任务，常见类型包括分类模型（用于预测离散类别，如垃圾邮件识别）、回归模型（用于预测连续数值，如销量预测）、聚类模型（用于发现数据内在结构，如用户画像分群）等，不同类型对应不同的问题解决目标。算法类型针对不同的数据特性和模型目标需匹配对应算法，经典传统算法包含线性回归、逻辑回归、决策树等；在处理复杂非结构化数据时，深度学习领域的卷积神经网络（CNN）、循环神经网络（RNN）等则成为主流选择，以高效挖掘数据深层特征。发展历程：萌芽期(1940s-1960s)1943年：人工神经元数学模型奠基沃伦·麦卡洛克和沃尔特·皮茨合作提出了人工神经元的数学模型，这一开创性成果为后续神经网络的发展搭建了核心理论框架，也让人类第一次尝试用数学语言去模拟人脑神经元的工作方式，成为连接生物学与计算机科学的重要桥梁。1949年：赫布学习规则确立法则唐纳德·赫布提出了著名的赫布学习规则，核心结论是“一起放电的神经元会连在一起”。这一规则揭示了神经细胞之间连接强度的变化规律，成为神经网络自组织学习和权重调整的基础法则，也为后续监督学习、无监督学习算法的诞生提供了关键的生物学启发。1950年：图灵测试与学习机器设想艾伦·图灵在论文中提出了经典的“图灵测试”，用以判断机器是否具备智能；同时他还前瞻性地设想了一种能够从经验中不断改进自身的“学习机器”。这一设想突破了当时计算机只能执行固定指令的局限，为人工智能和机器学习的发展方向指明了极具开创性的路径。1956年：人工智能领域正式诞生达特茅斯会议上，“人工智能”这一术语被约翰·麦卡锡等人正式提出，机器学习作为人工智能的重要分支也开始受到学术界的广泛关注。这次会议成为人工智能学科的诞生标志，让研究者们开始系统性地探索让机器具备学习能力的方法，开启了该领域数十年的发展征程。02核心概念与理论CoreConcepts&Theory发展历程：发展与寒冬期(1970s-1980s)1969年：AI领域的第一次寒冬马文·明斯基和西摩·帕普特在研究中指出，简单的感知器无法解决异或逻辑问题，这一理论缺陷给当时蓬勃发展的神经网络研究带来了沉重打击。相关研究经费大幅缩减，学者们的热情也随之消退，人工智能行业由此进入了漫长的第一次“寒冬期”。80年代初：算法突破带来转机杰弗里·辛顿等学者重新发明了反向传播（Backpropagation）算法，这一关键技术突破解决了多层神经网络的训练难题，使得有效训练深层神经网络成为可能。这项技术为沉寂多年的神经网络研究注入了新的活力，让学界重新看到了连接主义模型的潜力。1986年：连接主义的理论奠基辛顿、鲁梅尔哈特与威廉姆斯联合发表了具有里程碑意义的论文，系统且详细地阐述了反向传播算法的数学原理与具体应用方法。这一成果极大地推动了连接主义学派的发展，让基于神经网络的研究重新回到人工智能领域的主流视野，为后续技术演进提供了核心理论支撑。1989年：LeNet-5模型的成功实践扬·勒丘恩提出了经典的LeNet-5卷积神经网络模型，该模型在手写数字识别任务中取得了突破性的成功应用。这不仅是卷积神经网络（CNN）的早期经典实践案例，更向行业展示了深度学习在处理复杂模式识别问题上的巨大潜力，为后来深度学习的爆发式发展埋下了重要伏笔。发展历程：统计学习时代(1990s-2000s)SVM的兴起1995年，弗拉基米尔·瓦普尼克等人正式提出支持向量机（SVM）算法。该算法凭借坚实的统计学习理论基础与出色的小样本泛化性能，在解决分类与回归问题上展现出显著优势，迅速成为当时机器学习领域备受青睐的核心技术之一。MNIST基准诞生1998年，扬·勒丘恩发布了经典的MNIST手写数字数据集。这一数据集包含了大量标准化的手写数字样本，成为机器学习领域最重要的基准测试数据集之一，为不同算法的性能对比、模型验证和技术迭代提供了统一且权威的评估标准。统计方法主导这一时期，以统计学习理论为核心的方法论占据了绝对主导地位。除了SVM之外，决策树、贝叶斯网络等经典统计模型也被广泛应用，它们共同构成了这一阶段的技术主流，推动机器学习从早期的经验驱动逐步转向严谨的理论驱动与数据驱动相结合的发展模式。核心认知：统计学习时代是机器学习发展的关键跃迁期。SVM的提出为判别式模型提供了强大的理论与工具支撑，而MNIST数据集则建立了算法公平竞争的基准体系，二者相辅相成，让机器学习技术具备了更强的可解释性与工程落地能力，为后续深度学习的爆发积累了关键的技术基础。发展历程：深度学习的爆发(2010s-至今)2012年：AlexNet开启深度学习新纪元辛顿的学生使用AlexNet模型在ImageNet大赛中取得突破性胜利，以显著优势超越了传统计算机视觉算法。这一里程碑式成果向世界证明了深度卷积神经网络的强大能力，标志着深度学习时代的正式到来，也让该技术成为了人工智能领域的主流发展方向。2014年：GAN开创生成式AI新范式伊恩·古德费洛提出了生成对抗网络（GAN），通过生成器与判别器的零和博弈训练方式，赋予了AI自主生成逼真数据的能力。这一开创性架构彻底改变了人工智能的数据生成逻辑，为后续图像生成、风格迁移、数据增强等生成式AI应用提供了核心理论支撑，打开了全新的技术大门。2017年：Transformer重塑自然语言处理GoogleBrain团队提出了Transformer模型，其核心的自注意力机制打破了循环神经网络的序列依赖瓶颈，实现了高效的并行计算。这一架构成为了后续BERT、GPT等预训练大模型的技术基石，彻底革新了自然语言处理领域的算法范式，推动该领域进入了规模化应用的快车道。2020年至今：大模型驱动AIGC全面爆发以GPT系列、BERT为代表的大规模预训练模型（大模型）迎来井喷式发展，通过海量数据训练与万亿级参数规模展现出通用人工智能雏形。这一技术浪潮直接推动了AIGC（人工智能生成内容）的蓬勃兴起，从文本创作、图像生成到行业垂直应用，深刻改变了内容生产方式，为各行各业的智能化升级带来了颠覆性的变革。深度学习三巨头杰弗里·辛顿被誉为“深度学习之父”，多伦多大学教授，反向传播算法的核心重新发明者之一。他始终坚信神经网络的潜力，在学术界低谷期仍坚持研究，是连接主义复兴的灵魂人物。核心成就：革新玻尔兹曼机，完善反向传播算法，证明了深层神经网络在复杂模式识别任务上的优越性，为现代AI的爆发提供了关键的算法引擎。扬·勒丘恩纽约大学教授，FacebookAI研究院首席科学家。他将生物学视觉系统的灵感转化为数学模型，是卷积神经网络（CNN）的先驱，直接推动了计算机视觉技术的成熟。核心成就：发明LeNet-5模型，首次成功将CNN应用于手写数字识别；确立了卷积与池化的核心架构，让端到端的图像学习成为可能，成就了如今的自动驾驶与图像生成技术。约书亚·本吉奥蒙特利尔大学教授，深度学习领域的理论推动者。他专注于概率建模与无监督学习，在自然语言处理和生成式模型领域做出了里程碑式的工作，被誉为“深度学习的理论架构师”。核心成就：系统性地研究了深度学习的表示学习理论；推动了循环神经网络（RNN）在序列数据中的应用，并对生成对抗网络（GAN）的早期发展起到了关键的启发作用。2018年ACM图灵奖：表彰三人通过开发概念框架和工程实践，让深度神经网络成为计算的关键工具，从根本上改变了我们对智能系统构建方式的认知，使人工智能从理论走向了广泛的产业应用。大模型时代：AIGC的蓬勃发展大规模预训练模型以GPT系列、BERT为代表，这类模型在海量无标签数据上完成预训练，从而习得通用的语言知识与世界常识。通过下游任务的微调适配，能够快速迁移至各类实际应用场景，成为现代AI技术的核心基座。AIGC(人工智能生成内容)依托大模型的理解与生成能力，系统可根据用户的自然语言指令（Prompt），自动生成高质量的文本、图像、代码、视频等内容。这种技术突破了传统生成模型的边界，让AI从辅助工具转变为具备创造力的内容生产伙伴。技术核心：架构与范式Transformer架构的引入解决了长序列依赖与并行计算难题，而自监督学习则让模型能够高效利用海量未标注数据进行自我训练。这两大技术支柱相辅相成，共同支撑起大模型强大的感知、理解与生成能力，是AIGC浪潮背后的底层逻辑。产业渗透与价值重塑大模型正以前所未有的速度渗透进各行各业，从内容创意、广告营销到软件开发、企业服务，全面重塑业务流程。它不仅大幅降低了内容生产的门槛与成本，更极大释放了人的创造力，成为推动数字化生产力跨越式提升的关键力量。模型评估：数据集划分训练集(TrainingSet)用于训练模型，让模型学习数据中的规律，是模型学习过程中的核心“教材”。通过对训练数据的特征提取与拟合，模型能够捕捉数据内部的潜在模式和关联关系，从而形成基础的预测逻辑与决策规则，为后续的应用打下基础。验证集(ValidationSet)用于模型选择和超参数调优，是模型开发中的“试错与校准”环节。它帮助我们评估模型在未见过数据上的初步表现，通过分析验证结果调整模型结构或参数设置，有效避免模型出现过拟合问题，筛选出泛化能力更优的模型版本。测试集(TestSet)用于最终评估模型的泛化能力，是对模型效果的“最终考核”。在开发全程中需保持其“不可见”，以此模拟真实应用场景。测试集的评估结果是对模型未知数据表现的公正反馈，直接决定模型是否具备上线落地、解决实际问题的可靠能力。核心认知：科学的数据集划分是保障模型评估真实性的核心前提。训练集承担“知识传授”的基础任务，验证集负责“过程优化”的迭代工作，测试集则完成“结果验收”的关键环节，三者相互独立又协同配合，构建出从模型训练到效果验证的完整闭环，让模型性能的评估结果更具参考价值。分类任务评估指标：混淆矩阵TP(TruePositive)真正例实际为正样本且预测结果也为正。这是模型对目标类别的正确识别，代表了模型有效捕捉到了我们关注的对象。在欺诈检测中，即成功识别出真实的欺诈交易，是模型最期望得到的预测结果之一。TN(TrueNegative)真反例实际为负样本且预测结果也为负。模型准确排除了非目标对象，体现了对负类别的区分能力。例如在垃圾邮件分类中，正确将正常邮件判定为非垃圾邮件，这类正确预测保障了业务的基础稳定性。FP(FalsePositive)假正例实际为负样本却预测为正，即第一类错误（误报）。例如将健康用户误判为患病、正常交易误判为欺诈。这类错误会带来额外的验证成本或用户体验损失，是优化模型时需要根据业务场景权衡的重要指标。FN(FalseNegative)-第二类错误（漏报）实际为正样本却预测为负，是风险更高的漏检错误。在医疗诊断中漏诊重症患者、在安防中未识别出危险行为，都会造成严重后果。FN直接决定了模型的召回能力，是高风险业务场景下优化的核心目标。核心思想：性能评估的底层基石混淆矩阵通过TP、TN、FP、FN四个维度全景展示了模型的分类结果，是理解模型行为的关键窗口。它不仅揭示了模型是“误报多”还是“漏报多”，更提供了计算准确率、精确率、F1值等所有高级评估指标的原始数据，指导我们进行针对性的模型迭代。分类任务评估指标：三大核心准确率(Accuracy)以预测正确的样本数占总样本数的比例为核心，是最直观的整体性能指标。但在数据分布不平衡时易产生误导，例如负样本占比过高时，模型全预测为负也能得到高准确率。

精确率(Precision)聚焦于模型预测为正的结果质量，即“查准率”。它衡量了在所有被判定为正类的样本中，真实正样本的占比。在对误报敏感的场景中，该指标是核心评估依据。

召回率(Recall)聚焦于对真实正样本的识别能力，即“查全率”。它衡量了在所有实际为正的样本中，被模型成功捕捉到的比例。在对漏报零容忍的场景中，该指标优先级最高。

分类与回归任务的其他指标F1-Score精确率和召回率的调和平均数，用于综合评估模型性能。它能有效平衡模型在精确率和召回率之间的表现，避免单一指标的片面性，是样本不均衡场景下评价分类模型优劣的重要依据。AUC(ROC曲线下面积)ROC曲线下的面积，是衡量模型区分正负样本能力的核心指标。其取值范围在0到1之间，数值越接近1代表模型对正负样本的分类排序能力越强；若接近0.5，则说明模型的区分能力与随机猜测无异。均方误差(MSE)回归任务中经典的评估指标，计算预测值与真实值差值的平方的平均值。该指标对数据中的异常值较为敏感，因为平方运算会显著放大较大误差的影响，能直观反映模型预测误差的二阶特性，常用于优化模型参数。平均绝对误差(MAE)回归任务中衡量预测准确性的重要指标，计算预测值与真实值差值的绝对值的平均值。相比MSE，它对异常值的鲁棒性更强，不会因为个别极端误差而产生剧烈波动，更能客观反映预测误差的实际平均大小，体现预测结果的整体偏差程度。偏差与方差权衡(Bias-VarianceTradeoff)偏差(Bias)模型的期望预测与真实模型之间的差异，衡量了模型对数据的基本拟合能力。高偏差意味着模型结构过于简单，缺乏足够的复杂度去捕捉数据中的内在规律。这会直接导致模型出现欠拟合(Underfitting)，此时模型不仅在测试集上表现差，甚至在训练集上也无法达到可接受的误差水平。方差(Variance)不同训练集训练出的模型参数之间的差异，衡量了模型对训练数据波动的敏感程度。高方差意味着模型结构过于复杂，过度学习了训练数据中特有的随机噪声。这会直接导致模型出现过拟合(Overfitting)，模型在训练数据上表现完美，但面对未见过的新数据时，预测误差会急剧上升。直观示例：数据拟合的两种典型误区场景：用一阶直线模型拟合非线性分布的带噪数据。

本质：模型复杂度不足，对数据的描述能力太弱，无法反映真实规律，这正是高偏差引发的欠拟合状态。场景：用高阶多项式模型拟合同一组带噪数据。

本质：模型过度捕捉了数据中的随机误差，失去了对新数据的适应能力，这正是高方差引发的过拟合状态。过拟合与欠拟合过拟合(Overfitting)模型在训练集上表现近乎完美，但在测试集或全新数据上的预测误差显著增大，泛化能力极差。核心成因是模型结构过于复杂，过度学习了训练数据中的随机噪声和非本质细节，而非数据的内在规律。欠拟合(Underfitting)模型在训练集和测试集上的表现都很差，既无法在已知数据上学到有效模式，也无法适应新数据。核心成因是模型结构过于简单，表达能力不足，无法捕捉数据中蕴含的基本趋势和关键特征信息。直观比喻：学生备考的两种极端状态死记硬背的学生：背下所有真题答案和数字细节，却没理解原理。

结果是面对做过的题满分，遇到陌生新题型就完全不会解答。基础薄弱的学生：连课本核心公式和概念都没掌握，知识储备不足。

结果是即便面对讲过的例题和基础练习题，也无法正确完成。如何解决欠拟合与过拟合？解决欠拟合当模型对数据的表达能力不足时会出现欠拟合问题。核心解决思路是提升模型的学习能力，具体可通过增加模型复杂度（如增加神经网络层数、决策树深度）、引入更多有效特征维度、以及减少正则化的约束强度，让模型能够充分捕捉数据中的内在规律和特征关系。解决过拟合当模型过度学习训练数据中的噪声细节时会引发过拟合。主要解决手段包括扩充训练数据量以覆盖更多场景、使用L1/L2正则化限制参数规模、早停机制及时终止训练、深度学习中加入Dropout层随机丢弃神经元，同时也可通过降低模型复杂度，来削减模型的过强记忆能力，提升泛化性。核心思想：偏差-方差权衡模型优化的本质是在偏差与方差之间寻找最佳平衡点。通过动态调整模型复杂度、训练数据的规模以及训练策略，既避免因模型过于简单导致的高偏差（欠拟合），又防止因模型过于复杂引发的高方差（过拟合），最终让模型在未知的新数据上保持稳定且准确的预测表现。关键实践：交叉验证交叉验证是评估模型泛化能力和参数选择的核心手段。通过将数据集多次划分成训练集与验证集循环验证，能有效降低单次随机划分带来的误差，更客观地反映模型真实性能。同时它也是选择最优超参数的重要依据，帮助我们在不同模型配置中确定最适合当前任务的方案。03机器学习的主要类型MajorTypesofMachineLearning监督学习(SupervisedLearning)核心定义一种“有教师指导”的机器学习范式，核心是使用带有明确标签（Label）的数据进行训练。模型通过学习输入特征到输出标签的映射关系，掌握数据背后的规律，从而具备对未知新数据的预测能力。核心任务类型分类任务+回归任务分类预测离散类别（如垃圾邮件识别），回归预测连续数值（如房价预测）。二者是解决实际预测问题的两大核心方向。经典算法模型涵盖从传统统计方法到现代深度学习的各类模型，包括线性回归、逻辑回归、决策树、支持向量机（SVM）、随机森林以及深度神经网络等。这些算法针对不同数据特性，提供了多样化的拟合与预测手段。标准执行闭环流程系统首先从包含特征与标签的训练数据中归纳规律并生成模型；当面对新数据时，仅需输入特征，模型即可基于已习得的映射规则快速输出预测结果，实现从“学习”到“应用”的完整闭环。核心价值与落地场景作为目前应用最广泛的机器学习类型，它支撑了医疗诊断、金融风控、图像识别等关键领域。通过利用已知答案高效构建预测系统，监督学习成为了将数据转化为实际业务决策能力的核心技术路径。无监督学习(UnsupervisedLearning)核心定义这是一种让模型在没有人工标注标签的情况下进行自主训练的机器学习范式。算法无需给定“正确答案”，而是直接从原始、无标记的数据中挖掘内在结构、潜在模式与数据间的关联性，是让机器从海量信息中实现“自学”并提炼规律的核心方法。核心任务主要包含两类关键应用方向：一是聚类，将相似的数据点归为同一簇、相异点划分至不同簇，实现数据的自动分组；二是降维，在保留核心特征与关键信息的前提下，降低数据的维度规模，既简化计算复杂度，也让高维数据更易被可视化与后续模型处理。经典算法在实际工程中被广泛应用的代表性算法包括：K-Means作为经典的划分式聚类算法，高效解决常规分组需求；DBSCAN适用于发现任意形状的密度聚类，对离群点更鲁棒；PCA（主成分分析）则是线性降维的基础算法，常用于数据降噪、特征提取与数据压缩场景。核心认知：无监督学习打破了对人工标注数据的依赖，是挖掘海量未加工数据价值的关键技术。从电商用户的精准分群到复杂数据的降维可视化，它让我们在缺乏先验知识的场景下，直接从数据本身出发发现未知的内在模式，为后续的业务分析、决策制定与模型优化提供了重要的底层支撑能力。核心概念：强化学习(ReinforcementLearning)核心定义智能体（Agent）在与环境（Environment）的动态交互过程中，通过不断试错来选择和执行一系列动作。其学习目标是从持续的交互反馈中总结经验，形成最优的行为模式，从而最大化长期的累积奖励（Reward），这一过程完美模拟了生物界通过反馈进行自主学习的底层逻辑。关键要素包含构建智能决策闭环的四大核心组件：状态是环境传递给智能体的实时反馈信息；动作是智能体对环境做出的具体干预行为；奖励是环境给出的目标导向信号，直接影响学习方向；策略则是智能体的核心决策规则，指导其根据当前状态选择最优动作以获取最大化的长期收益。典型应用已在多个前沿领域实现突破性落地应用：包括战胜人类顶尖棋手的AlphaGo游戏AI；能自主完成复杂操作的机器人控制技术；实现环境感知与实时路径规划的自动驾驶系统；以及基于用户行为动态迭代的个性化推荐系统，充分展现了其在动态未知场景下的自主决策与自适应能力。核心价值：强化学习无需依赖人工标注的训练数据，而是通过智能体与环境的自主交互完成知识获取与策略优化。这种“探索-反馈-迭代”的学习范式，使其成为解决复杂动态环境下智能决策问题的关键技术，也推动了人工智能从被动感知向主动自主决策的重要跨越。其他重要学习范式半监督学习结合少量有标签数据和大量无标签数据进行训练的方法。在实际业务中，标签获取往往需要专业人员参与，成本高昂且周期长，半监督学习能充分利用易获取的无标签数据，在降低标注成本的同时有效提升模型的学习效果与泛化能力。自监督学习一种特殊的无监督学习形式，核心是通过设计“前置任务”让模型从无标签数据中自动生成监督信号。例如让模型预测句子的缺失部分、图像的旋转角度等，无需人工标注即可完成训练，这也是当前大模型能够从海量数据中习得通用知识的核心技术思想。核心思想现实世界中高质量有标签数据稀缺且昂贵，而无标签数据却无处不在。这类学习范式的本质是架起无监督学习与监督学习的桥梁，通过挖掘无标签数据的内在结构和潜在信息，让模型在缺少人工标注的情况下也能获得有效的学习信号，进而突破数据瓶颈提升性能。关键应用场景既适用于传统的图像分类、文本分类等标注成本高的任务，也成为了现代人工智能的核心应用方向。特别是在大模型预训练阶段，自监督学习让模型能消化互联网上海量的文本、图像等无标注数据，从而具备强大的通用理解与生成能力，赋能各类复杂的AI业务落地。04关键算法详解KeyAlgorithmsExplained传统算法：线性回归与逻辑回归线性回归(LinearRegression)主要用于连续值的回归预测任务。核心原理是拟合一条最优直线y=w·x+b，通过最小化预测值与真实值的平方误差来确定参数。其最大优势在于模型结构简单、计算高效，且每个参数都具有直观的数学解释意义，是理解复杂模型的基础。逻辑回归(LogisticRegression)专门解决分类问题的经典模型，尤其适用于二分类场景。它引入Sigmoid函数将线性回归的输出映射到(0,1)区间，输出值代表样本属于某一类别的概率。该模型不仅计算简单、训练速度快，输出结果还具备明确的概率含义，便于业务侧进行风险评估与决策。核心本质区别尽管两者名称中都包含“回归”，但核心目标完全不同。线性回归是生成式模型，目标是捕捉数据的连续变化趋势，回答“结果是多少”；而逻辑回归属于判别式模型，本质是学习类别间的决策边界，回答“属于哪一类”，输出的是概率而非具体数值。典型落地应用场景线性回归常见于房价走势预测、产品销量预估、气温变化推演等连续值预测领域；而逻辑回归则广泛应用于医疗的疾病早期筛查、互联网的垃圾邮件识别、金融行业的信贷违约风险判定等二分类决策场景中。传统算法：决策树(DecisionTree)算法用途作为经典的监督学习算法，决策树主要用于解决分类与回归两大核心问题。在分类任务中可输出离散的类别标签，在回归任务中则能预测连续的数值结果，是构建随机森林、GBDT等集成学习模型的基础单元。核心原理模拟人类的逻辑决策过程通过一系列if-then规则递归划分数据，内部节点代表特征测试，分支对应测试结果，叶节点输出最终结论，将复杂问题拆解为层级化的简单判断。模型核心特征具备白盒模型的显著特质，决策逻辑可被直观可视化；无需对数据做特征缩放、归一化等预处理操作，降低了数据准备成本；同时能够天然处理特征间的非线性关系，对异构数据的适应性较强。算法主要优势模型的决策过程如同清晰的流程图，具备极强的可解释性与可读性，便于业务人员理解和信任；训练过程计算开销相对较小，且无需对数据进行复杂的预处理工作；能有效捕捉数据中的非线性特征与变量间的交互作用，在中小规模数据集上表现稳定。算法潜在局限单棵决策树容易生成过于复杂的树结构，进而出现过拟合问题，对未知测试数据的泛化能力不足；对训练数据中的微小噪声、异常值或数据分布变化极为敏感，数据的局部变动可能导致树结构发生显著改变；在处理高维稀疏数据时预测效果受限，且容易偏向取值类别较多的特征。传统算法：支持向量机(SVM)核心用途SVM是经典的监督学习算法，主要用于解决分类与回归问题。作为判别式模型，它通过在样本空间中构建决策边界，实现对不同类别样本的精准划分，是处理复杂模式识别、数据分类任务的基础且高效的核心算法之一。核心原理最大间隔超平面+核技巧核心是寻找能分隔数据的最优超平面，让支持向量到平面的间隔最大化；引入核函数将低维非线性数据映射至高维空间，使线性模型可处理复杂的非线性分类与回归问题。关键特性优势在于高维特征空间表现优异、泛化能力强且小样本场景下效果稳定；劣势是面对大规模训练数据时计算成本高，模型内部逻辑与参数缺乏直观可解释性，同时核函数的选择和超参数调优也依赖较强的领域经验。核心价值：小样本下的高效判别SVM以“最大间隔”为核心设计原则，从根本上降低了模型过拟合的可能性。在文本分类、图像特征提取等小样本、高维度的经典任务中，核技巧能有效捕捉数据的非线性特征，使其成为衡量新算法性能的重要基准模型，也为后续复杂模型的发展提供了重要的理论参考。应用与实践：场景适配与取舍SVM广泛应用于垃圾邮件检测、生物特征识别、金融风控等领域；但面对TB级海量数据时训练效率显著不足，且核函数选择无通用标准，因此更适合对精度要求高、数据规模适中的离线分析场景，而非高并发、低延迟的实时在线业务系统，实际落地中需结合数据特点进行算法选型。传统算法：K-Means聚类算法核心用途属于无监督学习领域的经典聚类方法，无需依赖预先标注的标签数据。其核心目标是将海量未分类数据自动划分为K个簇，让同一簇内的数据样本特征相似度最大化，不同簇间的数据特征差异最大化，以此挖掘数据内在的自然分布结构与潜在规律。迭代执行逻辑初始化→分配→更新→收敛先随机选定K个初始中心点，再按距离规则分配样本，接着依据簇内样本重算中心点，反复迭代直至中心点位置稳定，此时完成聚类，得到最终的簇划分结果。算法核心优势模型原理简单易懂，计算效率突出，时间复杂度仅为O(nkt)，能高效处理大规模数据集；同时算法逻辑清晰，工程落地实现难度低，是目前工业界在处理无标签数据聚类任务时，应用最普遍、成本效益最高的基础算法之一。主要应用局限性需人工预先指定K值，缺乏自适应能力；聚类结果受初始中心点随机选择的影响较大，易出现局部最优解；同时对数据中的异常值和噪声极为敏感，极端值会显著干扰簇中心的计算，导致最终聚类结果偏离数据真实的分布特征。典型行业落地场景广泛应用于商业领域的客户价值分层与精准营销、电商平台的商品品类聚类与推荐系统优化；在技术领域可用于图像像素分割、文本主题提取，也能在金融风控中对用户交易行为进行异常检测，是从无标签数据中挖掘业务价值的核心技术手段。传统算法：主成分分析(PCA)核心用途作为经典的无监督降维技术，PCA旨在对高维数据进行维度压缩。它能在尽可能保留数据核心信息的基础上，去除特征间的冗余与噪声，从而简化后续计算、提升模型效率，是数据预处理中处理高维特征的关键手段。核心原理机制方差最大化→维度缩减通过正交变换将数据映射至新坐标系，首主成分取方差最大方向，后续成分方差递减且相互正交。仅保留前d个主成分，在损失少量次要信息的同时实现维度的有效压缩。数据转换本质本质是对原始数据的线性重构，将高维特征转化为互不相关的低维主成分。每个新主成分均为原始特征的线性组合，虽丢失了原始特征的直接物理含义，但精准保留了数据的主要变异规律，为后续分析提供精简的特征空间。核心优势：降噪与计算减负能够高效过滤数据中的随机噪声与多重共线性冗余，大幅降低特征空间维度，减少模型训练的计算开销。同时保留了数据的核心结构，是图像处理、人脸识别等领域中，在保证效果的前提下提升系统响应速度的重要预处理方法。局限性与适用边界作为线性方法，对非线性流形数据的降维效果受限；且主成分缺乏直观业务解释，难以对应实际场景的物理意义。因此更适合处理线性结构明显、对结果解释性要求较低的大规模数据，若需捕捉非线性特征则需结合核方法或非线性降维算法。深度学习：卷积神经网络(CNN)核心用途专为处理图像、视频这类网格状数据而生，是深度学习在计算机视觉领域的核心算法。它能自动捕捉数据中的空间局部特征，如像素关联、物体边缘与纹理等，突破了传统算法处理高维视觉数据的效率瓶颈，成为图像识别、目标检测、视频内容分析等应用场景的核心技术基础。核心结构由卷积层、池化层和全连接层三大关键模块构成：卷积层利用卷积核滑动提取局部特征；池化层通过下采样缩减特征图尺寸，降低计算复杂度并保留关键信息；全连接层则将提取的高维特征映射至输出空间，完成分类或回归任务，三层协同实现高效的特征学习与数据处理。经典模型从早期解决手写数字识别的LeNet-5，到引爆深度学习热潮的AlexNet，再到结构规整的VGG与突破深层训练瓶颈的ResNet，这些里程碑式模型不断推动技术革新。它们在特征提取能力、网络深度与训练效率上持续进化，成为不同阶段计算机视觉技术落地的重要标准范式。核心认知：CNN通过模拟生物视觉的局部感受野机制，将特征自动提取与数据降维有机融合，大幅降低了模型参数量与计算开销。这种架构让机器具备了类似人类的视觉感知能力，使其在自动驾驶、医疗影像诊断、智能安防等实际应用中展现出强大的落地价值，是现代人工智能视觉领域不可或缺的核心技术。深度学习：循环神经网络(RNN)及其变体核心用途专门用于处理具有先后顺序的序列数据，这类数据的核心特征是当前信息与历史上下文存在关联。典型的应用场景涵盖自然语言文本的语义理解、语音信号的识别与转换，以及金融、气象等领域的时间序列趋势分析，是捕捉数据动态变化规律的关键技术手段。基础RNN机制在网络结构中引入循环连接，让隐藏层的状态能够在序列的不同时间步之间传递信息，从而保留之前的输入记忆。但传统RNN存在明显的局限性：训练过程中易出现梯度消失或梯度爆炸问题，导致模型难以捕捉和学习序列中相隔较远的长期依赖关系，无法有效理解长文本或长时序数据的深层逻辑。LSTM解决方案作为RNN的关键变体，LSTM通过引入精巧的“门”机制（输入门、遗忘门、输出门）和持续的“细胞状态”，实现了对信息的选择性保留与遗忘。这一设计从根本上解决了传统RNN的长期依赖难题，能够稳定地传递长距离的有效信息，成为处理复杂长序列任务（如机器翻译、语音合成）的主流核心模型。核心认知：循环神经网络是深度学习处理序列数据的基石，RNN确立了循环传递信息的基本范式，而LSTM则通过创新的门控结构突破了其性能瓶颈。二者共同构成了理解时序动态信息的核心技术，为后续更复杂的序列模型（如GRU、Transformer）发展奠定了重要的理论与实践基础。深度学习：Transformer核心用途最初专为自然语言处理（NLP）任务设计，例如机器翻译、文本理解与生成等场景。随着技术的快速迭代，其核心架构已被成功迁移并广泛应用于计算机视觉（CV）、语音信号处理、推荐系统等多个AI核心领域，成为现代人工智能模型开发的通用且高效的基础范式。核心机制核心在于自注意力机制（Self-Attention）。该机制让模型在处理序列中任意位置的元素时，能够动态计算该元素与序列内所有其他元素的关联程度，并据此为每个元素分配差异化的权重。这一特性让模型可精准捕捉上下文语义信息，彻底摆脱了传统循环神经网络的顺序处理依赖。技术优势拥有卓越的并行计算能力，相比RNN类模型无需按时间步逐次处理数据，可大幅提升模型的训练效率与推理速度。同时，能够有效捕捉长距离依赖关系，解决了传统序列模型在长文本、长序列任务中容易出现的信息丢失问题，为超大规模预训练模型的工程化落地提供了关键技术支撑。代表模型与行业影响：以BERT、GPT系列为标志性成果，Transformer彻底重塑了人工智能领域的技术格局。它不仅突破了传统序列模型的性能天花板，更催生了预训练大模型的蓬勃发展，成为当前自然语言处理乃至通用人工智能（AGI）探索进程中不可或缺的核心技术架构，推动AI应用向更智能、更通用的方向迈进。生成式AI模型：GAN模型架构组成GAN即生成对抗网络，核心由生成器与判别器两个独立神经网络组成。生成器承担数据生成的核心任务，判别器则负责真伪判断，二者相互独立又协同工作，共同构成了这种独特的无监督生成模型结构，让机器具备了自主学习数据规律并生成新内容的能力。对抗博弈工作原理生成器⇌判别器生成器不断生成模拟数据试图欺骗判别器，判别器则持续优化识别能力分辨真伪。二者在交替训练中相互博弈、共同进化，直到生成器产出的数据让判别器无法区分真假，达成动态平衡。核心应用领域依托强大的生成能力，GAN已成为生成式AI的关键技术，被广泛应用于图像生成、风格迁移、超分辨率重建、人脸合成、数据增强等场景。在艺术创作、影视特效、工业设计等领域，GAN也为内容创新提供了高效的技术支撑，推动了AI生成内容的规模化落地。核心思想：对抗式自我进化GAN的核心在于通过“零和博弈”的对抗机制实现模型的自我迭代。生成器如同不断精进的“造假者”，判别器则是持续升级的“检验员”，这种动态博弈促使生成器逐步掌握数据的本质特征，最终生成出与真实数据高度相似的内容，实现了从“模仿”到“创造”的技术突破。技术突破与行业影响作为生成式AI的重要里程碑，GAN打破了传统生成模型对数据分布的严苛限制，大幅提升了复杂内容的生成质量。它不仅为计算机视觉、自然语言处理等领域提供了全新的建模思路，更在创意设计、医疗影像、自动驾驶数据合成等行业中创造了实际价值，成为推动AI从感知向生成跨越的核心动力。生成式AI模型：扩散模型模型定义一种重要的生成式AI架构，核心是先通过“正向过程”逐步向真实数据添加随机噪声，直至数据完全变为无意义的噪声状态；再训练神经网络学习对应的“反向过程”，使其具备从纯噪声中逐步恢复出真实、高质量数据样本的能力。核心工作原理正向加噪→反向去噪正向是清晰数据的退化过程，反向是模型的学习核心。通过把生成任务拆解为多步简单去噪，让模型掌握数据本质，实现从混沌噪声到真实内容的有序还原。技术特性优势不同于生成对抗网络（GAN）的对抗训练模式，扩散模型基于马尔可夫链实现渐进式生成。这种方式将复杂生成任务分解为大量微小步骤，有效降低了训练不稳定性，同时在生成结果的细节丰富度和样本多样性上展现出显著优势。核心思想：渐进式去噪的生成范式扩散模型的本质是将生成问题转化为连续的去噪过程。它把看似复杂的“无中生有”拆解为无数微小的修正步骤，每一步仅需去除少量噪声，让模型能够稳定学习数据的深层概率分布，从而突破了传统生成模型在复杂场景下的质量与可控性瓶颈。标杆应用与行业影响该技术已成为AIGC图像领域的主流核心，支撑起DALL-E、Midjourney、StableDiffusion等现象级应用。同时其技术理念也被快速拓展至视频生成、音频合成、分子结构设计等前沿领域，为各行各业的内容创新与效率提升提供了强大的技术底座。算法总结与对比传统算法：轻量高效的经典范式其核心优势在于原理简单、结果易解释，且训练速度快、对数据量要求较低，非常适合中小规模数据集场景。但受限于有限的表达能力，模型效果高度依赖人工特征工程。典型代表包括线性回归、决策树、支持向量机（SVM）等，是解决结构化数据问题的基础工具。深度学习：端到端的智能进化具备强大的自动特征提取与非线性表达能力，支持端到端的学习模式，能够处理图像、语音等复杂非结构化数据任务。但该技术门槛较高，不仅需要海量标注数据支撑，还需高昂的计算资源投入，同时模型内部逻辑难以直观解释。代表架构涵盖CNN、RNN、Transformer等前沿深度学习模型。核心差异：技术特性的关键分野传统算法更侧重规则与统计特征，模型轻量且部署成本低，适合可解释性要求高的金融、医疗等领域；深度学习则是数据驱动的范式，在复杂感知任务中表现卓越。两者的本质差距在于特征处理方式与模型复杂度，前者是“人工定义特征”，后者是“数据自动学习特征”。选型智慧：适配场景的最优解算法选择的核心原则是“没有最好，只有最适合”。实际落地中需综合考量任务类型、数据规模、计算资源储备，以及业务对模型可解释性的要求。例如小样本结构化数据优选传统算法，而复杂非结构化数据处理则需深度学习。合理平衡效果与成本，才能让技术真正赋能业务。05机器学习项目实践PracticalMachineLearningProjects标准项目流程：CRISP-DM01业务理解明确项目的核心业务目标与具体需求，深入理解业务背景和面临的痛点问题。通过与业务方沟通，确立数据挖掘的成功标准，为后续的技术实施设定清晰的方向和价值导向。02数据理解全面收集与业务问题相关的原始数据资源，开展初步的探索性数据分析（EDA）。熟悉数据的基本结构、字段含义与特征分布，同时识别数据中的缺失、异常等质量问题，挖掘潜在的业务规律。03数据准备这是项目中最耗时的关键环节，涵盖数据清洗、集成、转换与归约等操作。通过专业的特征工程提取有效信息，结合特征选择筛选关键变量，最终构建出干净、规范且适合模型训练的高质量数据集。04建模依据业务场景和数据特性选择适配的算法模型，利用处理好的训练数据进行模型训练。通过交叉验证等方法反复调整超参数，不断优化模型结构，从而获取在当前数据下表现最优的模型参数配置。05评估使用独立的测试数据集对训练好的模型进行全方位性能评估。不仅关注模型的技术指标，更要验证结果是否真正满足业务目标，同时分析模型的泛化能力，判断是否存在过拟合或偏差，为决策提供依据。06部署将经过严格验证的模型成果转化为实际可用的业务工具，集成到现有的业务系统或工作流程中。开发便捷的部署接口或应用程序，实现模型的自动化运行，确保模型输出的结果能高效辅助日常业务决策与执行。数据准备：数据清洗处理缺失值面对数据集中的空缺信息，可根据实际情况选择删除无效样本、用均值/中位数/众数等统计量填充，或借助机器学习模型进行预测补全。缺失值若不处理会严重干扰模型训练，选择适配业务场景的策略，能在保留数据样本的同时减少信息损失，维持数据集的完整性与可用性。处理异常值针对偏离正常范围的数据点，可采取直接删除、盖帽法（替换为合理临界阈值）或作为特殊类别单独标记。异常值可能源于测量误差、系统故障或真实极端业务情况，需结合业务逻辑判断成因，避免盲目删除导致关键信息流失，同时防止异常数据对模型参数学习产生偏差，影响最终预测效果。处理重复数据通过特征匹配识别并彻底删除完全重复的记录。重复数据会增加计算资源消耗、放大噪声影响，还会误导统计分析结果。执行严格的查重与去重操作，不仅能简化数据结构、提升后续算法的运行效率，更能保证数据的唯一性与准确性，让建模过程基于纯净的基础数据展开。核心思想：数据清洗的终极目标是系统性提升数据质量，为后续建模工作打下坚实基础。正如行业内经典的“Garbagein,garbageout.”法则所言，低质量的输入必然带来无效甚至错误的输出，因此严谨、细致的清洗流程是确保数据分析结论可靠、模型预测精准的核心前提。数据准备：特征工程特征编码：类别到数值的转换将文本、标签等非数值的类别特征转化为机器学习模型可识别的数值形式，常用方法包括独热编码（One-Hot）和标签编码（LabelEncoding）。这一步是让模型理解分类信息的基础，能有效解决算法无法直接处理离散类别数据的问题。特征缩放：统一数据的度量尺度对数值型特征进行尺度调整，使其落入统一的数值范围，典型手段有标准化（Z-score）和归一化（Min-Max）。此举能消除不同特征间的量纲差异，避免数值量级大的特征主导模型训练，同时加快梯度下降等优化算法的收敛速度，提升模型的训练效率与预测准确性。特征构造：挖掘数据的潜在价值基于业务逻辑和数据特性，从现有原始特征中衍生出新的、更具信息量的特征。例如从日期时间中提取星期、节假日，从用户行为中计算频次或时长，这类特征能更直观地反映数据背后的规律，显著增强模型对复杂模式的捕捉与表达能力。特征选择：精炼核心的有效信息通过统计方法或模型评估筛选出对目标变量最具预测价值的关键特征，剔除无关、冗余和噪声特征。这不仅能降低模型的计算复杂度、减少训练时间，还能有效避免过拟合问题，让模型在未知数据上保持更稳定的泛化性能，是提升模型鲁棒性的重要手段。06应用领域与未来趋势Applications&Future

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

机器学习与应用课件第1章机器学习概述

文档简介

温馨提示

最新文档

评论

机器学习与应用 课件 第1章 机器学习概述

文档简介

温馨提示

最新文档

评论

相关文档

机器学习与应用课件第1章机器学习概述