《人工智能通识教程》课件全套李正军第1-8章绪论、机器学习 -具身智能与机器人系统

上传人：q*** IP属地：山东上传时间：2025-11-11 格式：PPTX 页数：664 大小：18.04MB 积分：70 举报 版权申诉

《人工智能通识教程》课件全套李正军第1-8章绪论、机器学习 -具身智能与机器人系统_第2页

《人工智能通识教程》课件全套李正军第1-8章绪论、机器学习 -具身智能与机器人系统_第3页

《人工智能通识教程》课件全套李正军第1-8章绪论、机器学习 -具身智能与机器人系统_第4页

《人工智能通识教程》课件全套李正军第1-8章绪论、机器学习 -具身智能与机器人系统_第5页

已阅读5页，还剩659页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第一章绪论《人工智能通识教程》课件本章概述本章系统介绍人工智能的基础与背景，涵盖智能定义、起源及图灵测试、发展历程、应用领域、关键技术与伦理问题，帮助读者全面把握人工智能的核心知识框架。主要讲述的内容如下：（1）智能的概念及人工智能的定义与分类，明确基本内涵。（2）人工智能的起源与图灵测试，解析机器智能的评估标准。（3）人工智能发展历程，展示技术演进与重要变革。（4）人工智能在各行业的应用，体现其广泛影响力。（5）人工智能关键技术分析，包括四大要素与技术架构。（6）人工智能伦理问题，强调技术进步与道德规范的关系本章目录1.1人工智能概述11.2人工智能的起源和图灵测试1.6人工智能伦理1.5人工智能相关技术1.4人工智能的应用领域1.3人工智能的发展历史本章目录1.1人工智能概述11.2人工智能的起源和图灵测试1.6人工智能伦理1.5人工智能相关技术1.4人工智能的应用领域1.3人工智能的发展历史1.1人工智能概述智能是感知、记忆、思考、学习并行动的能力，存在于人、动物与集体系统中，如海豚用具与蚁群协作，体现复杂系统的涌现。人工智能以计算机模拟此能力，涵盖弱AI（语音助手、推荐）、强AI（语言模型、医疗决策）与理论中的超AI；技术含认知计算、机器学习、深度学习，推动从理论到应用演进。1.1人工智能概述智能是人类大脑思维活动的产物，是知识与智力的综合体现。它涵盖感知、记忆、思维、学习和行为能力，支持个体适应环境、解决问题。智能不仅存在于人类，也展现在动物和机器中，体现为复杂系统中多种因素交互作用的结果，是自然界的重要奥秘之一。1.1.1关于智能1.1人工智能概述人类主宰地球因祖先具高级智能，但其起源未解，成哲学与脑科学长期课题，列为自然四大奥秘之一。尽管脑科学等进展加深对脑结构与功能的认识，神经系统机理与脑的原理仍未明，统一定义智能亦困难。基于当前对人脑的认知，结合智能的外在表现，学者们从不同角度、不同层面、采用多种方法对智能展开研究，提出了多种智能定义，主要包括思维理论、知识阈值理论和进化理论等观点。1.智能的定义1.1人工智能概述（1）思维理论思维理论认为，智能的核心是思维活动，所有智能均源于大脑的思维过程。人类的一切知识均由思维创造，因此，通过研究思维的规律与方法，有望揭示智能的本质。（2）知识阈值理论知识阈值理论主张：智能行为取决于知识规模与其泛化能力，系统因拥有可应用知识而显智能。其将智能定义为：能在庞大搜索空间中快速找到满意解的能力。该理论深刻影响AI发展，促成知识工程与专家系统兴起，并奠定以知识获取、表示与推理为核心的技术路线。（3）进化理论进化理论强调行走、感知与维持生存繁衍的适应力奠定智能基础。智能为复杂系统涌现，由整体行为与环境互动决定，可无显式表示与推理而生。以“控制”替代“表示”，重分层结构。布鲁克于1991提“无表达”、1992提“无推理”。综合以上观点，可以给出一个较为直观的定义：智能是知识与智力的总和。其中，知识是所有智能行为的基础，智力则是获取知识并运用知识解决问题的能力。1.1人工智能概述智能的特征如下。（1）具有感知能力感知经视、听、触、嗅、味获取外界信息，是智能之基。逾80%由视觉、约10%由听觉获得，促使AI以机器视觉与机器听觉为感知核心方向。（2）具有记忆与思维能力记忆存储感知与知识，思维加工信息，进行分析、比较、推理、联想与决策；二者为智能核心，支撑获取与运用知识解决问题的动态过程。（3）具有学习能力人与环境互动持续学习，积累知识、适应变化；可自觉或无意识，可在教师指导或自主实践中进行，体现人类智慧的重要特征。（4）具有行为能力行为以语言、表情、眼神、肢体输出信息，回应刺激；与感知输入相对，皆受神经系统调控，构成智能系统信息交互与表达关键能力。2.智能的特征1.1人工智能概述标准化测试常见如数列题：1、3、6、10、15、21。相邻差值递增1，依次为2、3、4、5、6，故下一个数字为28。此类题评估识别关键特征的能力。经由经验积累与练习，我们不断发现、学习并迁移这些模式。可以试试用下面这两个数列来试试运气：a.1,2,2,3,3,3,4,4,4,4,···b.2,3,3,5,5,5,7,7,7,7,···既然上面已经给出了智能的一个定义，那么接下来大家可能会有以下疑问：（1）如何判定某个人或物是否有智能？（2）动物是否有智能？（3）如果动物有智能，那么如何评估它们的智能？3.动物智能1.1人工智能概述多数人能答首题。我们以问答观测反应评估智能，但动物如何界定？宠物展现记忆与导航：狗识旧人、能回家；猫闻开罐声兴奋。是条件反射，抑或有意识联结？关于动物智能，还有一则有趣的轶事：在1900年前后，德国柏林有一匹人称“聪明的汉斯”（CleverHans）的马，据说这匹马精通数学，如图1-1所示。“聪明的汉斯”表演加法与开平方惊艳众人；无观众时表现失常。其并非懂数学，而是敏锐捕捉观众情绪与细微暗示，借兴奋变化逼近正确答案。图1-1聪明的汉斯（CleverHans）1.1人工智能概述“人工智能”之“人工”源自artificial，常被解作人造且带贬意。但人造物并非次等：如人造花无需阳光与水，便能持久装饰，外观逼真，虽手感与香味逊于真花。人工智能（ArtificialIntelligence，AI）是一种利用计算机和相关技术来模拟、延伸和扩展人的智能的计算机科学的分支，目标是使用算法和数据构建能够表现出人类智能的系统，试图以人类的智慧为模型，开发出能以与人类智能相似的方式思考、学习、解决问题的计算机程序和技术。人工智能的研究目标是通过制造智能代理来实现人类智慧的各种能力，如语言理解、问题解决、学习、认知和决策等。人工智能的应用广泛，如自动驾驶汽车、语音识别、智能家居等。1.1.2人工智能的定义1.1人工智能概述从发展程度的角度上，人工智能可以分为三大类：弱人工智能、强人工智能、超人工智能，如图1-2所示。1.1.3人工智能的分类图1-2人工智能分类1.1人工智能概述1.弱人工智能（ArtificialNarrowIntelligence，ANI）弱人工智能聚焦单一任务，如AlphaGo只会下围棋，能胜世界冠军；被问及围棋之外的问题则无从作答，显示其智能专一而非通用。弱人工智能在多个实际应用中都得到了广泛应用，包括：（1）数字助手：如Apple的Siri、Amazon的Alexa和Google助手，能够执行语音命令、回答问题，并提供个性化推荐。（2）智能推荐系统：如Netflix和Spotify根据用户的历史观看和听歌记录，提供个性化的内容推荐。（3）人脸识别技术：在安全和监控系统中应用，通过机器学习算法输入大量的脸部图像，识别和验证个人身份。这类技术也被用于社交媒体平台以标记或识别用户1.1人工智能概述2.强人工智能（ArtificialGeneralIntelligence，AGI）强人工智能是一种具有通用智能的系统，能够像人类一样理解语言、解决问题、进行推理和做出决策。3.超人工智能（ArtificialSuperIntelligence，ASI）超人工智能是指一种超越人类智能的人工智能形式。在所有领域，包括科学创新、通识知识和社交技能上，超人工智能都显示出超出人类的能力。本章目录1.1人工智能概述11.2人工智能的起源和图灵测试1.6人工智能伦理1.5人工智能相关技术1.4人工智能的应用领域1.3人工智能的发展历史1.2人工智能的起源和图灵测试AI源自20世纪50年代，1956达特茅斯会议定调。自符号主义转向机器与深度学习，突破图像与语言。图灵测试探讨判定标准。AI分弱、强与超强，已广泛用于医金与自动驾驶，前景深远。1.2人工智能的起源和图灵测试AI自20世纪50年代起步，由符号主义转向机器与深度学习，推动图像、语言等突破，广泛应用并重塑社会，未来将持续引领变革。（1）1956达特茅斯会议奠基AI，早期符号主义以规则和逻辑推理模拟思维，强调可解释性。（2）符号主义难应对不确定和复杂感知，设备在动态环境下脆弱，反应僵化受限。（3）60年代末机器学习兴起，依赖数据自适应训练，融合统计方法与算法优化。（4）21世纪深度学习崛起，多层网络提取复杂特征，图像语音与语言显著突破。（5）算力与数据激增推动普及，AI融入各业，持续驱动创新，同时带来机遇与挑战1.2.1人工智能的起源1.2人工智能的起源和图灵测试艾伦·图灵（AlanTuring，1912—1954）是一位杰出的英国数学家，也是计算机科学史上的重要奠基人（图1-3）。学习过人工智能、计算机科学和密码学的学生对他的贡献应有所了解。图灵在人工智能领域的核心贡献是他所提出的著名“图灵测试”。该测试旨在解决一个颇具争议的问题：“计算机是否具备智能？”。通过这一测试，他探讨了计算机是否能够模拟人类的思维过程。1.2.2图灵测试图1-3图灵1.2人工智能的起源和图灵测试埃里希·弗罗姆（ErichFromm）写道：男女平等，但不一定表现都一样。例如，不同性别的人对于颜色和花朵的了解可能不同，花在购物上的时间也不同。区分男女与智能问题又有什么关系呢？图灵提出了两个“模拟游戏”（imitationgames）。第一个模拟游戏如图1-4所示。图灵认为，可能存在不同类型的思考方式，了解并容忍这些差异是非常重要的。图1-5给出了图灵测试（Turingtest）的第二个版本，即第二个模拟游戏。第二个模拟游戏更贴合人工智能的研究场景。帘幕后为人或机，机扮男性且偶尔撒谎，人始终诚实。询问者仅凭问答判定对象身份；若计算机成功欺骗，则通过图灵测试，被视为具备智能。图1-4第一个模拟游戏图1-5第二个模拟游戏本章目录1.1人工智能概述11.2人工智能的起源和图灵测试1.6人工智能伦理1.5人工智能相关技术1.4人工智能的应用领域1.3人工智能的发展历史1.3人工智能的发展史人工智能的发展历史可以分为以下几个阶段。1.第一次繁荣期：1956-1976年图1-6亚里士多德自古人类以机器替代脑力以增强征服自然之力。两千多年前AI萌芽已现。亚里士多德在《工具论》中提出形式逻辑定律，三段论成演绎推理基石。亚里士多德（前384—前322，如图1-6所示），柏拉图弟子、亚历山大大帝导师。其系统性著作深远影响，涵盖物理、形而上学、诗歌戏剧、音乐、生物、经济、动物、逻辑、政治、治理与伦理，与柏拉图、苏格拉底并称西方哲学奠基者。20世纪50年代，计算机科学家与数学家深入研究人工智能，提出“智能是什么”“如何实现AI”等关键理论问题。70年代AI发展显著，语言翻译、图形学、知识表示突破；基于规则的专家系统涌现，在特定领域达近专家水平，奠定未来基础。2.第一次低谷期：1976-1982年由于机器翻译等项目的失败以及一些学术报告的负面影响，人工智能的经费普遍减少。在这一阶段，人工智能研究遭受了严重打击，质疑与批评不断增加。这种情况的主要原因包括运算能力不足、计算复杂度较高以及实现常识与推理的难度较大等。1973年《莱特希尔报告》批评符号主义AI“未达承诺影响”，宣告首个“寒冬”到来。同年BBC以“通用机器人是海市蜃楼吗？”辩论引发社会担忧，行业面临挑战与反思契机。1.3人工智能的发展史3.第二次繁荣期：1982-1987年80年代算力提升促AI发展，神经网络展现更强学习，推动机器人控制与图像识别应用扩展。领域受关注度飙升，硬件进步加速研发，计算机视觉、语音识别、机器翻译等取得显著进展。4.第二次低谷期：1987-1997年1987年LISP机市场崩溃，技术受挫；抽象推理失宠，符号模型受批评。尽管80年代神经网络有进展，但应用有限，AI再陷低谷。1965年德雷福斯以兰德报告《炼金术与人工智能》批判AI；1988年应邀讲授AI与海德格尔现象学，促使研究者转向新路径。5.第三次繁荣期：1997年到现在90年代起，互联网普及与硬件提升促AI进展，语音识别、图像分析、自然语言处理突破；算法发展推动深度学习成核心方向。AI不再限专业领域，大学与企业积极加入促应用扩散。入21世纪，算力与大数据兴起，AI重焕活力并多域突破。本章目录1.1人工智能概述11.2人工智能的起源和图灵测试1.6人工智能伦理1.5人工智能相关技术1.4人工智能的应用领域1.3人工智能的发展历史1.4人工智能的应用领域人工智能可以被应用于各种领域，如自动驾驶汽车、语音助手、智能机器人、医疗诊断、金融分析等。人工智能的发展能够改变人们的生活和工作方式，带来了巨大的社会影响。1.智能安防人脸识别、物体检测、行为分析协同应用。即时识别人员、监测异常物体、预警风险，强化访问控制与监控，全面提升社会治安与建筑安全。2.智能金融智能投顾提供投资建议；风险评估判定信用；智能化信贷审批提速降人力；智能客服实时解答，提高效率与满意度，推进金融服务智能化。3.智能家居物联网联动设备，远程控安防、温度、照明。智能门锁手机管理，摄像头实时视频，提升家庭安全与便捷，带来更舒适高效的生活体验。1.4人工智能的应用领域4.智能医疗和健康管理AI助力影像诊断早筛，提高精度；可穿戴监测生理数据，支持个性化方案与持续管理，优化治疗效果并提升患者健康管理水平。5.智慧教育在线平台与智能家教个性化内容，按进度自适应教学；教育机器人互动助学，提升兴趣与评估能力，促进因材施教与学习效果提升。6.智能制造AI赋能智能工厂与机器人，联通生产、物流、消费，动态优化流程，提效降本，快速响应需求，推动工业4.0走向全面智能化。7.智能零售无人店以传感器与自动支付实现无人值守；AI优化库存与供应链；客流统计分析行为，助力精准营销与运营决策，重塑购物体验。8.智能交通与自动驾驶智能交通整合通信与控制，实时优化信号提升通行效率；自动驾驶与生态导航降拥堵与事故，降低能耗，提高安全，支撑城市可持续。本章目录1.1人工智能概述11.2人工智能的起源和图灵测试1.6人工智能伦理1.5人工智能相关技术1.4人工智能的应用领域1.3人工智能的发展历史1.5人工智能相关技术人工智能技术以数据、算力、算法和场景为核心要素，支撑其快速发展。关键技术主要包括：（1）机器学习：通过数据训练模型，应用于金融、医疗等领域。（2）深度学习：基于神经网络，擅长图像、语音识别。（3）计算机视觉：处理图像与视频，推动自动驾驶等应用。（4）自然语言处理：实现人机交互，如翻译与舆情分析。（5）语音识别：将语音转为文本，用于智能家居与车载系统。（6）生成式AI：创造新内容，如文本、图像生成。这些技术共同推动AI的广泛应用与创新。1.5人工智能相关技术人工智能四要素包括：数据、算力、算法、场景。随着AI大模型规模的不断扩大，对计算资源的需求也在增加。高性能的硬件设备、海量场景数据、强大的算力基础和升级迭代的算法模型成为支持AI大模型发展的关键。数据（Data）是AI训练与优化的基础。结构化、非结构化与实时数据同源汇入；大规模高质量数据构筑护城河，支撑关键算力与应用成效。算力（ComputingPower）为AI提供计算支撑。深度学习需高并行矩阵运算，GPU与专用AI芯片加速训练与推理，显著提升效率与速度。算法（Algorithm）是智能决策与预测之本。机器学习、深度学习、强化学习等从数据中学习，驱动语音、图像、NLP突破，支撑更高级AI能力。数据、算力、算法作为输入，只有在实际的场景（Scene）中进行输出，才能体现实际价值。1.5.1人工智能四要素1.5人工智能相关技术

人工智能的技术架构按照产业生态通常可以划分为基础层、技术层、应用层三大板块，如图1-6所示。1.5.2人工智能技术架构图1-6人工智能技术架构1.5人工智能相关技术

基础层提供大规模数据存储处理与高性能算力、通信基础设施；技术层以AI算法处理分析数据、提取信息知识；应用层将模型落地场景，实现智能决策与优化。

三层框架相互交织、功能重叠互动；实践中需按需求定制与整合，形成完整可落地的人工智能解决方案。1.5人工智能相关技术机器学习（MachineLearning,ML）是一门多领域交叉学科，综合了概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究如何通过计算机模拟或实现人类的学习行为，从而获取新的知识或技能并不断改善自身的性能。作为人工智能的核心，机器学习是赋予计算机智能的根本途径。在机器学习领域，数据、算法和模型是三个至关重要的要素。1.机器学习1.5人工智能相关技术（1）数据机器学习的核心目标是让计算机在没有明确指令的情况下，基于输入数据进行预测输出。数据可分为结构化数据（如表格数据）和非结构化数据（如图像、文本、音频等）。在机器学习过程中，数据用于训练模型、评估模型性能，以及支持预测和决策。与数据密切相关的重要概念：数据集（dataset）：用来训练机器学习模型的一组数据。开发者通常根据具体任务选择或设计数据集，常见的数据集类型包括数值型、统计型、文本型和图像型数据集。不同数据集在数据类型、规模和复杂度上存在显著差异。样本（sample）：模型训练和学习过程中使用的基本数据单位，用以描述某个具体对象。数据集中的每条数据即为一个样本。特征（feature）：每个样本包含的一组属性信息，用以描述该样本的各种特性。例如，一个人的样本可能包含姓名、性别、年龄、身高、体重等。在机器学习中，特征值和特征向量用于表示和操作数据，是训练模型的基础。标签（label）：也称为标记，表示样本对应的目标值或期望输出。为数据添加标签的过程称为数据标注，它为监督学习提供了学习目标和方向。机器学习的第一步是准备和处理输入数据，这也奠定了后续工作的基础。1.5人工智能相关技术（2）算法机器学习是赋予机器“学习能力”的技术，而算法则是实现这种学习的具体方法。不同算法对应不同的数学公式，将输入数据带入算法中，即可得到相应的输出结果。算法是推动人工智能发展的关键。算法工程师的主要职责包括：使用数据分析技术和建模工具理解和挖掘数据特性。设计和开发创新算法，解决具体问题。编写代码实现算法功能。优化算法性能，提升其预测准确率和运算效率。（3）模型模型是算法与数据结合后的产物。将输入数据传入模型后，模型会基于所用算法进行处理，生成预测结果。对于监督学习，输入数据配有期望输出的标签，模型通过比较预测值与标签不断调整参数，优化算法。1.5人工智能相关技术总之，数据提供基础，算法赋予方法，模型实现预测，三者相辅相成，共同推动机器学习技术的发展。机器学习的主要算法包括有监督学习、无监督学习、半监督学习和强化学习等。机器学习的分类如图1-7所示。图1-7机器学习的分类1.5人工智能相关技术（1）监督学习训练监督学习（supervisedlearning）模型时，需要为模型提供带有标签的训练数据。模型在学习时同时获得输入与理想输出（标签）。标签起“监督”作用，模型比较预测与标签差异，反复调整参数，逐步提升预测准确度与泛化表现。监督学习依赖标注数据训练，如图像标注动物类别。数据充足且高质时，可精准分类或预测，如以症状为输入、疾病为标签的诊断。监督学习主要应用于以下两类任务：分类（classification）任务：预测输入数据所属的类别，输出结果为离散的类别标签。例如，判断明天的天气是晴天、阴天、雨天还是雪天。

若仅有两个类别，该任务称为二分类问题，比如判定图片中动物是猫还是狗。回归（regression）任务：预测输出为连续数值的任务。例如，预测明天的气温变化。1.5人工智能相关技术（2）无监督学习与监督学习不同，无监督学习不依赖于带标签的数据，而是基于输入数据的内在结构和特征，尝试将相似的数据点归为一类。这个过程通常被称为聚类（clustering）。无监督学习无需严格标注，灵活且门槛低，适用更广。电商可基于购物与搜索历史聚类用户，划分群体并推荐相似商品，典型用于推荐系统。除聚类外，无监督学习还适用于以下两类任务：异常检测（AnomalyDetection）：识别数据中的异常点或异常行为，从本质上也是一种分类方法，用于发现与大部分数据显著不同的样本。密度分析（DensityEstimation）：也称为概率密度估计，通过对训练样本的分布进行估计，推断样本空间的概率密度。这是生成模型等技术的基础之一。1.5人工智能相关技术（3）半监督学习监督与无监督各有限：监督效果佳但高质标注昂贵且耗时，规模越大越明显；无监督不依赖标注但适用面受限、难解诸多任务。基于此，半监督融合二者优势，提高学习效率与应用成效。半监督学习的工作原理如图1-8所示。图1-8半监督学习的工作原理1.5人工智能相关技术（4）强化学习概括而言，强化学习是一种基于反复试验的学习方法，包含以下核心概念：代理人（agent）：指试图学习和决策的主体（可类比游戏中的玩家角色）。环境（environment）：代理人所处的外部环境（类似游戏中的虚拟世界）。状态（state）：代理人从环境中感知到的自身信息，如游戏中角色的经验值、体力值等。行动（actions）：代理人基于当前状态在环境中执行的各种操作，例如游戏角色的行走、跳跃或使用道具。奖励（reward）：对代理人行动结果的反馈，正向奖励表示成功（如角色升级），负向奖励表示失败。策略（strategy）：代理人根据当前状态制定的行动方案，目标是在未来一段时间内最大化累计正向奖励，最小化负向奖励。价值函数（valuefunction）：用于评估某一状态或动作对代理人未来收益的函数，衡量其“价值”。1.5人工智能相关技术在强化学习中，代理人作为智能体，根据环境反馈不断调整策略，通过不断试错以优化决策，从而实现最佳行为选择。强化学习的工作原理如图1-9所示。强化学习适用于完成决策任务。图1-9强化学习的工作原理1.5人工智能相关技术深度学习（DeepLearning,DL）是机器学习的一种分支，主要通过构建模拟人脑的神经网络，来实现对图像、声音、文本等数据的识别、理解和生成。核心在于使用多层神经网络结构，能够通过大量数据自动学习特征和模式，从而在复杂任务中表现优异。相较于传统机器学习算法，深度学习具有更强的表达能力和学习能力，适合处理大规模和高维度的数据。2.深度学习1.5人工智能相关技术（1）发展历史20世纪50—60年代提出神经网络与感知机概念；受算力与数据限制，发展曾停滞。2006年辛顿等提出深度信念网络与无监督预训练，缓解深层训练难题，推动深度学习复兴。（2）主要算法深度学习包括多种算法，各有不同的特点和应用领域：卷积神经网络（CNN）：主要用于图像识别和计算机视觉。循环神经网络（RNN）：用于序列数据处理及自然语言处理。长短时记忆网络（LSTM）：一种特定的RNN，可有效解决梯度消失问题，适用于序列预测。生成对抗网络（GAN）：用于生成真实的图像、音频和文本。自编码器（AE）：用于无监督学习，可进行数据降维及特征提取。深度强化学习（DRL）：结合深度学习与强化学习，学习高层次策略。1.5人工智能相关技术（3）建模过程深度学习的建模过程一般包括以下步骤：数据收集与预处理：整理和清洗数据，进行特征选择与标准化。模型选择与设计：根据问题和数据特征选择合适的深度学习模型，并设计其结构。模型训练：使用训练数据对模型进行训练，优化模型参数，选择合适的优化算法和损失函数。模型评估与调优：使用测试数据评估模型性能，并进行必要的调整，以提升泛化能力和鲁棒性。模型应用与部署：将训练好的模型应用于实际问题，部署到相应系统，实现自动化处理和决策。需要注意的是，不同任务可能会使这些步骤有所变化，深度学习的建模过程通常是一个迭代优化的过程。1.5人工智能相关技术（4）应用场景深度学习的应用广泛，主要场景包括：计算机视觉：图像分类、目标检测、图像分割、人脸识别等。自然语言处理：文本分类、情感分析、机器翻译、对话系统等。推荐系统：商品推荐、广告推荐、搜索排序等。医疗健康：疾病诊断、医疗影像分析等。金融风控：风险评估、欺诈检测等。自动驾驶：图像识别、车道检测、交通标志识别等。深度学习以其强大的能力在各种领域中发挥着重要作用，不断推动人工智能技术的发展。1.5人工智能相关技术计算机视觉（ComputerVision，CV）是人工智能领域的一项重要研究方向，致力于让计算机能够理解和解释图像或视频中的信息。通过研究如何从视觉数据中获取信息，并对其进行处理与分析，计算机视觉使机器能够自动完成检测、识别、跟踪等任务。应用涵盖从人脸识别、对象检测到自动驾驶等众多领域。图像处理与分析：先预处理与滤波降噪提质；再提取边缘、纹理、颜色、形状等特征，支撑后续分析。特征提取效果直接影响分类准确性。深度学习推动：CNN在分类、检测、分割、识别上表现卓越，多层网络自动学习大规模数据模式，显著提升准确性与鲁棒性，优于传统方法，适应复杂场景与环境变化。其他方向与应用：涵盖运动分析、三维重建、图像合成；广泛用于医疗影像、智能监控、AR/VR等，持续驱动创新并强化未来技术影响力。3.计算机视觉1.5人工智能相关技术自然语言处理（NaturalLanguageProcessing，NLP）是人工智能（AI）领域的重要分支，致力于研究如何理解和处理人类语言。核心目标是构建能够准确理解并回应人类输入的智能系统，从而实现更加自然、高效的人机交互。NLP技术融合了语言学、计算机科学和人工智能等多学科的研究成果，近年来取得了显著的发展与突破。4.自然语言处理1.5人工智能相关技术语音识别技术是一种将人类语音转换为文本的先进技术，广泛应用于现代人机交互中。（1）工作原理语音识别的工作原理通常包括几个关键步骤。首先是音频信号的采集和预处理，包括降噪、信号放大和采样等。接着，通过特征提取算法（如梅尔频率倒谱系数MFCC）提取出语音特征，这些特征能够有效描述语音的音色和音高等信息。随后，这些特征会被输入到机器学习模型（例如深度神经网络）中进行训练与识别，以预测其对应的文本输出。（2）应用领域语音识别技术在多个领域都有广泛应用，如：智能家居：用户可以通过语音指令控制家庭中的智能设备，例如调节灯光、温度和安全系统等。车载娱乐：司机可以通过语音命令控制导航、音乐播放和电话接听，大大提高了驾驶安全性。手机助手：智能手机中的语音助手（例如Apple的Siri、GoogleAssistant）允许用户通过语音进行查询、设置提醒、发送信息等操作。5.语音识别1.5人工智能相关技术（3）未来发展AI与ML进步提升语音识别准确与响应；5G增强实时性与接入效率。未来将广泛应用医疗、教育、客服等场景，带来便捷与乐趣。总之，语音识别技术的持续发展和应用将改变我们与设备交互的方式，使之更加智能化和人性化。1.5人工智能相关技术生成式人工智能（ArtificialIntelligenceGeneratedContent，AIGC）是一种前沿的人工智能技术，旨在通过自动生成内容来满足多种需求。（1）工作原理AIGC主要依赖于深度学习算法，尤其是生成对抗网络（GAN）和变分自编码器（VAE）。这些算法通过对大量数据进行训练，理解其中的分布特征，从而生成新的内容。例如，在文本生成中，模型可以学习语言的结构和语法规则，生成连贯且符合语境的句子。在图像生成方面，GAN可以创造出高逼真的图像，从而在艺术、设计和广告等领域找到应用。6.生成式人工智能1.5人工智能相关技术（2）应用领域AIGC的应用领域相当广泛，包括但不限于：文本生成：自动生成新闻报道、社交媒体内容、博客文章和小说，极大地提高了内容创作的效率。图像生成：可以生成艺术作品、产品设计或广告图像等，降低了设计成本并激发了创意。音频和视频生成：在音乐创作、音效设计以及视频制作领域，AIGC能够快速生成高质量的音频和视频内容。AIGC在人工智能中的定位及其与其他要素的关系如图1-10所示。图1-10AIGC在人工智能中的定位及其与其他要素的关系本章目录1.1人工智能概述11.2人工智能的起源和图灵测试1.6人工智能伦理1.5人工智能相关技术1.4人工智能的应用领域1.3人工智能的发展历史1.6人工智能伦理人工智能伦理学作为专门研究人工智能系统应用伦理的学科，关注人类在设计、制造、使用人工智能系统过程中涉及的道德问题，涵盖机器伦理中的机器行为及超级人工智能引发的奇点问题。具体而言，人工智能伦理涵盖以下几个关键方面：（1）隐私保护与数据安全AI依赖海量数据，收集存储易致隐私泄露与滥用。需保障个人信息与用户隐私，推动更安全的数据管理与保护技术。（2）算法公平与透明偏见致歧视，损害弱势群体；如人脸识别跨族群准确率差异。应提升算法公平、可解释与透明，维护社会公正。（3）责任归属与法律挑战医疗、司法、自动驾驶等失误致责难界定。需明确开发者、使用者与系统责任，完善法律框架与治理机制。1.6人工智能伦理（4）就业影响与社会公正自动化重塑就业结构，或加剧分层与失业。需以政策调节与保障，推动AI成果的包容共享与社会公平。（5）安全风险与恶意使用技术或被用于网攻、信息操控、武器化，增新威胁。应构建多方协作，强化风评与防范，遏制恶意利用。2016年IEEE发布《AI设计伦理准则》白皮书，倡建通行伦理标准。2017年ISO组建AI委员会，制定算法偏见、隐私、数据与网络、机器人伦理等标准。2018年牛津、剑桥、OpenAI发布《AI的恶意使用》报告，评估安全威胁并给出对策；微软、谷歌、IBM等亦发布伦理原则。2021年11月，联合国教科文组织通过《人工智能伦理建议书》，确立人权与尊严、环境可持续、多样与包容、和平公正四大价值，明确十项原则与十一行动领域，成为全球权威指导并为国际标准与法律提供重要参考。第二章机器学习《人工智能通识教程》配套课件《人工智能通识》教研组本章概述本章介绍机器学习的基本概念、发展历程及多样化应用，涵盖学习分类、系统结构、主要算法及实际应用，帮助读者全面理解机器学习的理论与实践价值。主要讲述的内容如下：（1）机器学习的发展概述与定义，介绍研究内容和基础知识。（2）机器学习的分类，包含监督学习、无监督学习和强化学习等方法。（3）机器学习系统结构，阐明环境、知识库与执行部分的组成。（4）主要机器学习算法，涵盖回归、决策树、朴素贝叶斯、聚类、支持向量机、神经网络及集成方法。（5）机器学习的实际应用，展示其在数据分析、模式识别、生物信息学、物联网、聊天机器人和无人驾驶等领域的广泛应用。本章目录2.1机器学习概述12.2基于学习方式的分类2.5机器学习的应用2.4机器学习的算法2.3机器学习的基本结构本章目录2.1机器学习概述12.2基于学习方式的分类2.5机器学习的应用2.4机器学习的算法2.3机器学习的基本结构2.1机器学习概述机器学习（MachineLearning，ML）是人工智能的一个重要分支，旨在使计算机系统通过数据学习和改进其性能，而无需明确编程。机器学习算法通过识别数据中的模式和规律，能够进行预测、分类和决策等任务。一些手机提供了智能语音助手，一些电子邮箱使用了垃圾邮件过滤器（软件），等等。机器学习作为人工智能的一个分支，如图2-1所示，机器学习所涉及的应用范围包括语言处理、图像识别和智能规划等。图2-1机器学习是人工智能的一个分支2.1机器学习概述机器学习最早可以迫溯到英国数学家贝叶斯在1763年发表的贝叶斯定理，这是关于随机事件A和B的条件概率（或边缘概率）的一则数学定理。贝叶斯定理是概率论中的一个重要定理，它描述了如何根据新的证据更新事件的概率。公式如下：2.1.1机器学习的发展2.1机器学习概述应用场景：医学诊断：根据测试结果更新疾病的可能性。机器学习：在分类算法中，通过先前的数据更新模型。决策分析：在不确定的环境中根据新信息调整决策。贝叶斯定理提供了一种系统的方法来整合新证据与先验知识，从而得出更准确的概率评估。2.1机器学习概述从20世纪50年代研究机器学习以来，不同时期的研究途径和目标并不相同，大体上可以划分为4个阶段。第1阶段（20世纪50年代中半至60年代中半）：热烈时期。本阶段研究“有无知识的学习”，聚焦执行能力。通过改变环境与性能参数检验反馈，系统在程序作用下自组织调整，最终择优环境生存。代表性成果为塞缪尔的下棋程序。第2阶段（20世纪60年代中半至70年代中半）：冷静时期。本阶段聚焦植入领域知识，模拟人类学习，以图与逻辑结构表征系统。因学习长期性，转向整合专家知识以获深层认知，并取得成效；代表为海耶斯与罗斯的结构学习方法。第3阶段（20世纪70年代中半至80年代中半）：复兴时期。本阶段由单概念扩展至多概念学习，策略与应用并进；专家系统的知识获取需求推动ML发展，示例归纳与自动知识获取成主流。1980研讨会奠基，1984专著与期刊创刊。代表作有莫斯托、莱纳特、兰利之作。第4阶段（自20世纪80年代中半）：新的边缘学科阶段。2.1机器学习概述机器学习的这个新阶段具有如下特点：（1）机器学习成为新的边缘学科，它综合应用了心理学、生物学、神经生理学、数学、自动化和计算机科学等，形成了机器学习理论基础。（2）融合各种学习方法，且形式多样的集成学习系统研究正在兴起，机器学习融合的各种学习方法如图2-2所示。（3）机器学习与AI基础问题的统一性观点形成：将学习与求解结合、以便于学习的知识表达，催生通用智能系统的组块学习。类比学习与求解结合的案例法成经验学习重要方向。（4）学习方法应用扩展并商品化：归纳学习的知识获取工具广泛用于诊断专家系统；连接学习在声图文识别占优；分析学习用于设计型专家系统；遗传算法与强化学习在工程控制具前景；与符号系统耦合的神经网络用于智能管理与机器人规划。（5）学术活动空前活跃：除年度机器学习研讨会外，尚有计算机学习理论会议、遗传算法会议等国际会议持续推进研究。2.1机器学习概述图2-2机器学习融合的各种学习方法2.1机器学习概述学习是人类具有的一种重要的智能行为，而机器学习多学科交叉，使用计算机作为工具，致力于真实实时的模拟人类学习方式，并将现有内容进行知识结构划分来有效提高学习效率。兰利（1996年）的定义是：“机器学习是一门人工智能的科学，该领域的主要研究对象是人工智能，特别是如何在经验学习中改善具体算法的性能。”汤姆·米切尔（1997年）对信息论中的一些概念有详细的解释，其中定义机器学习时提到：“机器学习是对能通过经验自动改进的计算机算法的研究。”阿尔帕丁（2004年）对机器学习的定义是：“机器学习使用数据或以往的经验，以此优化计算机程序的性能标准。”2.1.2机器学习的定义2.1机器学习概述机器学习是人工智能中研究怎样使用计算机模拟或实现人类学习活动的科学，其理论和方法已被广泛应用于解决工程应用和科学领域的复杂问题。机器学习的研究主要分为两个方向：第一个是传统机器学习的研究，第二个是大数据环境下机器学习的研究。2.1.3机器学习的研究内容2.1机器学习概述1．传统机器学习的研究内容传统机器学习关注学习机制，涵盖决策树、随机森林、神经网络与贝叶斯学习，强调可解释性与泛化能力。（1）决策树通过信息增益等准则分裂特征，结构清晰、可解释，剪枝抑制过拟合，适合中小规模与表格数据。（2）ID3引入信息论，偏向多值属性；C4.5改进为信息增益率并支持连续属性，但需遍历阈值，内存占用大。（3）1984年提出剪枝思想显著提升泛化；Chi-Square依据属性与类别关联统计量；AS-SISTANT允许类别取值交集。（4）随机森林集成多棵树，袋外估计评估误差，抗过拟合、鲁棒性强，对高维与缺失数据友好，缺点是可解释性弱。（5）人工神经网络（ArtificialNeuralNetworks，ANN）具非线性表达与自适应能力，擅长模式与语音识别、非结构化数据，但训练需大量数据与算力。2.1机器学习概述2．大数据环境下机器学习的研究内容大数据促使机器学习以分布式并行提升效能，提取可理解知识；降噪与分治降成本提效率，支撑多模态智能分析与产业升级。（1）分布式与并行计算支撑大规模训练，横向扩展算力，缩短训练时长，满足海量数据实时与批处理需求。（2）分治策略与降噪机制缓解冗余与异常干扰，降低存储与通信成本，稳定模型性能，提升总体学习效率。（3）数据转向与处理能力提升，强化采集、清洗、标注、治理与存储，支撑端云协同与数据生命周期管理。（4）新型数据涌现：文本与情感、图像与视频、图与网络，推动跨模态表示学习与检索，拓展应用边界。（5）面向智能数据分析，融合挖掘与学习，实现自动化规划与人机协同，赋能产业升级与新兴业态发展。本章目录2.1机器学习概述12.2基于学习方式的分类2.5机器学习的应用2.4机器学习的算法2.3机器学习的基本结构2.2基于学习方式的分类机器学习的核心是“使用算法解析数据，从中学习，然后对世界上的某件事情做出决定或预测”。机器学习有3种主要类型，即监督学习、无监督学习和强化学习，机器学习的3种主要类型如图2-3所示。图2-3机器学习的3种主要类型2.2基于学习方式的分类监督学习，也称有导师学习，是指输入数据中有导师信号，以概率函数、代数函数或人工神经网络为基函数模型，采用迭代计算方法，学习结果为函数。监督学习以标注数据训练函数，预测新样本结果；含分类与回归，两者依赖特征-目标映射与误差最小化。（1）分类将样本映射到离散类别，如垃圾邮件过滤，基于历史标注学习判别边界，提升准确率并控制误报率。（2）回归预测连续数值，如天气预报，利用历史多变量特征拟合函数，关注偏差-方差权衡与区间不确定性。（3）训练需输入与输出成对标注，采用损失函数与正则化减过拟合，交叉验证与早停提升泛化与稳定性。2.2.1监督学习2.2基于学习方式的分类无监督学习又称无导师学习、归纳性学习，是指输入数据中无导师信号，采用聚类方法，学习结果为类别。典型的无监督学习有发现学习、聚类、竞争学习等。无监督学习通过循环和递减运算来减小误差，达到分类的目的。在无监督学习中，数据是无标签的。由于大多数真实世界的数据都没有标签，因此这样的算法就特别有用。无监督学习分为聚类和降维。聚类用于根据属性和行为对象进行分组。这与分类不同，因为这些组不是用户提供的。聚类的一个例子是将一个组划分成不同的子组（如基于年龄和婚姻状况），然后应用到有针对性的营销方案中。降维通过找到共同点来减少数据集的变量。大多数的大数据可视化使用降维来识别趋势和规则。2.2.2无监督学习2.2基于学习方式的分类强化学习（ReinforcementLearning，简称RL，也称增强学习）是一种以环境反馈——即奖励或惩罚信号——为指导，结合统计学与动态规划方法，通过试错机制实现学习的关键技术。强化学习通过智能体与环境交互试错，学习最优策略以最大化累积奖励；不依赖标签，重绩效。应用涵盖棋类、自动驾驶、推荐与机器人控制。强化学习的核心组成如下：（1）环境（Environment）：环境是智能体外部世界，定义状态、动作与奖励。根据动作返回新状态与奖励，形成交互闭环；可为现实场景或仿真平台。（2）智能体（Agent）：执行决策与学习的主体，目标最大化长期回报。基于状态按策略选动作，并依奖励信号持续更新策略以优化表现。（3）状态（State）：刻画环境某时刻信息，供智能体决策。形式可为数值向量或多模态数据，如棋局布局、视频帧与多传感器读数。（4）动作（Action）：智能体在给定状态的决策输出，直接作用环境演化。可为离散选择或连续控制，如移动方向、速度与转向角。（5）奖励（Reward）：环境对行为的反馈度量优劣。正奖励强化期望行为，负奖励惩罚错误；奖励设计决定学习动力与策略优化方向。（6）策略（Policy）：定义状态到动作的映射或概率分布，可确定性或随机性。策略为算法核心，主导决策效率与整体性能。2.2.3强化学习2.2基于学习方式的分类1．基于学习策略的分类基于学习策略，机器学习分为模拟人脑的和直接采用数学方法的。（1）模拟人脑的机器学习符号学习基于认知心理学，以符号为输入、推理搜索图或状态空间，目标为概念与规则，含记忆、示例、演绎、类比、解释等。神经网络学习以脑科学为基础，数值输入与迭代优化权值和拓扑。（2）直接采用数学方法的机器学习以统计机器学习为主，基于数据与目标选择模型与超参数，输入样本并按策略训练，利用合适算法优化，最终用训练后模型进行分析与预测。统计机器学习有3个要素：①

模型：在未进行训练前，其可能的参数有多个甚至无穷多个，故可能的模型也有多个甚至无穷多个，这些模型构成的集合就是假设空间。②

策略：即从假设空间中挑选出参数最优的模型的准则。模型的分类或预测结果与实际情况的误差（损失函数）越小，模型就越好。那么策略就是误差最小。③

算法：即从假设空间中挑选模型的方法（等同于求解最佳的模型参数）。机器学习的参数求解通常都会转化为最优化问题，故学习算法通常是最优化算法，如最速梯度下降法、牛顿法以及拟牛顿法等。2.2.4机器学习的其他分类2.2基于学习方式的分类2．基于学习方法的分类基于学习方法，机器学习有归纳、演绎、类比和分析等类别。（1）归纳学习。符号归纳学习：典型的有示例学习、决策树学习。函数归纳学习（发现学习）：典型的有神经网络学习、示例学习、发现学习、统计学习。（2）演绎学习。（3）类比学习：典型的有案例（范例）学习。（4）分析学习：典型的有解释学习、宏操作学习。3．基于数据形式的分类基于数据形式，机器学习分为结构化方法和非结构化方法。（1）结构化学习：以结构化数据为输入，以数值计算或符号推演为方法。典型的有神经网络学习、统计学习、决策树学习、规则学习。（2）非结构化学习：以非结构化数据为输入，典型的有类比学习、案例学习、解释学习、文本挖掘、图像挖掘、Web挖掘等2.2基于学习方式的分类4．基于学习目标的分类基于学习目标，机器学习分为概念、规则、函数、类别、贝叶斯网络等方法。（1）概念学习：学习目标和结果为概念，或者说是获得概念的学习。典型的有示例学习。（2）规则学习：学习目标和结果为规则，或者说是获得规则的学习。典型的有决策树学习。（3）函数学习：学习的目标和结果为函数，或者说是获得函数的学习。典型的有神经网络学习。（4）类别学习：学习目标和结果为对象类，或者说是获得类别的学习。典型的有聚类分析。（5）贝叶斯网络学习：学习目标和结果是贝叶斯网络，或者说是获得贝叶斯网络的学习。其又可分为结构学习和多数学习。本章目录2.1机器学习概述12.2基于学习方式的分类2.5机器学习的应用2.4机器学习的算法2.3机器学习的基本结构2.3机器学习的基本结构机器学习的基本流程包括数据预处理、模型学习、模型评估及新样本预测。环境提供高质量信息以减轻学习负担；学习部分更新知识库，重表示与可推理可扩展；执行部分重复杂性、反馈与透明性；整体实现对现有知识的扩展改进。机器学习与人脑思考过程的对比如图2-4所示。图2-4机器学习与人脑思考过程的对比2.3机器学习的基本结构信息质量决定学习系统设计难度。若环境数据质量高且与知识库原则差异小，学习部分易于处理、对齐与吸收，快速更新知识库，提高执行效率与稳定性，降低训练与维护成本。面向杂乱无序数据，系统需充分采集后筛除冗余细节，归纳总结并抽象一般原则，再写入知识库。此过程任务繁重，设计复杂度高，需可靠特征工程与稳健算法支撑。2.3.1环境2.3机器学习的基本结构知识库是影响学习系统设计的第二个关键因素。在选择合适的表示方式时，设计者需要兼顾以下四个方面：（1）表达能力强：选用的表示方式应能够充分表达复杂的知识和关系，使系统能够捕捉到细微差别，满足具体任务的需求。（2）易于推理：表示方式应支持高效的推理过程，让系统能够快速得出结论或推导出新的知识，以应对环境的变化和任务的要求。（3）容易修改知识库：知识表示应便于更新和修改，以适应新的信息或变化的需求。这一特性使得系统能够不断演化，融入新知识，保持其相关性和有效性。（4）知识表示易于扩展：随着应用的扩展，知识表示方法应该能够无缝整合新的知识模块，支持系统的灵活扩展，以适应日益复杂的场景和需求。2.3.2知识库2.3机器学习的基本结构执行部分是整个学习系统的核心，因为它的操作直接体现了学习部分所力求改进的效果。执行部分负责将学习到的知识应用于实际任务，从而实现目标和解决问题。在设计学习系统时，需要关注与执行部分相关的三个关键问题：复杂性、反馈和透明性。（1）复杂性：执行部分需在策略复杂度与可操作性间权衡。过复杂影响实时性与效率；设计应支持复杂操作又保持简洁，便于实施与维护。（2）反馈：建立强反馈机制，评估执行效果，及时准确回传数据，助策略调整与知识库优化，提升学习能力与对新情境适应性。（3）透明性：提升执行过程可解释与可理解性，尤其在敏感任务中。透明化增强信任，便于用户理解决策依据并参与系统优化2.3.3执行部分2.4机器学习的算法学习是一项复杂的智能活动，其中学习过程与推理过程密切相关。学习中使用的推理越多，系统的能力就越强。要全面理解大多数机器学习算法，基本掌握一些关键的数学概念是非常重要的，这些概念包括：（1）线性代数线性代数是机器学习的重要基础，涉及的概念包括：矩阵运算：用于描述和操作数据集的基本形式。特征值与特征向量：在降维和数据分析中起着关键作用。向量空间：为理解数据之间的关系提供结构。范数：用于测量向量的长度或大小，是优化算法中的一个重要工具。2.4机器学习的算法（2）微积分微积分提供了处理变化和优化的工具，主要概念包括：偏导数：用于描述多变量函数的变化率，特别是在优化目标函数时。向量值函数：将多个输入映射到多个输出，广泛应用于深度学习和多变量优化中。方向梯度：描述函数在某个方向上的变化率，对梯度下降算法等优化方法至关重要。（3）概率论与统计学这两者为处理不确定性和数据分析提供了理论基础，包括：贝叶斯定理：用于更新概率信息和进行推断，广泛应用于分类和预测模型中。组合学：用于处理离散结构和确定可能的组合，帮助理解算法的复杂性。抽样方法：用于从总数据集中提取样本，支持推断与模型评估。掌握这些数学概念将为更深入的机器学习研究和应用奠定坚实的基础。2.3机器学习的基本结构信息质量决定学习系统设计难度。若环境数据质量高且与知识库原则差异小，学习部分易于处理、对齐与吸收，快速更新知识库，提高执行效率与稳定性，降低训练与维护成本。面向杂乱无序数据，系统需充分采集后筛除冗余细节，归纳总结并抽象一般原则，再写入知识库。此过程任务繁重，设计复杂度高，需可靠特征工程与稳健算法支撑。2.3.1环境2.3机器学习的基本结构知识库是影响学习系统设计的第二个关键因素。在选择合适的表示方式时，设计者需要兼顾以下四个方面：（1）表达能力强：选用的表示方式应能够充分表达复杂的知识和关系，使系统能够捕捉到细微差别，满足具体任务的需求。（2）易于推理：表示方式应支持高效的推理过程，让系统能够快速得出结论或推导出新的知识，以应对环境的变化和任务的要求。（3）容易修改知识库：知识表示应便于更新和修改，以适应新的信息或变化的需求。这一特性使得系统能够不断演化，融入新知识，保持其相关性和有效性。（4）知识表示易于扩展：随着应用的扩展，知识表示方法应该能够无缝整合新的知识模块，支持系统的灵活扩展，以适应日益复杂的场景和需求。2.3.2知识库2.3机器学习的基本结构执行部分是整个学习系统的核心，因为它的操作直接体现了学习部分所力求改进的效果。执行部分负责将学习到的知识应用于实际任务，从而实现目标和解决问题。在设计学习系统时，需要关注与执行部分相关的三个关键问题：复杂性、反馈和透明性。（1）复杂性：执行部分需在策略复杂度与可操作性间权衡。过复杂影响实时性与效率；设计应支持复杂操作又保持简洁，便于实施与维护。（2）反馈：建立强反馈机制，评估执行效果，及时准确回传数据，助策略调整与知识库优化，提升学习能力与对新情境适应性。（3）透明性：提升执行过程可解释与可理解性，尤其在敏感任务中。透明化增强信任，便于用户理解决策依据并参与系统优化。2.3.3执行部分本章目录2.1机器学习概述12.2基于学习方式的分类2.5机器学习的应用2.4机器学习的算法2.3机器学习的基本结构2.4机器学习的算法2.4.1专注于学习能力一个算法应该具有以下5个重要特征：（1）有穷性：算法必须能够在有限的步骤后终止。这意味着算法的执行是可控的，不会进入无尽循环，能够保证在一定时间内完成计算任务。（2）确切性：算法的每一个步骤都必须清晰且准确地定义，以避免产生歧义。这种明确性确保了在执行过程中没有不确定性，使得每一步都容易理解和实现。（3）输入项：算法可以接受零个或多个输入，这些输入用于描述运算对象的初始状态。即使没有输入，算法本身也应提供所需的初始条件，以便进行后续计算。（4）输出项：算法应至少产生一个输出，以反映对输入数据处理后的结果。没有输出的算法通常没有实际意义，因此输出是评估算法有效性的重要方面。（5）可行性：算法中的每个计算步骤都应能够分解为基本的可执行操作。这意味着所有步骤可以在有限时间内完成，确保算法的有效性和实际应用的可行性。2.4机器学习的算法算法的要素主要如下：（1）数据对象的运算和操作：计算机可以执行的基本操作是通过指令形式描述的。这些指令组成了计算机系统的指令集，定义了系统能够执行的所有操作。基本的运算和操作通常可以分为以下四类：①算术运算：包括加法、减法、乘法和除法等基本数学运算，用于数值计算和数据处理。②逻辑运算：包括与（AND）、或（OR）和非（NOT）运算，这些运算用于处理布尔逻辑，常用于条件判断和控制流。③关系运算：包括大于、小于、等于和不等于等比较运算，用于评估数据之间的关系，通常用于条件语句和决策过程。④数据传输：包括输入、输出和赋值运算，负责在计算机和外部环境之间传递数据，以及在不同数据存储之间转移和分配数据。（2）算法的控制结构：算法功能受操作选择与执行顺序共同影响。控制结构统筹顺序、分支与循环，保障逻辑流达成目标。合理设计可提升效率与可读性，使复杂问题求解更系统规范。2.4机器学习的算法2．算法的评定同一问题可以用不同的算法来解决，而算法的质量将直接影响程序的效率。因此，算法分析的主要目标在于选择合适的算法并对其进行改进。算法评价主要考虑时间复杂度和空间复杂度：（1）时间复杂度：度量计算工作量与效率，随规模增大而上升，运行时间显著受输入大小影响，常用渐近表示。（2）空间复杂度：度量内存占用，分析类似时间复杂度，采用渐近表示；相对更易评估内存使用。（3）正确性：最关键标准，要求对全部输入产生预期输出，经数学证明或测试验证，决定可靠性。（4）可读性：衡量易读与理解。高可读性具清晰结构与注释，便于他人理解，降低维护成本。（5）健壮性：即容错性。能妥善处理异常或不合理输入，避免崩溃与错误结果，提升稳定性与体验。2.4机器学习的算法回归分析是一种用于建模和分析数据的预测性技术工具，旨在研究因变量（目标变量）与自变量（预测变量）之间的关系。它通常应用于预测分析、时间序列模型以及变量之间因果关系的发现。回归分析的曲线拟合过程如图2-5所示。2.4.2回归算法图2-5回归分析的曲线拟合过程2.4机器学习的算法例如，司机的鲁莽驾驶与道路交通事故数量之间的关系可以通过回归分析来研究，这是一种重要的数据建模和分析工具。回归分析主要包括七种常用技术：线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归和弹性网络回归。回归分析的好处有很多，主要包括：（1）它能够揭示自变量与因变量之间是否存在显著关系，同时量化这种关系的强度。（2）它可以有效地表明多个自变量对单一因变量的影响程度，帮助理解各变量之间的相互作用。2.4机器学习的算法最著名的基于实例的算法是k-最近邻（K-NearestNeighbor，KNN）算法，它是机器学习中最基础和简单的算法之一，既能用于分类，也能用于回归。KNN的工作原理如下：（1）数据存储：在训练阶段，KNN算法会将所有的训练数据存储在内存中。这个过程本质上是“记忆”，并不进行复杂的学习。（2）距离度量：当接收到一个新的数据点时，KNN算法会计算该数据点与所有训练数据点之间的距离。常用的距离度量方法包括欧几里得距离、曼哈顿距离和闵可夫斯基距离。选择不同的距离度量会影响分类结果。（3）查找最近邻：算法会根据计算出的距离，选择距离新数据点最近的k个训练样本。“k”的选择通常是一个超参数，可以通过交叉验证等方法进行调优。（4）分类或回归：在分类任务中，KNN算法会对这k个邻居进行投票，选择出现频率最高的类别作为新数据点的预测类别；在回归任务中，则会求取这k个邻居的平均值作为预测结果。KNN算法的一个显著优点是其简单性和易于解释性，适合于处理小型到中型数据集。对于不均匀分布的特征向量，KNN也能有效地进行分类。它能够自适应数据的变化，处理具有复杂边界的多类分类问题。2.4.3基于实例的算法2.4机器学习的算法决策树以树状组织“弱”学习器，将输入空间划分为区域，叶节点对应类别。自根递归分割样本至纯，沿根至叶路径即分类规则。结构简单，训练与预测高效。1.工作原理决策树的工作原理可以概括为以下几个步骤：（1）模型构建：自根递归分裂特征节点，按分支划分样本，直至子集同类成叶。（2）特征选择：用信息增益、增益比、基尼评估区分力，选最佳特征分裂。（3）递归分裂：每层择优分裂并生成子节点，至达深度/样本/增益等停止条件。（4）预测过程：自根按特征路径下行，至叶节点，输出对应类标签或回归值。2.4.4决策树算法2.4机器学习的算法2.应用场景决策树被广泛应用于各个领域，包括：（1）金融领域：信用评分、风险评估等。（2）医疗领域：疾病诊断、治疗方案推荐等。（3）市场营销：客户细分、产品推荐等。（4）计算机视觉：图像识别与处理等。决策树算法通过其简单有效的结构和直观的可解释性，使得在多种实际应用中展现了良好的表现。通过结合集成方法（如随机森林和提升决策树）能显著提高其性能，克服单一决策树的不足。决策树算法如图2-6所示。图2-6决策树算法2.4机器学习的算法单一特征难以识别动物，组合多特征可提升预测。随机森林以随机特征构建多树并集成，抗噪与过拟合更强。汇总各树预测评估训练与测试误差，衡量拟合与精度，优势显著。（1）高精度分类器：随机森林算法通过集成多个决策树的预测结果，通常能够生成高精度的分类器，有效提高了分类的准确性。（2）处理大量变量：该算法能够处理大量的变量和复杂的数据集，能够很好地应对高维数据，适用于多种实际应用中的特征选择。（3）平衡分类误差：随机森林具有自然的防过拟合能力，并且能够在不同类别的分类资料集之间平衡误差，从而减少模型对噪声数据的敏感性，提升对未知数据的泛化能力。（4）内置特征重要性评估：随机森林可以通过计算特征的影响力，自动评估每个特征的重要性，为后续的特征选择或降维提供依据。随机森林算法通过集成多个决策树的力量，不仅提高了模型的稳定性和准确性，还有效解决了个别树模型容易过拟合的问题，成为了一种广泛应用于分类和回归问题的强大工具。2.4机器学习的算法2.4.5朴素贝叶斯算法朴素贝叶斯算法是一种基于贝叶斯定理的简单而高效的分类算法，常用于文本分析、垃圾邮件过滤和情感分析等领域。它由一系列算法组成，这些算法共享一个共同的原则：在分类时，被分类的每个特征都与其他特征的值独立。2.4机器学习的算法1.工作原理朴素贝叶斯算法主要基于贝叶斯定理，其公式如下：2.4机器学习的算法使用朴素贝叶斯算法时，模型主要经历以下几个步骤：（1）特征概率计算：首先计算每个特征在每个类别下的条件概率。这通常是通过统计数据集中的特征频率或使用拉普拉斯平滑等方法来完成。（2）先验概率估计：然后，需要计算每个类别的先验概率，这可以通过类别的频率来获取。（3）分类：在进行分类时，根据贝叶斯定理来计算待分类样本的后验概率，选择具有最高后验概率的类别作为预测结果。2.4机器学习的算法2.应用实例朴素贝叶斯算法在很多实际应用中都非常流行，例如：（1）垃圾邮件过滤：许多垃圾邮件过滤器使用朴素贝叶斯算法来分析和分类电子邮件。使用用户输入的类标记数据（如“垃圾邮件”或“正常邮件”）进行训练后，算法能够对新邮件进行适当分类。（2）文本情感分析：在社交媒体和用户评论中，朴素贝叶斯被广泛用于情感分析，以判断文本的情感倾向（如正面、负面或中立）。（3）推荐系统：在个性化推荐中，朴素贝叶斯也可以用于分析用户行为数据，辅助建立用户偏好模型。2.4机器学习的算法聚类算法是一类用于发现数据集中的元素之间的共性并将其进行分组的无监督学习技术。通过对数据的聚类分析，我们可以识别出自然形成的类别或群体，从而帮助理解数据结构。聚类算法广泛应用于市场细分、社交网络分析、图像处理等多种领域。其中最常用的聚类算法之一是均值聚类算法。这是一种基于划分的聚类方法，其工作过程可以描述如下：1.工作原理（1）选择簇数：首先，分析人员需要预先指定簇的数量。这个参数对于最终的聚类结果有重要影响，因此通常需要通过实验或交叉验证来选择一个合适的值。（2）初始化：随机选择个数据点作为初始簇中心（或质心）。（3）分配步骤：对于每个数据点，计算它与每个簇中心的距离，通常采用欧几里得距离。将每个数据点分配给距离其最近的簇中心，从而完成初始分组。（4）更新步骤：根据当前成员的数据点位置，重新计算每个簇的中心位置。具体来说，对于每个簇，从其成员点的平均值计算新的簇中心。（5）迭代：重复进行分配步骤和更新步骤，直到簇中心位置不再发生显著变化或者达到设定的迭代次数。这时，聚类过程被视作收敛。2.4.6聚类算法

2.4机器学习的算法2.应用场景k均值聚类算法具有广泛的应用，主要包括：市场细分：通过对客户数据进行聚类，企业可以识别出不同顾客群体，制定个性化的市场营销策略。图像压缩：在图像处理中，均值可以用来识别颜色群体，从而压缩图像数据。社会网络分析：在社交网络中，通过聚类用户行为，可以识别出特定类型的用户群体，进行深入的网络分析。异构数据分析：在生物信息学中，均值用于分析基因表达数据，寻找相似的基因组或样本。聚类算法，特别是均值聚类算法，提供了一种有效的方式来理解和组织复杂的数据集。2.4机器学习的算法支持向量机（SupportVectorMachine，SVM）是一种在统计学习理论中的强大算法，广泛用于分类和回归分析。它与传统学习方法的思维方式有很大不同，主要体现在通过映射输入空间到高维特征空间来简化问题，使得原本非线性可分的问题在高维空间中变得线性可分。2.4.7支持向量机算法2.4机器学习的算法1.工作原理支持向量机的基本思想可以概括为以下几个步骤：（1）空间变换：通过一种非线性变换，将输入数据从原始空间映射到一个高维特征空间。这种变换的目的是寻找一个更有效的分隔超平面。常用的映射方法包括多项式核、径向基函数（RBF）核等。（2）寻找最优超平面：在高维空间中，支持向量机通过找到一个最优的分隔超平面来进行分类。这个超平面最大化了不同类别样本点的间隔（margin）。具体而言，支持向量机的目标是解决以下优化问题：最大化边界（margin）:找到一个超平面，使得到最近的正负样本的距离最大。确定支持向量：位于边界附近的样本点（支持向量）是确定分类决策的关键。超平面的方程通常可以表示为：（3）分类决策：一旦划分了样本空间，支持向量机就可以通过超平面进行分类。当新的样本数据出现时，支持向量机判断该样本属于哪个类别，依据于其到超平面的距离。（4）处理软间隔：数据含噪或不可线性可分时，SVM引入软间隔，允许少量样本越界。通过软间隔优化，提高训练误差容忍度，增强模型泛化。2.4机器学习的算法2.应用实例支持向量机被广泛应用于多个领域，主要包括：垃圾邮件识别：通过分析特征（如邮件内容、发件人等），支持向量机可以高效地将邮件分类为垃圾邮件或正常邮件。人脸识别：在计算机视觉领域，支持向量机可以用于对人脸数据进行分类，

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《人工智能通识教程》课件全套 李正军 第1-8章 绪论、机器学习 -具身智能与机器人系统

文档简介

温馨提示

最新文档

评论

相关文档

《人工智能通识教程》课件全套李正军第1-8章绪论、机器学习 -具身智能与机器人系统