人工智能技术基础及应用活页式教程 课件 第1章 人工智能基础与关键技术_第1页
人工智能技术基础及应用活页式教程 课件 第1章 人工智能基础与关键技术_第2页
人工智能技术基础及应用活页式教程 课件 第1章 人工智能基础与关键技术_第3页
人工智能技术基础及应用活页式教程 课件 第1章 人工智能基础与关键技术_第4页
人工智能技术基础及应用活页式教程 课件 第1章 人工智能基础与关键技术_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章人工智能基础与关键技术从图灵测试到DeepSeekAIFUNDAMENTALS&KEYTECHNOLOGIES章节导入:从图灵测试到DeepSeekDeepSeek:自然语言处理新高度2025年春节期间,DeepSeek以卓越的语言理解与生成能力闯入大众视野,在AI领域掀起变革浪潮,展现了大模型技术的无限潜力。宇树机器人:AI走进现实舞台龙年春晚舞台上,宇树机器人的精彩表演成为全球焦点。这标志着人工智能已从抽象概念落地,以实体形态融入并惊艳现实生活。本章核心目标:系统探讨人工智能的基础理论与关键技术,解析从图灵测试到现代AGI的演进路径,掌握这一引领时代的核心科技力量。图1-1春晚宇树机器人的精彩表演2025/2026年央视春晚,宇树科技(Unitree)的人形机器人与演员同台共舞,展现了极高的运动控制精度与协同能力。1.1人工智能的发展阶段与发展方向DEVELOPMENTSTAGESANDFUTURETRENDSOFAI1.1.1人工智能的发展阶段在科技发展的漫长长河中,人工智能(ArtificialIntelligence,AI)宛如一颗璀璨的星辰,从萌芽到蓬勃发展,不断改写着人类认知与实践的边界。从奠定理论基石的图灵测试,到如今大放异彩的DeepSeek,这一历程见证了无数科学家的智慧结晶与不懈探索。理论奠基蓬勃发展理论奠基期(1950—1980年)图灵测试1950年艾伦·图灵发表《计算机器与智能》,提出“机器能否思考”的命题,并设计了著名的“图灵测试”作为判断机器智能的标准。达特茅斯会议1956年,在美国达特茅斯学院举行的研讨会首次正式提出“人工智能”这一学科名称,确立了AI研究的核心方向。符号主义范式这一时期的研究主要围绕符号主义展开,核心思想是将人类知识转化为形式化的符号规则,通过逻辑推理模拟智能。ARTIFICIALINTELLIGENCEHISTORY图1-2图灵测试;图1-3达特茅斯会议图1-2艾伦·图灵与图灵测试人工智能理论的奠基人,提出图灵测试图1-3达特茅斯会议与会者1956年确立人工智能学科的里程碑会议技术沉淀期(1980—2010年)范式转变:统计学习崛起研究范式从符号主义转向以数据驱动的统计学习方法,机器学习逐渐成为人工智能研究的核心主流范式。关键事件:深蓝战胜人类1997年IBM“深蓝”战胜国际象棋冠军卡斯帕罗夫,这一标志性事件向世界展示了AI在特定领域的巨大潜力。技术进步:算法与算力双升计算能力与数据量的增长奠定了发展基础,支持向量机、决策树等经典机器学习算法在这一时期相继完善成熟。商业应用:走出实验室AI技术开始从学术研究走向实际商业落地,在垃圾邮件过滤、个性化推荐系统等领域实现了规模化应用。图1-4IBM深蓝战胜卡斯帕罗夫1997年,IBM深蓝计算机战胜国际象棋世界冠军卡斯帕罗夫,标志着人工智能在特定领域达到人类顶尖水平,成为AI发展史上的里程碑事件。深度学习爆发期(2010—2020年)技术突破:ImageNet里程碑2012年AlexNet在ImageNet竞赛中取得突破性成果,大幅降低识别错误率,正式拉开了深度学习革命的序幕。关键事件:AlphaGo人机大战2016年AlphaGo战胜围棋世界冠军李世石,向世界展示了深度强化学习在复杂决策领域的强大能力。架构创新:Transformer变革Transformer架构的提出彻底改变了NLP领域,BERT、GPT等预训练大模型相继问世,推动AI能力指数级增长。广泛应用:垂直领域落地AI技术从实验室走向产业界,在医疗影像诊断、金融风控、智能制造等专业领域的规模化应用成为现实。图1-5AlphaGo对战李世石2016年3月,AlphaGo与围棋世界冠军李世石展开五番棋对决AlphaGo以4:1的总比分获胜,标志着人工智能在复杂策略游戏领域取得重大突破AI里程碑时刻通用智能探索期(2020年至今)大模型时代引领潮流以ChatGPT、DeepSeek、Claude为代表的大模型技术重塑产业格局,展现出强大的通用智能潜力。全球研发竞赛加剧全球范围内展开激烈的大模型研发角逐,中国的DeepSeek-R1等模型在技术前沿表现突出。学术成就获最高认可2024年诺贝尔物理学奖和化学奖分别授予人工神经网络及蛋白质结构预测领域的科学家。应用与治理成为议题AI技术在全球范围内的深度应用加速,其带来的社会影响与全球治理成为各国关注的重要议题。图1-62024诺奖物理与化学奖获得者图1-6a物理学奖获得者表彰人工神经网络领域的奠基性贡献图1-6b化学奖获得者表彰计算蛋白质设计与结构预测成就核心启示:人工智能技术已成为推动基础科学突破的关键引擎1.1.2人工智能未来的发展方向通用人工智能探索加速演进具身智能关键发展方向人机协同深度融合深化前沿科技融合多技术交叉赋能全球治理体系规则与伦理构建未来人工智能技术正迈向更加广阔的发展前景,其演进将深刻影响社会生产与生活方式,推动人类文明迈向新的高度。未来发展方向:通用人工智能与具身智能通用人工智能(AGI)探索将加速推进,下一代AI系统将具备更强大的自主决策能力。具身智能与AGI的结合将产生乘数效应,推动智能体在真实世界中自主学习与进化。具身智能(EAI)将成为关键突破方向,AI系统正从纯软件形态向具身化方向演进。在多模态感知、高精度运动控制和复杂环境交互方面将取得显著进展。“技术融合将打破物理与数字世界的边界,开启智能新纪元”未来发展方向:人机协同与前沿科技融合人机协同:从工具到“数字同事”AI系统正从单一辅助工具向深度协作的“数字同事”转变。在医疗、教育、智能制造等关键领域,人机协作模式将得到广泛应用。脑机接口等新兴技术的突破,将进一步打破物理界限,深化这种协作关系。前沿科技融合:催生新一轮技术革命人工智能将与量子计算、类脑芯片、边缘计算等前沿技术深度融合。这种跨学科的融合将突破现有算力与算法的瓶颈,催生新的技术革命,推动AI能力实现质的飞跃,开启超智能时代。未来发展方向:全球人工智能治理全球治理体系构建正在形成多层次的治理框架,欧盟、中国、美国等主要经济体积极制定法规政策,旨在构建统一标准,确保AI技术在安全、可控和负责任的轨道上发展。伦理规范与安全标准高度关注AI伦理问题,特别是具身智能带来的新挑战。国际社会正在加速制定伦理指南和技术安全标准,以平衡创新发展与风险防控。学习思考问题一:在人工智能的发展过程中,早期探索受限的主要原因是什么?问题二:人工智能技术突破和社会需求是如何相互影响、相互促进的?结合本章所学知识,深入探讨上述议题1.2人工智能介绍INTRODUCTIONTOARTIFICIALINTELLIGENCE1.2.1人工智能的定义人工智能是计算机科学的重要分支,其核心目标是使机器具备模拟、延伸甚至超越人类智能的能力。本节将详细解析其定义内涵,为后续深入学习奠定基础。人工智能的定义解析学科定位:人工智能是计算机科学的一个重要分支,致力于探索智能的本质。核心目标:使机器具备模拟、延伸甚至超越人类智能的能力,实现自主化操作。感知能力接收和处理文字、图像、声音等各种输入信息,如同人类的感官。推理与学习根据输入信息进行逻辑推理,并从海量数据中自动学习潜在规律。决策与执行基于分析结果做出合理反应或输出,高效解决特定领域的复杂问题。通俗理解:让机器能听、能看、能说、会思考,像人一样智能地感知和行动。人工智能定义的应用举例智能语音助手如Siri、小爱同学,能理解语音指令并执行操作或回答问题,实现人机语音交互。图像识别系统如人脸识别、车牌识别,通过算法准确识别图像中的物体、特征或特定目标。推荐系统常见于电商平台,基于用户历史行为数据,通过模型预测喜好并进行个性化商品推荐。机器翻译如谷歌翻译、DeepL,利用神经网络模型,能将一种自然语言自动翻译成另一种语言。这些应用都体现了人工智能的感知、学习与决策能力,正深刻改变着我们的生活。1.2.2人工智能的分类人工智能可以根据不同的标准进行分类,最常见的是按照其功能和应用范围划分为弱人工智能和强人工智能。弱人工智能(WeakAI)定义(Definition)专注于特定任务或领域的智能系统,也被称为“专用人工智能”,仅在单一领域具备专业能力。核心特点(KeyFeatures)领域专一:擅长解决特定问题,跨领域能力弱。无自主意识:仅执行预设程序,不具备自我意识。当前现状(CurrentStatus)是目前人工智能技术的绝对主流,技术相对成熟,已广泛渗透并应用于各行各业的实际业务中。典型应用(Applications)智能客服、语音识别(如Siri)、图像分类、电商推荐算法、自动驾驶辅助系统(ADAS)等。“弱人工智能是人工智能发展的基石,虽然没有意识,但它正在重塑我们的工作与生活方式。”强人工智能(StrongAI)核心定义(Definition)具有与人类智能相当的通用智能的系统,也被称为“通用人工智能”(AGI)。它旨在创造出像人类一样能理解、学习和适应各种环境的机器。核心特点(KeyFeatures)通用能力:能够理解、学习和执行人类可以完成的任何智力任务,而非局限于特定领域。自主意识:拥有自我意识、情感和主观体验,能像人类一样思考、推理并理解世界。当前现状(CurrentStatus)目前仍处于理论研究和科幻想象阶段,尚未有任何系统被证实达到了强人工智能的水平,距离实现还有巨大的技术鸿沟。面临挑战(Challenges)不仅涉及复杂的技术难题(如意识的本质),还面临着深刻的伦理、哲学以及社会影响等多方面的严峻挑战。弱人工智能vs.强人工智能核心特征弱人工智能(WeakAI)强人工智能(StrongAI)智能范围特定领域,专用智能通用领域,通用智能自主意识无有学习能力针对特定任务学习像人类一样自主学习当前状态已广泛应用(如Siri,AlphaGo)理论研究阶段本质人类工具的延伸类人智能的突破关键区别:智能的通用性与是否具备自主意识1.2.3人工智能的应用领域人工智能的应用领域非常广泛,几乎涵盖了现代社会的各个方面,本节将介绍其在主要领域的应用。人工智能的主要应用领域医疗领域疾病诊断、医学影像分析、药物研发,提高诊断准确性和效率。金融领域风险评估、投资决策、欺诈检测,预测市场趋势,保障金融安全。交通领域自动驾驶技术,实时感知环境并决策,提升交通安全性与效率。教育领域智能辅导系统,提供个性化学习方案,因材施教。娱乐领域智能推荐系统,根据用户兴趣精准推荐电影、音乐等内容。制造业智能机器人协助完成复杂生产任务,大幅提升生产效率与质量。农业领域农作物生长监测、病虫害预测,助力精准农业,提高生产效益。“人工智能正在重塑各行各业,从传统制造到现代农业,从精准医疗到智慧交通。”1.2.4人工智能技术全景图人工智能技术体系可以划分为基础层、技术层和应用层,共同构成了完整的技术全景图。人工智能产业链结构基础层:AI发展的基石包含数据、算力、算法三大核心要素,为上层应用提供底层支撑。技术层:核心能力引擎涵盖计算机视觉、自然语言处理、语音技术、人机交互等关键技术。应用层:行业落地场景AI技术与传统行业深度融合,如智慧医疗、智能金融、智能制造等。人工智能技术全景图CHAPTER01.3人工智能关键技术KEYTECHNOLOGIESOFARTIFICIALINTELLIGENCE机器学习|深度学习|神经网络|计算机视觉|自然语言处理1.3.1机器学习机器学习是人工智能的核心技术,它让计算机能够从数据中学习,自动发现规律并进行预测。机器学习的定义与类比核心定义机器学习是人工智能的子集,它赋予计算机从海量数据中自我学习的能力。通过算法自动发现数据背后的规律,并利用这些规律构建模型,从而对未来的新数据进行预测或辅助决策。通俗类比:教小朋友认动物就像教孩子识别猫和狗:数据输入:给孩子看大量标注好的猫/狗图片特征学习:孩子观察并总结出“猫耳尖、狗耳圆”等特征预测应用:之后看到新图片,孩子就能准确判断是猫还是狗核心逻辑:数据(Data)+算法(Algorithm)→模型(Model)→预测(Prediction)机器学习的过程01.数据及处理收集数据,并进行清洗、转换和特征工程。02.机器训练选择合适算法,输入处理好的数据进行训练。03.构建模型根据算法构建模型,并评估其性能。04.预测结果将新数据输入训练好的模型,得到预测结果。机器学习全流程可视化示意图机器学习的类型监督学习使用标记的数据集进行训练,学习输入与输出的映射关系,主要用于预测和分类任务。无监督学习使用未标记的数据集,让模型自行发现数据中的内在模式和关系,常用于聚类和降维。强化学习通过与环境交互,基于奖励或惩罚机制进行学习,目标是最大化长期总奖励,适用于决策任务。核心差异:数据是否带标签(监督/无监督)vs交互与奖励机制(强化学习)监督学习与无监督学习监督学习(SupervisedLearning)模型在标记的数据集上训练,学习输入与输出的映射关系。例:人脸识别系统用标注好身份的人脸图像训练。无监督学习(UnsupervisedLearning)模型在未标记的数据集上训练,自行发现数据中的模式和关系。例:电商平台根据用户行为数据将用户分成不同群体。1.3.2深度学习和神经网络深度学习是机器学习的一个特殊子集,它通过构建多层人工神经网络来处理复杂数据,是当前人工智能领域的核心技术。深度学习的定义与特点核心定义深度学习是机器学习的子集,通过构建多层人工神经网络来处理信息,自动从数据中提取高级特征,无需人工特征工程。关键特征使用三层或更多层的神经网络结构,具备强大的自动模式识别能力,非常适合处理图像、语音、自然语言等复杂非结构化数据。图示:深度学习神经网络处理图像分类的过程机器学习与深度学习对比对比维度机器学习(MachineLearning)深度学习(DeepLearning)算法原理应用统计算法发现数据模式使用人工神经网络学习数据模式数据需求可处理少量数据需要大量数据适用任务适合低标签、结构化数据任务适合图像、自然语言处理等复杂任务特征提取依赖人工提取特征,需领域知识自动提取特征,支持端到端学习硬件需求计算量较小,可在CPU上运行计算量大,需要GPU等高算力硬件神经网络的工作原理输入层(InputLayer)作为网络的起点,负责接收原始数据并传递给后续层级。隐藏层(HiddenLayer)多层网络结构,逐层对数据进行特征提取、抽象和非线性变换。输出层(OutputLayer)产生最终结果,输出分类预测、数值回归等任务的答案。核心学习机制通过反向传播算法不断调整神经元之间的连接权重,优化模型准确性。神经网络结构示意图神经网络主要模型卷积神经网络(CNN)专为处理图像数据设计,擅长图像分类、目标检测等视觉任务。循环神经网络(RNN)擅长处理序列数据,广泛应用于自然语言处理、时间序列预测。生成对抗网络(GAN)通过生成器与判别器的对抗生成逼真数据,用于图像生成与编辑。图神经网络(GNN)专门处理图结构数据,适用于社交网络分析、知识图谱构建。Transformer基于自注意力机制,彻底改变了自然语言处理领域,支持并行计算。1.3.3实践项目:可视化神经网络实验室通过一个在线交互式实验室,直观地体验和理解神经网络的工作原理。实践步骤:访问并启动Netlab1.访问网站在浏览器中访问“神经网络实验室NeuralNetworkLab”(Netlab),准备开始探索。2.启动应用点击界面中的“LaunchApplication”按钮,即可进入交互式可视化界面开始实验。Netlab访问界面示例1.3.4计算机视觉计算机视觉是人工智能的一个重要领域,它让计算机能够从图像和视频中获取有意义的信息,赋予机器“看”的能力。AIFUNDAMENTALS计算机视觉的原理与人类视觉对比图像的数值化图像本质上是由像素组成的数字矩阵,每个像素可用灰度值或RGB值表示。计算机通过读取这些数值来理解图像内容。视觉系统对比人类通过眼睛和大脑处理视觉信息,而计算机视觉系统通过传感器、算法和计算设备来模拟这一过程,最终实现类人感知。计算机视觉的主要任务光学字符识别(OCR)从图像中自动提取文本信息,将印刷或手写文字转换为机器编码。对象和图像分类识别并分类图像中的具体对象,或对整个图像的场景内容进行归类。对象跟踪在连续的视频帧中,实时追踪特定目标对象的运动轨迹和状态。基于内容的图像检索根据图像的视觉内容特征,在海量数据库中查找相似或相关的图像。对象检测在复杂场景中,精准定位并标记出特定对象的位置,通常使用边界框。核心技术基石这些任务共同构成了AI视觉感知的基础,广泛应用于安防、医疗、自动驾驶等领域。计算机视觉的典型应用交通出行自动驾驶、车牌识别,提升交通效率与安全性。安防领域人脸识别、智能视频监控,强化公共安全保障。工业制造产品质量检测、机器人导航,推动智能制造升级。医疗行业医学影像分析、辅助诊断,提高医疗诊断准确率。零售行业虚拟试衣间、库存管理,优化消费体验与运营。农业领域作物监测、病虫害识别,助力精准农业发展。1.3.5实践项目:基于Web的以图搜图通过一个简单的实践项目,体验计算机视觉技术在以图搜图中的应用。计算机视觉·Web应用实践步骤:复制图片并粘贴到搜图引擎1.复制图片选择一张要搜索的图片,进行复制或截图操作,准备用于后续搜索。2.粘贴搜索打开支持以图搜图的引擎(如搜狗图片),在搜索栏中粘贴复制的图片进行检索。实践结果:查看搜索结果智能对象识别系统自动分析图片特征,精准识别出主体为“金毛寻回犬”,并提取关键属性信息。海量相似推荐基于深度学习算法,从海量图库中快速检索并返回视觉特征高度相似的图片集合。多维信息溯源展示图片来源网站及相关上下文信息,提供完整的信息检索闭环,满足溯源需求。▲以图搜图结果页面示例1.3.6自然语言处理自然语言处理是人工智能的核心领域之一,它让计算机能够理解和生成人类语言,实现人机之间的自然交互。自然语言处理的分支:理解与生成自然语言理解(NLU)核心目标是让计算机“听懂”人类语言,解析语言的语义和逻辑,建立机器对文本的认知能力。关键技术领域具体内容词法分析分词、词性标注、命名实体识别句法分析句法结构解析、依存关系分析语义理解文本分类、情感分析、意图识别自然语言生成(NLG)核心目标是让计算机“写作”,将数据或意图转化为符合人类语言习惯的流畅、有意义的文本。关键技术领域具体内容内容规划确定生成主题、结构和关键信息点语言生成从结构化数据转换为自然语言文本文本润色提升文本流畅度、多样性和风格化理解与生成相辅相成,共同构成了人机语言交互的完整闭环,推动人工智能向更通用的方向发展。自然语言处理的主要应用自动语音识别(ASR)将语音信号转换为文本,实现人机语音交互的基础。文本分类基于内容将文本划分到预定义类别,如垃圾邮件过滤。义项排岐(WSD)利用上下文信息,确定多义词在特定语境下的具体含义。文本—语音转换(TTS)将文字信息转换为自然的语音输出,实现机器发声。主题建模从大规模文档集中自动提取关键主题和潜在语义结构。情感分析分析文本所表达的情绪倾向(如正面、负面、中性)。1.3.7实践项目:基于情感分析的文本分类通过一个在线工具,体验如何利用自然语言处理技术对文本进行情感分析和分类。NLPPRACTICEPROJECT·SENTIMENTANALYSIS实践步骤:输入文本并进行情感分类访问网站在浏览器中访问GROUPDOCS站点输入文本在左侧对话框中输入一段影评文本(如《哪吒2》评论)选择分类选中“Sentiment”单选按钮,点击“分类”按钮查看结果系统分析后,在右侧显示分类结果及概率界面演示:输入文本与情感分析结果展示实践结果:查看详细分类报告查看详细分类报告点击“分类总计”等按钮,系统将生成可视化的详细分类报告,展示多维数据。多源输入分析支持不仅支持文本输入,还可通过上传本地文件或粘贴网页URL,对整份文档进行情感分析。结果导出与分享分析完成后,可一键下载结果文件,或直接将报告发送至指定邮箱,方便归档与分享。▲GROUPDOCS文档情感分析界面示例总结:通过多源输入与详细报告,该工具实现了从数据获取到深度分析的闭环,提升了文本处理效率。1.4人工智能伦理与安全随着人工智能技术的广泛应用,其带来的伦理挑战和安全风险日益凸显。探讨并解决这些问题,对于构建可信、可靠、可控的人工智能系统,以及推动行业的健康、可持续发展至关重要。伦理挑战安全风险健康发展1.4.1人工智能伦理概述伦理的基本概念处理人与人、人与社会关系的行为准则和规范体系,其核心在于追求与实践“善”的价值。起源与发展随着AI技术从理论走向广泛应用,其社会影响日益增大,伦理问题已从科幻想象变为现实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论