人工智能导论 课件 第1章 绪论_第1页
人工智能导论 课件 第1章 绪论_第2页
人工智能导论 课件 第1章 绪论_第3页
人工智能导论 课件 第1章 绪论_第4页
人工智能导论 课件 第1章 绪论_第5页
已阅读5页,还剩105页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章绪论问题:虽然大语言模型可以根据我的提问进行回答,被认为是人工智能,那么空调也能根据室内温度进行自动调控温度,不也是人工智能吗?人工智能是不是一定会按照人类思考的方式来进行思考?人工智能虽然听起来很前沿,但是你知道这个概念有多大岁数了呢?人工智能究竟有哪些技术?1.1.人工智能的概念ArtificialIntelligence1.1.1.智能狭义的智能可以理解为人类所具有的智能,是指具备学习、理解、推理、适应和解决问题等认知能力的能力,它涉及对信息的处理、对环境的适应和对目标的实现从表现来看,智能往往体现在人类的认知能力上,包括知识的获取和应用、推理和解决问题、学习和记忆、语言和沟通、创造力和创新等广义的智能是包括人类在内的很多系统通过获取和加工信息而获得的一种能力,据此可以实现从简单到复杂的演化智能不仅体现在从环境中接受感知,而且还要表现为执行行动并适应环境冰箱是不是人工智能?现阶段人工智能研究应用所处的位置如何看待智能中的感性成分?人类智能并非始终理性人工智能的理性目标也具有有限性在理性智能所不能到达的区域,感性成分发挥不可替代的作用感性本身往往并不具有理性推导和规则计算的特点,感性更多要结合文化、情感等更多的成分智能是否意味着有意识?1.1.2.人工智能从定义来看,1956年计算机科学家约翰·麦卡锡首次提出了“人工智能”的概念当时主要是指在处理任务时具有人类智力特点的机器,它们具有组织和理解语言、识别物体和声音、学习和解决问题等能力约翰·麦卡锡被尊称为“人工智能之父”在1956年达特茅斯会议上提出了“人工智能”这个概念著名人工智能编程语言LISP的发明人在人工智能领域的贡献而在1971年获得图灵奖名称具有多种指代性表示一门学科知识,即制造智能机器的科学与工程,今天的人工智能学科主要是计算机科学的一个分支表示一种技术,即实现人工智能的相关技术、算法和方法等表示一种智能体,即一个可以观察周遭环境并作出行动以达致目标的系统,是可以模仿人类思维相关认知功能的机器或计算机简单理解由人类创造的类人智能关键特点人工,即强调该方法或系统是由人类设计、为人类所创造智能,即模拟、实现和超越人类智能的水平准确定义在理论层面,研究开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统在应用层面,关注如何让计算机去完成以往需要人的智力才能胜任的工作硅基芯片人工智能的研究离不开计算载体,现阶段主要的方式依然采取依赖于硅基芯片的计算方式生物芯片在一块玻璃片、硅片、尼龙膜等材料上放上生物样品,通过生物芯片上布列的一个个生物探针分子实现数据的存储、计算和采集,并由计算机给出分析数据结果人工智能未必意味着该技术一定要和人类一样来进行思考汽车的行驶原理和效果已远远脱离了传统动物奔跑等的基本移动模式对比人类智能与人工智能——产生起源人类智能是一种生物进化的产物,基于大脑神经元之间的复杂连接和交互人工智能它依赖计算机程序、算法和大量数据来模拟智能行为对比人类智能与人工智能——工作方式人类智能依托于人类的大脑,其具有大约1000亿个神经元人工智能的结构和功能则是通过计算机硬件和软件来实现硬件以二进制数据的方式编码存储在硬盘或硅基芯片上软件通过诸如神经网络技术来模拟人类大脑神经元的连接方式对比人类智能与人工智能——外在表现人类智能具有更强的适应性和创造性,并能产生新的想法和解决方法,还具有情感、道德和伦理等方面的智能表现现阶段的人工智能则更多的表现出一种在特定任务上具有类人智能的能力,如语音识别、图像识别、自然语言处理等,缺乏一般性和灵活性对比人类智能与人工智能——效果与效率目前人工智能的技术应用在某些特定领域,如棋艺、图像识别、多语言翻译等,确实已经超越了人类智能水平现阶段的人工智能还不能达到可以完全取代人类智能的水平从效率来看,人类大脑在能量消耗方面更为高效对比人类智能与人工智能——自我意识人类具有自我意识和自我认知的能力,可以意识到自己的存在和感受,理解自己的行为和思维过程,并对自己的行为和思维进行反思和调整现阶段人工智能还无法像人类一样具有意识和自我认知的能力如何测度人工智能?——图灵测试1950年图灵提出了基于“模仿游戏”的图灵测试(Turing

Test)方法只要用于测试的机器表现出与人类相同的思维和行动效果,人们无法区分这些是人类所为还是机器所为,那么就可以据此断定机器具有智能通过图灵测试,就能够区分机器思考能力是否与人类相同在测试中,由测试者写下自己的问题,随后将问题以纯文本的形式(如计算机屏幕和键盘)发送给另一个房间中的一个人与一台机器。测试者根据他们的回答来判断哪一个是真人,哪一个是机器。所有参与测试的人或机器都会被分开通常测试时长通常为5分钟,如果机器能回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则机器通过测试完全图灵测试需要与真实世界中存在的对象和人进行交互具身图灵测试强调机器系统与世界环境的具身交互研究测试内容具体包括控制身体和操纵物体与世界互动、应对未知情况的行为灵活性、具有经济可行的能源效率等具身图灵测试如果机器的行为与活着的同类无法区分,则通过测试比如人工海狸在大坝建设中的物种特异性行为测试1.1.3人工智能主要技术理论方法基于规则学习的方法(结构)问题求解的搜索方法基于知识的推理和规划方法(即逻辑和知识表示)知识和推理中的不确定性(即概率推理、概率编程和多智能体决策)基于机器学习的方法(功能)概率方法深度学习强化学习应用领域自然语言处理计算机视觉机器人相关哲学、伦理、安全和管理等社会科学问题结合基础设施和行业应用1.2人工智能的发展1.2.1基本情况人工智能第一次出现在人类语言中可以追溯到1889年肌肉机器机器智能大脑智能智能机器肉体智能(EmbodiedIntelligence)无肉体智能​(DisembodiedIntelligence)二十世纪五十年代才开始得到广泛的关注达特茅斯研讨会的申请书会议原址:达特茅斯楼会议内容会议主题认为理论上人类学习的每个方面或智能的任何特征都可以被精确的描述提出了七个拟攻克的领域,即自动(可编程)计算机、编程语言、神经网络、计算复杂性、自我学习和提高(机器学习)、抽象、随机性和创造性预言与人类具有同等智能水平的机器将在不超过一代人的时间中出现确定了人工智能这门学科和人工智能概念早期所提出的人工智能实现方法多以规则和推理等类人的思维方式来构建,由于缺乏对求解问题复杂性的深刻认识,这些方法通常也只适合处理具有特定规模的任务,这些方法无一例外都在二十世纪七十年代遇到了严重的发展阻力直至二十世纪九十年代以后,随着机器学习方法的广泛应用,尤其是2010年以后大数据的产生,以大数据驱动的机器学习方法开始在人工智能研究和应用领域发挥出越来越明显的作用和价值NP完全性NP完全性(NP-Completeness)描述了问题的固有复杂度比如一座山峰可能没有明确的路线,或者路线可能非常复杂和难以找到,需要在各种可能的路线中尝试,甚至可能需要尝试所有的路线,才能确定哪一条可以通往山顶(非确定时间内可解),即使找到正确的路线,也可能需要花费巨大的时间和努力才能到达山顶(计算复杂度很高)NP完全性并不意味着一个问题无法解决,而是指目前还没有找到一种高效的解决方法1.2.2发展三阶段第一代人工智能——规则学习方式第二代人工智能——传统机器学习方式第三代人工智能——神经网络学习方式第一代人工智能——规则学习方式符合直觉的人工智能实现方式通过认知建模方法实现类人思考只要有足够精确的心智理论,就有可能把这个理论表达为计算机程序,进而实现人工智能早期的尝试亚里士多德提出的三段论就是一种法则化的思维方法十九世纪形成逻辑学,通过建立精确符号系统来描述世间万物及之间的关系,并提供了推导和演算的严密规则十四世纪的拉蒙·鲁尔设计了一种推理系统GreatArt,它是一个可以旋转成不同排列组合的纸盘机械系统十七世纪《利维坦》认为心脏就是发条,神经就是游丝,关节就是齿轮,而推理就是一种数值计算相关逻辑学研究也构成了人工智能研究领域的逻辑主义近代的尝试1955年,艾伦·纽厄尔等人开发了“逻辑理论家”程序能够证明《数学原理》中前52个定理中的38个赫伯特·盖伦特设计的几何定理证明程序能够证明许多数学专业学生都认为较难的定理利用LISP语言编写的MYCIN系统可以诊断血液感染,大约有450条规则,尽管如此,开处方的正确率达到了69%,其表现已经优于一些初级医生,虽然低于80%这个专业从事细菌感染的医师正确率例子——质谱仪信息推断分子结构如果M是整个分子的质量,且在x1和x2处有两个峰,并且(a)x1+x2=M+28(b)x1−28是一个高峰(c)x2−28是一个高峰(d)x1和x2中至少有一处是高峰则该分子含有酮基取得的成果——搜索式推理为了实现一个目标,可以一步步地前进,就像在迷宫中寻找出路。如果遇到死胡同则进行回溯,并继续寻找新的出路但是这种迷宫存在的线路总数会随着迷宫的规模变大而产生指数爆炸般的增长,因此也可以使用一些启发式算法去除一些不必要的寻找以提高性能STRIPS由斯坦福大学于1970年开发名称是斯坦福研究所问题解决者(StanfordResearchProblemSolver)的首字母缩写定义了目标导向型行动计划(GOAP),可以让AI自己去找到解决问题的方法STRIPS四个主要成分Agent代理:主体,AI就是控制Agent来执行各种行为Action:动作,比如拿东西、丢东西、吃饭、伐木等,每个动作需要有执行的先决条件、执行后的效果和执行需要的代价如吃饭行为执行的先决条件是饿了和有食物,执行后的效果是解决饥饿IGoap:提供给Agent目标和反馈是否成功失败等Planer:决策出最优的路线供Agent使用,从目标开始往前查找Action,如果Action的效果能够完成至少一个目标,则保存Action的效果,然后将Action的前置条件写入到目标,继续往前查找取得的成果——自然语言处理采取规范化的表达方式来进行类似于计算机编程语言采取诸如语义网络、明确人类语言语法规则等方法来构建自然语言处理应用系统二十世纪六十年代世界上第一个聊天机器人Eliza主要问题——数理逻辑具有局限性虽然机械设备能够模拟数学推理过程,但是并非所有的数学推理都可以形式化1931年,哥德尔的不完全性定理证明存在着演绎的限制,即使在一些强形式化理论中,也必然存在一些没有证明的真实陈述没有一个数理逻辑体系能够证明自身的一致性,因此数学公理的真理性必须在这些体系之外得到证明主要问题——世界认知逻辑具有不确定性规则学习方法还需要假定关于世界的认知逻辑具有确定性,而实际上这很难实现对于政治、经济等复杂事件,却始终无法存在一种唯一并且普适的规则,甚至哪种规则更为合理都会存在争议主要问题——计算能力有限很多人工智能应用非常重要的常识与推理都需要大量对世界的认识信息和计算能力,而这样一个巨大的知识数据库当时无法实现二十世纪七十年代,人们发现当时的人工智能技术只能解决它们尝试解决的问题中最为简单的一部分应用实践也证明,哪怕一个仅容纳一个普通人所有常识的知识数据库也无法制造出来人工智能发展遭受比较大的挫折莫拉维克悖论(Moravec'sParadox)要实现人类高阶智慧能力只需要非常少的计算能力,但是要想实现一些诸如无意识技能和简单的直觉行为却需要极大的运算能力现实的选择依据一组从专门知识中推演出的逻辑规则并在某一特定领域回答或解决问题的专家系统一度取得了不错的效果苹果公司在2011年开发的Siri语音助手就需要人工干预来扩展其知识库和功能积木世界(BlocksWorld)MITAILab(麻省理工人工智能实验室)在二十世纪六十年代研发的一个视觉处理项目,通过将真实世界进行视觉简化,将所有物体的形状都分解为由若干类似于积木的矩形单元来组成对于诸如“找到一个大的黄色积木并将其放在红色积木上面”这样简单的动作要求,却需要大量复杂的规则才能描述清楚也正是该项目使得人们最终意识到单纯依靠规则学习方法来实现对复杂现实世界的推理学习并不可行第二代人工智能——传统机器学习方式强调借助大量数据样本,让程序自己学习并获得智能思维能力这种学习过程与包括概率论在内的数学紧密相关数学方法与人工智能的关系算法(Algorithm)”这个词语最早就来自于九世纪的数学家穆罕默德·本·穆萨·阿尔·花剌子模(MuhammadibnMusaal-Khwarizmi)概率数学方法提供了一种有效的解决方案,允许在掌握不确定信息情况下进行严格的推理,甚至可以构建全面的理性思维模型基于概率论的贝叶斯法则已称为现代人工智能方法的基础算法概率怎么用在人工智能技术上?woshizhonggguoren我是中国人(0.0001)

仁(0.0000001)

……(0.000000001)更多数学方法决策论结合了概率论和效用理论,为在不确定性下做出个体决策提供了计算方法每个主体都无须关注其他独立主体的行为,但是每一个主体行为都可以给其他参与者效用带来积极或者消极的作用博弈论强调理性智能体的个体理性会产生集体非理性,个体有时采用随机策略反而最优运筹学主要关注当行为的收益不是立即产生而是在几个连续的行为后产生时,此时应该如何做出理性决策特点使得人工智能可以与其他学科展开更高层次的合作使得相关研究结果更易于评估和证明主要问题受限于有限的计算能力和训练数据资源,当时的大部分机器学习方法都建立在小型规模数据的训练基础之上往往只能局限于与那些被处理数据接近的应用领域,缺乏对大规模数据应用场景的普适性和高效计算能力有效性与可解释性在二十世纪八十年代使用隐马尔可夫模型进行语音识别取得了非常不错的效果,但是这肯定不是人类使用和理解语言的方式机器学习三种主要方法无监督学习监督学习强化学习无监督学习直接原始数据中进行学习典型方法就是聚类给定一组水果,通过将每个水果颜色、味道、形状等特征使用一个向量来表示,再根据这些特征向量之间的相似度进行聚类监督学习从已经带有标注信息的数据中进行学习,因此方法可以学习到数据特征与这些已标注信息之间的对应关系比如分类给定一组动物,标注好每种动物所属的类别(如鱼、狗、鸟等)通过学习,机器找到图片特征与已知类别的关系具体学习过程绝非人类的语义理解过程强化学习通过智能体的设计来自主探索环境状态,采取行为作用于环境并从环境中获得回报,据此不断调整智能体的执行逻辑和优化执行效果强调学习是一个动态过程,没有明确的学习目标,对结果也没有精确的衡量标准强化学习在棋类游戏中的成功应用在1956年,亚瑟·萨缪尔就使用了该方法研究西洋跳棋对弈程序,特点在于可以自我学习,甚至比其创造者玩得更好2017年10月,DeepMind推出了基于强化学习技术的AlphaGoZero程序,它能够在无师自通的情况下实现自我博弈,最终以100:0的成绩战胜了前任AlphaGo第三代人工智能——神经网络学习方式从二十世纪八十年代神经网络方法再次得到关注开始发展至今到二十一世纪后,以大数据驱动的深度学习方法最终产生了人工智能研究的突破性发展神经网络利用类似于人类大脑神经元的计算模式来构建人工智能早在1943年,神经学家麦卡洛克等首次提出神经元性质的数学表达形式,以试图了解大脑计算的运行方式后期产生的神经科学也主要针对大脑等神经系统进行研究超级计算机个人计算机人类大脑计算单元106GPU+CPU1015个晶体管8个CPU内核1010个晶体管1011个神经元存储单元1016字节(10PB)RAM1017字节(100PB)磁盘1010字节(10GB)RAM1012字节(1TB)磁盘1011个神经元1014个突触周期时间10-9秒10-9秒10-3秒运算/秒1018101010172019年典型计算机配置和人类大脑性能对比大脑的神经网络结构大脑中不同神经元之间通过轴突相互连接信号就通过复杂的电化学反应从一个神经元通过轴突传递到其他神经元通过这些信号,大脑可以实现短期的活动控制,也可以通过改变神经元的连通性实现长期记忆效应神经网络方法人工模拟大脑神经元计算的方法通过人工神经元和彼此之间的连接设计来实现数值计算学者证明任何可计算的函数可以通过一些神经元互相连接的网络来计算所有的逻辑运算(AND、OR、NOT等)也都可以通过网络结构来实现适当定义的网络还可以进行自我学习通过修改神经元之间连接强度来表达规则更新较早的形式感知器只有一个输入层、一个神经元和一个输出美国军方利用感知器技术完成了对坦克图片的识别复杂神经网络BP神经网络玻尔兹曼机误差反向传播深度神经网络(深度学习)大数据支撑2011年IBM的Watson系统在《危险边缘》战胜人类冠军小样本学习也称为低样本学习强调从有限数量的数据集进行快速训练的能力,从而实现时间成本和计算成本更小的学习能力人类的学习行为更类似于小样本学习相关研究尚未取得突破性的进展深度学习方法一种神经网络方法,即深度神经网络具有多层处理单元的深层神经网络方法深度学习与传统机器学习的区别深度学习的发展2006年深度学习的基本理论框架得到验证2010年在语音识别和自然语言处理等领域取得突破2012年ImageNet图像分类竞赛中获得冠军识别率超过第二名10个百分点深度学习的数据要求在20世纪八九十年代,典型的人工智能程序神经元个数一般只有几十个,相应的模型参数也就几百个诸如GPT4这样的现代大模型,都是以万亿为模型参数单位互联网产生的大数据提供了相当规模的数据资源,根据IDC的预测,2024年全球数据量有160ZB,而到2028年会增加到310ZB深度学习的算力要求从提高时钟频率开始演变为增加计算核数,有益于并行计算,可以加速与大脑并行特性类似的深度学习计算过程CPU(中央处理器)、GPU(图形处理器)、TPU(张量处理器)、WSE(晶圆级引擎)、ASIC(专用集成电路)、FPGA(现场可编程门阵列)等计算芯片也提供了强大的算力支持芯片制程从28nm到14nm,再到7nm,再到5nm乃至更小2012年英伟达推出了CUDA编程模型2014年需要一天时间的机器学习训练在2018年只需两分钟即可完成人工智能、机器学习和深度学习的关系深度学习的局限性传统机器学习发展历史久,很多算法相当成熟对计算条件要求不高,完全适用于很多应用场合支持向量机决策树随机森林深度学习的局限性所需的训练成本、调参复杂度等问题仍然存在目前深度学习属于人工智能主流方法不论在计算效果还是计算性能方面,都取得了非常惊人的发展最先进的深度学习方法已经能够达到甚至超过人类平均水平强化学习也是现代人工智能重要方法1.3人工智能应用领域自然语言处理计算机视觉机器人1.3.1自然语言处理让计算机能够阅读、理解和提取包括各种人类语言在内的自然语言文本或语音,实现人与计算机之间更为自然的交流效果让人去适应计算机计算机编程语言让计算机去适应人自然语言处理涉及的技术文本分析文本挖掘语义分析语音识别人机问答......人类语言的复杂性人类语言数量多,约六千种,各种语言的语法规则也大相径庭德语可以不使用空格来连接多个词语法语动词变位会受到语式、时态和人称不同而产生超过二十多种的变化阿拉伯文字从右向左阅读,但是遇到阿拉伯数字时还需从左向右进行人类语言中存在语义模糊现象Timeflieslikeanarrow,fruitflieslikeabanana我知道你不知道我知道你不知道我知道你不知道上下文(Context)当前语句所处的语言环境准确的语义理解需要对其上下文进行全面的分析例子:小明帮助了小亮,因此我表扬了他第二句话中的“他”应该指“小明”规则方法的失败1954年美国乔治敦大学和IBM公司合作实现将超过60句的俄语自动翻译成英语,该系统仅包含6个语法规则和250个词随着词语数量的增加,这些方法很快就产生了规则数量爆炸性增长的问题,因此无一例外都宣告失败深度学习方法的胜利使用深度学习方法的人工智能技术实现了类似于人类自然对话的人机交互效果比如ChatGPT等大语言模型完全可以胜任一些常见的客服对话仍然存在的问题任何系统都不可能无限并且始终及时地获取人类语言新词数据并进行统计学习由于大模型的训练数据通常只包含文本和对应的标签,而不包含显式的知识或逻辑规则,因此它们可能难以进行复杂的知识推理和逻辑推理人类语言中存在的某些复杂语言现象,如隐喻、双关语、诗歌等,模型可能难以准确理解和生成在情感分析方面,如何深入理解文本中的情感细微差别和生成具有特定情感的文本方面,仍然还有距离主要应用机器翻译情感分析问答系统文本摘要命名实体识别语音识别这种自动翻译的错误是如何产生的?很多机器翻译系统将这句英文翻译到俄语好后再翻译回英语时,却变成Thespiritiswillingbutthefleshisweak意思是指“心有余而力不足”TheVoltkaisstrongbutthemeatisrotten意思是指“伏特加酒很浓但肉却腐烂了”1.3.2.计算机视觉研究如何通过计算机及相关设备来模拟生物视觉功能视觉很重要人类的眼睛获取了约占70%的外界输入信息大脑中20%-30%的皮层区域用于处理视觉信息常见的计算机视觉功能分类功能含义举例分割在图像视频中分离出各类特定物体并描述相关特征自动驾驶中分离道路交通特征分类根据定义的类别用于确定图像视频中内容并进行分类是猫还是狗?检测检测目标物是否存在以及空间位置等,通常会在相关区域周围设置矩形边界框包围住目标对象物体跟踪(车辆轨迹)、光学字符识别(车牌识别)AlphaGo是否是计算机视觉?并非所有处理原始对象为图像的研究技术都是计算机视觉该技术的输入只是棋子的位置信息,甚至在对弈期间也是人类扮演了AlphaGo棋手来进行真实的对弈如果Al

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论