版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能发展概述目录CONTENTS01人工智能的定义与发展02人工智能的认知观03人工智能的分类04人工智能技术五要素05人工智能的研究内容06人工智能的主要应用领域人工智能通识
第一课问题导向、目标导向1.你来大学学什么?2.你来大学如何学习?3.你在学习中是否使用AI工具;
如何使用AI工具?注:你,具象化(专业,性别,学历等┈)人工智能
第1章绪论
十五五规划纲要中,出现
人工智能52次,出现
人工智能+9次,出现
数智27次。
01人工智能的定义与发展智能的多维解读:从哲学到多元智能将者,智、信、仁、勇、严也。——《孙子兵法·始计篇》所以知之在人者谓之知,知有所合谓之智。所以能之在人者谓之能,能有所合谓之能。——《荀子·正名篇》古代对智能的哲学思考多元智能理论美国教育学家和心理学家霍华德·加德纳(HowardGardner)博士提出多元智能理论,认为人类智能分为语言、数理逻辑、空间、身体动觉、音乐、人际、自省和自然观察这八种类型,每种智能都有独特表现与价值。图灵测试1950年图灵提出“模仿游戏”,若机器能通过文本交流使30%提问者分不清人机,即具人类智能,为AI发展设下明确目标。人工智能1956年夏季,在美国达特茅斯学院举办了一场为期两个月的夏季研讨会,旨在探讨“机器是否会产生思维”。在会议中,麦卡锡首次提出“人工智能”的概念,即“人工智能就是让机器的行为看起来像人所表现出的智能行为一样”。达特茅斯会议被公认为人工智能领域的起点,其框架和议题主导了此后数十年的研究方向,这一年也因此被称为“人工智能元年”。达特茅斯会议合影(1956年)人工智能是研究如何使机器像人一样具有智能的科学。人工智能的发展概念形成期第一次AI浪潮第一次寒冬期第二次AI浪潮第二次寒冬期第三次AI浪潮第四次AI浪潮概念形成期(1936-1956)1936年,艾伦·图灵提出了图灵机的概念,界定了计算机的能力,为现代计算机和人工智能奠定了理论基础。图灵提出的“图灵测试”,首次为机器智能提供了理论框架与评价标准。冯·诺依曼提出了现代计算机的基本架构,被称为“冯·诺依曼原理”,奠定了现代计算机的基础。1943年,人类历史上首个具有里程碑意义的人工神经元模型——MP模型。1952年,被誉为“机器学习”之父的亚瑟·塞缪尔创造了机器学习这一概念。1956年,在达特茅斯会议上,约翰·麦卡锡首次提出“人工智能”这一概念,标志着人工智能学科的正式诞生。第一次AI浪潮(1956-1974)1955-1956年,逻辑理论家是人工智能史上首个具备自主推理能力的程序。1959年,Unimation公司制造出世界上第一台工业机器人Unimate。1966年,麻省理工学院的约瑟夫·魏岑鲍姆开发了第一个聊天机器人ELIZA。1966年至1972年,美国斯坦福国际研究所开发出Shakey机器人。1972年,爱德华·费根鲍姆与化学家团队开发出专家系统Dendral,这是全球首个成功应用的专家系统。Unimate机器人Shakey机器人第一次寒冬期(1974-1980)人工智能发展遭遇第一次寒冬,主要是因为技术瓶颈、过度承诺与资金断裂的三重夹击。即使处于发展低潮期,仍有许多新思想、新方法在悄然萌芽。1974年,保罗·韦伯斯首次提出反向传播算法(BackPropagation,BP)。1975年,被誉为“遗传算法之父”的约翰·霍兰德提出遗传算法(geneticalgorithms,GA)。遗传算法、进化策略(evolutionstrategies,ES)和遗传编程(geneticprogramming,GP)共同构成了进化计算(evolutionarycomputation,EC)的三大支柱,是人工智能领域的重要分支。第二次AI浪潮(1980-1987)经历了第一次寒冬期,人工智能研究者意识到必须对智能机器的问题范围进行充分限制,专家系统作为人工智能领域的标志性成果,迎来了爆发式增长。20世纪70年代,斯坦福大学人工智能实验室在爱德华·费根鲍姆的领导下,开发了一款具有里程碑意义的专家系统——MYCIN,推动了医疗AI的发展。20世纪80年代初期,数字设备公司(DEC)开发出一款专家系统——XCON,是专家系统商业化的里程碑。1982年,约翰·霍普菲尔德提出了Hopfield神经网络模型。1986年,BP算法被系统化提出,正式作为神经网络训练优化算法,为复杂神经网络训练提供了理论基石,是人工智能发展史上的里程碑。日本研发的第五代计算机第二次寒冬期(1987-1993)专家系统依赖人工构建知识库;硬件性能无法满足大规模知识推理需求;实际进展和效果不如预期,引发公众对人工智能的信任危机。1987年,亚历克斯·瓦贝尔开发了时延神经网络。1989年,被誉为“卷积神经网络之父”的杨立坤(YannLeCun)及其团队利用反向传播算法训练卷积神经网络(convolutionalneuralnetwork,CNN),成功开发了一套手写数字识别系统。20世纪80年代,麻省理工学院学者罗德尼·布鲁克斯提出包容式架构,他的六足行走机器人是行为主义的代表案例之一。在罗德尼·布鲁克斯等人的推动下,行为主义成为人工智能的一个重要学派。第三次AI浪潮(1993-2010)人工智能的稳步发展期,人工智能相关的各个领域都取得了长足的进步,研究重点从基于知识系统转向了机器学习方向,机器学习算法不断改进和优化。1993年,计算机科学家和科幻作家弗农·文奇在文章“TheComingTechnologicalSingularity”中提到了人工智能的“奇点理论”。1997年5月,IBM公司生产的超级国际象棋电脑“深蓝”,战胜了国际象棋冠军卡斯帕罗夫,它的计算速度可达到约每秒钟2亿步。2000年,谷歌搜索引擎使用PageRank算法在众多搜索引擎中脱颖而出。2006年,这一年被视为深度学习乃至整个人工智能领域的转折点。被誉为“神经网络之父”“人工智能教父”的杰弗里·辛顿正式提出“深度学习”(deeplearning,DL)模型。第四次AI浪潮(2010年至今)2012年,杰弗里·辛顿团队提出AlexNet——一个8层的卷积神经网络,在ImageNet图像识别竞赛中以85%的准确率夺冠,首次验证深度卷积神经网络的优越性,标志着深度学习时代的开启。2016年3月,谷歌旗下DeepMind公司开发的围棋人工智能AlphaGo,它的计算速度约是“深蓝”的3万倍,最终以4比1的总比分击败了韩国围棋九段、世界冠军李世石。2016年,英伟达推出P100GPU,这是全球首款基于Pascal架构的AI计算芯片,成为首批支持TensorFlow、PyTorch等框架的硬件,是AI算力革命的里程碑。2017年,谷歌正式提出Transformer模型,推动了“大模型”时代的到来。2022年,OpenAI发布ChatGPT,展现了对话生成、代码编写等多任务泛化能力,标志生成式AI进入大众视野。同年,StableDiffusion与DALL-E2引领图像生成革命,AIGC(artificialintelligencegeneratedcontent,人工智能生成内容)进入主流应用。GAI(generativeartificialintelligence,生成式AI)的应用极大地拓展了人工智能的边界。02人工智能的认知观人工智能的认知观智能源于对符号的逻辑运算和规则推理,通过形式化的知识表示模拟人类思维。符号主义基于神经网络的智能模拟方法,强调通过模拟人类大脑神经元的连接和学习机制来实现智能。联结主义通过模仿人类或动物的行为实现智能,强调在真实环境中进行学习和适应。行为主义
符号主义:用逻辑规则复制专家思维符号主义核心符号主义主张智能源于符号逻辑运算与规则推理,通过形式化知识表示模拟人类思维。成功案例Dendral、Watson、知识图谱是符号主义成功案例,体现其在知识推理与表示上的优势。局限性符号主义难以处理模糊与大规模知识,可解释性强但在复杂问题上受限。联结主义:数据驱动的分布式学习联结主义核心联结主义基于神经网络,通过模拟大脑神经元连接与学习机制实现智能。技术代表BP、CNN、RNN、LSTM、GAN是联结主义核心技术,推动AI在视觉、语音等领域突破。挑战与前景联结主义面临黑箱与数据饥渴问题,但与神经科学结合前景广阔。行为主义:感知动作闭环与环境交互01行为主义起源行为主义源于控制论,强调智能体通过感知动作闭环与环境交互学习。02强化学习强化学习是行为主义重要成果,通过试错与奖励信号优化行为策略。03应用与局限行为主义在机器人等领域应用广泛,但样本效率低、可解释性弱,常与其他方法结合。03人工智能的分类AI三级跳:弱、强、超人工智能01弱人工智能专注于特定任务,如语音识别、自动驾驶,在限定领域超越人类。02强人工智能具备跨领域迁移、逻辑推理与自主学习能力,目前仍处于研究阶段。03超人工智能理论上可自我迭代、全面超越人类,引发伦理与治理挑战。1.1人工智能的分类-弱人工智能第一章绪论of3124弱人工智能是指不能制造出真正地推理(Reasoning)和解决问题(Problem_solving)的智能机器,这些机器只不过看起来像是智能的,但是并不真正拥有智能,也不会有自主意识。弱人工智能是人类已经掌握的技术,它往往只擅长某一个方面的工作,不管是可以预约烧饭的电饭煲,还是会聊天的机器人,都属于此列。从原则上说,弱人工智能只能在行为上表现出“具有人类智力”的特点,但它实现功能时,依靠的还是提前编写好的运算程序。1.1人工智能的分类-弱人工智能第一章绪论of3125弱人工智能也称限制领域人工智能或者应用型人工智能。指的是专注于且只能解决特定领域问题的人工智能,毫无疑问,我们今天看到的所有人工智能算法和应用都属于弱人工智能的范畴,AlphaGo是弱人工智能的一个最好实例。AlphaGo虽然在围棋领域超越了人类最顶尖选手,但它的能力也仅止于围棋。一般而言,限于弱人工智能在功能上的局限性,人们更愿意将弱人工智能看成是人类的工具,而不会将弱人工智能视成威胁。1.1人工智能的分类-强人工智能第一章绪论of3126强人工智能
一词最初是约翰·罗杰斯·希尔勒针对计算机和其它信息处理机器创造的,其定义为:“强人工智能观点认为计算机不仅是用来研究人的思维的一种工具;相反,只要运行适当的程序,计算机本身就是有思维的。”(JSearleinMindsBrainsandPrograms.TheBehavioralandBrainSciences,vol.3,1980。但事实上,Searle本人根本不相信计算机能够像人一样思考,在这个论文中他不断想证明这一点。他在这里所提出的定义只是他认为的“强人工智能群体”是这么想的,并不是研究强人工智能的人们真正的想法。因此反驳他的人也不少。可参考:《AChineseroomthatUnderstands》-herbertA.Simon&StuartA.Eisenstadt)。拥有“强人工智能”的机器不仅是一种工具,而且本身拥有思维。“强人工智能”有真正推理和解决问题的能力,这样的机器将被认为是有知觉,有自我意识。1.1人工智能的分类-强人工智能第一章绪论of3127强人工智能
又称通用人工智能或者完全人工智能,指的是可以胜任人类所有工作的人工智能,人可以做什么,强人工智能就可以做什么,这种定义过于宽泛,缺乏一个量化的标准来评估什么样的计算机程序才是强人工智能为此不同的研究者提出了许多不同的建议。最为流行,被广为接受的标准,是前面我们详细讨论过的图灵测试,但即便是图灵测试本身,也只是关注与计算机的行为和人类之间的行为。从观测者角度而言的不可区分性,并没有提及计算机到底需要具备哪种具体的特征或能力才能实现这种不可区分性。1.1人工智能的分类-强人工智能第一章绪论of3128一个可以称得上强人工智能的程序,大概需要具备以下几个方面的能力:第一,存在不确定因素时进行推理,使用策略,解决问题,制定决策的能力。第二,知识表示的能力,包括常识性知识的表示能力。第三,规划能力。
第四,学习能力。第五,有使用自然语言进行交流沟通的能力。第六,将上述能力整合起来,实现既定目标的能力。强人工智能的定义里存在一个关键的的专业性问题:强人工智能是否有必要具备人类的意识?有些研究者认为,只要只有具备人类意识的人工智能才可以叫强人工智能。另一些研究者则说,强人工智能只需要具备胜任人类所有工作的能力就可以了,未必需要人类的意识,也就是说,一旦牵涉“意识”,强人工智能的定义和评估标准就会变得异常复杂,而人们对于强人工智能的担忧也主要来源于此。1.1人工智能的分类-超人工智能第一章绪论of3129超人工智能牛津大学哲学家、未来学家Nick.Bostrom在他的《超级智能》一书中,将超人工智能定义为在科学创造力,智慧和社交能力等每一方面都比最强的人类大脑聪明很多的智能,显然对于今天的人来说,这是一种只存在于科幻电影中的想象场景。与弱人工智能、强人工智能相比,超人工智能的定义最为模糊,因为没人知道超越人类最高水平的智慧,到底会表现为何种能力。首先我们不知道强于人类的智慧形式是怎样的一种存在,现在去谈论超人工智能和人类的关系不仅仅为时过早,而是根本不存在可以清晰界定的讨论对象,其次我们没有办法也没有经验去预测超人工智能到底是一种不现实的幻想还是一种在未来必定会降临的结局,也就是说,我们根本无法准确推断到底计算机程序有没有能力达到这一目标。04人工智能技术五要素数据人工智能技术五要素算法算力场景人才人工智能核心技术之一:知识
知识是人工智能的重要基础,知识的科学内涵包括知识表示、知识推理、知识应用。知识获取是其瓶颈问题。
知识是人工智能之源(Source),人工智能的发展源于知识,并依赖知识。专家系统、模糊计算、知识图谱、知识库等都是以知识为基础发展起来的。知识:人们通过体验、学习或联想而认识的世界客观规律性。算法数据知识算力AI1.5.3人工智能的核心技术
数据为人工智能提供“原材料”,从计算智能数据迅速发展到互联网和物联网的海量数据。5G网络使数据传输速度更快、时延更小,应用更广泛、更有效。
数据是人工智能之基(Foundation),并促进人工智能的发展升级。计算智能取决于数据而不是知识;神经计算,进化计算等都是以数据为基础而发展起来的。
人工智能核心技术之二:数据数据:事实或观察的结果,指所有能输入计算机并被程序处理的数字、字母、符号、影像信号和模拟量等各种介质的总称。
算法是人工智能的策略性内涵。基于神经计算的算法已获得广泛应用。认知计算与认知决策算法、类脑计算、普适计算与普适算法以及进化计算与基于群体迭代的进化算法等研究也取得进展。
算法是人工智能之魂(Source),也是人工智能软实力的核心。A*算法、深度学习算法、遗传算法等是算法的代表。人工智能核心技术之三:算法算法:解题方案准确而完整的描述,是一系列求解问题的清晰指令,代表着用系统方法描述问题求解的策略机制。
算力为人工智能提供了执行能力。从处理器配备的高端部件以及芯片组、内存和硬盘质量提高计算能力。出现了新芯片和新计算(云计算、量子计算等)等新的计算架构。算力是人工智能之力(Power),也是人工智能硬实力的关键保证。计算能力的不断增强和计算速度的不断提高,极大地促进人工智能的发展。人工智能核心技术之四:算力算力:机器在数学上的归纳和转化能力,即把抽象复杂的数学表达式或数字通过数学方法转换为可以理解的数学式子的能力。。
算力是数字经济时代的核心生产力,智算力则是数字化创新的源动力。人工智能已在国家经济建设、科技实力提升、推动生产力发展等方面呈现出举足轻重的作用。人工智能算力正在为国家创造力的发展带来实质性推进,为企业带来切实的创新成效,加速驱动新业态的形成。
中国算力规模,尤其是智能算力规模,正在高速增长。2021年中国智能算力规模达155.2每秒百亿亿次浮点运算(EFLOPS),2022年智能算力规模将达到268.0EFLOPS,预计到2026年智能算力规模将进入每秒十万亿亿次浮点计算(ZFLOPS)级别,达到1,271.4EFLOPS。
2021年中国通用算力规模达47.7EFLOPS,预计到2026年通用算力规模将达到111.3EFLOPS。2021-2026年期间,预计中国智能算力规模年复合增长率为52.3%,同期通用算力规模的年复合增长率为18.5%。伴随人工智能算力需求的高速增长,建立健全助商惠民的数字基础设施服务体系、推进算力基建化发展势在必行。参考:IDC与浪潮信息联合发布《2022-2023中国人工智能计算力发展评估报告》人工智能核心技术之四:算力知识、数据、算法和算力是人工智能的要素,但不是发展人工智能的关键;人工智能的要素和核心技术要通过人发挥作用,发展人工智能的关键是人才。
专业人才已成为人工智能发展的最大瓶颈,人工智能人才存在很大缺口。人工智能的要素之五:人才人才:人工智能专业人才。。《抢滩数字时代·人才迁徙报告2023》2022年整体招聘需求和互联网人才需求下行,但新兴行业招聘扩张。脉脉创始人兼CEO林凡表示,2003年的互联网、2013年的移动互联网是驱动经济的强劲动力。十年轮回,2023年,人工智能、电子芯片、新能源汽车、碳中和、生物医药正在展现出下一个十年经济支柱的潜力。《报告2023》显示,2022年碳中和行业职位量增长近3倍,新能源汽车职位量增长近2倍。人工智能行业人才紧缺指数(人才需求量/⼈才投递量)达0.83,平均6个人竞争5个岗位,成为2022年人才最紧缺的行业。(光明网,2022年12月30日)人工智能的要素之五:人才05人工智能的研究内容
人工智能的研究内容计算智能神经网络自然计算进化算法模糊逻辑感知智能多模态感知技术计算机视觉语音识别认知智能知识图谱自然语言处理多模态认知技术06人工智能的主要应用领域人工智能的主要应用领域01诊断辅助药物研发手术治疗与患者监护个性化治疗智能医疗020304风险评估金融监管投资决策客户服务智慧金融质量控制预测性维护供应链管理生产流程优化个性化定制生产智能制造智能控制能源管理安全监控健康管理智能家居人工智能的主要应用领域05个性化学习智能辅导智能教学辅助教育资源优化智慧教育060708精准营销库存管理客户服务智能化管理智慧零售智能交通管理智能监控与执法自动驾驶智能出行智慧交通作物种植管理农业生产自动化农业预测与决策智慧农业THANKS谢谢!计算思维目录CONTENTS01计算思维基础02数制及其转换03信息的编码01计算思维基础思维概括性人类思维的概括性使我们能够从众多具体事物中提炼出共性规律,例如从各种鸟的特征中总结出‘有羽毛、卵生、会飞’等本质特征,从而更好地认识事物类别。这种能力让我们无需对每个具体事物都孤立了解,大大提高了认知效率。间接性思维的间接性体现在借助已有的知识经验和其他事物来认识那些不能直接感知的事物。例如医生通过患者的症状表现和检查报告,间接推断出患者身体内部可能患有的疾病及病情状况,这体现了人类思维超越感官的高级能力。逻辑性思维的逻辑性要求我们遵循一定的逻辑规律,如归纳、演绎和类比等方法。在数学证明中,依据已知的定理、公理以及给定的条件,通过步骤严谨的逻辑推导得出最终结果,确保思维的条理清晰和严谨有序。三大思维方法计算思维又称构造思维,设计和构造,如计算机科学实验思维又称实证思维,通过观察和实验获取自然规律,如物理理论思维又称逻辑思维,抽象概括,定理、证明、公理化,如数学学科010203强调推理强调归纳希望自动求解50概念表示概念的经典定义方法概念的精确定义就是给出一个命题,亦称概念的经典定义方法。在这样一组概念定义里,对象属于或不属于一个概念是一个二值问题。即:一个对象要么属于这个概念,要么不属于这个概念,二者必居其一。一个经典概念由三部分组成:概念名,概念的内涵表示,概念的外延表示。概念的内涵表示用命题来表示,反映和揭示概念的本质属性,是人类主观世界对概念的认知,可存在于人的心智之中,属于心智世界。概念的外延表示由概念指称的具体实例组成,是一个由满足概念的内涵表示的对象构成的经典集合。概念的外延表示外部可观可测。经典概念大多隶属于科学概念。比如,偶数,英文字母属于经典概念。51概念表示概念的经典定义方法经典概念大多隶属于科学概念。比如,偶数,英文字母属于经典概念。偶数的概念名为偶数。偶数的的内涵表示:只能被2整除的自然数。偶数的的外延表示:{0,2,4,6,8,10,
}。概念的表示主要内容经典概念理论、数理逻辑、集合论、概念的现代表示理论等。参考教材:李德毅主编,于剑执行主编,中国人工智能学会组编《人工智能导论》,2018年9月,中国科学技术出版社。52概念表示亚里士多德提出和建立的三段论亚里士多德的三段论是逻辑学中的一个重要概念,它由三个部分组成:大前提、小前提和结论。这种推理方法的目的是通过两个前提来得出一个逻辑上必然的结论。以下是三段论证的基本结构:大前提(MajorPremise):一个普遍性的陈述,例如“所有人都是凡人”。小前提(MinorPremise):一个特殊性的陈述,例如“苏格拉底是人”。结论(Conclusion):从大前提和小前提中逻辑上推导出的陈述,例如“因此,苏格拉底是凡人”。53概念表示亚里士多德提出和建立的三段论三段论的结构三段论是由三个直言判断组成的,所以共有三个主项和三个谓项。因为事实上每个词项都出现了两次,所以一个三段论共包括三个不同的词项。这三个词项分别是:大项(P):结论中的谓项。小项(S):结论中的主项。中项(M):在前提中出现两次而在结论中不出现的词项。三段论的特点三段论都是由两个已知直言判断作为前提推出一个新的直言判断。作为前提的两个直言判断中必然包含一个共同概念,这个共同概念(即中项)是联结两者的词项。54概念表示亚里士多德提出和建立的三段论三段论的应用三段论不仅在哲学和逻辑学中有着重要的地位,而且在法律、科学、教育和哲学与伦理学等领域也有广泛的应用。例如:法律领域:三段论常用于法律推理和判例分析。法律条文通常以普遍原则的形式存在,而具体案件则需要通过小前提进行分析。科学研究:三段论被用来验证假设和理论。科学家们通常会提出一个普遍的假设,然后通过实验观察特定的现象。教育领域:三段论在教育领域也发挥着重要作用,尤其是在逻辑和批判性思维的培养中。哲学与伦理学:三段论被用来探讨道德和伦理问题。55概念表示亚里士多德提出和建立的三段论推理正确的案例大前提:所有人都是要死的(为真)小前提:苏格拉底是人(为真)
结论:苏格拉底是都是要死的(为真)56概念表示亚里士多德提出和建立的三段论推理错误的案例1.大前提:所有人都是长生不老的(为假)
小前提:苏格拉底是人(为真)
结论:苏格拉底是长生不老的(为假)2.大前提:所有人都是要死的(为真)
小前提:贾府门前的狮子是人(为假)
结论:贾府门前的狮子都是要死的(为假)57概念表示亚里士多德提出和建立的三段论三段论的优势与局限性优势:清晰性:三段论的结构简单明了,使得推理过程易于理解和追踪。普适性:适用于多种领域,包括法律、科学、教育和哲学等,具有较强的适应性。有效性:当前提成立时,结论必然成立,具有较高的逻辑有效性。局限性:前提的真实性:三段论的有效性依赖于前提的真实性,若前提不成立,则结论无效。复杂性不足:在处理复杂问题时,三段论可能显得过于简化,无法涵盖问题的所有维度。主观性:某些领域(如伦理学)的前提往往带有主观色彩,可能导致结论的争议性。计算思维的概念
计算思维是运用计算机科学的基础概念进行问题求解、系统设计以及人类行为理解等涵盖计算机科学之广度的一系列思维活动。求解问题中的计算思维设计系统中的计算思维理解人类行为中的计算思维计算思维的特征01.概念化,不是编程化02.是根本技能,不是刻板技能03.是人的思维方式,不是计算机的思维04.是数学与工程思维的互补与融合计算思维特征01020304050606.面向一切人类活动05.是思想,不是硬件等人造物计算思维的本质计算思维抽象设计评估自动化通信协作记忆本质:抽象和自动化建模模拟计算思维的应用领域人工智能与数据科学生物信息学智能制造社交网络分析影视游戏与内容创作金融科技……特斯拉超级工厂02数制及其转换用进位的原则进行计数称为进位计数制,简称数制。
数码:一组用来表示某种数制的符号。如:1、2、3、A、B、C、Ⅰ、Ⅱ、Ⅲ、Ⅳ等。
基数:数制所使用的数码个数称为“基数”或“基”,常用“R”表示,称为R进制。如二进制的数码是0、1,基为2。
位权:指数码在不同位置上的权值。在进位计数制中,处于不同数位的数码代表的数值不同。如十进制数111,个位数上的1的权值为1,十位数上的1的权值为10,百位数上的1的权值为100。数制二进制各种进位制以及它们之间的转换
组成数码进位规则基数十进制D八进制O0,1,2,3,4,5,6,7,8,90,10,1,2,3,4,5,6,70,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F逢10进1逢2进1逢8进1逢16进1102816二进制B十六进制H数制表示:1.将数字用括号括起来,再加下标
(101)22.用进位制的字母符号101B常用数制对于任何一个二进制数、八进制数、十六进制数,均可以先写出它的位权展开式,然后再按十进制进行计算即可将其转换为十进制数。例如:(1111.11)2
=1×23+1×22+1×21+1×20+1×2-1+1×2-2=15.75(A10B.8)16=10×163+1×162+0×161+11×160+8×16-1=41227.5注意:在不至于产生歧义时,可以不注明十进制数的进制,如上例。
二进制、八进制、十六进制数转化为十进制数十进制数的整数部分和小数部分在转换时需作不同的计算,分别求值后再组合。整数部分采用除R取余法,即逐次除以R,直至商为0,得出的余数倒排,即为R进制各位的数码。小数部分采用乘R取整法,即逐次乘以R,从每次乘积的整数部分得到R进制数各位的数码。(参见下例)例:将十进制数100.125转化为二进制数十进制数转化为R进制数步骤一:先对整数100进行转换由上得出,100D=1100100B
100250232122622521200011001基数余数整数
0.125×2=0.2500……a-10.25×2=0.5
0……a-20.5×2=1
1……a-3
由上得出,0.125D=0.001B。
将整数和小数部分组合,得出:100.125D=1100100.001B。步骤二:对于小数部分0.125的转换
二进制数转换成八进制数:将二进制数从小数点开始,对二进制整数部分向左每3位分成一组,不足3位的向高位补0凑成3位;对二进制小数部分向右每3位分成一组,不足3位的向低位补0凑成3位。每一组有3位二进制数,分别转换成八进制数码中的一个数字,全部连接起来即可。
八进制数转换成二进制数:将八进制数转换成二进制数,只要将每一位八进制数转换成相应的3位二进制数,依次连接起来即可。二进制数与八进制数的相互转换例:把二进制数11111101.101转化为八进制数。二进制3位分组011111101.101转换为八进制数375.5所以,11111101.101B=375.5O。
二进制数转换成十六进制数:只要把每4位分成一组,再分别转换成十六进制数码中的一个数字,不足4位的分别向高位或低位补0凑成4位,全部连接起来即可。十六进制数转换成二进制数:只要将每一位十六进制数转换成4位二进制数,然后依次连接起来即可。二进制数与十六进制数的相互转换例:将10110001.101B转换为十六进制数。二进制4位分组10110001.1010转换为十进制数111.10转换为十六进制数B1.A所以,10110001.101B=B1.AH。1.算术运算规则加法规则:0+0=0;0+1=1;1+0=1;1+1=10(向高位有进位);减法规则:0-0=0;10-1=1(向高位借位);1-0=1;1-1=0;乘法规则:0×0=0;0×1=0;1×0=0;1×1=1除法规则:0/1=0;1/1=1二进制的运算规则2.逻辑运算规则非运算(NOT):与运算(AND):0∧0=0;0∧1=0;1∧0=0;1∧1=1;或运算(OR):0∨0=0;0∨1=1;1∨0=1;1∨1=1;异或运算(XOR):0⊕0=0;0⊕1=1;相同为0,不同为1
1⊕0=1;1⊕1=0;二进制的运算规则03信息的编码
(1)位(bit)
简记为b,也称为比特,是计算机存储数据的最小单位。一个二进制位只能表示0或1。
(2)字节(Byte)
简记为B。字节是存储信息的基本单位。规定1B=8bit。微机存储器由存储单元构成,每个存储单元的大小就是一个字节。1KB=210B=1024B1MB=220B=1024KB1GB=230B=1024MB1TB=240B=1024GB
(3)字(Word)
CPU通过数据总线一次存取、加工和传送的数据称为字。字长是计算机一次所能处理的实际位数长度,字长是衡量计算性能的一个重要指标。计算机中数据的单位数值信息的表示定点数定点数用于表示整数,小数点位置固定,分为原码、反码和补码三种编码形式。它适用于对整数进行精确计算的场景,如金融交易中的金额计算。浮点数通过科学记数法表示实数,遵循IEEE754标准,分为单精度和双精度。它能够表示极大或极小的数值,适用于科学计算和工程领域,但存在精度损失的问题。浮点数(1)字符编码:目前采用的字符编码主要是ASCII码(美国标准信息交换代码)。7位ASCII码称为标准ASCII码,8位ASCII码称为扩展ASCII码。7位标准ASCII码用一个字节(8位)表示一个字符,并规定其最高位为0,实际只用到7位,因此可表示128个不同字符,包括数字、英文字母、标点符号等。同一个字母的ASCII码值小写字母比大写字母大32(20H)。
A
–
65
a
–
97文字信息的表示(2)汉字编码
A.外码:也称为输入码,将汉字通过键盘等输入设备输入计算机,通常分为流水码、音码、形码和音行结合码四种。
B.交换码:一般用连续的两个字节来表示一个汉字。1980年,我国颁布了第一个汉字编码字符集标准,即GB2312-80《信息交换用汉字编码字符集基本集》,该标准编码简称国标码。
C.机内码:为了能区分汉字与ASCII码,在计算机内部表示汉字时把交换码(国标码)两个字节最高位改为1,称为“机内码”。机内码是真正的计算机内部用来存储和处理汉字信息的代码。
D.
字形码:为了将汉字在显示器或打印机上输出,描述汉字的笔画、结构和形状,把汉字按图形符号设计成点阵图,就得到了相应的点阵代码,即字形码。文字信息的表示音频信息的表示音频本质是连续的模拟信号(如声波),计算机需通过采样、量化、编码三步将其转换为数字信号,这一过程称为声音的数字化。
在播放音频时,再将数字信号转换为实际的声波信号,由扬声器播放。音频文件的格式主要有MP3、WAV、WMA、MIDI等。
GoldWave、AdobeAudition都是常见的音频处理工具。图形图像的表示
图形又称矢量图,而是通过数学公式和几何参数来描述图形。无论放大、缩小或旋转,图形始终保持清晰、平滑。矢量图形常用于logo设计、插画、字体等对清晰度要求高且需灵活变换尺寸的场景,其常见格式包括SVG(可缩放矢量图形,用于网页)、AI(AdobeIllustrator专用格式)、EPS(适用于印刷出版)。不过,矢量图形在表现复杂真实场景(如自然风景照片)时存在局限性,难以呈现细腻的色彩过渡和细节。
图像又称位图,以像素为基本单元,将图像分割成由离散点构成的矩阵,每个像素记录颜色、亮度等信息。常见的位图格式有JPEG(有损压缩,适合照片)、PNG(无损压缩,支持透明通道)、BMP(无压缩,文件体积大)。视频也是由图像组成的。THANKS谢谢!第三章
知识与知识表示
知识与知识表示第一节知识的定义:经过组织、解释和验证的信息,它包含了事实、规则、概念、原理和经验等。可表示性知识可以被以某种形式明确地表达出来。可推理性知识之间存在逻辑关系,支持推理和推断。可共享性知识可以在不同的个体或系统之间传递交流。可增长性知识是可以不断积累和扩展的。知识的定义与特性谓词逻辑使用逻辑符号和变量表示知识,支持逻辑推理和证明,形式化程度高。产生式规则基于“如果-那么”结构,适用于表示具有因果关系的知识,推理灵活。语义网络通过节点和边表示概念和关系,图形化展示,直观表达知识间的联系。框架表示结构化表示方法,使用框架描述对象和属性,支持继承和多态特性。本体论定义领域概念、属性和关系,抽象且通用,为知识共享和重用奠定基础。应用价值合理的知识表示是构建智能系统的核心,决定了推理效率和系统能力。知识表示的基本方法谓词逻辑表示法第二节个体词(Individuals)表示具体或抽象的对象。可以是常数(如a,b)或变量(如x,y),是逻辑中的基本元素。谓词(Predicates)描述对象的属性或关系。如P(x)表示“x具有P属性”,R(x,y)表示“x和y具有R关系”。量词(Quantifiers)•全称量词(∀):表示“对于所有”,限定范围为全体。•存在量词(∃):表示“存在至少一个”,限定范围为部分。逻辑连接词(Connectives)“∧”表示“与”,“∨”表示“或”,“¬”表示“非”,“→”表示“蕴含”,用于连接谓词和量词谓词逻辑的基本概念原子公式由谓词和个体组成的基本表达式,是谓词逻辑的最小单元。示例:•P(a):表示“a具有P属性”其中P是一元谓词,x是个体变项。复合公式由逻辑连接词连接的原子公式,用于表达更复杂的逻辑关系。示例:•P(x)∧Q(y):x有P属性且y有Q属性•P(x)→Q(y):若x有P属性,则y有Q属性谓词逻辑的表示方法(一)全称量词(∀)表示“对于所有”,如∀xP(x)表示“对于所有x,x都具有P属性”。存在量词(∃)表示“存在至少一个”,如∃xQ(x)表示“存在至少一个x,x具有Q属性”。谓词逻辑的表示方法(二)经典案例:用谓词逻辑表示自然语言案例:“所有的猫都喜欢吃鱼”定义谓词Cat(x):x是猫;Like(x,y):x喜欢y;Fish(y):y是鱼构造公式∀x(Cat(x)→∃y(Fish(y)∧Like(x,y)))通俗翻译对于所有x,如果x是猫,那么存在某个y,y是鱼并且x喜欢y。猫与鱼的关系1.确定个体域明确问题讨论的对象集合,为后续谓词定义与逻辑推理提供基础。2.定义谓词将自然语言中的关系或性质转化为逻辑符号,形成原子公式的基础。3.构造原子公式通过谓词与个体词组合,形成最基本的逻辑表达式。谓词逻辑表示的步骤(一)04.使用连接词组合公式通过逻辑连接词(如与、或、非)构建复合公式,表达更复杂的逻辑关系与约束。05.引入量词引入全称量词(∀)和存在量词(∃),扩展公式的适用范围,精准表达对象集合的性质。06.验证与优化检查逻辑表示的正确性、完备性与一致性,并优化表达结构以提升推理效率。谓词逻辑表示的步骤(二)状态空间表示法第三节状态空间表示法的核心思路生活化类比:地图寻路•初始状态=起点,目标状态=终点•操作符=行走规则,状态空间=所有可能路线核心定义将问题转化为状态集合,通过合法操作从初始状态转移到目标状态,寻找最优解路径。核心价值适用于路径规划与问题求解类AI任务,如机器人导航、游戏策略推演等。状态空间的抽象可视化:从起点到终点的多维路径探索状态与状态空间的定义(一)
状态的定义:最小完备性描述系统在某一时刻的所有关键信息。仅根据当前状态就能推断出后续状态,无需额外历史信息,即满足“最小完备性”。典型案例解析机器人导航状态表示为“位置坐标+朝向”,例如:(x,y,北),包含了移动所需的全部信息。八数码问题状态是3×3方格中数字的具体位置组合,每个数字的排列即为一个唯一的状态。快递配送状态可表示为“快递位置+配送员位置”,这两个信息决定了下一步的配送路径。状态与状态空间的定义(二)S状态集合所有可能状态的集合,包含问题在不同阶段的所有表现形式。例如:机器人在环境中的所有可能位置O操作符集合状态转换的规则,即允许从一个状态转移到另一个状态的动作。例如:机器人可以“向前走”、“向左转”S₀初始状态问题求解的起点,是状态空间中一个特定的状态节点。例如:机器人在实验室的位置G目标状态问题求解的终点,是希望达到的一个或多个状态的集合。例如:机器人需要到达会议室状态与状态空间的定义(三)状态空间图的定义一种图形化的表示方式,其中节点代表状态,边代表操作符(即状态之间的转换)。核心作用直观展示所有可能状态及转换关系,帮助清晰看到从初始状态到目标状态的路径,方便寻找最优解。状态空间图结构示意操作符与状态转换操作符(Operator)定义:引起状态转换的规则或动作,是实现状态变化的核心驱动力。核心特性:局部性:操作通常只影响当前状态的局部特征。合法性:必须符合问题的约束条件(如机器人避障)。状态转换(Transition)定义:系统通过应用一个合法的操作符,从当前状态演变到下一个状态的过程。分类方式:确定性操作符:操作结果唯一,状态路径确定。非确定性操作符:操作结果存在多种可能性(概率性)。问题建模与表示方法状态变量定义与编码选择关键状态变量,用符号或数值表示。例如八数码问题中数字位置的向量表示。操作符集合设计设计所有合法操作符,确保符合约束条件。例如八数码问题中空格的移动规则。状态空间图的构建将所有状态和操作符组合,构建完整的状态空间图,形成问题的完整模型。解路径搜索利用搜索算法(如BFS、DFS、A*)在状态空间图中寻找从初始到目标状态的路径。经典案例:八数码问题问题描述:在3×3方格中,通过移动空格,将无序的初始状态转化为有序的目标状态。状态空间:所有可能的排列组合,总共有9!=362880种可能的状态。操作符:空格可以进行上、下、左、右四个方向的移动,推动数字位置变化。求解方法:使用广度优先搜索(BFS)找最短路径,或A*算法结合启发式信息加速求解。文科生友好说明:核心在于理解“将问题转化为状态转换”的思路,而非纠结算法细节。八数码问题状态转换示意图问题归约表示法第四节问题归约表示法的核心思想:分而治之生活化类比:拆解任务如同撰写毕业论文,将其拆解为“选题、查资料、写初稿”等子任务,解决所有子任务即解决原问题。核心定义:分解与组合将复杂问题分解为若干简单子问题,求解子问题后,将它们的解组合起来,从而得到原问题的解。核心价值:降维增效显著降低问题的复杂度,提高求解效率,特别适合解决复杂、层次化的大型问题。问题归约:如同拼图,分解与重构“分而治之”是人工智能求解复杂问题的基石问题归约的核心分解机制(一)状态空间法将原问题转化为一个状态空间图,求解原问题就相当于在这个图中寻找一条解路径。子问题可以看作是路径中的子路径,通过逐步搜索路径来达成目标。与或图法(AO*算法)“与”关系(AND)所有子问题都必须解决,原问题才能解决。例:做饭=买菜∧洗菜∧炒菜。“或”关系(OR)解决任意一个子问题,原问题即可解决。例:去学校=公交∨地铁∨骑车。核心思想:将复杂问题分解为若干子问题,通过解决子问题来间接解决原问题,利用“与/或”逻辑构建问题求解的依赖关系网。问题归约的核心分解机制(二)子目标递归分解将原问题分解为若干子目标,每个子目标再进一步分解为更小的子目标,直到分解出不需要再分解的“本原问题”。例如:计算“1+2+3+4”可分解为“1+2”和“3+4”,再分别计算。本原问题定义:不需要再分解的、可以直接求解的简单问题。例如:“1+1=2”、“机器人向前走一步”。作用:是问题分解的“终点”,是求解原问题的基础。问题归约的实现步骤1.问题形式化表示将实际问题转化为数学或逻辑模型,明确问题的范围、状态空间和约束条件。2.归约算子设计设计分解规则,将原问题分解为子问题,并定义子问题之间的“与/或”关系。3.搜索策略选择选择合适的搜索算法(如A*算法),求解各个子问题,并将它们的解组合得到原问题的解。经典案例:复杂项目任务拆解原问题:完成“人工智能科普展”项目分解子问题(与关系):策划方案∧场地布置∧展品准备∧人员安排再分解(或关系):“展品准备”=制作科普海报∨准备AI演示设备本原问题:设计一张科普海报、调试一台演示设备核心小结:问题归约让复杂的项目变得条理清晰,易于执行和管理。项目进度与任务拆解甘特图问题归约表示法的优缺点与适用场景优点显著降低问题的复杂度结构层次清晰,便于理解和管理适合解决复杂、层次化的问题缺点分解规则设计难度大,需深入理解问题子问题关系复杂时容易出错适用场景项目管理与任务拆解复杂算法设计数学问题证明语义网络表示法第五节语义网络表示法:符合人类认知习惯生活化类比:大脑的“知识图谱”如同想到“苹果”会自然联想“水果”、“红色”、“甜”等属性,符合直觉联想。定义:图形化知识表示由节点(概念/实体)和弧(边)(语义关系)组成的图形结构。核心价值:直观且基础直观易懂,符合人类认知习惯,是知识图谱、自然语言理解等领域的重要基础。语义网络/知识图谱的抽象结构“连接万物,让知识可见”语义网络的基本结构(一)节点定义:表示实体、概念、属性或事件。例:“苹果”、“水果”、“红色”、“吃饭”特点:每个节点都有唯一的标识,确保语义的准确性。弧定义:表示节点之间的语义关系,带有方向(箭头指向)。例:连接“苹果”与“红色”的“具有”关系特点:弧上通常标注关系类型,如“ISA”(是一个)、“Have”(有)。语义网络的基本结构(二)实例关系(ISA)“小花”ISA“猫”表示个体与类别的实例化关系分类关系(AKO)“猫”AKO“动物”表示子类与父类的泛化关系属性关系(Have)“猫”Have“四条腿”表示对象拥有的属性或能力成员关系(Member)“北京”Member“中国”表示个体与集体的所属关系包含关系(Part-of)“心脏”Part-of“人体”表示部分与整体的组成关系时间关系(Before)“吃饭”Before“睡觉”表示事件发生的先后顺序位置关系(Located)“书”Located-on“桌子”表示对象所处的空间位置相近关系(Similar)“猫”Similar-to“老虎”表示对象间的相似或类比关系因果关系(If-then)“下雨”If-then“地面湿”表示事件之间的因果逻辑关系语义网络的知识表示步骤知识获取与形式化描述收集相关知识,明确核心概念、实体及关系。例如:明确“苹果”是水果,具有红色、甜等属性。语义网络构建创建节点(如苹果、水果),用弧标注关系(ISA、Have),并添加约束确保关系无矛盾。语义网络优化消除冗余节点和关系,检查逻辑一致性,优化网络性能,确保知识表示的准确性与高效性。语义网络的推理机制正向推理从已知事实出发,利用语义网络关系,推导出新结论。例:苹果是水果+水果会腐烂
→苹果会腐烂反向推理从目标结论出发,在语义网络中寻找支持该结论的前提条件。问:苹果会腐烂吗?
查:寻找“苹果是水果”等前提混合推理结合正向推理和反向推理的优势,有效提高推理的效率和准确性。策略:正向推理确定方向
反向推理验证细节语义网络的典型应用场景知识图谱如百度百科、维基百科的知识图谱,直观展示概念间的关系,构建结构化知识库。自然语言理解帮助语音助手、机器翻译系统理解人类语言的语义,实现人机自然交互。智能推荐基于用户兴趣与商品关系的深度挖掘,进行精准的个性化内容推荐。专家系统在医疗诊断、法律咨询等专业领域,利用语义网络表示知识并进行逻辑推理。语义网络表示法的优缺点与适用场景直观易懂,符合人类认知习惯表达能力强,可表示复杂语义关系可扩展性好,便于添加新节点复杂知识网络结构会过于繁琐缺乏严格逻辑基础,推理效率不高知识图谱构建自然语言理解智能推荐系统本章授课结束感谢聆听!
《人工智能概论》第四章机器学习及其经典算法
118目录CONTENTS01初识机器学习02学习策略与风险03监督学习类型04感知机模型05多层感知机06支持向量机目录CONTENTS01应用场景与案例02总结与展望01初识机器学习机器学习的定义与本质01机器学习的定义机器学习是研究计算机如何通过数据构建概率统计模型,并利用模型进行预测与分析的学科。它通过经验数据自动改进性能,无需显式编程。02学习者视角赫尔伯特·西蒙与米切尔分别从不同角度定义学习为系统性能的提升过程。学习是系统通过执行某个过程改进其性能的行为。03机器学习的作用机器学习通过模拟人类学习活动,获取知识与技能,从而提升系统性能,是人工智能实现智能行为的关键技术之一。
MachineLearning<T,P,E>:ComputerautomaticallyimprovesattaskT(任务)accordingtoperformancemetricP(性能)throughexperienceE(经验) TomMitchell123米切尔(Michell)给学习下了个比较宽广的定义,使其包括任何计算机程序通过经验来提高某个任务处理性能的行为:定义1.1
对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么就称这个计算机程序从经验E中学习。124125机器学习(Machinelearing)也称为统计机器学习(Statisticalmachinelearing),或称为统计学习(Statisticallearing)。什么叫做机器学习?至今还没有统一的“机器学习”的定义,也很难给出一个公认的和准确的定义。为了便于进行讨论和估计学科的进展,有必要对机器学习给出定义,即使这种定义是不完全的和不充分的。126定义1.2机器学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。定义1.3
机器学习是研究机器模拟人类的学习活动、获取知识和技能的理论和方法,以改善系统性能的学科。这里所说的“机器”,指的就是计算机;现在是电子计算机,以后还可能是中子计算机、量子计算机、光子计算机或神经计算机等。127机器学习的发展历程机器学习的发展分为4个时期第一阶段是在50年代中叶到60年代中叶,为热烈期,研究无知识学习。第二阶段在60年代中叶至70年代中叶,被称为机器学习的冷静时期,尝试符号概念学习。第三阶段从70年代中叶至80年代中叶,称为复兴时期,知识库与强化学习结合。机器学习的最新阶段为80年代中期至今为爆发期,神经网络复兴,多种学习方法并存。12802学习策略与风险机器学习的目的是根据给定的训练样本,估计体系输入与输出的依赖关系,使之能够尽可能准确的预测出系统的未来输出。机器学习问题一般可以表示为:变量y与x存在一定的未知依赖关系,即遵循某一未知的联合概率
机器学习问题就是根据n个独立同分布的观测样本:130损失函数与风险函数损失函数监督学习通过损失函数度量预测误差,常用0-1损失、平方损失、绝对损失、对数损失等。1.机器学习常用的损失函数有以下几种:132损失函数与风险函数损失函数度量预测模型一次预测的好坏,风险函数度量平均意义下模型预测的好坏。损失函数值越小,模型就越好。预测函数也称为学习函数、学习模型或学习机器。风险函数在模型假设空间F,求一个最优的函数进而
对x和y的依赖关系进行估计,使其期望风险最小。由于模型的输入、输出(x,y)是随机变量,遵循联合分布P(x,y),所以损失函数的期望学习的目标就是选择期望风险最小的模型。134险fengx函数135险fengx函数136险fengx函数根据大数定律,当样本容量N趋于无穷时,经验风险趋于期望风险。所以,一个非常自然的方法是用经验风险估计期望风险。但是,由于现实世界中训练样本数目有限,甚至很小,而用经验风险估计期望风险常常效果并不理想,需要对经验风险进行一定的矫正。这就关系到监督学习的两个基本策略:经验风险最小化和结构风险最小化。137险fengx函数在假设空间F、损失函数及训练数据集DN确定的情形下,经验风险函数式就可以确定。经验风险最小化(empiricalriskminimization,ERM)策略认为,经验风险最小的模型是最优模型。根据经验风险最小化策略求最优模型就是求解最优化问题:138险fengx函数结构风险最小化(structuralriskminimization,SRM)是为了防止过拟合而提出来的策略。结构风险最小化等价于正则化(regularization)。结构风险在经验风险上加上表示模型复杂度的正则化项(regularizer)或罚项(penaltyterm)。在假设空间F、损失函数及训练数据集DN确定的情形下,结构风险的定义为:139险fengx函数比如贝叶斯估计中的最大后验概率估计MAP)就是结构风险最小化的典型案例。当模型是条件概率分布、损失函数是对数损失函数、模型复杂度由模型的先验概率表示时,结构风险最小化就等价于最大后验概率估计。结构风险最小化的策略认为,结构风险最小化的模型就是最优模型。根据结构风险最小化策略求最优模型就是求解最优化问题:140经验风险与结构风险最小化经验风险最小化经验风险最小化(ERM)选择训练误差最小的模型,适用于大样本,如极大似然估计。结构风险最小化结构风险最小化(SRM)在经验风险上加模型复杂度惩罚项,权衡拟合与泛化,如最大后验概率估计。正则化的作用SRM通过正则化控制模型复杂度,提升对未知数据的预测能力,是监督学习中的核心优化目标。因此,监督问题就变成了经验风险或结构风险函数的最优化问题式(
)和式(4-11)。这时经验或结构风险函数就是最优化的目标函数。03监督学习类型机器学习类型根据样本数据的特点和求解手段,机器学习有不同的分类标准。基于学习方式的分类目前比较常用,可分为监督学习(有导师学习)、无监督学习(无导师学习)、半监督学习、增强学习。监督学习和无监督学习的主要区分为是否有标签,即数据样本是否有标准答案。监督学习是从给定的数据集中学习一个函数,当新的数据来临时,可以根据这个函数预测结果;监督学习的训练集要求是包括输入和输出,也可以说是特征和目标,而训练集中的目标是由人标注的;常见的监督学习包括分类和回归等算法。机器学习类型无监督学习:与监督学习相比,训练集没有人为标注的结果。无监督学习算法包括聚类(如K-均值聚类等)。半监督学习:介于监督学习与无监督学习之间。增强学习:通过观察来学习做成如何的动作。每个动作都会对环境有所影响,学习对象根据观察到的周围环境的反馈来做出判断。一、分类学习分类是机器学习的一种非常重要的方法,分类的概念是在已有数据的基础上学会一个分类函数或构造一个分类器模型。分类学习的关键在于特征的选择和模型的构建。对于样本数据需要把它们分成两个不同的集合:一个集合被称为训练数据集,用于通过算法训练获得分类器模型;另一个集合被称为测试数据集,用于测试分类器模型的分类效果。一、分类学习:离散标签的预测分类学习的目标分类是监督学习的核心任务之一,其目标是通过从已标注的训练数据中学习一个分类模型(分类器),该模型能够将新的、未知的离散类别标签的数据分配到正确的类别中。分类学习的应用分类广泛应用于银行风控、入侵检测、人脸识别、文本分类等场景,是智能系统实现“分门别类”的基础能力。一、分类学习分类问题包括学习和分类两个过程。在学习过程中,根据已知的训练数据集利用有效的学习方法学习一个分类器;在分类过程中,利用学习的分类器对新的输入实例进行分类。分类问题可以用图4-2进行描述。二、回归学习回归问题:回归问题是分析数据特征与标签的关系,并用以预测样本标签的任务。其中,标签是一个连续的数值。回归(Regression)是监督学习的一个重要问题。回归用于预测输入变量(自变量,解释变量)和输出变量(因变量,响应变量)的关系,特别是当输入变量的值发生变化时,输出变量的值也随之发生变化。回归模型正是表示从输入变量到输出变量映射的函数。二、回归学习回归问题分为学习和预测两个过程。二、回归学习回归学习系统的基本结构。回归学习:连续值的拟合回归学习的任务回归用于预测连续变量,如房价、股价等。通过训练数据学习输入特征与输出值之间的映射函数,常用均方误差作为损失函数。回归学习的应用回归分析包括训练与预测两个阶段,广泛应用于金融、医疗、工业等领域,是理解变量间依赖关系的重要工具。04感知机模型感知机如果两类数据能够用一条直线分开,就称为线性可分。感知机是通过模拟人类大脑的神经元(也称为神经细胞)行为来处理线性可分的模式识别问题。感知机(perceptron)就是这样一种线性分类器,它是最简单的一种人工神经网络,即单层的神经网络,是机器学习中的一种二分类线性分类模型。20世纪50年代,FrankRosenblatt(如图4-3所示)提出的感知机是一个仅包含输入层和输出层的两层神经网络,又称为正向传播网络,是神经网络和支持向量机的基础。图4-3Rosenblatt提出感知机模型单层感知机结构与原理感知机结构感知机是两层神经网络,输入层传递数据,输出层计算加权和并通过阶跃激活函数产生0或1输出,用于二分类。感知机原理权重根据预测误差在线调整,学习规则简单。尽管算法简洁、可在线学习,但只能解决线性可分问题,对噪声敏感。感知机的局限与突破感知机局限感知机无法解决线性不可分问题,如异或逻辑,导致神经网络研究一度停滞。突破局限其局限性促使多层感知机(MLP)的出现,通过引入隐藏层和非线性激活函数,突破线性边界,开启深度学习时代。1、感知机的工作原理可以分为以下几个步骤(1)输入与加权和:感知机接收多个输入信号(如图像像素值或数据特征),每个输入信号都会被赋予一个权重。然后,感知机计算所有输入的加权和,这个过程类似于对输入信号进行加权求和。(3)训练过程:感知机的训练过程非常简单,基于误差调整权重。假设感知机输出错误,则通过梯度下降法(或类似的优化方法)调整输入特征的权重和偏置项,直到其输出正确为止。(2)激活函数:加权和通过一个激活函数进行非线性变换。通常使用阶跃函数,阶跃函数决定了感知机的输出是0还是1(即二分类任务的类别)。2、感知机的局限性(1)仅能解决线性可分问题:感知机模型的最大局限性在于,它只能解决线性可分问题。(3)线性不可分问题的突破:尽管感知机的局限性在于线性不可分问题,但它仍为神经网络的进一步发展提供了启发。(2)感知机的“感知机定理”:1969年,计算机科学家马克·米尔(MarvinMinsky)和西摩·帕帕特(SeymourPapert)发表了著名的《感知机》一书,指出感知机只能解决线性可分的问题。2、感知机的优点和缺点(1)优点:①算法简单,易于实现:感知机模型的数学表达式和训练过程都非常简单,易于理解和实现。②可以在线学习:感知机模型可以在线学习,适用于大规模数据集。对于线性可分的数据集,感知机可以得到全局最优解:在数据线性可分的情况下,感知机模型可以找到一个最优的分类超平面。(2)缺点:①只能处理线性可分的数据集:感知机模型的最大局限性在于,它只能解决线性可分问题。②对于噪音数据非常敏感:感知机模型对噪音数据非常敏感,容易受到噪音的影响。③模型无法输出概率估计:感知机模型无法输出概率估计,只能给出类别标签。2、感知机的应用场景(1)图像分类:感知机可以用于图像分类任务,将图像分为不同的类别。(3)垃圾邮件过滤:感知机可以用于垃圾邮件过滤任务,将邮件分为垃圾邮件和非垃圾邮件。(2)文本分类:感知机可以用于文本分类任务,将文本内容分为不同的类别。(4)信用评估:感知机可以用于信用评估任务,根据客户的信用记录将客户分为高风险和低风险。(5)医学诊断:感知机可以用于医学诊断任务,根据病人的症状将病人分为患有某种疾病和未患有某种疾病等。05多层感知机MLP结构与前向传播MLP结构多层感知机由输入层、一个或多个隐藏层和输出层组成,每层神经元通过权重连接。前向传播输入数据经隐藏层非线性变换提取特征,最终输出层生成预测结果。隐藏层引入激活函数如ReLU、Sigmoid,使网络具备非线性建模能力。反向传播与参数更新反向传播MLP训练通过反向传播算法实现。前向传播计算预测值与误差,误差从输出层反向传递至隐藏层,计算各层梯度。参数更新利用梯度下降或其变体(如Adam、RMSProp)更新权重与偏置,最
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年正规版艺术品交易代理合同协议
- 2026年法律硕士联考备考全解析-法条解读与案例分析
- 会计基础知识试题及答案
- 2026年蚂蚁集团校招笔试高频题
- 2026年设计师作品集评分标准与备考资料
- 2026年情书歌曲说课稿幼儿园
- 2026年仓储货物入库合同协议
- 2026年财务管理师考试冲刺卷
- 2026年职业教育竞赛活动方案
- 2026年用电常识及安全知识
- X光影像诊断题库及答案
- 2026年天津市河西区中考一模英语试卷和答案
- 产前筛查宣教课
- 2026年上海市徐汇区初三下学期二模数学试卷和答案
- 湖南省好房子建设技术导则(2026版)
- 2026年河南郑州市高三二模语文试卷答案讲评课件
- 2026浙江杭州市萧山区机关事业单位第一次招聘编外人员87人笔试备考题库及答案解析
- 2026年江苏省盐城市社区工作者招聘笔试参考试题及答案解析
- 2024年云南省考评员应知应会题库(含答案)
- CJ/T 158-2002 城市污水处理厂管道和设备色标
- 人力资源管理流程
评论
0/150
提交评论