版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
初识人工智能第1章人工智能通识基础
(慕课版在线案例实训版)案例引入深圳打造人工智能先锋城市:全栈生态领跑全国2024年,深圳聚焦“赋能千行百业”与“做大产业集群”,全力打造人工智能全域全时全场景应用先锋城市。全市有人工智能企业超2200家,形成以华为、腾讯为龙头,元象科技、兔展智能等高成长企业支撑的“雁阵式”生态,覆盖芯片、模型、硬件到应用的全栈产业链。深圳的科技创新硬实力持续增强。鹏城实验室、光明实验室等平台错位布局,聚焦具身智能、高效大模型等前沿方向;国家人工智能学院(深圳)加速筹建,联合清华大学、北京大学培养拔尖人才。算力与数据基础设施同步提速:鹏城云脑Ⅲ获批建设,全市训力超55E;建成政务智能语料平台,加工语料10TB;深圳数据交易所累计交易额达133.58亿元,居全国首位。深圳滚动发布近200个“城市+AI”场景,在司法、气象、城管等领域打造标杆:深圳中院上线全国首个司法审判大模型,覆盖85项流程;市气象局联合华为云推出区域级AI预报模型“智霁”;80余个人工智能环卫机器人应用场景落地。华为昇腾AI处理器、欣旺达AI设备调优系统等4个案例入选工业与信息化部“人工智能赋能新型工业化”典型名单;腾讯、小库科技等在游戏、建筑等现代服务业深化AI应用。“三全智能”(全身、全车、全屋)产品加速破圈,华为、荣耀发布AI手机,乐聚、逐际动力推出智能机器人。政策与空间保障同步强化。2024年12月,《深圳市打造人工智能先锋城市的若干措施》出台,推出“训力券”“语料券”等支持举措;高标准规划建设十大人工智能集聚区,并举办国际通用人工智能大会、AI视觉创意大赛等重大活动,推动技术、资本、人才高效对接,加速构建最健全、最开放的人工智能产业生态。思考:全栈式AI产业链是不是城市构建人工智能竞争力的必要条件?深圳“芯片—模型—应用”一体化生态对其他城市有何影响?人工智能基础人工智能伦理与安全人工智能与人才培养010203目录CONTENTS01人工智能基础人工智能(ArtificialIntelligence,AI)是人类智慧的延伸与拓展,它正以前所未有的深度和广度,影响着人们的生活方式和思维方式,成为驱动新一轮科技革命和产业变革的重要力量。从最初的概念提出到如今的“超级智能”探索阶段,AI已走过曲折而辉煌的发展历程,并在算法、算力与数据的协同驱动下,形成了涵盖基础层、技术层与应用层的完整产业链。当前,弱人工智能广泛应用,强人工智能稳步推进,超人工智能仍处于探索前沿;与此同时,全托管与开源生态并行、平台化服务与定制化方案共存的多元商业模式,正加速AI在医疗、制造、金融、教育等千行百业的落地。开放平台与开源软件则成为推动技术普惠与创新的重要引擎,不仅降低了使用门槛,也促进了全球协作与生态繁荣。站在2026年这一关键节点,人工智能已从“技术可行”迈向“商业普及”,成为驱动社会进步与产业升级的核心动力。1.1.1人工智能的概念与特征人工智能是计算机科学技术的一个分支,旨在研究用于模拟和延伸人的智能的理论、方法及技术。它利用计算机系统和算法,使机器能够执行那些通常需要人类智慧才能完成的任务,包括学习、推理、感知、理解和创造等活动。简单来说,人工智能就是让计算机像人一样“会看、会听、会说、会思考、会学习”。人工智能的概念跨学科性具备模仿人类智能的能力自主性集成性可扩展性强人工智能的特点1.1.2人工智能的发展历程与现状发展阶段发展特点主要事件初步发展阶段(1950年-1973年)人工智能成为一个研究领域,并取得了一些研究成果①1950年,英国数学家艾伦·图灵提出“图灵测试”,奠定了人工智能研究的理论基础,激发了人们对研究智能机器的热情;②1955年,“逻辑理论家”程序问世,其被认为是人类历史上第一个人工智能程序;③1956年,在美国达特茅斯学院举行的学术研讨会上,人工智能的概念被首次提出;④1958年,约翰·麦卡锡提出LISP编程语言,这种语言专为人工智能研究设计,至今仍被广泛使用;⑤1966年,美国科学家发布了世界上第一款聊天机器人ELIZA,标志着人工智能在自然语言处理方面取得了初步进展第一次寒冬阶段(1974-1980年)因技术瓶颈、社会舆论压力及人工智能研究项目的失败,人工智能进入低谷期,政府和企业对人工智能的投资减少1973年,英国科学研究理事会发布报告,批判人工智能项目进展缓慢。人工智能研究资金被削减第二次发展阶段(1981-1987年)专家系统兴起,出现一些人工智能公司,人工智能技术开始产生一些商业价值专家系统被应用于医疗诊断、地质勘探等领域人工智能的发展历程1.1.2人工智能的发展历程与现状发展阶段发展特点主要事件第二次寒冬阶段(1988-1993年)人工智能大规模商业应用的期望仍未实现,人工智能再次进入低谷人工智能大规模应用受阻,资金被削减深化发展阶段(1994-2015年)人工智能技术被应用于多个领域,出现许多创新的理论、方法、技术和应用①1997年5月,IBM深蓝超级计算机在国际象棋比赛中战胜国际象棋世界冠军加里·卡斯帕罗夫;②2011年,IBM的智能系统沃森在智力问答节目中战胜两位人类选手并获得冠军蓬勃发展阶段(2016年至今)大数据技术的发展、计算能力的提升和机器学习技术的进步,推动了人工智能的蓬勃发展①2016年,AlphaGo击败围棋选手李世石,展示深度学习潜力;②2019年,百度发布文心大模型1.0;2023年10月,百度发布文心大模型4.0;2024年6月,百度发布文心大模型4.0Turbo;③2022年,OpenAI发布聊天机器人ChatGPT,其凭借强大的文字处理能力和人机交互功能迅速获得了众多关注;④2023年,阿里云发布通义千问大模型;2024年5月,阿里云发布通义千问2.5版本人工智能的发展历程1.1.2人工智能的发展历程与现状2025年,人工智能的发展呈现技术突破、产业深化、国际竞争与治理创新并行的鲜明特征,整体进入“超级智能”探索阶段,应用落地与商业化加速推进。技术突破在技术层面,2025年被称作“推理之年”。AI通过“思维链+强化学习”在数学、代码等复杂任务上实现显著突破;同时,开源生态快速崛起;小模型趋势明显;硬件的提升与液冷技术的突破缓解了算力瓶颈。产业深化在产业应用方面,智能体和多模态AI成为新热点。智能体具备记忆、规划和工具调用能力,已广泛用于IT、医疗、金融等领域,预计未来更多企业将整合智能体到工作中。多模态AI的发展推动内容生成、医疗影像诊断等场景深度融合。国际竞争国际竞争格局加速演变。美国推动“AI国家行动计划”,中国加速算力自主与开源生态建设,欧盟《人工智能法案》的实施面临阻力。AI的全球监管呈现差异化,欧盟注重多层风险义务,美国加州以轻量化透明度为主,中国通过“人工智能+”行动与生成内容标识等务实政策推动产业融合。治理创新在安全治理方面,AI安全标准体系加速构建。生成式AI内容标识、专利指引等政策密集出台,力图在创新与风险间寻求平衡。1.1.3人工智能的类型超人工智能强人工智能弱人工智能按照智能程度分类弱人工智能是指专注于执行特定任务的人工智能系统,这类人工智能系统无法像人类一样进行广泛的学习和适应新环境。强人工智能是指能够像人类一样理解、学习、推理、解决各种复杂问题,并能够在不同的任务和环境中灵活运用知识、完成任务的人工智能系统。超人工智能是指远超人类智慧的人工智能系统。智能音箱1.1.3人工智能的类型人工智能类型特点弱人工智能·单一任务导向:在其特定的任务领域可以表现出很高的性能,但在其他领域则无法进行智能操作;·无自我意识:不具备真正的理解和认知能力,只依靠预设的算法和模型进行运算;·实时学习和改进:虽然不具有全局学习能力,但它可以通过大量的数据输入和反馈机制不断优化其在特定任务领域的性能强人工智能·多功能性:能够处理各种类型的任务,而不局限于某一特定领域;·学习和适应:具备广泛的认知能力,能够在不同情境下推理、解决问题和学习新技能,并将学到的技能应用于新的任务中;·自我改进:具有自我修正和升级的能力,能够不断提高自身的性能和效率;·情感理解:理论上,强人工智能能够理解和模拟人类的情感,可以在社会互动中展现出更高的智能水平超人工智能·超越人类的智能:能够进行高度复杂的推理和决策;·自我驱动:具有自己的需求、欲望和情感,能够自主设定目标并为之努力;·全方位能力:不仅能完成智力任务,还可以在艺术创作、情感表达和人际关系处理等方面超越人类弱人工智能、强人工智能与超人工智能的特点对比1.1.4人工智能的产业链与商业模式1.1.4人工智能的产业链与商业模式0501030402该模式以标准化AI产品为核心,企业自主研发成熟的人工智能硬件或软件产品,直接面向客户销售,类似传统行业的货架式售卖。技术产品售卖模式该模式聚焦传统行业的转型升级需求,AI企业作为技术合作伙伴,将人工智能技术与传统行业的业务流程深度融合,帮助合作方降本增效、创造新价值,再从中获取收益。AI赋能传统行业模式针对不同行业或企业的个性化需求,AI企业提供量身定制的解决方案。AI企业会根据客户的具体业务流程、数据特点,专项开发AI系统或模型。定制化服务模式基于“数据是AI的燃料”这一核心逻辑,企业先通过合法合规渠道收集、整理、清洗各类数据,再运用AI技术进行深度分析、挖掘,将加工后的高价值信息产品提供给客户。数据服务+AI结合模式企业搭建综合性AI服务平台,整合各类AI功能,用户通过付费订阅获得使用权限,模式类似主流的视频会员、办公软件订阅服务。平台订阅/会员模式人工智能的
商业模式1.1.5人工智能开放平台与人工智能开源软件人工智能开放平台人工智能开放平台是指面向开发者、企业及研究机构,提供人工智能能力(如语音识别、图像处理、自然语言处理等)及模型训练、部署、管理、API(应用程序编程接口)调用等全流程服务的软件平台。这些平台旨在降低AI技术使用门槛,加速AI应用落地。人工智能开放平台的核心功能包括数据采集、清洗、标注与存储;模型训练、调优、自动化超参数调整;模型部署、API服务化与分布式计算;监控、评估与安全管理;支持多种开发框架,如TensorFlow、PyTorch
等。人工智能开放平台的应用场景主要是智能客服、智能家居、医疗影像分析、金融风控、工业制造、智慧教育、城市大脑等;通过社区协作,推动技术快速迭代;产业赋能,推动AI技术向实体经济渗透。类型概念举例国家级平台由科技部主导,依托头部企业建设百度建设自动驾驶国家级平台,阿里云建设城市大脑国家级平台,腾讯建设医疗影像国家级平台,科大讯飞建设智能语音国家级平台企业级平台由科技企业自主建设,聚焦自身技术与场景优势百度飞桨与文心大模型深度协同,形成立体开源体系,支持内部技术迭代与外部开发者使用开源社区平台由开源组织或企业建设,聚焦开源模型与工具的协同开发开放原子开源基金会推出的AtomGit平台,提供“代码+模型+环境+算力”全流程服务,支持国产芯片与主流深度学习框架,推动开源生态繁荣人工智能开放平台的具体说明1.1.5人工智能开放平台与人工智能开源软件人工智能开放平台人工智能开放平台是指面向开发者、企业及研究机构,提供人工智能能力(如语音识别、图像处理、自然语言处理等)及模型训练、部署、管理、API(应用程序编程接口)调用等全流程服务的软件平台。这些平台旨在降低AI技术使用门槛,加速AI应用落地。人工智能开放平台的核心功能包括数据采集、清洗、标注与存储;模型训练、调优、自动化超参数调整;模型部署、API服务化与分布式计算;监控、评估与安全管理;支持多种开发框架,如TensorFlow、PyTorch
等。人工智能开放平台的应用场景主要是智能客服、智能家居、医疗影像分析、金融风控、工业制造、智慧教育、城市大脑等;通过社区协作,推动技术快速迭代;产业赋能,推动AI技术向实体经济渗透。人工智能开源软件人工智能开源软件是指人工智能的源代码公开,允许任何人查看、使用、修改和分发的软件库、框架和工具,其核心是“开放、协作、共享”,通过社区驱动创新,降低技术垄断,推动技术普惠。人工智能开源软件的核心特征包括以下几点。●代码开放:源代码公开,用户可以查看、修改与分发。●社区协作:通过GitHub、GitCode
等平台,开发者共同参与代码贡献、错误修复、功能迭代。●许可证规范:遵循开源许可证(如GPL、MIT、Apache),明确使用、修改、分发的规则,保障用户权益。1.1.5人工智能开放平台与人工智能开源软件人工智能开放平台与人工智能开源软件是相辅相成、协同发展的关系:●人工智能开源软件是人工智能开放平台的核心支撑,人工智能开放平台的技术能力(如模型、框架、工具)多基于人工智能开源软件开发,如百度大脑基于飞桨框架,科大讯飞开放平台基于TensorFlow等开源框架。●人工智能开放平台是人工智能开源软件的生态载体,人工智能开放平台通过汇聚开发者、企业、研究机构,推动人工智能开源软件的应用与迭代,如AtomGit
平台通过“开源+AI”一体化服务,推动开源模型与算力的协同。●两者均以“技术共享”为核心,通过降低门槛、加速创新、产业赋能,推动AI技术向实体经济渗透,推动我国抢占AI科技竞争制高点。人工智能开放平台与人工智能开源软件的关系1.1.5人工智能开放平台与人工智能开源软件对比维度人工智能开放平台人工智能开源软件开放性API/SDK服务,部分能力开放源代码全开放使用门槛低,适合企业快速接入较高,需开发能力成本按调用/订阅计费,或部分免费使用免费,但有维护成本定制性受限,依赖平台能力极高,可深度定制生态支持企业级支持,服务完善社区支持,依赖社区数据控制数据可能上传至厂商服务器完全掌握数据,适合敏感场景部署方式以云服务为主支持自托管、私有化部署人工智能开放平台与人工智能开源软件的区别探索AI开放生态——主流人工智能开源平台与工具对比分析学生自由分组,以3~4人为一组,围绕“高职院校AI教学与小型项目开发”这一典型需求,选取至少3个国内外主流AI开放平台或开源框架进行调研。每组需完成一份《AI工具选型对比分析报告》,内容包括各平台/工具的核心特点、适用场景、学习门槛、社区支持情况,并给出针对教学或轻量级项目开发的推荐建议。实训要求课堂协作实训(1)回顾“人工智能开放平台与人工智能开源软件”一节的内容,明确评估AI工具的关键维度,如易用性、文档完善度、中文支持、部署便捷性、算力要求等。(2)小组分工,分别负责不同平台/工具的信息收集,重点查阅官方文档、社区论坛及教学案例。(3)汇总信息,制作对比表格,聚焦高职学生在无强大算力或专业背景下的使用可行性。(4)基于对比结果,讨论并形成推荐意见,撰写分析报告,并准备3分钟的简要汇报用于课堂交流。实训思路02人工智能与人才培养人工智能正以前所未有的速度变革劳动力市场与职业生态。它不仅替代了部分重复性、流程化的工作,还催生出一批融合技术与创意的新职业,这些新职业折射出人机协作日益深化的时代趋势。面对这一变革,人才的定义也在悄然转变——它不再仅是掌握单一技能的执行者,而是兼具技术素养、行业洞察与人文关怀的复合型个体。未来的人才竞争力不仅在于能否驾驭AI工具,还在于能否在“AI+专业”的交叉地带提出创新解决方案,在机器无法触及的情感、伦理与复杂决策领域彰显人的独特价值。1.2.1人工智能对就业的影响01人工智能的发展与应用既给就业带来了新的挑战,也创造了新的机遇。随着人工智能的发展,一些重复性高、规律性强的工作岗位,如数据输入员、文件处理员、客服代表等,很容易被自动化和智能化的系统所取代。02人工智能的广泛应用推动了人机协作工作模式的发展。人机协作工作模式是指人类与人工智能系统在工作过程中相互配合、优势互补、共同完成任务的一种新型工作方式。就业者需要学会与人工智能系统协同工作,借助人工智能的优势提高工作效率和质量,同时发挥人类的独特价值,如情感理解、人际交往等。人类与人工智能协作的模式1.2.1人工智能对就业的影响01人工智能的发展与应用既给就业带来了新的挑战,也创造了新的机遇。随着人工智能的发展,一些重复性高、规律性强的工作岗位,如数据输入员、文件处理员、客服代表等,很容易被自动化和智能化的系统所取代。02人工智能的广泛应用推动了人机协作工作模式的发展。人机协作工作模式是指人类与人工智能系统在工作过程中相互配合、优势互补、共同完成任务的一种新型工作方式。就业者需要学会与人工智能系统协同工作,借助人工智能的优势提高工作效率和质量,同时发挥人类的独特价值,如情感理解、人际交往等。03人工智能的广泛应用对就业者的技能要求发生了显著变化,传统行业的就业者需要不断学习和掌握新技能,以适应新的工作环境和市场需求。这在一定程度上促进了职业转型和升级,使就业者能够向更高技能、更高薪资的岗位发展。1.2.2人工智能催生的新职业人工智能的发展催生了许多新职业,这些岗位主要集中在AI技术的研发、应用、人机协作及与特定产业深度融合等领域。职业名称产生/认证时间具体职责生成式人工智能系统应用员2024年由国家人社部认证运用生成式AI技术进行系统设计、模型调用与训练、性能优化及日常维护管理人工智能训练师2020年由国家人社部认证通过数据标注、算法参数设置、人机交互设计等方式训练AI模型,提升其智能水平与可靠性,其工种包括数据标注员、人工智能算法测试员等无人机群飞行
规划员2025年由国家人社部公示为新职业负责规划无人机群的飞行路线,制订飞行计划与任务,并进行飞行现场管理,确保表演或作业的顺利完成生成式人工智能动画制作员2025年由国家人社部公示为新工种使用生成式AI工具设计脚本和镜头,生成动画素材,并进行后期修改和优化,完成动画视频制作具身智能机器人训练师2023—2024年设计并执行人形或服务机器人的行为训练计划;通过仿真与真实环境数据,训练机器人完成行走、抓取、避障等物理交互任务;分析传感器数据,优化控制算法与决策逻辑;协同算法工程师调优强化学习策略,提升机器人在物流、制造等场景的自主作业能力提示词工程师2022年兴起专注于设计与优化输入AI模型的提示词,以精准控制AI生成的文本、图像或视频等内容的质量和风格AI伦理审查员/AI伦理审计师2023年兴起,
2024—2025年制度化负责对AI系统的决策过程、数据使用及输出结果进行审计与评估,确保其符合伦理规范和监管要求人工智能新职业及其具体职责1.2.2人工智能催生的新职业早期职业(如人工智能训练师)侧重于基础模型训练,而现在像生成式人工智能系统应用员这样的角色则更注重将大模型能力与电商、医疗等具体行业场景深度结合,解决实际业务问题。许多新岗位的核心不再是单纯的技术开发,而是当好AI的搭档。例如,提示词工程师需要深刻理解AI的思维方式,用语言引导其工作。AI不仅改造旧行业,还创造全新领域,如低空经济。无人机群飞行规划员这一职业就是随着无人机表演市场的扩大而诞生的,它要求从业者兼具艺术创意和数字技术能力。从通用到行业专用从纯技术到人机协作催生全新产业与岗位新职业的涌现反映了AI技术发展的核心方向1.2.3人工智能对人才的能力与技能要求技术能力是人才对接AI应用的核心支撑,分为通用基础技术能力和专业进阶技术能力,适配不同岗位需求。通用基础技术能力是指所有人工智能人才都需要具备的技术能力;专业进阶技术能力适合技术岗人才。技术能力能力类型相关解释AI工具操作能力熟练使用主流AI工具提高工作效率,如用豆包辅助文案创作、数据整理;
用Midjourney/StableDiffusion生成设计素材;
用Excel插件简化数据处理技术认知能力了解大语言模型、智能体、RAG等核心AI技术的基本原理与适用场景,能清晰区分“AI能做什么”和“AI不能做什么”,避免盲目依赖数据素养具备基础的数据收集、清洗、解读能力,能看懂简单的数据报表,如模型准确率、用户行为数据,理解“数据驱动决策”的核心逻辑,避免被错误数据误导通用基础技术能力1.2.3人工智能对人才的能力与技能要求技术能力是人才对接AI应用的核心支撑,分为通用基础技术能力和专业进阶技术能力,适配不同岗位需求。通用基础技术能力是指所有人工智能人才都需要具备的技术能力;专业进阶技术能力适合技术岗人才。技术能力能力类型相关解释模型应用与开发
能力掌握低代码/无代码AI平台的使用,能搭建简单的智能体;
技术研发岗需具备Python编程、机器学习框架(TensorFlow/PyTorch)使用、模型调优(如PromptEngineering、参数微调)能力部署与运维能力了解AI模型的基本部署方式,掌握Docker等容器化工具的基础操作,能监控模型运行状态、排查常见故障(如响应延迟、生成结果偏差)合规与安全技术
能力熟悉AI相关法规(如《生成式人工智能服务管理暂行办法》),具备基础的AI内容合规检测、数据隐私保护能力,避免技术应用引发合规风险专业进阶技术能力1.2.3人工智能对人才的能力与技能要求AI擅长高效执行、批量处理,但在情感交互、复杂决策、创新创造等领域存在天然短板,这些正是软技能的核心价值所在。软技能能力类型相关解释批判性思维与决策能力能对AI生成的结果进行逻辑校验和事实核查,识别“AI幻觉”,如虚假数据、错误结论,并结合实际场景做出最终决策创新思维与问题
解决能力具备“AI+场景”的创新意识,能思考如何用AI技术解决行业痛点。面对AI无法解决的复杂问题,如突发客户投诉、技术故障,能快速拆解问题、寻找替代方案,而非陷入“AI失灵即无措”的困境情感智力与沟通
协作能力具备共情能力,能理解用户的情感需求,在AI辅助下提供更具温度的服务;能清晰表达AI相关需求,也能向非技术人员解释AI技术的核心逻辑,促进跨团队协作终身学习能力AI技术更新迭代速度极快,需保持持续学习的意识,主动关注技术动态、行业案例,不断更新知识体系,避免被技术淘汰软技能1.2.3人工智能对人才的能力与技能要求人工智能的价值在于与各行业深度融合,“AI技术+行业知识”的复合能力成为人才竞争的关键,核心体现为跨领域整合与
落地能力。复合能力能力类型相关解释行业知识与AI技术的融合能力深耕某一行业,如教育、医疗、电商、制造,掌握行业核心业务逻辑与痛点,能将AI技术与行业需求精准匹配,而非单纯追求技术炫酷跨学科协作与资源整合能力能与不同专业背景的人员(如技术研发、市场、合规、行业专家)协作,整合各方资源推进AI项目落地伦理与责任意识具备AI伦理素养,能识别技术应用中的潜在风险,在追求技术效果的同时坚守法律底线与社会责任感复合能力AI时代的职业画像——新职业探索与个人能力规划学生自由分组,以3~4人为一组,选择一个AI新职业,围绕该职业开展调研。每组需完成一份《AI新职业探索与个人适配分析报告》,内容包括该职业的核心工作内容、所需技术能力与软技能、典型应用场景,并结合自身的专业背景,分析“我是否适合这一职业”及“需要补充哪些能力”。实训要求课堂协作实训(1)回顾本节内容,重点理解AI对就业的影响,新职业类型及“T型人才”能力结构。(2)小组协商,选定一个AI新职业,通过人社部官网、招聘平台(如BOSS直聘、智联招聘)、行业公众号等渠道收集该职业的最新信息。(3)对照能力框架,分析该职业对应的关键能力要求,制作“职业—能力”匹配表。(4)每位成员结合自身专业,反思现有能力与目标职业的差距,提出1~2项可落地的学习计划。(5)整合形成小组报告,并准备3分钟课堂分享,重点说明职业亮点与个人发展启示。实训思路03人工智能伦理与安全人工智能的发展为人类社会带来了重大变革,但其对社会的影响是一柄双刃剑,它既改造了人类社会,又给人类社会带来了冲击,人工智能带来的伦理挑战和安全风险是人类必须面对的问题。1.3.1人工智能伦理问题与应对人工智能伦理问题数据偏见机器道德数据隐私与安全1.3.1人工智能伦理问题与应对人工智能伦理问题数据偏见机器道德数据隐私与安全应对人工智能伦理问题增进人类福祉促进公平公正保护隐私安全确保可控可信体现责任担当1.3.2人工智能安全问题与应对人工智能安全问题(1)自身技术缺陷带来的安全风险算法安全漏洞系统稳定性风险数据依赖风险(2)人为不当使用/滥用引发的安全问题数据安全与隐私泄露恶意滥用风险合规与伦理安全1.3.2人工智能安全问题与应对人工智能安全问题(1)自身技术缺陷带来的安全风险算法安全漏洞系统稳定性风险数据依赖风险(2)人为不当使用/滥用引发的安全问题数据安全与隐私泄露恶意滥用风险合规与伦理安全应对人工智能安全问题(1)防控算法安全漏洞(2)保障系统稳定性(3)治理数据依赖风险(4)保护数据安全与隐私(5)防控恶意滥用风险(6)保障合规与伦理安全提供决策逻辑说明的方法1.3.2人工智能安全问题与应对人工智能安全问题(1)自身技术缺陷带来的安全风险算法安全漏洞系统稳定性风险数据依赖风险(2)人为不当使用/滥用引发的安全问题数据安全与隐私泄露恶意滥用风险合规与伦理安全应对人工智能安全问题(1)防控算法安全漏洞(2)保障系统稳定性(3)治理数据依赖风险(4)保护数据安全与隐私(5)防控恶意滥用风险(6)保障合规与伦理安全添加数字水印AI伦理与安全风险辨识——生成式AI应用场景的合规性分析学生自由分组,以3~4人为一组,从以下典型生成式AI应用场景中任选一个:智能招聘系统(用于简历筛选与初面);校园AI心理辅导聊天机器人;本地政务AI问答助手(回答社保、户籍等政策问题);电商AI客服(自动生成商品推荐与售后回复)。针对所选场景,小组需完成一份《AI应用伦理与安全风险分析报告》,内容包括该场景可能涉及的伦理问题(如偏见、隐私、透明度缺失);潜在的安全风险(如数据泄露、误导性输出、被恶意利用);结合伦理规范与安全应对措施,提出2~3条具体改进建议。实训要求课堂协作实训(1)回顾本节内容,重点梳理人工智能伦理的原则和安全风险分类。(2)小组讨论选定应用场景,分析其用户群体、数据类型、决策影响范围,识别高风险环节,并具体化本场景的风险表现形式。(3)提出可操作的优化建议,如“在心理辅导机器人中加入人工干预开关”“为政务AI添加决策解释模块”“对招聘模型定期进行偏见审计”。(4)分工撰写报告,并准备3分钟课堂陈述,重点说明风险识别逻辑与改进建议的合理性。实训思路本章实训体验千帆大模型平台完成千帆大模型平台的账号注册,并进入大模型对话界面;围绕本章三大核心主题(人工智能基础、AI与就业、AI伦理与安全)提出至少5个问题,与大模型进行交互;观察并记录大模型回答的准确性、逻辑性、语言风格及是否存在幻觉;撰写一份《千帆大模型平台初体验报告》,内容包括操作感受、典型问答示例、对大模型能力的初步判断及反思。实训要求1.登录平台2.明确提问方向,设计问题清单3.开展人机对话,观察回答表现4.尝试追问与对比提问5.整理体验过程,撰写简要报告实训步骤人工智能基础技术第2章人工智能通识基础
(慕课版在线案例实训版)案例引入知识图谱构建法律超级“大脑”“北大法宝”是国内领先的法律信息数据库,它深度融合了知识图谱技术,将法律法规、司法案例、法学论文、法律文书等海量、异构的法律信息进行结构化处理,构建了一个庞大的法律知识系统。该平台拥有包括“法律法规”“司法案例”“法学期刊”“法宝律师”“专题参考”“English”“检察文书”“行政执法”“法宝视频”“法宝书城”“法考系统”等十余个检索系统,全面涵盖法律信息的各种类型。各种法律信息形成了一个庞大的系统性知识体系,用户使用关键词可以获得以关键词为核心的可视化的知识网络。例如,用户搜索某部法律文件时,“北大法宝”不仅可以向用户展示该法律文件的全文,还会清晰地展示该法律文件的修订历史、修改的原因和背景、引用该法律文件的司法案例等。这对于用户研究法律变迁和适用旧法案件至关重要。用户输入案情要素,“北大法宝”能够快速推送与之最相似的过往案例,并基于大数据分析提供特定罪名的量刑范围
预测。“北大法宝”相当于一个拥有海量法律知识和判例经验的“法律专家系统”,赋能了律师、法官、法学生及企业法务等专业人士,将他们从工作内容烦琐的“信息检索员”角色中解放出来,使其能够更专注于案件策略制定、法律适用性分析等工作中,从而极大地提高了整个法律行业的工作效率与智慧水平。思考:与传统的法律文件、司法案例搜索系统或平台相比,“北大法宝”有什么优势?“北大法宝”将海量、异构的法律信息整合成庞大的知识系统。请思考,在这个过程中,确保这个“法律大脑”高智商、高可靠性的最大挑战是
什么?目录CONTENTS人工智能的三要素深度学习机器学习知识图谱0102030401人工智能的三要素人工智能技术的发展与应用依赖于数据、算法和算力3个核心要素的协同作用。这些要素既是理解人工智能技术原理的基础,也是构建和优化人工智能系统的关键支撑。本节将围绕人工智能的核心要素展开探讨,为后续深入学习奠定理论基础。2.1.1数据数据的定义数据是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。数据不仅指狭义上的数字,还可以是具有一定意义的文字、字母、数字、符号的组合,图形、图像、视频、音频等,也可以是客观事物的属性、数量、位置及其相互关系的抽象表示。例如,“0、1、2……”“晴、阴、雨”“学生的档案记录、货物的运输情况”等都是数据。数据经过加工后就成为信息。数据的作用在人工智能领域,数据具有多方面至关重要的作用。模型训练的基石影响模型性能评估模型性能人工智能领域涉及的数据类型现实世界中的数据并非以单一的形式存在的,而是呈现出多样性与复杂性。类型说明数值型数据由数字组成,可以是整数、分数、小数等。通常用于表示可以量化的属性,如年龄、身高、体重、价格等,也可进行数学运算,如加法、减法、乘法和除法文本型数据由自然语言组成,没有固定的结构,可以是单词、句子、段落、文档等。在使用之前,通常需要对其进行预处理,如分词、去停用词、提取词干、词形还原等,以从数据中提取有用的特征或表示图像数据可以是照片、图片、图表,也可以是视频帧,在使用之前,通常需要对其进行缩放、裁剪、归一化等预处理,并通过卷积神经网络等模型进行特征提取音频数据由声音信号组成的数据,可以是音乐、语音、环境声音等。在使用之前,通常需要对其进行采样、滤波、特征提取等预处理,以从音频数据中提取有用信息时间序列数据按照时间顺序排列的数据,通常用于描述随时间变化的现象,如股票价格、气温、销售额等。在使用之前,通常需要对其进行平滑、去趋势、差分等预处理,以提取时间序列中的趋势、季节性和周期性等信息视频数据由连续的图像帧组成,同时可能包含音频信息,可以是电影、电视剧、短视频等。在使用之前,通常需要对其进行去噪、转换帧率、调整分辨率、变换空间等预处理图形数据通常用于表示节点和边之间的关系,如社交网络、地图等。在使用之前,通常需要对其进行图嵌入、节点特征提取等预处理多维数据通常包含多个属性或特征,如多维数据集、多维数组等。在使用之前,通常需要对其进行降维、聚类等预处理传感器数据通常来自各种传感器设备,如温度传感器、湿度传感器、加速度计等。这类数据在物联网(InternetofThings,IoT)、环境监测等领域具有广泛的应用。在使用前,通常需要对其进行去噪、校准等预处理人工智能领域涉及的数据类型2.1.1数据数据的获取方式开发者确定所需的数据类型和范围后,需要采用合适的方法获取数据。获取方式具体说明使用网络爬虫抓取数据使用Python、JavaScript等语言构建网络爬虫,也可使用八爪鱼、火车头等网络爬虫工具抓取数据使用传感器采集数据通过部署各种传感器设备(如湿度传感器、温度传感器等),可以实时采集各种环境数据,如温度、湿度、光照、声音等通过开放API获取数据通过网站或平台提供的开放API以规范的方式获取数据购买数据集从数据集供应商处购买特定领域的,已经做好预处理和数据标注的数据集通过数据库查询数据通过结构化查询语言(StructuredQueryLanguage,SQL)从关系数据库中获取所需的数据通过用户交互获取数据设计调查问卷并邀请用户填写,收集用户的反馈和意见使用数据分析工具获取数据使用百度指数、飞瓜数据、蝉妈妈等工具收集用户行为数据,如点击次数、浏览时间、购买记录等获取数据的常用方式2.1.2算法算法的定义算法是指解题方案的准确而完整的描述,是解决问题的一系列清晰指令。这些指令通常由计算机执行,用于计算、数据处理、自动推理和决策制定等任务。算法负责将原始数据转化为有价值的信息,它决定了人工智能系统能够理解和处理信息的深度和广度。算法的作用算法的作用主要体现在以下3个方面。支持数据处理与分析推动人工智能技术进步拓宽人工智能的应用领域人工智能领域的常用算法不同的算法有不同的特点,能够解决不同的问题。监督学习算法无监督学习算法强化学习算法深度学习算法人工智能领域常用算法2.1.3算力算力的定义算力是支持计算机通过处理数据,实现特定结果输出的计算能力。算力是支撑人工智能算法运行和数据处理的基础资源。人工智能的不断发展使其对算力的需求也在不断增加。算力的作用算力是人工智能模型高效、准确处理任务的重要支撑,是人工智能发展不可或缺的核心要素之一,其作用主要体现在以下两个方面。支持人工智能模型的训练、应用与迭代决定人工智能应用的性能和效率算力的类型算力可以分为3种类型,即基础算力、智算算力和超算算力,它们分别提供基础通用计算、人工智能计算和科学工程计算。类型释义特点适用场景基础算力由基于中央处理器(CentralProcessingUnit,CPU)芯片的服务器所提供的算力,是最基本的计算能力具有广泛的适用性,能够满足日常办公、网页浏览、文件处理、移动计算及物联网等常规应用场景的基本计算需求适用于对计算性能要求不高、但需要稳定可靠的计算支持的场景智算算力主要是基于图形处理器(GraphicsProcessingUnit,GPU)、现场可编程逻辑门阵列(FieldProgrammableGateArray,FPGA)、专用集成电路(ApplicationSpecificIntegratedCircuit,ASIC)等芯片的加速计算平台提供的算力擅长处理大规模的并行计算和执行复杂的算法,具有性能更优、能耗更低等优点,能够快速处理海量的数据和执行复杂的人工智能算法主要用于人工智能模型的训练和推理计算超算算力由超级计算机之类的高性能计算集群所提供的算力,是一种强大的计算能力算力系统通常由大量的高性能处理器、高速内存和存储设备组成,具备极高的计算性能和强大的并行处理能力,能够处理极端复杂的问题或数据密集型的问题主要用于尖端科学研究、工程模拟、气象预报、药物研发、航空航天等对计算能力要求极高的领域,这些领域的计算任务通常非常复杂,需要大量的计算资源和高性能的计算设备来支持各类算力的特点与适用场景2.1.3算力人工智能算力的构成人工智能算力是一个复杂且多层面的系统,涵盖了硬件、软件、网络通信等多个方面,这些组成部分相互协作,共同支撑起人工智能应用的强大计算能力。硬件部分硬件部分包括处理器、内存和存储设备。人工智能算力常用的处理器包括CPU、GPU、ASIC、FPGA。人工智能算力中常用的内存有随机存取存储器(RAM)和高带宽存储器(HBM)。人工智能算力常用的存储设备有固态硬盘、高速网络存储设备(如网络附接存储、存储区域网)。处理器说明CPU主要负责控制和协调各个硬件组件的工作,以及进行一些通用计算任务。虽然它在处理大规模并行计算时效率较低,但在处理复杂的逻辑和控制流程方面仍然起着重要作用GPU具有大量的计算核心,擅长并行计算,能够快速进行大规模的矩阵运算和卷积操作,非常适合深度学习中的模型训练和推理任务ASIC具有可定制化的特点,与GPU相比,其在性能、功耗和成本方面更具优势FPGA具有较高的灵活性和适应性,可用于加速特定的算法或任务。同时,FPGA的功耗相对较低,适用于一些对功耗要求较高的边缘计算场景人工智能常用的处理器2.1.3算力人工智能算力的构成人工智能算力是一个复杂且多层面的系统,涵盖了硬件、软件、网络通信等多个方面,这些组成部分相互协作,共同支撑起人工智能应用的强大计算能力。硬件部分硬件部分包括处理器、内存和存储设备。人工智能算力常用的处理器包括CPU、GPU、ASIC、FPGA。人工智能算力中常用的内存有随机存取存储器(RAM)和高带宽存储器(HBM)。人工智能算力常用的存储设备有固态硬盘、高速网络存储设备(如网络附接存储、存储区域网)。项目释义对人工智能的价值RAM计算机中用于暂时存储数据和程序的存储器人工智能的计算需要大容量的内存来存储中间结果和临时数据,RAM具有较高的容量和相对较快的读写速度,能够满足人工智能的内存需求HBM一种专门为高性能计算设计的存储器,具有极高的带宽和较低的延迟在人工智能领域,特别是对于数据规模较大的深度学习模型,HBM可以提供更快的数据访问速度,从而加速模型的训练和推理过程人工智能算力中常用内存2.1.3算力人工智能算力的构成人工智能算力是一个复杂且多层面的系统,涵盖了硬件、软件、网络通信等多个方面,这些组成部分相互协作,共同支撑起人工智能应用的强大计算能力。硬件部分硬件部分包括处理器、内存和存储设备。人工智能算力常用的处理器包括CPU、GPU、ASIC、FPGA。人工智能算力中常用的内存有随机存取存储器(RAM)和高带宽存储器(HBM)。人工智能算力常用的存储设备有固态硬盘、高速网络存储设备(如网络附接存储、存储区域网)。软件部分软件部分包括深度学习框架、分布式计算框架、编译器和优化器。深度学习框架是一种用于构建、训练和部署深度神经网络模型的工具集合。分布式计算框架可以将计算任务分配到多个计算节点上进行并行处理,提高模型的训练效率。编译器用于将高级编程语言编写的人工智能代码转换为可以在特定硬件上高效运行的机器码。优化器可以对神经网络模型本身进行优化,以提高模型在特定算力设备上的运行效率。网络通信在多节点的人工智能计算集群中,以太网是最常用的网络通信方式之一。它可以将多个计算节点连接在一起,实现数据和指令的传输。InfiniBand是一种高性能的网络通信技术,主要用于数据中心内部的高速通信。在大规模的人工智能计算集群中,InfiniBand可以提供比以太网更高的带宽和更低的延迟。2.1.4数据、算法、算力的关系数据是人工智能的“燃料”,为人工智能发展提供原料。算法是人工智能的“大脑”,是将数据转化为知识与决策的逻辑规则。算力是人工智能的引擎,是算法
执行与模型训练的物质基础。人工智能产品三要素分析学生自由分组,以2~3人为一组,选择1~2款现实生活中使用的人工智能产品,拆解该产品应用中数据、算法、算力的作用、协同工作原理。撰写一份500字左右的分析报告,报告需清晰列出所选AI应用,并分别从数据、算法、算力3个维度进行详细分析。重点阐述三者之间的协同关系,并说明如果其中某一个要素薄弱,会对应用产生什么影响。实训要求课堂协作实训(1)小组讨论,选择一个日常生活中常见的AI应用,如抖音/快手的视频推荐系统、智能音箱、人脸识别门禁等。(2)拆解所选应用中数据、算法、算力三要素。例如,分析这个应用需要哪些数据(例如,推荐系统需要用户的点击、观看时长、点赞、评论等行为数据)。猜测它可能使用了什么类型的算法(例如,推荐系统可能用到协同过滤、深度学习等算法),思考它需要什么样的算力支持(例如,需要在云端服务器集群上进行大规模计算,还是可以在手机端本地完成)。(3)写作分析报告,并用流程图或文字描述数据、算法、算力三者在这个应用中是如何相互作用、缺一不可的。例如,海量数据(数据)通过复杂的推荐算法(算法)在强大的服务器集群(算力)上进行计算,最终为用户提供个性化的推荐结果。实训思路02机器学习机器学习是人工智能的核心技术之一,它使计算机能够从数据中学习规律、模式和趋势,从而具备一定的
智能决策和预测能力。本节重点介绍机器学习的内涵、类型、常见任务与算法。2.2.1机器学习的内涵人类学习与机器学习的原理机器学习机器学习是一种让计算机能够自动从数据中获取知识和经验,并利用这些知识和经验进行模式识别、预测和决策的技术。简单来说,机器学习就是让计算机像人一样,通过数据来学习知识,发现事物规律,进而获得某种分析问题、解决问题的能力。2.2.2机器学习的类型简单来说,监督学习就是利用有标注的数据训练模型,使模型能够预测新数据的标签。监督学习01监督学习的原理2.2.2机器学习的类型在无监督学习中,数据没有预先定义的输出标签或目标值,算法的目的是从数据本身的结构、分布等特性中挖掘信息,发现数据中的规律、模式或者对数据进行分组等操作。无监督学习02简单来说,监督学习就是利用有标注的数据训练模型,使模型能够预测新数据的标签。监督学习01无监督学习的原理2.2.2机器学习的类型半监督学习结合了监督学习和无监督学习的特点,模型利用少量的标注数据和大量的未标注数据来进行学习。半监督学习03强化学习的原理是智能体通过与环境的交互,学习如何采取行动以获得最大化的奖励。强化学习包括智能体、环境、状态、动作、奖励、策略等要素。强化学习04在无监督学习中,数据没有预先定义的输出标签或目标值,算法的目的是从数据本身的结构、分布等特性中挖掘信息,发现数据中的规律、模式或者对数据进行分组等操作。无监督学习02简单来说,监督学习就是利用有标注的数据训练模型,使模型能够预测新数据的标签。监督学习01机器人走迷宫的游戏2.2.2机器学习的类型半监督学习结合了监督学习和无监督学习的特点,模型利用少量的标注数据和大量的未标注数据来进行学习。半监督学习03强化学习的原理是智能体通过与环境的交互,学习如何采取行动以获得最大化的奖励。强化学习包括智能体、环境、状态、动作、奖励、策略等要素。强化学习04在无监督学习中,数据没有预先定义的输出标签或目标值,算法的目的是从数据本身的结构、分布等特性中挖掘信息,发现数据中的规律、模式或者对数据进行分组等操作。无监督学习02简单来说,监督学习就是利用有标注的数据训练模型,使模型能够预测新数据的标签。监督学习01要素说明“机器人走迷宫”示例说明智能体执行动作的主体,它可以是一个软件程序、一个机器人或者其他能够执行动作的实体。它通过与环境的交互来学习如何采取行动以获得最大化的奖励机器人是智能体,能够根据获得的相关信息做出前进、后退、向左转、向右转等动作环境智能体进行交互的外部世界,可以是物理环境,也可以是虚拟环境。环境会受到智能体动作的影响而改变状态,并且会向智能体反馈奖励信号迷宫的每个路口、障碍物的位置等构成了环境,当机器人做出前进、后退等动作时,游戏环境会发生变化,并且根据机器人的行为给予相应的奖励状态对环境和智能体在某一时刻情况的完整描述,它包含了智能体做出决策与执行动作所需要的所有信息机器人的状态可能包括它在迷宫中的位置、周围墙壁的位置、是否持有钥匙等信息。机器人根据当前状态来执行动作,并且随着机器人的行动和环境的变化,状态也会发生改变动作智能体在某一状态下可以选择的行为,它决定了智能体如何与环境进行交互动作可能是机器人的各种运动方式,如前进、后退、旋转等奖励环境对智能体执行动作做出的反馈,它体现了智能体在当前状态下执行的动作的好坏。正奖励代表智能体的动作对实现目标是有益的;负奖励代表智能体的动作对实现目标是不利的机器人选对一个路口会得到一个正奖励,而如果机器人碰到了障碍物或选错了路口,就会得到一个负奖励。奖励信号是智能体学习的重要依据,它引导智能体朝着能够获得更多奖励的方向学习策略智能体从状态到动作的映射,它决定了智能体在给定状态下应该如何执行动作。策略可以是确定性的,即给定一个状态,策略会明确地指定一个唯一的动作;也可以是随机性的,即给定一个状态,策略会给出执行不同动作的概率。策略是智能体的行为准则,它决定了智能体在不同状态下的动作选择。智能体通过学习不断地优化策略,以提高在环境中获得奖励的能力智能体的策略可以是根据当前所在的位置、迷宫的结构及已探索的路径,决定是向左转、向右转、直行还是保持当前位置进行进一步的观察。机器人通过这些策略在迷宫中寻找通向出口的最优路径强化学习的要素2.2.3机器学习领域中常见的任务与算法分类是监督学习的核心任务之一,即给定一个由输入样本(特征)和其对应的已知输出(类别标签)组成的训练数据集,构建一个模型,该模型能够将新的、未曾见过的输入样本分配到预定义的类别中。分类任务要求训练数据包含明确的类别标签,其核心目标是判断输入属于哪个类别,输出是离散的、无序的标签,如“是”或“否”“猫”或“狗”“垃圾邮件”或“正常邮件”。分类任务典型算法有决策树、支持向量机、逻辑回归、朴素贝叶斯、k
近邻算法。分类分类任务的原理2.2.3机器学习领域中常见的任务与算法分类是监督学习的核心任务之一,即给定一个由输入样本(特征)和其对应的已知输出(类别标签)组成的训练数据集,构建一个模型,该模型能够将新的、未曾见过的输入样本分配到预定义的类别中。分类任务要求训练数据包含明确的类别标签,其核心目标是判断输入属于哪个类别,输出是离散的、无序的标签,如“是”或“否”“猫”或“狗”“垃圾邮件”或“正常邮件”。分类任务典型算法有决策树、支持向量机、逻辑回归、朴素贝叶斯、k
近邻算法。分类通过一系列的“如果……那么……”判断规则对数据进行递归划分,最终形成一棵树状结构。每个内部节点代表一个特征测试,每个分支代表测试结果,每个叶节点代表一个类别标签。决策树决策树算法原理示例2.2.3机器学习领域中常见的任务与算法分类是监督学习的核心任务之一,即给定一个由输入样本(特征)和其对应的已知输出(类别标签)组成的训练数据集,构建一个模型,该模型能够将新的、未曾见过的输入样本分配到预定义的类别中。分类任务要求训练数据包含明确的类别标签,其核心目标是判断输入属于哪个类别,输出是离散的、无序的标签,如“是”或“否”“猫”或“狗”“垃圾邮件”或“正常邮件”。分类任务典型算法有决策树、支持向量机、逻辑回归、朴素贝叶斯、k
近邻算法。分类通过一系列的“如果……那么……”判断规则对数据进行递归划分,最终形成一棵树状结构。每个内部节点代表一个特征测试,每个分支代表测试结果,每个叶节点代表一个类别标签。决策树其核心思想是在特征空间中寻找一个最优超平面,将不同类别的样本分开,并最大化类别间的间隔。支持向量是指距离超平面最近的样本点,它决定了超平面的位置。支持向量机(SVM)支持向量机的原理x2x1O最优超平面最大化间隔支持向量2.2.3机器学习领域中常见的任务与算法分类是监督学习的核心任务之一,即给定一个由输入样本(特征)和其对应的已知输出(类别标签)组成的训练数据集,构建一个模型,该模型能够将新的、未曾见过的输入样本分配到预定义的类别中。分类任务要求训练数据包含明确的类别标签,其核心目标是判断输入属于哪个类别,输出是离散的、无序的标签,如“是”或“否”“猫”或“狗”“垃圾邮件”或“正常邮件”。分类任务典型算法有决策树、支持向量机、逻辑回归、朴素贝叶斯、k
近邻算法。分类通过一系列的“如果……那么……”判断规则对数据进行递归划分,最终形成一棵树状结构。每个内部节点代表一个特征测试,每个分支代表测试结果,每个叶节点代表一个类别标签。决策树其核心思想是在特征空间中寻找一个最优超平面,将不同类别的样本分开,并最大化类别间的间隔。支持向量是指距离超平面最近的样本点,它决定了超平面的位置。支持向量机(SVM)其核心思想在于它并非直接预测样本的类别,而是预测样本属于某个类别的概率,它通过Sigmoid函数将线性回归的输出映射到(0,1)区间,得到一个概率值。通过设定一个阈值,将概率值转换为二分类结果。逻辑回归它通过计算样本属于各个类别的后验概率,并选择概率最大的类别作为预测结果。在朴素贝叶斯中,假设特征之间相互独立,即一个特征的出现不影响其他特征的出现。这个假设被称为“朴素”的假设,也是算法名称的由来。朴素贝叶斯通过计算待分类样本与训练集中各个样本的距离,找到距离最近的k
个样本。如果这k
个样本中的大多数属于某一个类别,则该待分类样本也属于这个类别。k
近邻算法2.2.3机器学习领域中常见的任务与算法回归任务的目标是建立一个模型,描述输入特征与连续目标变量之间的映射关系。回归模型的输出是定量的、连续的数值,如价格、温度、销量。回归任务常见的应用场景如预测房价、预测温度等。线性回归是回归任务的常见算法。回归线性回归是一种用于预测分析的统计学方法,它通过建立一个或多个自变量(解释变量)与一个因变量(响应变量)之间的线性关系来预测连续的数值。线性回归算法的核心思想是通过建立自变量(特征)与因变量(目标)之间的线性关系模型,实现对新数据的预测。线性回归线性回归的一般模型2.2.3机器学习领域中常见的任务与算法聚类属于无监督学习任务,其目的是将数据集中的样本划分为若干个簇,使得同一簇内的样本相似度较高,不同簇的样本相似度较低。聚类算法不需要预先定义类别标签,模型能够自动发现数据中的潜在结构和模式。聚类任务常见的应用场景如客户分类、图像分割等。聚类任务常见算法有k
均值聚类算法、DBSCAN。聚类简单来说,k
均值聚类算法就是通过迭代的方式,找到k
个聚类中心,让所有数据点到最近聚类中心的距离之和
最小。k
均值聚类算法k均值聚类算法原理中心点2.2.3机器学习领域中常见的任务与算法聚类属于无监督学习任务,其目的是将数据集中的样本划分为若干个簇,使得同一簇内的样本相似度较高,不同簇的样本相似度较低。聚类算法不需要预先定义类别标签,模型能够自动发现数据中的潜在结构和模式。聚类任务常见的应用场景如客户分类、图像分割等。聚类任务常见算法有k
均值聚类算法、DBSCAN。聚类简单来说,k
均值聚类算法就是通过迭代的方式,找到k
个聚类中心,让所有数据点到最近聚类中心的距离之和
最小。k
均值聚类算法基于密度的聚类算法,该算法一般假定类别是可以通过样本分布的紧密程度来决定的。同一个类别中,样本之间是紧密相连的,也就说通过将紧密相连的样本划分为一类,这样就生成了一个聚类类别。DBSCAN的核心在于基于样本点的密度进行聚类,即通过找出样本空间中密集的区域来进行簇的划分。DBSCAN每个密集区域当作一个聚类簇噪声点噪声点DBSCAN原理2.2.4机器学习的应用场景应用方向应用场景说明金融欺诈检测通过分析用户的历史交易行为模式,构建异常检测模型。当出现与常规模式显著偏离的交易时(如异地大额消费),系统可实时预警并阻止潜在的信用卡欺诈或盗刷行为信用评分利用机器学习模型分析申请人的多维度数据(如收入、负债、历史还款记录等),自动评估其信用风险医疗医疗影像分析对X光片、CT(ComputedTomography,计算机断层扫描)、MRI(MagneticResonanceImaging,磁共振成像)等医学影像进行分析,辅助医生识别病灶,如肿瘤、病变等药物发现通过分析化合物结构与生物活性之间的关系,机器学习模型可以预测特定分子的药效和毒性,从而在庞大的化学库中筛选出有潜力的候选药物,降低实验成本个性化治疗方案推荐基于患者的个体特征(如基因信息、生活习惯、既往病史),机器学习模型可以为不同患者推荐最优的治疗方案或药物剂量推荐系统协同过滤通过分析大量用户的历史行为数据(如点击、购买、评分等),发现用户或物品之间的相似性。例如,“购买了A商品的用户也购买了B商品”,或“与你兴趣相似的用户喜欢C电影”基于内容的推荐根据物品本身的属性特征,如电影的类型、导演、演员,文章的关键词等,以及用户的历史偏好,为用户推荐具有相似特征的物品混合推荐将协同过滤与基于内容的推荐等多种方法相结合,以弥补单一方法的不足,提升推荐的准确性和多样性机器学习的代表性应用场景2.2.4机器学习的应用场景应用方向应用场景说明自动驾驶环境感知通过融合摄像头、激光雷达、毫米波雷达等多源传感器数据,利用计算机视觉技术实时识别车辆周围的行人、其他车辆、车道线、交通信号灯等静态物体和动态物体行为预测基于对其他交通参与者,如车辆、行人过去几秒的运动轨迹和状态,利用循环神经网络或时序模型预测其未来的行为意图和运动路径,为车辆的决策规划提供依据路径规划与决策在感知和预测的基础上,利用强化学习算法,根据当前交通状况和导航目标,实时做出安全、合理的驾驶决策,如加速、减速、变道或超车机器学习的代表性应用场景根据数据表构建决策树课堂协作实训学生根据下表所示的客户数据信息构建决策树,用于帮助银行预测新客户张明是否会违约。张明的信息如下。年收入:70万元;信用记录:差;是否有工作:是;贷款金额:40万元。实训要求客户数据信息根据数据表构建决策树课堂协作实训(1)分析客户数据的所有特征,从中挑选一个最能区分“好客户”和“坏客户”的特征作为根节点,在此可以选择“信用记录”作为根节点。(2)递归提问,构建子树。在“信用记录差”的人群中,“是否有工作”这个特征能最好地区分结果,可以选择它作为下一个节点。(3)综合步骤(1)(2)用图示化的方式画出决策树。(4)将新客户张明的信息代入决策树,预测其是否会违约,从而判断是否要为其提供贷款。实训思路03深度学习深度学习是机器学习领域的一个重要分支,它以人工神经网络为核心架构,通过构建多层网络结构来实现对数据特征的自动提取与复杂模式的学习。与传统机器学习相比,深度学习在处理图像、语音、文本等非结构化数据时表现出更强的适应性。随着大数据和计算能力的快速发展,深度学习已在计算机视觉、自然语言处理、医疗诊断等多个领域取得突破性进展。2.3.1深度学习的内涵深度学习深度学习是机器学习的一个分支,它采用深度人工神经网络的复杂结构,通过模拟人脑的学习方式,让机器能够从海量数据中自动学习并发现复杂的模式和规律,并做出决策。深度学习本质上是一种端到端的学习范式。人们只需向深度学习模型提供原始数据和期望的输出,该模型就能自动构建起从输入到输出的复杂映射关系,中间的特征工程过程几乎完全自动化。人工神经网络结构2.3.2深度学习与机器学习的区别人工
智能机器
学习深度
学习机器学习是一个广阔的领域,它赋予计算机学习的能力。深度学习则是这个领域中最前沿、最强大的技术之一,它通过模拟人脑的神经网络结构,实现了从数据中自动学习特征的能力,从而在处理复杂问题上取得了革命性的突破。人工智能、机器学习、深度学习之间的关系2.3.2深度学习与机器学习的区别机器学习需要特征工程。它在把数据“喂”给模型之前,需要由人类专家或数据科学家手动设计和提取特征。这个过程非常耗时,且效果很大程度上取决于专家的经验。在数据充足的情况下,深度学习模型能够自动学习特征,实现端到端的学习。无需特征工程,开发者只需把原始数据直接输入深度学习模型,深度学习模型会从低级到高级,逐层自动从数据中学习和提取有用的特征。整个学习过程是自动的,无需人工干预。机器学习与深度学习的学习流程对比2.3.2深度学习与机器学习的区别机器学习与深度学习的对比维度机器学习深度学习特征提取需要人工设计特征自动从数据中学习特征数据需求在小到中等数据集上表现良好需要海量数据才能发挥最大的效用硬件要求通常在CPU上就能高效训练强烈依赖GPU、TPU等高性能计算单元学习方式分步骤学习,每一个步骤都要经过设计端到端学习,从输入直接到输出性能表现性能有上限,受限于特征工程的质量在数据充足的情况下,能够达到顶尖的准确率机器学习与深度学习的对比2.3.3深度学习的典型模型卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种专为处理网格结构数据设计的深度学习模型,它模拟了人类视觉系统的工作机制,通过逐层提取数据的局部特征(如边缘、纹理、形状等),并逐步压缩信息,最后组合为全局特征,完成分类、检测、生成等任务。一个典型的卷积神经网络由输入层、卷积层、激活函数、池化层、全连接层和输出层组成。卷积神经网络卷积神经网络结构原理2.3.3深度学习的典型模型循环神经网络(RecurrentNeuralNetwork,RNN)是一种具有短期记忆能力的人工神经网络。其核心特征在于网络结构中存在循环连接,在循环神经网络中,神经元既可以接收其他神经元的信息,也可以接收自身的信息,形成具有环路的网络结构。循环神经网络的记忆机制使得网络能够处理变长的序列数据,并且可以捕捉到序列中的时序信息。此外,循环神经网络还可通过堆叠多个循环单元来增加网络的深度,提高网络的表达能力。循环神经网络循环神经网络结构原理2.3.3深度学习的典型模型生成对抗网络(GenerativeAdversarialNetwork,GAN)是一种基于博弈论的深度学习模型,它通过两个神经网络之间的对抗性训练过程,学习数据的内在分布,并能够生成与真实数据高度相似的新样本。生成对抗网络由生成器和判别器两部分组成。生成器的任务是通过学习真实数据分布,生成逼真的合成数据;判别器的功能是作为一个二分类器,用于判断输入样本是来自真实数据,还是来自生成器生成的样本。生成对抗网络生成对抗网络结构原理2.3.4深度学习的应用场景应用方向应用场景说明医疗健康医学影像分析利用深度学习模型对医学影像,如X光片、CT、MRI、病理切片等进行自动分析药物研发用于预测分子的生物活性、筛选候选药物、优化药物分子结构智能交通交通管理利用深度学习模型预测车流量与监测交通状态自动驾驶·深度学习模型用于处理摄像头、激光雷达数据等多模态数据,实现对道路、车辆、行人、交通标志等元素的精确检测、分割和跟踪;·运用深度学习训练决策模型,使其能够在复杂的交通场景中学习类似人类驾驶员的驾驶策略,优化行驶路径和乘坐舒适性工业制造工业质检基于深度学习构建缺陷检测模型,使目标检测系统可识别微米级缺陷,大大提高产品检测精准度生产流程优化数字孪生系统通过GAN生成虚拟生产环境,并结合物理仿真模型实现工艺参数的离线优化验证信息推荐推荐系统深度学习通过学习用户和物品的深层、非线性特征表示,显著提高了推荐系统的精准度和个性化程度深度学习的代表性应用场景深度学习应用案例解析每个学生搜集2~3个深度学习应用案例,解析案例中应用的深度学习技术,说明技术应用产生的效果,最后写作一份500~800字的案例解析报告,每个案例解析要包括案例名称、应用的深度学习模型、应用效果。实训要求课堂协作实训(1)学生通过网络搜索搜集2~3个深度学习的应用案例。(2)对搜集到的案例进行解析,包括使用的深度学习模型(如CNN、RNN)、达到的应用效果。(3)写作案例解析报告,报告中要展示搜集的案例截图或关键信息。实训思路04知识图谱知识图谱是一种以结构化方式组织和表达知识的技术,能够将分散、异构的数据转化为结构化、语义化的知识网络,其核心作用在于实现数据的有序组织和深度关联,通过揭示实体间的隐含关系,打破数据孤岛,为人工智能系统提供可解释、可推理的知识基础。2.4.1知识图谱的内涵知识图谱知识图谱是一个用于描述物理世界中概念、实体及其相互关系的语义网络。它以图的形式组织知识,通过节点和边的关联关系,结构化地描述现实世界的知识体系。知识图谱的作用是通过图模型实现知识的可视化表达与计算机可理解的语义化推理能力。知识图谱包括实体、关系和属性3个要素,三者以“实体-关系-实体”或“实体-属性-属性值”三元组结构组成知识的基本表达单位,最终构成网状的知识结构。实体指现实世界中可区分的事物或概念;关系用于描述实体之间存在的特定联系,在知识图谱中体现为连接实体节点的边;属性用于描述实体本身所具有的特征或性质。知识图谱(示例)三元组结构2.4.2知识图谱的构
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 日处理5万吨污水处理厂及配套管网项目可行性研究报告模板拿地申报
- 2025北京四中高二(上)期中数学试题及答案
- 脑梗死护理规范考核试题及答案解析
- 2026北京海淀区初三一模化学试题含答案
- 2026七年级道德与法治下册 青春岁月珍惜态度
- 医院电子化审批制度流程
- 医院防肺炎疫情工作制度
- 卒中中心各项工作制度
- 南方基金内部管理制度
- 卫生部下发医疗核心制度
- 2025年江苏省宿迁市泗阳县初中学业水平第二次模拟数学测试题
- 2025年苏州市公务员考试行测真题附答案详解
- 【真题】七年级数学下学期期末试卷(含解析)湖南省长沙师大附中集团2024-2025学年
- 2025年广西公需科目答案
- 中医消化内科试题及答案
- 监狱文化课件
- 多轴加工项目化教程课件 项目一 任务1-2基于UG NX多轴加工刀路相关知识介绍
- GB/T 43650-2024野生动物及其制品DNA物种鉴定技术规程
- 2023年湖南省衡阳市中考物理真题卷(含答案与解析)
- 2017版银皮书(中英文完整版)FIDIC设计采购施工交钥匙项目合同条件
- 大型水利工程运行与安全管理 图文并茂
评论
0/150
提交评论