《人工智能通识》中职全套教学课件_第1页
《人工智能通识》中职全套教学课件_第2页
《人工智能通识》中职全套教学课件_第3页
《人工智能通识》中职全套教学课件_第4页
《人工智能通识》中职全套教学课件_第5页
已阅读5页,还剩309页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

项目一从概念解析到历史溯源,开启智能世界探索之旅:人工智能认知启蒙全套可编辑PPT课件

项目一

探秘人工智能:智能生活的魔法钥匙项目二

解码AI:技术背后的智慧密码项目三

玩转AI:创意实践与无限可能项目四

对话AI:伦理与责任的深度探讨FOREWORD引言引言日前,智能聊天机器人ChatGPT的火爆程度超乎人们想象,继2022年底以最快速度5天突破100万用户之后,仅过了2个月,其月活用户突破1亿,引起了各方的关注,各界人士对其议论纷纷ChatGPT究竟是什么?我们该如何看待它?未来又会怎样变化?目录01揭开面纱,认识人工智能真面目02时光穿梭,追溯人工智能技术进化史03触手可及,人工智能的奇妙应用世界任务一揭开面纱,认识人工智能真面目(一)体验人工智能智能词典秒查单词、拍照搜题瞬间解析难题,办公时借助的自动生成PPT软件、智能会议记录工具,都是人工智能技术的产物。这些应用就像被施了魔法般不断出现,不仅颠覆了人们以往的做事习惯,还让我们的学习更高效、生活更便捷、工作更轻松。一、人工智能的内涵人脸识别属于生物识别技术的一种,在身份验证、公共安全等领域发挥重要作用。车牌识别单击此处输入你的正文,文字是您思想的提炼,根据需要可酌情增减文字。美颜拍照单击此处输入你的正文,文字是您思想的提炼,根据需要可酌情增减文字。一、人工智能的内涵车牌识别实现停车场自动化管理,提升效率与体验。美颜拍照融合人脸识别,智能优化拍摄体验。AI翻译AI翻译应用大模型,消除语言障碍便捷高效。语音识别语音识别听懂人言,高效实现人机信息转换。兴趣推荐个性化推荐高效筛选信息,实现精准送达。一、人工智能的内涵人工智能是一门融合自然科学、社会科学与技术科学的交叉学科,也是极具探索价值与挑战的前沿学科。“人工”指代依靠人力或人类智力创造出的产物,而“智能”则关联意识、自我认知、思维活动等复杂问题。人工智能的研究不仅聚焦于技术层面的开发,还深入探索人类智能的本质。一、人工智能的内涵(二)人工智能的定义能源技术人工智能人工智能基因工程空间技术纳米科学一、人工智能的内涵21世纪新的三大尖端技术20世纪70年代三大尖端技术人工智能作为模拟人类智能的技术体系,其核心特征可从预测、行为、交互三个维度解析。二、人工智能的核心特征预测能力行为能力交互能力构建复杂的数学模型对海量数据的学习和分析实现对未来趋势、事件结果的预测基于深度学习算法识别数据中的模式和规律(一)预测能力二、人工智能的核心特征二、人工智能的核心特征(一)预测能力02人工智能系统需要收集交通出行数据、社交媒体数据、商业消费数据等多维度信息,通过深度挖掘和分析来构建数学模型,从而预测不同时间段、不同区域的人口聚集和流动情况。通过卫星云图、雷达回波、海洋温度等多种监测设备实时收集海量气象数据。人工智能系统基于这些数据等分析影响台风移动的各类因素及其变化规律,从而预测台风未来的移动路径、强度变化以及可能带来的风雨影响。在城市规划领域在气象领域01二、人工智能的核心特征获取环境信息以自动驾驶汽车为例,车辆搭载的人工智能系统实时感知路况、其他车辆及行人动态预设规则方案大数据算法等预设处理方案等做出决策通过算法计算最佳行驶路径和速度采取行动自动完成加速、刹车、转向等操作人工智能具备在特定场景下自主决策并执行任务的能力。(二)行为能力(三)交互能力人工智能致力于实现与人类及其他智能体的自然交互。借助自然语言处理、计算机视觉、语音识别等技术,人工智能能够理解人类的语言、文字、手势甚至情感,实现多模态交互。智能语音助手如Siri、小爱同学,可以理解用户的语音指令并做出回应聊天机器人能够与用户进行连贯的对话,解答问题、提供建议虚拟会议场景人工智能可以实时分析参会者的表情和语言,辅助会议管理与内容总结二、人工智能的核心特征三、人工智能的优势与局限(一)人工智能的优势人工智能优势5.智能辅助与自动化人工智能可以帮助我们自动完成许多烦琐、重复的任务。4.数据处理与模式识别人工智能擅长处理大规模数据,从中发现规律。3.持续工作的特性人工智能不会像人类一样感到疲劳或注意力下降,能够长时间不间断工作。2.高精度与准确性在特定任务中,人工智能的精度和准确性非常高。1.强大的计算能力人工智能计算速度极快,能快速处理大量数据。163三、人工智能的优势与局限(二)人工智能的局限人工智能局限5.伦理与社会问题比如自动驾驶汽车面临不可避免的碰撞时应该保护哪些群体,引发失业等。4.决策过程不透明一些复杂的人工智能模型,如深度学习模型,其决策过程很难理解和解释。3.应对复杂环境能力不足面对复杂多变的现实环境,人工智能的表现会受到限制。2.数据依赖与偏差人工智能的性能过于依赖数据的质量和数量。可能会出错误结果。1.缺乏理解与创造力处理数据和完成任务

人类的理解能力和创造力。四、人工智能与人类智能(一)学习能力的差异人类在学习过程中展现出强大的灵活性和理解能力。遇到陌生的句子,也能结合上下文和已有的知识储备推测其含义还能将英语学习中积累的语言逻辑和思维方式,迁移到其他语言的学习中,这是人工智能难以实现的。人工智能的学习依赖大量数据和特定算法。“书中自有黄金屋”这种具有文化内涵和特殊表达的句子,由于缺乏对文化背景和深层语义的理解,翻译结果往往不够准确。当出现新的词汇或表达方式时,它必须重新进行数据学习和算法训练,才能提升翻译能力。四、人工智能与人类智能(二)决策方式的不同人类决策会综合考虑客观信息、情感、道德和经验等因素。当面临帮助行动不便的老年人搬运物品和参与社区环境清洁两项任务时,同学们会根据自己的价值观和对他人需求的理解进行选择。这种充满人文关怀和个性化的决策,体现了人类智能的独特之处。人工智能的决策基于预设的程序和模型。自动驾驶汽车中的人工智能系统通过传感器收集路况、车速等信息,按照既定的算法规则做出加速、减速或转向等决策。但当遇到复杂的突发情况,缺乏基于经验和情感的判断能力。四、人工智能与人类智能(三)创造能力的差异人类的创造能力源于丰富的生活体验和内心感悟达·芬奇创作《蒙娜丽莎》,通过细腻的笔触和神秘的微笑,展现出文艺复兴时期人们对人性的探索与赞美。无论是画画还是文学作品,都蕴含着独特的创意和情感。人工智能的创造本质上是对已有数据的分析和重组。以人工智能绘画工具为例,它会从大量的绘画作品数据库中提取元素,按照一定的风格和算法进行组合生成,虽然作品精美却缺乏独特的思想内涵和情感表达,只是对现有艺术风格的模仿和重复。四、人工智能与人类智能(四)情感理解与社交互动的差异人类在社交互动中,能够通过语言、表情、肢体动作等多种方式进行情感交流基于情感共鸣的互动,不仅能够传递信息,还能建立深厚的人际关系,体现了人类智能在情感交流方面的巨大优势。人工智能可以通过特定的算法识别文本或语音中的情感倾向,但它本身不具备真正的情感体验。智能客服在与用户交流时,能够根据用户的语言判断其情绪是开心、不满还是疑惑,并给出相应的回应。然而,这种回应只是基于预设的程序和规则,无法真正体会用户的情感,更不能给予情感上的支持和共鸣。在智能应用的背后,数据、算法和算力发挥着至关重要的作用,它们就像是人工智能系统的核心要素,共同支撑起人工智能的“智慧大厦”。五、数据、算法和算力在人工智能系统中的作用人工智能数据算法算力(一)数据五、数据、算法和算力在人工智能系统中的作用海量数据学习从海量的双语对照文本中“学习”。这些文本来源广泛,有日常交流对话、新闻报道、文学作品等。数据量级软件“学习”的内容越丰富,对不同语言的语法结构、表达方式和文化背景的理解就越深刻,翻译的准确性自然也就越高。精准翻译要实现精准翻译,就需要从海量的双语对照文本中“学习”。010302(一)数据五、数据、算法和算力在人工智能系统中的作用02数据是人工智能获取信息和知识的源泉,涵盖文字、图片、声音、视频等各种形式,堪称人工智能的“知识宝库”。如果“知识宝库”中的数据存在缺陷,如数据不准确、有偏差或者不够全面,人工智能就可能“学错知识”。知识宝库学错知识01(二)算法五、数据、算法和算力在人工智能系统中的作用1.语音识别算法:将我们说出的语音信号转化为计算机能够理解的文字信息2.自然语言处理算法对这些文字进行分析,理解我们的问题意图,明确我们是在询问天气情况3.搜索算法在庞大的数据库中查找与天气相关的信息4.语音合成算法将找到的天气信息转化为语音反馈给我们当我们使用智能语音助手查询天气时背后就涉及多个算法协同工作(二)算法五、数据、算法和算力在人工智能系统中的作用算法是人工智能处理数据、完成任务的规则和步骤,就像为人工智能制定的“行动指南”。优秀的算法可以让人工智能高效、准确地解决问题,而不够完善的算法则可能导致结果出错或效率低下。算法的优劣造成的影响示例一训练一个能够创作故事的人工智能模型,需要对大量的故事文本数据进行分析和计算,这个过程可能涉及数亿甚至数十亿次的运算。如果算力不足,过程会极其漫长。示例二人工智能辅助诊断系统分析患者的CT影像,这一过程不仅要处理海量图像数据,还要运行复杂的深度学习算法。如果算力不足,诊断效率下降,影响医生诊断甚至耽误患者病情。算力代表着人工智能系统的计算能力,是驱动人工智能运行的“动力源泉”,它决定了人工智能处理数据和执行算法的速度与效率。(三)算力五、数据、算法和算力在人工智能系统中的作用(四)数据、算法和算力的协同合作五、数据、算法和算力在人工智能系统中的作用数据数据为人工智能提供学习的内容,是算法训练和优化的基础算力算力则为数据处理和算法运行提供强大的动力支持,确保人工智能高效运行算法算法决定了如何对数据进行处理和分析,是实现人工智能功能的核心1.智能客服能快速回答问题,为什么我们还需要人工客服?2.人脸识别方便了生活,但可能会出现什么不良的情况?课堂思辨揭开面纱,认识人工智能真面目任务二时光穿梭,追溯人工智能技术进化史(一)符号主义一、人工智能的三大流派精密运转的机器充满智慧的人类01遵循物理定律的“物理符号系统“开启智能大门的钥匙0203(一)符号主义一、人工智能的三大流派(二)连接主义一、人工智能的三大流派连接主义尝试把对大脑结构和功能的研究变成计算机能实现的技术,人工神经网络就是它最经典的成果,就像给计算机造了个“数字大脑”。20世纪50年代末,感知机模型出现——模仿大脑神经元连接传递信号的方式,计算机能识别简单图像数据深度学习成为连接主义的新突破——通过构建多层神经网络,让计算机的“数字大脑”变得更聪明底层网络抓取图像线条、颜色这些基础信息,高层网络再把这些信息整合起来,精准判断画面内容(三)行为主义一、人工智能的三大流派行为主义,也称进化主义或控制论学派,其灵感来自控制论和“感知-动作”的反应模式,就像给机器人编写了一套“生存指南”。奠基人布鲁克斯大胆开启了机器人研究的新方向。这个学派最突出的成果就是机器人控制系统;让机器人在实践中慢慢“进化”研发出六足机器虫实验系统。(三)行为主义一、人工智能的三大流派行为主义还指出,传统人工智能(如符号主义、连接主义)就像用简化版地图导航复杂城市,把现实世界想得太简单,很难应对真实环境里的突发状况。在研究方法上,行为主义主张“从行动学本事”,不追求一步实现高级智能,而是先模仿生物的基础行为。在与环境、其他智能体的不断互动中逐渐提升的。(三)行为主义一、人工智能的三大流派(四)三大流派演化一、人工智能的三大流派一、人工智能的三大流派人工智能三大流派的后续演化过程如图1-2-3所示。二、人工智能的发展历程第一阶段:蹒跚学步的起步期(1956—1979年)达特茅斯会议后人工智能诞生;科学家F.Rosenblat发明了神经网络Perceptron;1964年,第一台聊天机器人诞生,1970年,限于计算机算力不够强大,人工智能的研究进入了第一个“寒冬期”。第二阶段:专家系统的探索期(1980—1996年)1980年,卡内基梅隆大学推出了第一个专家系统XCON,拥有强大的知识库和推理能力,能帮忙解决特定领域的问题,但因为常常翻车、应用范围也比较有限。所以再次遇冷。第三阶段:深度学习的爆发期(1997年至今)1997年“深蓝”战胜国际象棋冠军卡斯帕罗夫;2006年,“深度学习”问世,人工智能全新升级;2012年,谷歌无人驾驶汽车上路;近十年来,随着大数据、云计算等技术的飞速发展,人工智能推动第四次技术革命不断向前。(一)政策助力,按下发展“快进键”中国很早就认识到了人工智能的巨大潜力,政府相继推出了一系列强有力的政策,以促进其快速发展。其中,《新一代人工智能发展规划》尤为重要,它设定了一个宏伟的目标:到2030年,使中国成为全球人工智能的创新中心。在政策的推动下,全国各地纷纷建立了人工智能产业园区,如北京的中关村软件园等,整个行业因此充满了活力。三、我国人工智能发展现状(二)产业爆发,规模一路“狂飙”政策效应的逐步释放,中国人工智能产业出蓬勃发展。截至2024年,该产业规模已成功突破7000亿元大关,并且每年正以超过20%的惊人速度迅猛增长。与此同时构建完备且成熟的人工智能产业链,形成有机的产业生态系统,推动着这一领域不断迈向新的高度。三、我国人工智能发展现状(三)技术突破,勇攀科技“最高峰”三、我国人工智能发展现状1.大模型:百花齐放展实力百度的“文心大模型”、阿里的“通义千问”等15个国产大模型通过备案。这些大模型就像超级大脑,拥有强大的自然语言处理能力。我国的大模型表现出色,与国际先进水平的差距越来越小。2.芯片与硬件:自主创新显担当中国科学家们日夜攻关,造出了许多性能超强的“中国芯”。华为研发的昇腾芯片、中国科学院推出的“寒武纪”世界首款类脑互补视觉芯片“天眸芯”:芯片国产芯片不仅打破了国外技术垄断,还为我国人工智能发展打下了坚实基础。四、人工智能的未来发展趋势人工智能或许会进化出“超级大脑”。它不再依赖预设程序,而是像人类一样在生活中积累经验,快速适应各种复杂场景。不仅能像人类一样思考、行动,还能与人类并肩解决难题。超级智能工厂全自动化智能生产线生产效率翻倍,避免工人接触危险操作;医疗辅助机器人能帮助医生更准确地诊断病情,扫地机器人等;让我们的生活变得更轻松、更安全,也让我们有更多时间去探索和创造。智能服务未来的人工智能可能会带来震撼的技术飞跃。比如,语音识别不再局限于“听话音”,而是猜透”个人的潜台词,真正理解话语背后的情绪和隐藏含义。科技突破020103(一)人工智能未来的发展趋势阶段(二)中国人工智能未来发展趋势展望四、人工智能的未来发展趋势增强模型可靠性。构建多样性的数据集支撑不同技术路线的AI发展等。1.小数据和优质数据只有AI的输出结果与人类价值观相符,才能确保AI模型的能力和行为与人类意图保持一致。2.人机对齐制定明确的标准和规范,减少AI在制度尚未完善的情况下被过度使用所带来的风险。3.AI使用边界和伦理监督模型在保障有效性的前提下,提高可解释性,有助于减少对公共资源的消耗,增强用户对AI系统的信任度,并促进其在关键领域的应用。4.可解释性模型基于海量参数和训练数据的大规模预训练模型能够有效提高人机交互和推理能力,增强可完成任务的多样性和丰富性。5.规模定律(二)中国人工智能未来发展趋势展望四、人工智能的未来发展趋势全模态大模型可处理和理解文本、图片、音频、数据表格等多种类型的数据输入,并生成多样性输出。6.全模态大模型使用大模型、生成式技术等来提高科学研究中提出假说、试验设计、数据分析等阶段的效率和准确性。7.人工智能驱动的科学研究具身智能小脑模型使智能机器人更加满足现实世界的精细操作与实时控制的需求。8.具身小脑模型人形机器人是实体人工智能系统的终极表现形态,它不仅具备多模态感知和理解能力,能够与人类自然互动,还可以在复杂环境中自主决策和行动,并有望在未来应用到更多复杂的工作场景中。9.实体人工智能系统世界模拟器能提供沉浸式的高仿真体验,为使用者带来更加丰富和多样化的游戏世界,可应用于教育、娱乐等领域,还可以创造更多超级数字场景。10.世界模拟器1.人工智能发展历程中多次陷入寒冬,为什么人们始终没有放弃对它的研究?2.我国人工智能产业规模不断扩大且发展趋势向好,未来是否有可能主导全球人工智能领域的发展?课堂思辨时光穿梭,追溯人工智能技术进化史任务三触手可及,人工智能的奇妙应用世界(一)医疗资源的现状与挑战一、智慧医疗医疗资源分配不均、看病难、看病累、医院排长队复杂病情越来越多,医生每天要面对大量患者和疑难病症,压力山大一、智慧医疗3.私人定制治疗师4.手术黄金搭档2.药物研发加速器1.疾病诊断小帮手5.医疗管理的智能管家(二)人工智能如何大显身手(二)人工智能如何大显身手一、智慧医疗病理诊断小卫士:它能像显微镜一样自动分析细胞图像,用深度学习算法精准识别细胞特征。捕捉微小的病变信号,为医生减轻了约30%的工作量。医学影像诊断:利用深度学习算法,像赋予了一双“火眼金睛”,能快速分析图像。医生诊断疾病的速度大大提升,患者也能更早接受治疗,离康复又近了一步。基因健康预警员:通过分析基因信息,提前预测你患癌症等疾病的风险。比给健康装上了“警报器”,让我们能早做准备。(1)(2)031.疾病诊断小帮手新药研发就像一场艰难的“马拉松”,但人工智能让这场“马拉松”变成了“百米冲刺”。它用机器学习技术快速筛选有潜力的药物分子,就像给研发团队配备了“火眼金睛”。有了它,药物研发周期能缩短到原来的十分之一,让更多患者更快用上救命药。2.药物研发加速器(二)人工智能如何大显身手一、智慧医疗人工智能化身“医疗定制大师”,综合患者的基因、生活习惯和病史,量身打造专属治疗方案。比如,在癌症治疗中,它能精准匹配药物,把患者5年生存率提高到70%以上。治疗过程中,它还会实时“监控”病情变化,像个24小时在线的私人医生,随时调整治疗方案,确保治疗效果。3.私人定制治疗师(二)人工智能如何大显身手一、智慧医疗高精度机械臂比人手更稳、更准,让手术成功率直接提升20%。它还擅长微创手术,能减少伤口、缩短恢复时间它支持远程手术,医生即使远隔千里,也能通过操控机器人完成手术。全球已经有1000多台远程手术成功完成,真正打破了距离的限制。4.手术黄金搭档(二)人工智能如何大显身手一、智慧医疗(二)人工智能如何大显身手一、智慧医疗健康数据小秘书:收集病历、检查报告、生活习惯等,生成专属健康档案,据不仅能帮助医生更了解病情,还能预测疾病风险。医疗资源调配小能手:它用大数据分析患者数量和分布,帮医院合理安排床位、调配医护人员,让每一份医疗资源都不被浪费。通过远程医疗服务使偏远地区获得优质医疗资源。医疗质量监督员:监督医疗环节并及时预警,揪出并纠正约20%的医疗错误,帮助医院把服务质量提升15%。(1)(2)035.医疗管理的智能管家未来人工智能的“大脑”会越来越聪明,诊断疾病、预测病情会更精准。而且,它还会和物联网、5G技术“手拉手”,组成强大的医疗系统。戴着智能手环、手表就能随时把健康数据传给医生,医生也能立刻给出专业建议。以后看病不用排长队,健康管理更轻松,智慧医疗会让我们的生活变得更方便。(三)智慧医疗的未来蓝图一、智慧医疗城市里的汽车增多,道路的拓展速度不足;早晚高峰时堵车,车流艰难挪动;路口的信号灯还“帮倒忙”,道路资源分配不均;有些司机随意变道、抢行,加重拥堵程度;疲劳驾驶、视线盲区等因素,每年交通事故频发。(一)交通现状:堵在路上的烦恼二、智慧交通二、智慧交通3.智能导航:出行的“超级军师”4.智能公交:会“读心术”的公交车2.自动驾驶:未来的“超级司机”1.交通信号灯的“智慧大脑”5.交通管理:交警的“千里眼+最强大脑”(二)人工智能大显神通,改变出行未来的人工智能交通简直像科幻电影。汽车、红绿灯、道路设施都会“聊天”;前车发现路面有大坑,后车瞬间就能收到提醒;整个城市交通会变成一张智能大网,所有车辆、道路设施完美配合,堵车和事故彻底消失;上学上班出行路上时间直接减半,自动驾驶汽车成主流。(三)智慧交通的未来畅想二、智慧交通去银行办业务,排队需要较长时间;银行职员手动核对信息,不仅慢,还容易填错表格;投资者对股票、基金市场风险无把握,易被骗。(一)金融行业的烦恼清单三、智慧金融三、智慧金融2.风险评估:金融界的“福尔摩斯”3.智能投顾:专属你的“财富管家”4.反欺诈:网络诈骗的“天敌”1.智能客服:永不离线的“问题粉碎机”(二)人工智能在智慧金融中的神奇应用去银行不用带卡和证件,刷脸完成所有业务;学理财就像玩闯关游戏,复杂知识变成趣味动画;量身制订计划,让财富管理更简单容易操作。(三)智慧金融的未来畅想三、智慧金融未来的人工智能金融简直像科幻片。传统课堂,几十名学生学习进度无法统一兼顾;课后作业更是“一刀切”,浪费时间又打击积极性;网上海量的学习资料令学生和家长难以精准选择。(一)传统学习的“吐槽大会”四、智慧教育2.智能教学工具:课堂里的“魔法道具”3.智能辅导老师:口袋里的“解题超人”4.虚拟学习伙伴:云端的“学霸好友”1.个性化学习助手:你的私人“学习军师”(二)人工智能在智慧教育中的奇妙魔法四、智慧教育戴上VR眼镜“瞬移”进虚拟教室,和老师同学互动;学地理时,足不出户“漫游”埃及金字塔、攀登珠穆朗玛峰;学生物时,瞬间“缩小”钻进细胞,围观DNA如“复制粘贴”;根据兴趣特长,定制专属成长路线。(三)智慧教育的未来畅想四、智慧教育人工智能教育未来前景简直像穿越到科幻片:老式工厂工人如拧螺丝等枯燥机械化操作弊端;大型机器故障维修难并且耽误工期;检查产品质量靠人眼等无法发现细小瑕疵。(一)传统制造中的“老大难”问题五、智能制造2.预测性维护:机器的“私人医生”3.智能质检:产品的“火眼金睛”4.个性化定制:你的专属造物魔法1.智能生产调度:工厂的“最强大脑”(二)人工智能在智能制造中的神奇操作五、智能制造智能机器人替代工人,并能自学新技能,根据市

场需求随时切换生产模式;用VR眼镜“穿越”进工厂,围观自己设计的玩具、衣服如何诞生;人工智能的魔法还在升级,智能制造的惊喜才刚刚开始。(三)智能制造的未来畅想五、智能制造智能工厂已经很先进,但未来简直像科幻电影1.智慧医疗中人工智能诊断准确率高,是否意味着未来患者看病不需要再和医生面对面交流?2.智慧交通让自动驾驶成为可能,当无人驾驶车辆发生事故时,责任该由程序员、车企还是乘客承担?课堂思辨触手可及,人工智能的奇妙应用世界感谢您的观看项目二从数据基石到算法核心,揭秘AI的智慧引擎:人工智能技术解码FOREWORD引言引言目录01数据:AI成长的“营养宝库”02算法:AI思考的“神奇公式”03实战演练,典型技术应用大赏任务一数据:AI成长的“营养宝库”在当今数字化时代,数据就如同石油一样,是一种极其重要的资源。而数据采集,就是获取这些宝贵数据的第一步,它为后续的数据分析、处理和应用奠定了基础。(一)不同渠道采集的数据类型及编码方式(二)数据采集的基本流程一、数据采集(一)不同渠道采集的数据类型及编码方式数据类型就像是不同种类的原材料,有着各自独特的性质和用途。而编码方式则如同给这些原材料贴上特定的标签,方便计算机进行识别、存储和处理。一、数据采集一、数据采集传感器采集AI的“触角”:温度传感器采集温度数据;摄像头是图像传感器它采集到的是图片数据;声音传感器采集音频数据。

网络爬虫采集网络爬虫按照我们设定的规则,在这个信息宝库里“寻宝”。获取到的这些文本数据属于结构化数据。在编码时,这类数据通常采用UTF-8编码格式。问卷调查采集通过精心设计问卷,我们可以收集到丰富多样的数据;在问卷调查中,选择题的答案一般属于分类数据,填空题收集的文本内容则采用UTF-8编码。010302(一)不同渠道采集的数据类型及编码方式一、数据采集保证数据的完整性和准确性;提高问卷的回收率;使用传感器时,保它能够持续、准确地采集数据。使用网络爬虫时,注意检查抓取的数据是否完整,有没有遗漏重要信息。采集到的数据需要妥善存储,方便后续使用。存储数据时,要注意数据的格式和命名规范。明确采集的数据是用于解决什么问题;如果目标不明确,就可能会采集到一些无用的数据,浪费时间和精力。问卷调查(纸质问卷、在线问卷平台等);监测奶茶店的客流量,安装客流量传感器;获取竞争对手在网络上的产品宣传信息,可以使用网络爬虫工具。3.实施采集4.数据存储1.明确采集目标2.选择采集方法和工具(二)数据采集的基本流程(一)数据清洗采集来的数据常常存在各种各样的问题,这些有问题的数据就被称为“脏数据”。数据清洗的任务就是对这些“脏数据”进行清理,让数据变得干净、准确,为后续的分析和应用打下良好的基础。1.处理重复数据利用数据库的去重功能处理重复数据。2.修正错误数据与原始资料进行核对;设置数据范围阈值。3.处理缺失数据人工补全;采用统计方法进行填补。二、数据处理(二)数据标注数据标注就像是给数据贴上标签,让计算机和AI能够理解数据的含义。它在数据处理中起着重要作用,尤其是在人工智能领域,如图像识别、自然语言处理等方面。二、数据处理想要训练AI识别猫和狗的图片,对大量的猫和狗的图片进行标注,AI通过学习发现它们的特征差异。图像识别对文本进行标注,AI就能够理解文本的结构和语义,进而可以进行新闻分类、信息提取等操作。自然语言处理操作简单,适合初学者使用。可以使用软件提供的矩形框工具,在需要标注的图片上框选要标注的目标物体,在对应的位置输入标签名称并单击保存,这样就完成了一次图像标注,如图2-1-9所示。以PascalVOC和YOLO格式输出,且在目标检测任务中应用广泛。1.LabelImg(二)数据标注二、数据处理支持图像标注、视频标注;它提供了两种标注视频便捷方式:逐帧标注和关键帧标注。由于其强大的功能,CVAT非常适用于大规模的计算机视觉项目,如自动驾驶场景中的视频数据标注,需要对大量的行车视频进行目标检测和标注,CVAT就能很好地完成这样的任务。2.CVAT(ComputerVisionAnnotationTool)(二)数据标注二、数据处理(三)针对数据标注过程中的问题构建数据集方法二、数据处理标注指南就像是一份操作说明书,明确了个标签的定义和标注规则。制定标注指南避免标注人员因为理解不一致而导致标注结果混乱。同时,在标注指南中,还可以对一些特殊情况进行说明,如汽车被部分遮挡时的标注方法等。制定详细的标注指南02培训标注人员详细讲解标注指南的各项内容,让标注人员清楚地知道每个标签的含义和标注要求。可以通过实际的案例演示,让标注人员直观地了解如何进行标注。同时,要给标注人员提供练习的机会,让他们在实践中熟悉标注流程和方法。组织标注人员培训01(三)针对数据标注过程中的问题构建数据集方法二、数据处理安排不同的标注人员对同一批数据进行标注,然后对比他们的标注结果以减少错误。当出现标注差异时,由专业人员进行仲裁。确定正确的标注结果。通过这种交叉标注与仲裁的方式,可以有效地提高标注数据的准确性。交叉标注与仲裁04为了让AI能够适应各种复杂的实际情况,构建数据集时要特别注意保证数据的多样性。在图像数据集中,应该包括不同角度、不同光线条件甚至是不同品牌、不同型号的图片;在文本数据集中,也要涵盖不同风格、不同主题的文本。让AI模型学习到更丰富的特征和模式,从而在实际应用中表现得更加出色。保证数据多样性03无论是我们日常使用的语音助手,还是用于疾病诊断的智能系统,背后都离不开数据集的支持。我们就一起走进数据集的世界,了解它的基本构成、类型划分,以及对模型训练效果的影响。(一)数据集的基本构成(二)数据集的类型划分(三)数据集对模型训练效果的影响三、数据集数据集,简单来讲,是由数据和对应的标签(在有监督学习任务的情况下)组成的集合。而标签呢,就是每个图片所对应的真实数字,范围是0~9,如图2-1-11所示。模型通过学习这些带有标签的图片数据,掌握如何识别不同的手写数字。1.数据与标签(一)数据集的基本构成三、数据集元数据就像是数据集的“说明书”,它记录了数据的采集时间、采集地点、数据格式等信息。比如,我们收集了一组关于城市交通流量的数据,元数据会告诉我们这些数据是在哪个城市采集的,是在工作日还是周末采集的,数据是以表格形式存储还是以某种特定的数据库格式存储等。这些元数据对于我们理解数据集的背景和适用范围非常有帮助。2.元数据(一)数据集的基本构成三、数据集测试集的作用是最终评估模型的泛化能力,也就是模型在从未见过的数据上的实际表现。测试集是检验模型是否有效的关键环节。只有当模型在测试集上取得良好的效果,如准确率达到了一定的标准,我们才能说这个模型具有实际应用价值。测试集训练集是数据集的核心主体部分,它的主要任务是用于训练AI模型。可以把它想象成学生学习用的大量练习题。AI模型通过在训练集上不断学习数据的特征和规律,来调整自身的参数。训练集验证集就像是一个“小考官”,在模型训练的过程中,每隔一段时间,我们就会用验证集来测试一下模型的性能。通过不断地在验证集上测试和调整超参数,让模型在验证集上达到较好的性能,也能在一定程度上保证模型在面对新数据时具有较好的泛化能力。验证集020103(二)数据集的类型划分(二)数据集的类型划分三、数据集(三)数据集对模型训练效果的影响三、数据集

数据集的规模越大,蕴含的信息更丰富,对模型训练越有利。以训练语言模型为例,如果使用大规模的文本数据集来训练,模型就有机会学习到各种各样的语言表达方式、丰富的语义信息以及不同语境下词汇和语句的用法。语言模型在文本生成、问答系统等任务中,往往能够表现得更加出色。01数据集规模过大的劣势:一方面,处理大规模数据集需要消耗大量的计算资源、配套计算机硬件设备,成本较高;另一方面,训练时间会大幅延长,能需要几天甚至几周的时间,这在实际应用中可能会影响项目的进度。021.数据集规模的影响(三)数据集对模型训练效果的影响三、数据集

如果数据中存在大量错误和噪声,会干扰模型的学习过程,导致模型性能下降。例如,在一个图像识别数据集中对部分图片的标签标注错误,把猫标注成了狗,那么模型就会被这些错误信息误导,从而无法准确学习到猫和狗的特征区别,在后续的图像识别任务中就容易出错。01准确、干净、标注正确的数据能够为模型提供清晰、准确的学习样本,让模型学习到正确的特征和规律,进而提高模型的准确率和泛化能力。因此,在构建数据集时,对数据进行严格的清洗和标注审核是非常必要的环节。022.数据质量的影响(三)数据集对模型训练效果的影响三、数据集

以图像识别为例,如果数据集中仅包含晴天拍摄的图片,那么模型在这样单一环境下学习到的特征可能仅适用于晴天的场景。当遇到阴天、雨天等不同环境下拍摄的图片时,模型的识别效果可能就会大打折扣。01如果数据集中包含各种天气条件、不同时间、不同拍摄角度等多样化的图片数据,模型就能学习到更全面、更具代表性的图像特征,从而在面对各种复杂环境下的图像时,都能有较好的识别效果,也就是模型的鲁棒性得到了提高。023.数据多样性的影响单纯的数据往往是枯燥且难以直观理解的。数据可视化技术的出现解决了这一难题,它能够将复杂的数据转化为直观、易懂的图表和图形,帮助我们快速洞察数据背后隐藏的信息。(一)数据可视化的基本方法(二)数据可视化对理解AI处理结果的作用四、数据可视化(一)数据可视化的基本方法柱状图主要用于比较不同类别数据的大小。例如,要比较不同班级在某次考试中的数学平均分,使用柱状图就能清晰地呈现出每个班级平均分的高低差异。制作柱状图时,我们将班级名称放置在横轴上,用来区分不同的类别;将平均分放在纵轴上,代表要比较的数据大小。每个班级对应一个柱子,柱子的高度直观地表示该班级的平均分数值。通过柱子高度的对比,我们可以迅速判断出各个班级数学成绩的相对水平。这种直观的视觉呈现方式,比单纯查看数字表格更易于理解和比较。四、数据可视化1.柱状图(一)数据可视化的基本方法折线图常用于展示数据随时间或其他连续变量的变化趋势,比如天气温度、股票价格等。以某城市一年中每月的气温变化为例,折线图就能很好地展示其变化规律。以月份为横轴,因为月份是一个连续的时间变量;将气温作为纵轴,表示要观察的数据。将每个月对应的气温数据点在图中标记出来,再用线段依次连接这些点,形成一条折线。通过观察这条折线的起伏,直观地看到气温是如何随着月份的推移而升降的。折线图能够帮助我们清晰地把握数据的变化趋势,预测未来的发展走向。四、数据可视化2.折线图(一)数据可视化的基本方法饼图主要用于展示各部分数据在总体中所占的比例关系,比如,分析一个班级学生的成绩分布时,我们想知道优秀、良好、中等、及格、不及格各等级在班级总人数中所占的比例,这时饼图就能派上用场。制作饼图时,我们将整个圆看作一个整体,即班级的总人数。然后按照各成绩等级人数占总人数的比例,将圆划分成不同大小的扇形每个扇形代表一个成绩等级,扇形面积的大小直观反映了该等级人数在总人数中所占的比例。四、数据可视化3.饼图(一)数据可视化的基本方法散点图可以展示两个变量之间的关系,在研究一些变量之间是否存在某种关联时,散点图是一个很有用的工具。我们以学习时间作为横轴,成绩作为纵轴。将每个学生对应的学习时间和成绩数据作为一个点,标注在图中。通过观察这些散点的分布情况,我们可以尝试判断两个变量之间的关系。散点图帮助我们直观地探索变量之间的潜在关系,为进一步的分析和研究提供线索。四、数据可视化4.散点图面积图展示数据随时间的累计变化情况箱线图单击此处输入你的正文,文字是您思想的提炼,根据需要可酌情增减文字。热力图单击此处输入你的正文,文字是您思想的提炼,根据需要可酌情增减文字。了解数据的分布特征和离散程度展示数据在二维空间上的分布密度(一)数据可视化的基本方法四、数据可视化其他可视化图表帮助我们评估AI模型的性能:根据性能指标,在出现问题时调整训练参数或改进模型结构。还能帮助我们比较不同模型的性能。辅助模型评估与优化AI模型会根据客户的特征对客户进行分类,一眼看出各个群体在消费行为上的分布特点,看到不同群体之间的差异,这对于企业制定针对性的营销策略非常有帮助。在客户细分项目中的应用人脸识别系统,AI模型识别出图像中的人物身份后标注出识别出的人物姓名,并改进模型,提高其识别准确率;医学图像识别有助于医生更直观地了解病情,做出准确的诊断。在图像识别任务中的应用213(二)数据可视化对理解AI处理结果的作用四、数据可视化1.当AI翻译软件把句子翻译错了,导致重要文件出现问题,这算AI的“错”,还是研发人员的责任?2.短视频平台用AI自动给视频加滤镜,结果让有的视频画面变得很奇怪,平台应该提前检查好AI效果,还是让用户自己接受这种结果?课堂思辨任务一

数据:AI成长的“营养宝库”任务二算法:AI思考的“神奇公式”基于人工神经网络的技术架构,致力于模拟人类大脑神经元之间相互连接、传递信息的方式,从而实现对复杂数据的高效处理与深度分析。在深度学习构建的神经网络中,包含了许多层次的神经元,能够对输入的数据进行逐步筛选、加工与提炼,挖掘出数据背后隐藏的关键信息与内在规律。(一)深度学习的特点(二)深度学习在各领域的应用(三)深度学习与神经网络的关系一、深度学习(四)深度学习与机器学习的区别和特征一、深度学习1.自动提取特征深度学习可以从海量的图像数据中自动学习和总结出事物的特征等,会不断调整自身内部的参数,逐渐构建起对图像特征的理解和认知。极大地提高了数据处理的效率和准确性。

3.灵活且可优化的模型结构深度学习模型结构如可定制的“智能大厦”,可通过优化适应不同任务。图像识别常用CNN提取空间特征,处理时间序列则采用RNN或LSTM以捕捉时序依赖。通过灵活调整结构,模型能够在多种领域发挥最优性能。2.强大的复杂数据处理能力深度学习模型能高效处理语音、图像、文本等多样数据,且数据量越大效果越优。海量数据助其更精准捕捉模式,如提升语音识别的准确度、增强图像中对不同物体的辨识能力,并深化对语言规则的理解以完成机器翻译等复杂任务。010302(一)深度学习的特点安防监控:通过深度学习算法,安防监控系统能够自动识别监控画面中的各种物体和行为。一旦发现异常情况,及时报警。这大大提高了安防监控的效率和准确性,有效预防和减少了各类安全事故的发生。人脸识别:手机内部搭载深度学习模型,对我们面部的众多特征进行深入细致的分析、行综合处理和比对,如果两者高度吻合,手机便会立即解锁,给我们的生活带来便利。医疗领域:强有力的医生辅助诊断工具,对于X光、CT、MRI等医学影像,深度学习模型,可以帮助医生更准确地检测出病变的位置、形状、大小等信息,甚至能够发现一些人类肉眼难以察觉的细微病变。(1)(2)031.图像识别领域一、深度学习(二)深度学习在各领域的应用客户服务领域:智能客服依托深度学习技术,实时识别并理解客户的语音或文本输入,提供快速、准确且个性化的响应。这不仅减轻了人工客服负担,提升了服务效率与质量,也显著降低了企业运营成本。智能语音助手:当我们对着手机或智能音箱说出指令时,语音识别系统中的深度学习模型先会将我们的语音信号转化为数字信号并分析和处理、识别,模型会根据识别结果,在其庞大的知识库中搜索相应的答案或执行相应的操作。实时字幕生成:实时字幕技术通过深度学习将语音实时转为文字并显示,使听障人士能够借助字幕理解内容,参与会议、讲座等活动,有效促进了信息的无障碍获取与交流。(1)(2)032.语音识别领域一、深度学习(二)深度学习在各领域的应用机器翻译技术:深度学习显著提升机器翻译水平,通过分析语法语义并利用平行语料库实现语言转换,虽复杂语境处理仍有不足,但已基本满足日常跨语言交流需求。搜索引擎:深度学习模型是搜索引擎的核心,能深入理解用户搜索意图,结合上下文与历史记录,从海量数据中快速筛选并排序,呈现最相关、高质量的结果。文本生成:深度学习技术推动了文本生成的突破,可自动撰写新闻、创作小说和诗歌。尽管生成文本的逻辑性和创造性尚不及人类,但已展现出巨大潜力,广泛应用于新闻生产与创作灵感激发,显著提升了效率。(1)(2)033.自然语言处理领域一、深度学习(二)深度学习在各领域的应用1.早期的神经网络:包含的神经元层数较少,在处理复杂问题时,能力受到一定的限制。2.深度学习出现后显著增加神经网络的层数,有了更多的“智慧触角”能够对数据进行更加深入、全面的学习和分析。3.随着深度学习技术的不断发展和创新,涌现出了许多不同结构的神经网络,它们各自具有独特的设计特点和优势,适用于不同类型的任务。深度学习的核心支柱深度神经网络一、深度学习(三)深度学习与神经网络的关系一、深度学习(三)深度学习与神经网络的关系最底层神经元类似于“视觉侦察兵”,专注于识别图像中的一些最基本元素,如边缘线条的方向、颜色的深浅变化等。中间层神经元将底层提取的简单特征进行整合和加工,开始识别出一些局部的物体特征,如眼睛、耳朵、鼻子等。最上层的神经元综合前面各层提取的所有特征信息,准确无误地判断出图像中所描绘的物体究竟是什么。1.数据要求方面02传统机器学习依赖人工提取特征,虽所需数据量较小,但过程繁琐且高度依赖专业经验。不同人员提取的特征差异易导致模型通用性和稳定性下降。深度学习能自动从原始数据中提取关键特征,如同智能“特征探测器”。它依赖大量数据训练,通过调整参数学习数据中的模式,数据越丰富,模型性能越优。机器学习依赖人工提取信息深度学习自动提取特征01一、深度学习(四)深度学习与机器学习的区别和特征2.模型结构方面02传统机器学习模型结构简单固定,如决策树、支持向量机等,其结构和参数多在训练前确定,训练过程仅优化既定参数,灵活性较差。深度学习神经网络结构灵活,可自由调整层数、神经元数量及连接方式,以适配不同任务需求,例如通过设计CNN优化图像识别,或选择RNN及其变体处理自然语言任务。模型结构固定不灵活结构复杂且灵活多变01一、深度学习(四)深度学习与机器学习的区别和特征机器学习它就像一位隐形的“智能魔法师”,赋予计算机自主学习的超能力,让机器不仅能“听懂”语言、“看懂”图像,还能预测未来趋势。二、机器学习机器学习的学习模式(一)(二)(三)(四)(五)不同情境下的人工智能案例分析不同机器学习模式的应用场景机器学习的学习算法机器学习的学习过程(一)机器学习的学习模式监督学习就像是有老师辅导的学习过程;我们提供给计算机的训练数据都带有“标准答案”,也就是标签。监督学习的常见任务有两类:一类是分类任务,如区分猫和狗的图片、判断肿瘤是良性还是恶性;另一类是回归任务,用于预测数值型的结果,如预测房价、股票价格等。在回归任务中,计算机要学习数据特征与目标数值之间的关系,从而对新数据的数值进行预测。二、机器学习1.监督学习:跟着“标准答案”学本领(一)机器学习的学习模式没有明确的“标准答案”,计算机需要像探险家一样,自己从数据中发现规律和模式。最常见的任务是聚类分析,包括客户细分、相似的新闻文章归类,方便新闻网站内容管理和推荐;对图像进行聚类,把相似的图片放在一起,便于图像检索和整理。二、机器学习2.无监督学习:自主探索“知识宝藏02让机器人在复杂的环境中学会行走、抓取物体。机器人会不断尝试不同的动作,根据动作产生的结果给予自己“奖励”或“惩罚”。通过大量的尝试和调整,机器人会逐渐找到最优的策略,完成复杂的任务。强化学习在游戏领域也大显身手,让AI通过与游戏环境交互,学习如何在游戏中取得高分,甚至在一些复杂的策略游戏中战胜人类玩家。机器人控制在游戏领域01(一)机器学习的学习模式二、机器学习3.强化学习:在“试错”中成长(二)机器学习的过程二、机器学习1.数据准备:为学习打好基础明确任务需求,确定采集数据监督学习任务,还需要给数据标注上正确的标签数据会存在“杂质”将处理好的数据划分为训练集、验证集和测试集02选择算法:分类任务—决策树算法、支持向量机算法等;回归任务—线性回归算法。开始学习:将训练集数据输入模型中开始“学习”。手动调整参数:学习率、迭代次数等。学习率决定了模型学习的“速度”,太高,会错过最优解;学习率太低,训练时间会变长。迭代次数则表示模型学习的“次数”,需要根据实际情况进行调整,以提高模型的性能。选择算法调整参数01(二)机器学习的过程二、机器学习2.模型训练:让计算机“学本领”准确率用于分类任务,表示模型正确分类的样本数占总样本数的比例。例如,在猫狗图片分类中,如果模型正确分类了90张图片,总共有100张图片,那么准确率就是90%。召回率同样用于分类任务,它衡量的是模型正确预测出的正例(如患病样本)占所有实际正例的比例,反映了模型识别正例的能力。均方误差常用于回归任务,计算预测值与实际值之间误差平方的平均值,误差越小,说明模型的预测越准确。(1)(3)(2)(二)机器学习的过程二、机器学习3.模型评估:检验学习成果模型欠拟合模型过拟合模型“死记硬背”了训练数据,无法应对新的数据可以采用正则化方法,它就像给模型“戴上枷锁”,限制模型过度学习训练数据的细节;也可以增加数据量,让模型学习更多的样本,提高泛化能力。在训练集和验证集上表现都不好尝试更换更复杂的模型,如从简单的线性模型换成非线性模型;或者增加数据特征,让模型有更多的信息可以学习。(二)机器学习的过程二、机器学习4.模型优化:让模型变得更优秀回归算法主要用于预测数值型的结果,如预测明天的气温、股票价格、学生的考试分数等。如线性回归,它的基本原理可以想象成在一堆散点中寻找一条“最合适”的直线,这条直线要使得所有数据点到它的距离之和最小,这样这条直线就能够代表数据的变化趋势,用于预测新的数据。局限性在于在现实世界中,很多数据之间的关系是非线性的复杂关系。(三)常见的机器学习算法二、机器学习1.回归算法:预测数值的“小能手”(三)常见的机器学习算法二、机器学习2.分类算法:分门别类的“小管家”分类算法场景决策树算法垃圾邮件分类、图像分类、客户信用等级分类等都是分类算法的应用场景区分水果根据颜色判断非红色红色其他红色水果草莓苹果优缺点优点:直观易懂,可解释性强;却点:容易出现过拟合。聚类算法的任务是将数据按照相似性分成不同的簇,就像把相似的物品放在同一个篮子里。K-均值聚类算法是最常用的聚类算法之一。市场细分:对消费者数据进行聚类,发现不同消费群体的特点,为企业制定精准的营销策略提供依据;图像分割:将图像中相似的像素点聚成一类,可以帮助我们提取图像中的目标物体,用于图像识别、图像编辑等;生物信息学:对基因数据进行聚类分析,可以发现具有相似功能的基因簇,为研究基因的功能和疾病的治疗提供线索。(三)常见的机器学习算法二、机器学习3.聚类算法:寻找相似的“小侦探”强化学习擅长在动态环境中进行决策优化,可应用于智能电网的能源分配与物流路径规划,通过实时数据调整策略,有效提升效率并降低成本。强化学习的应用场景适用于有明确标签数据且需要进行预测或分类的场景。监督学习可基于客户数据预测信用等级以决策贷款,或利用患者信息辅助疾病诊断,提升金融与医疗领域的准确性和效率。监督学习的应用场景无监督学习能从无标签数据中发现内在结构和规律,例如社交领域通过聚类分析划分用户兴趣群体以优化推荐,或在工业生产中检测设备异常实现预测性维护,从而提升效率、降低成本。无监督学习的应用场景020103(四)不同机器学习模式的应用场景(四)不同机器学习模式的应用场景二、机器学习强化学习通过奖励机制(赢棋+1,输棋-1)引导机器人在对弈中调整策略,经大量训练后能掌握最优下法,甚至战胜人类棋手,展现其在复杂决策中的强大能力。机器人下棋:强化学习创佳绩首先收集历史交通流量及相关影响因素数据,并以未来交通流量为标签;然后选择回归算法构建预测模型,通过学习特征与流量关系实现未来流量预测;交通管理部门可根据预测结果提前疏导,如调整信号灯或部署警力,以缓解拥堵提升效率。交通流量预测:监督学习显身手电商平台通过无监督学习,基于购买行为等数据,利用聚类算法将客户分为不同群体(如时尚爱好者、家庭采购者等),进而实施个性化精准营销,提升客户满意度与购买率。客户细分:无监督学习展优势020103(五)不同情境下的人工智能案例分析(五)不同情境下的人工智能案例分析二、机器学习1.当深度学习模型在图像识别中把野生动物误判为普通物品,导致保护行动延误,这主要是数据标注的问题,还是模型结构的缺陷?2.电商平台用机器学习算法给用户推荐商品,却推送了用户明确表示不感兴趣的内容,是该怪算法不够智能,还是用户数据收集得不够全面?课堂思辨任务二

算法:AI思考的“神奇公式”任务三实战演练,典型技术应用大赏自然语言处理(NLP)正努力打破人类日常语言与计算机代码之间看似难以跨越的障碍,致力于赋予计算机理解、处理并生成人类语言的神奇能力。从最基础的文字识别,到复杂的语义理解、情感分析等一系列关键任务,NLP贯穿其中,堪称实现人机自然交互的核心所在。(一)自然语言处理的技术原理(二)自然语言处理的常见应用一、自然语言处理一、自然语言处理(一)自然语言处理的技术原理01分词计算机着手处理文本时,首要步骤便是分词,简单来讲,就是把一长串连贯的句子拆解成一个个独立且有意义的词语。中文由于不像英文等语言有天然的空格来分隔词语,所以分词难度相对较大,需要借助专门的算法和规则,才能精准地识别出词与词之间的边界。02词性标注给每个词语都标注上对应的词性,常见的词性包括名词、动词、形容词、副词、介词等。通过词性标注,计算机能初步梳理出句子的结构框架,知晓每个词语在句子中所扮演的角色。03语义分析在这一阶段,计算机需要综合考量词语本身的含义、词性、句子的整体结构,以及上下文所提供的信息,从而透彻理解整个句子的真正意图。在深度学习领域,Transformer模型的多头注意力机制赋予模型强大的能力,使其能够同时关注句子中各个词语之间千丝万缕的关系。机器翻译:跨越语言鸿沟——运用自然语言处理技术,先对源语言预处理、拆解,接着,借助深度学习模型,如Transformer架构,深入挖掘源语言的语义内涵,最后将其巧妙地转换为目标语言。智能客服:网购好帮手——借助机器学习中的监督学习模式,智能客服对顾客有问必答、快速响应。随着深度学习技术的融入,智能客服更具洞察力和主动性,优化自身的回答策略,变得越来越智能,越来越贴心。文本生成:新闻网站利用深度学习自动生成体育、财经等结构化数据新闻。在文学领域,AI可基于关键词生成故事大纲与段落,为创作者提供灵感和参考,显著提升内容生产效率。123(二)自然语言处理的常见应用一、自然语言处理(二)自然语言处理的常见应用计算机视觉(简称CV)致力于让计算机像人类一样“感知”视觉世界,通过分析图像和视频,识别物体、场景和动作,进而理解其中的信息。从生活到工业,从医疗到交通,计算机视觉正悄然改变着我们的方方面面。二、计算机视觉

(一)计算机视觉的核心技术:卷积神经网络(二)计算机视觉的典型应用(三)计算机视觉的未来与挑战二、计算机视觉

(一)计算机视觉的核心技术:卷积神经网络卷积层卷积层模仿人类视网膜神经元对局部区域的感知能力,通过“卷积核”(类似滤镜)扫描图像,提取边缘、纹理、颜色等局部特征。池化层池化层对卷积层提取的特征进行“压缩”,降低数据维度,减少计算量。全连接层全连接层将所有提取到的特征“串联”起来,通过计算来判断图像的类别。1.CNN的工作原理卷积层会先检测猫的胡须、耳朵等边缘特征。缩小像素并保留关键特征整合特征后输出“这是一只猫”的结论。通过引入“残差结构”,让神经网络可以更轻松地学习深层特征,避免了梯度消失等问题。如,在识别复杂医学影像时,ResNet能通过数十层甚至上百层网络提取细节特征,大幅提升诊断准确率。随着图像识别需求的复杂化,科学家发现:单纯增加CNN的层数虽然能提升模型的“学习能力”,但可能导致性能退化(如准确率下降)。为解决这一问题,ResNet(残差网络)应运而生。二、计算机视觉

(一)计算机视觉的核心技术:卷积神经网络2.技术改进:残差网络(ResNet)小区门禁系统基于CNN精准捕捉人脸的关键特征(如眼睛间距、鼻梁弧度等),实现身份验证。医生借助计算机视觉分析X光、CT等医学影像。辅助医生发现微小病变,为癌症早筛提供帮助。拍照识花APP通过机器学习的分类算法构建识别模型,帮助用户识别花卉类型。二、计算机视觉

(二)计算机视觉的典型应用1.图像识别:让机器“认得出”在足球比赛中,计算机视觉技术可以跟踪球员的运动轨迹,统计跑动距离、传球路线等数据;在篮球转播中,系统能自动锁定持球球员,让镜头始终跟随焦点,提升观众观赛体验。汽车的YOLO算法,将图像划分为多个网格进行监测,每秒30帧以上的速度下实时检测图像中的多个目标,为汽车刹车、转向等决策争取宝贵时间。二、计算机视觉

(二)计算机视觉的典型应用2.目标检测与跟踪:让机器“看得准”02AI绘画工具可据文字生成图像,其基于GAN(含生成与判别器对抗优化)或扩散模型(通过去噪还原复杂细节)。AI绘画助力动画、游戏设计提效。《愚公移山》融合2D/3D、AIGC、CG、XR等技术,打造高质量AI影像,推动国产动画至技术高峰。AI图像生成助力游戏动画领域01二、计算机视觉

(二)计算机视觉的典型应用3.图像生成与编辑:让机器“会创作”02未来,随着5G、边缘计算等技术的发展,计算机视觉将更深入地融入智能家居、智慧城市、元宇宙等领域。将来,手机能通过摄像头实时翻译外文菜单,超市货架能自动识别缺货商品,盲人朋友能借助智能眼镜“看见”世界。未来多数算法需要大量标注数据;光照变化等可能导致模型“认不出”同一物体;人脸识别技术也可能引发隐私泄露问题;怎么平衡效率与伦理这一社会课题。挑战01二、计算机视觉

(三)计算机视觉的未来与挑战智能语音技术让计算机具备“听”和“说”的能力,实现了人与计算机之间的语音交互。我们通过语音指令让智能音箱播放音乐、使用车载语音助手导航,这些便捷的操作都得益于智能语音技术的发展,它使我们的生活更加智能化。(一)智能语音的实现原理(二)智能语音的主要应用三、智能语音(一)智能语音的实现原理语音识别是让计算机听懂人话。声学模型将声音信号解码为音素;语言模型则掌握词语组合规律,将音素合理组合成有意义的句子,两者协同工作。深度学习大幅提升语音识别能力。模型通过海量数据优化参数,其中RNN和LSTM能有效处理语音的时间序列特性,记忆前后信息,显著提高准确率。三、智能语音1.语音识别(一)智能语音的实现原理三、智能语音2.语音合成语音合成是与语音识别相反的过程,它是让计算机“说出”人类的语言。文本处理对输入的文本进行一系列处理,包括分词、词性标注等,以便计算机理解文本的结构和含义。转换语音参数通过声学参数生成模型,将文本信息转换为对应的语音参数,这些参数就像是控制语音的“密码”,决定了语音的音高、音长、音色等特征。语音生成通过语音合成器,根据语音参数生成自然流畅的声音。现在的语音合成技术给我们带来更加个性化和有趣的体验。三、智能语音(二)智能语音的主要应用(1)会议记录能够快速、准确地将会议中的语音内容转换为文字,大大提高了记录的效率和准确性;语音转文字软件可以在会议结束后几分钟内生成完整的会议记录,为参会人员后续的工作提供了极大的便利。(2)语音输入法遇到双手不方便操作或者需要快速输入大量文字的情况,语音输入法将语音转换为文字,大大提高了输入速度。现在的语音输入法还支持多种语言和方言(普通话、粤语还是英语)满足了不同人群的需求。(3)智能客服系统当用户拨打客服电话时,智能客服系统能够快速识别用户的问题,并给出相应的解答。在电商平台,对用户咨询能够迅速响应,提供准确的信息,大大提高了客户服务的效率和质量,同时也降低了企业的人力成本。1.语音识别的应用(2)电子书朗读功能将文字转为语音,使用户能在开车、做家务或者运动等多场景中“听书”,享受阅读乐趣。智能公交借语音合成精准播报站点,为乘客提供便捷指引,让乘客安心乘坐,免去乘过站之忧。朗读功能站点播报(1)三、智能语音(二)智能语音的主要应用2.语音合成的应用(2)智能语音助手(如Siri、小爱同学)能理解并执行语音指令,随时提供便捷服务。先进语音系统能进行多轮对话,理解上下文,提供个性化智能家居等服务,打造便捷生活。智能语音助手先进的语音交互系统(1)三、智能语音(二)智能语音的主要应用3.语音交互的应用在当今数字化的时代,身份认证无处不在。传统的身份验证方式繁琐复杂,而生物特征识别技术的出现,就像一把神奇的钥匙,为我们开启了安全便捷的身份认证新时代。(一)生物特征识别的技术特点(二)生物特征识别的应用场景四、生物特征识别(一)生物特征识别的技术特点生物特征识别4.多模态采用多模态识别技术综合验证,即将多种生物特征结合起来进行识别。3.局限性指纹识别会因手指受伤、有污渍或者脱皮失效;人脸识别在光线不足、遮挡时准确率降低;声纹识别易受环境噪声的干扰。2.便捷性无须复杂密码、不怕丢失钥匙或证件。1.安全性每个人的指纹、人脸、虹膜、声纹等生物特征都是独一无二的,并且在相当长的时间内不会发生改变。四、生物特征识别2指纹识别通过采集比对特征点,用于手机解锁、打卡等场景,快速准确且防伪。人脸识别技术广泛应用于车站刷脸进站、食堂支付及安防监控,提升效率、安全与便利性。指纹识别人脸识别1(二)生物特征识别的应用场景四、生物特征识别4虹膜具唯一性,识别技术安全精准,适用于金库、边境等高安全场所。声纹识别通过声音特征验证身份,广泛应用于金融防诈骗与智能家居声控,提升安全与便捷性。虹膜识别声纹识别3(二)生物特征识别的应用场景四、生物特征识别生成式人工智能是根据已有的数据和学习到的模式,生成图像、文字、音频、视频等各种形式的内容。它赋予计算机“创作”能力,为各领域带来了新的可能性。(一)生成式人工智能的技术原理(二)生成式人工智能的应用五、生成式人工智能五、生成式人工智能(一)生成式人工智能的技术原理生成式对抗网络(GAN)由生成器和判别器两部分组成。生成器创作新的数据,判别器则是一位眼光犀利的“艺术鉴赏家”,负责判断生成器创作的作品真伪。经过持续的“对抗”,生成器的创作水平越来越高。使用StableDiffusion、Midjourney等AI绘画工具,把文字描述输入工具,几秒钟即可完成。这些AI绘画工具不仅能绘制基础画面,还支持风格转换功能。无论是艺术爱好者进行创意创作,还是设计师寻找灵感,AI绘画都能提供强大助力。五、生成式人工智能(二)生成式人工智能的应用1.AI绘画:让想象跃然屏幕上(2)在AI编程辅助工具中输入你的需求,工具就能快速生成包含Python代码和数据库语句的基础框架,节省时间、提升效率。无论是撰写电商商品描述,还是创作广告宣传语,AI都能快速给出多个不同风格的创意方案。为创作者提供灵感。编写代码框架文案创作(1)五、生成式人工智能(二)生成式人工智能的应用2.文本生成:高效创作的得力助手(2)向AI音频生成工具输入需求,工具很快就能生成一段基础旋律。可以在此基础上调整和弦走向、添加和声等,提升效率。AI音频生成还能模拟各种乐器的声音,甚至可以创造出自然界中不存在的独特音效,为音乐创作带来更多可能性。音乐创作模拟乐器声(1)五、生成式人工智能(二)生成式人工智能的应用3.音频生成:音乐创作的新伙伴(2)向AI视频生成工具输入需求以生成特效镜头,特效团队可以参考这些镜头,调整细节后进行高质量渲染,相比传统纯人工制作,成本能降低40%左右。在短视频创作、广告制作等领域,作者们可以通过简单的文字描述快速生成视频初稿,大大提高了创作效率。视频生成视频制作(1)五、生成式人工智能(二)生成式人工智能的应用4.视频生成:影视制作的革新力量算力,简单来讲就是计算机的计算能力,体现为计算机在单位时间内处理数据的能力。无论是训练复杂的深度学习模型,还是实时处理大量图像、语音数据,都需要强大的算力支持。没有足够的算力,再先进的算法和模型也无法高效运行。(一)算力的重要性(二)算力的应用(三)提升算力的方式六、算力(四)算力与人工智能的关系(一)算力的重要性六、算力强大的算力可对更加复杂的模型结构和进行更大规模的数据训练,从而探索新的算法和技术。一些前沿的人工智能研究,如脑机接口模拟、复杂分子结构预测等,都依赖于强大的算力来运行复杂的模型和处理庞大的数据,推动人工智能技术不断向前发展。人工智能技术创新训练大型深度学习模型,如语言模型、图像识别模型等,往往需要处理海量的数据。如果算力不足,模型训练可能需要耗费数月甚至数年的时间。而强大的算力能够显著缩短训练周期,提高研发效率。训练大模型在自动驾驶、智能监控等实时应用场景,计算机需要实时处理传感器采集到的大量数据。。如果算力不足,自动驾驶汽车可能无法及时对这些数据进行分析和处理,从而无法及时做出反应,极易引发交通事故等。实时应用场景数据处理020103算力的重要性(二)算力的应用六、算力云计算提供的算力资源,使得平台能够根据学生数量的变化灵活调整计算能力,保证学生在学习过程中视频播放流畅,学习系统稳定运行。同时,借助算力,教育机构还可以利用人工智能技术对学生的学习情况进行分析,为学生提供个性化的学习方案。教育领域超级计算机凭借强大的算力,快速处理气象预测中海量的气象数据,生成准确的气象模型,为气象预报提供有力支持。在生物医学研究方面,强大的算力让研究人员对基因序列分析、模拟药物分子与靶点的结合过程等做到迅速处理,推动医学的发展和新药的研发。科学研究领域金融机构利用算力强大的服务器,通过复杂的算法对数据进行分析,预测股票价格走势、评估投资风险等,确保了交易策略能够及时执行,为投资者获取收益。金融行业020103算力的应用(三)提升算力的方式六、算力分布式计算将大任务分解为多个小任务,分配到不同计算机上并行处理,充分利用多台机器算力,大幅提升计算速度,尤其适合训练大型深度学习模型等大规模数据处理任务。分布式计算使用更先进的芯片是提升算力的关键。GPU凭借大量核心,擅长并行计算,非常适合深度学习中的矩阵运算,极大提升了AI及深度学习的训练效率。还有TPU等专用芯片,进一步为AI任务提供强大算力。硬件升级云计算平台按需提供算力资源,用户无需购买昂贵设备,可根据需求租用。其整合大量服务器,算力强大、弹性扩展、成本低,有效助力企业降低创业投入。云计算020103提升算力的方式算力是人工智能发展的重要基石。AI技术的飞速发展催生了指数级增长的算力需求,同时也在反向推动算力技术的革新,催生出专用芯片与高效服务,形成了相互促进的良性循环。(四)算力与人工智能的关系六、算力1.当智能客服用自然语言处理技术回答问题时答非所问,这是算法不够先进,还是训练数据不够准确全面的问题?2.人脸识别技术应用在校园门禁后,偶尔会出现误识导致学生无法正常进出,学校该为追求便捷继续使用,还是考虑换回传统刷卡方式?课堂思辨任务三

实战演练,典型技术应用大赏感谢您的观看项目三从感知到创造,解锁AI的无限可能:人工智能实践与创新FOREWORD引言引言日前,智能聊天机器人ChatGPT的火爆程度超乎

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论