《DeepSeek大语言模型边做边学-原理、配置、提示词和案例实操》课件 第1章 人工智能演进与DeepSeek突破_第1页
《DeepSeek大语言模型边做边学-原理、配置、提示词和案例实操》课件 第1章 人工智能演进与DeepSeek突破_第2页
《DeepSeek大语言模型边做边学-原理、配置、提示词和案例实操》课件 第1章 人工智能演进与DeepSeek突破_第3页
《DeepSeek大语言模型边做边学-原理、配置、提示词和案例实操》课件 第1章 人工智能演进与DeepSeek突破_第4页
《DeepSeek大语言模型边做边学-原理、配置、提示词和案例实操》课件 第1章 人工智能演进与DeepSeek突破_第5页
已阅读5页,还剩20页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能演进与大模型崛起中的DeepSeek突破2025/06/08广州理工学院CONTENTS目录01人工智能的演进历程02大语言模型的技术革命03DeepSeek的定位与突破04技术趋势与产业展望人工智能的演进历程01人工智能的起源神经元模型的提出1943年,沃伦·麦卡洛克和沃尔特·皮茨提出首个数学化神经元模型,从理论上证明计算结构可模拟生物神经机制,为神经网络研究奠基。图灵测试的诞生1950年,艾伦・图灵在《计算机器与智能》中提出“图灵测试”,通过“模仿游戏”设定智能判定标准,为人工智能研究提供可验证目标。达特茅斯会议的召开1956年,约翰·麦卡锡、马文·明斯基等学者在达特茅斯研讨会上首次确立“人工智能”术语,明确研究目标,标志其成为独立学科。符号主义的探索与局限早期代表性成果ELIZA(1966)是首个能模拟心理治疗师与用户对话的程序,展示了人工智能在自然语言处理领域的初步可能性;SHRDLU(1968)可理解并执行自然语言指令的积木世界系统,在知识表示和推理方面取得早期突破。规则系统的瓶颈早期人工智能基于符号逻辑方法,规则依赖性强,难以处理复杂、模糊的现实问题。如早期象棋程序缺乏对棋局整体形势的直觉判断和灵活应变能力。专家系统的困境专家系统依赖人工编码知识,存在知识获取瓶颈、维护成本高、缺乏学习能力和受算力制约等问题,促使研究者转向数据驱动范式。从专家系统到深度学习01专家系统案例对比DENDRAL(1965年)首次使用启发式规则识别分子结构;MYCIN(1976年)准确率69%,推动AI在医学中的应用,但它们都暴露出符号主义范式的局限。02数据驱动范式的兴起21世纪以来,计算能力提升和数据量爆发,各种数据处理算法涌现,基于统计的机器学习在多个领域取得显著突破,如垃圾邮件过滤、信用卡欺诈检测等。03数据驱动取代符号逻辑1997年IBM深蓝击败国际象棋冠军卡斯帕罗夫,标志着人工智能从规则驱动正式转向数据驱动,数据驱动范式逐渐取代符号逻辑方法。深度学习的革命性突破深度信念网络训练方法2006年,Hinton团队提出深度信念网络训练方法,成功突破梯度消失难题,推动连接主义范式进入新阶段。ImageNet数据集的建立2009年,ImageNet数据集建立,为计算机视觉训练提供重要基准,验证了数据驱动范式在大规模图像识别任务中的有效性。AlexNet架构的出现2012年,AlexNet架构开启了CNN在计算机视觉领域的统治时代,大幅提升图像识别等任务的准确率,证明神经网络自主学习特征能力远超人工设计特征。大语言模型的技术革命02Transformer架构的革新自注意力机制解决长距离依赖早期自然语言处理存在“长距离依赖”难题,如难以解析“小明说小红去了图书馆,她借了一本书”中“她”的指代关系。Transformer架构的自注意力机制能实现对全局语义的动态关联,有效解决了这一问题。奠定大模型技术基石2017年提出的Transformer架构,标志着连接主义范式在自然语言处理领域的重大突破,为后续大语言模型的发展奠定了坚实基础。GPT系列的里程碑意义ChatGPT的多任务微调与RLHF技术2022年11月30日发布的ChatGPT,核心创新在于海量数据训练、多任务微调及人类反馈强化学习(RLHF)。文本生成能力展示ChatGPT能够生成连贯、逻辑合理的文本,可根据自然语言描述生成高质量代码片段,在语言生成、问答系统、文本摘要等任务中表现出色。推理能力展示ChatGPT能理解问题逻辑结构并给出准确答案,在逻辑推理等领域发挥重要作用,为用户解决复杂问题提供思路和方案。大模型的发展阶段与格局全球大模型技术路线对比大模型发展经历准备期(2022.11-2023.03)、成长期(2023.04-2023.12)、爆发期(2024-至今)。不同阶段技术特点不同,如准备期基于Transformer初步探索,成长期多模态与开源生态形成,爆发期进行垂直领域微调与AGI探索。“百模大战”竞争生态呈现国内学术和产业界积极跟进大模型发展,文心一言、通义千问等模型相继推出,形成了“百模大战”的竞争格局。AIGC的爆发与多模态生成文本/图像/视频生成技术融合AIGC从单一文本生成扩展到多模态内容生成,以GPT、DeepSeek为代表的大语言模型,不仅能在文本生成、代码生成、逻辑推理方面表现卓越,还能根据文本描述生成图像或动态视频内容。AIGC对行业的颠覆性影响AIGC的爆发深刻改变了多个行业的格局,为内容创作、教育、科研、办公等领域带来了新的发展机遇和变革。AIGC的行业应用价值01教育场景案例AIGC支持个性化学习,能根据学生学习进度和特点生成针对性练习题和解答。如根据学生数学作业错误情况,分析知识薄弱点,生成个性化练习题和讲解内容。02科研场景案例AIGC可帮助科研人员检索文献、总结研究成果、辅助撰写论文。能快速筛选相关研究文献,提炼核心观点,节省科研人员时间和精力,加速科研创新进程。03办公场景案例AIGC在办公场景实现智能文档生成、会议纪要自动整理等功能。可根据用户需求和已有资料快速生成格式规范、内容完整的文档,实时记录会议内容并提取关键信息生成清晰纪要。DeepSeek的定位与突破03DeepSeek的崭露头角01开源推理模型的亮相2025年1月,DeepSeek凭借开源推理模型DeepSeek-R1正式崭露头角,其性能与OpenAI的o1模型相当,但训练成本仅为OpenAI同类模型的1/20。02全球市场冲击效应该模型引发全球关注,应用程序登顶苹果应用商店免费下载排行榜,在国际大模型排名中升至第三,用户注册量短短七天新增一亿。其低算力依赖特性引发美股震荡,英伟达股价单日暴跌17%,市值一夜蒸发23万亿。03版本发展与特色截至目前,DeepSeek已实现多代次架构演进,DeepSeek-V3和DeepSeek-R1是比较有代表性的两个版本,各有独特优势。V3:全能多模态通用模型MoE架构与通用定位DeepSeek-V3于2024年12月26日发布,是自研MoE混合专家架构的通用自然语言处理模型,在文本、图像、音频、视频多模态处理上表现均衡,适用于智能客服、内容创作、知识问答等通用场景。高效训练体系采用预训练+监督微调+轻量强化学习组合,结合FP8混合精度训练与无辅助损失的负载均衡技术,在14.8Ttoken规模预训练中实现成本优化,训练效率显著提升。多维度能力优势在长文本处理、代码生成、数学推理、中文理解及多语言支持方面均表现优异,生成速度快且硬件适配性强,支持多框架集成与多推理模式。开源生态友好性对资源有限的中小企业和开发者友好,可自由定制优化,广泛应用于聊天交互、多语言翻译、图像生成等领域。R1:垂直领域推理专家专注复杂推理的定位DeepSeek-R1于2025年1月发布,是专注复杂推理的开源模型,专为数学逻辑、代码生成、金融分析等高精度任务设计。强化推理能力通过监督微调、多阶段强化学习与混合数据微调,结合冷启动技术,在极少标注数据下实现媲美OpenAIo1系列的推理性能,在数学逻辑推理、代码生成等复杂任务中分类准确率超90%。成本优势与模型蒸馏训练成本仅为同类模型的1/20,支持模型蒸馏技术,可将推理能力迁移至轻量化模型,适配本地部署需求。垂直领域深耕成果在科研数据分析、算法交易策略生成、复杂SQL查询等场景表现卓越,成为降低AI开发成本的优选方案,获开源社区广泛二次开发。全场景覆盖架构移动端(APP)应用支持iOS和Android两大主流平台,功能丰富,包括智能问答、文档解析、代码生成与调试、多模态交互等。具备离线缓存能力,优化弱网环境响应速度,提升移动办公效率。网页端(Web)优势支持PC及主流浏览器,无需安装即开即用。支持多标签会话管理,与企业办公软件深度集成,可高效进行长文档和大数据分析,提升团队协作效率。本地化部署(私有化方案)价值针对金融、政务、医疗等数据安全性要求高的敏感行业,提供本地化部署方案,确保数据安全可控,企业可定制化训练行业专属模型。多端部署性能对比单击此处添加项正文跨端同步与混合计算跨端同步的无缝工作流用户在不同设备(手机、电脑、平板)登录同一账号,可实时同步聊天记录、文件解析记录、代码片段等,确保工作连续性。如程序员小张在地铁上用手机咨询代码优化方案,到办公室后可在网页端继续编辑。混合计算架构的优势采用混合计算架构,结合云端高性能计算与本地边缘计算,对于敏感数据可在本地处理,通用任务借助云端加速,实现效率与隐私的平衡。如摄影师老张在本地处理照片数据,通过云端获取教程和灵感。多模态交互与持续学习多模态交互的自然体验DeepSeek支持文本、语音、图片、文件混合输入,输出结合图文、表格等多种形式,带来更自然的AI交互体验。如烹饪新手小美上传图片并语音提问,DeepSeek给出针对性建议。持续学习优化的个性化适应基于用户反馈和交互数据动态调整模型,在专业场景中表现持续提升,越来越贴合用户需求。如健身爱好者小陈使用DeepSeek制定健身计划,效果越来越好。垂直领域落地实践医疗场景的应用在医疗场景,针对数据安全性要求高的特点,DeepSeek提供本地化部署方案。如小型诊所医生可通过加密接口访问本地病历数据库,借助医学知识库更准确地判断病情。金融场景的应用在金融场景,本地化部署方案可确保数据安全可控。如小型金融公司系统可实时审核贷款申请资料,并通过API与公司内部风控系统对接,保障业务安全高效运行。技术趋势与产业展望04大模型技术演进方向AGI融合多模态大模型将向通用人工智能(AGI)迈进,进一步融合多模态能力,如结合文本、图像、音频、视频等多种模态,推动更自然的人机交互和更高效的行业应用。例如AIGC技术已从单一文本生成延伸至图像、音频和视频生成领域。低算力依赖像DeepSeek的开源推理模型DeepSeek-R1,性能与OpenAI的o1模型相当,但训练成本仅为OpenAI同类模型的1/20,低算力依赖特性将成为大模型发展的重要趋势。垂直深耕大模型会在垂直领域进行深度结合与深耕,满足不同行业的特定需求。如DeepSeek-R1专为数学逻辑、代码生成、金融分析等高精度任务设计,在科研数据分析、算法交易策略生成等场景表现卓越。DeepSeek

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论