人工智能与未来 课件 7.5 扩展:国产大模型DeepSeek_第1页
人工智能与未来 课件 7.5 扩展:国产大模型DeepSeek_第2页
人工智能与未来 课件 7.5 扩展:国产大模型DeepSeek_第3页
人工智能与未来 课件 7.5 扩展:国产大模型DeepSeek_第4页
人工智能与未来 课件 7.5 扩展:国产大模型DeepSeek_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

GenerativeArtificialIntelligence07生成式人工智能2035主讲:王红梅7.17.27.37.4生成式人工智能那些事生成式人工智能概述生成式人工智能的核心技术*目录CONTENTS7.5生成式人工智能具体应用扩展:国产大模型DeepSeekDeepSeek是杭州深度求索人工智能基础技术研究有限公司(简称深度求索)开发的一系列人工智能大模型,这些大模型因其开发成本低、性能卓越而引起关注。创始人梁文锋浙江大学毕业,创办的幻方量化基金,资金规模超过百亿,2023年创建深度求索公司,开始投入大模型,目标直逼AGI。深度求索也是国内少有的拥有万卡集群算力的AI大模型公司。7.5.1DeepSeek啥来头?1.技术创新与突破DeepSeek的技术创新和突破主要在成本优势和性能优势两个方面。提出一种崭新的多头潜在注意力机制,替代传统多头注意力机制,将显存占用降到过去的5%~13%;还提出混合专家模型,通过组合多个专家模型(子模型)来提高整体性能,混合专家模型根据输入数据特征动态选择一部分专家模块进行激活。7.5.2为啥是DeepSeek引起全球的轰动?1.技术创新与突破

例如,当输入文本包含金融术语时,系统优先激活金融专家模块,其它专家不启动,正是这些创新使得数据与算力的潜力释放到极致,使得模型在保持高性能的同时,大幅降低了显存占用和推理成本,在全球引起巨大轰动。相比之下,其他国产大模型在技术创新和性能优化上就没有这么出色,无法像DeepSeek那样提供高效、低成本的AI解决方案。7.5.2为啥是DeepSeek引起全球的轰动?混合专家模型的工作模式;根据输入激活对应专家2.开源策略和生态建设DeepSeek的开源策略也是其火爆的重要原因之一,DeepSeek开源了世界上第一个推理模型,这种开源模式吸引了全球开发者参与优化,形成了“技术众包”生态,快速迭代出适配教育、电商、医疗、金融等垂直场景的轻量化模型。而其他国产大模型可能由于闭源或开源程度有限,限制了其生态建设和应用推广。7.5.2为啥是DeepSeek引起全球的轰动?3.对中国和全球AI的影响

DeepSeek打破了美国企业在AI技术上的垄断地位,展示了中国在AI领域的新实力,同时也为中国AI企业在全球市场上争取了更多的话语权和影响力。更深远的影响是DeepSeek重新定义AI的发展模式,重塑了“AI高成本、大算力的”的游戏规则,推动了全球AI行业从资本驱动向算法驱动的转型。相比之下,其它的国产大模型主要是做应用上的创新,没有在底层架构上有所创新,这也是国产其它大模型无法像DeepSeek火爆全球的原因。7.5.2为啥是DeepSeek引起全球的轰动?在DeepSeek大模型之后,大模型领域会经历一系列显著的变化和发展趋势,这些变化可能包括:1.开源社区和大模型生态的建设2.技术路线多元化3.垂直领域深耕细作4.算力需求依旧强盛7.5.3DeepSeek之后呢?

谈谈

DeepSeek对你

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论