deepseek:智能时代的全面到来和人机协作的新常态-浙江大学-202502_第1页
deepseek:智能时代的全面到来和人机协作的新常态-浙江大学-202502_第2页
deepseek:智能时代的全面到来和人机协作的新常态-浙江大学-202502_第3页
deepseek:智能时代的全面到来和人机协作的新常态-浙江大学-202502_第4页
deepseek:智能时代的全面到来和人机协作的新常态-浙江大学-202502_第5页
已阅读5页,还剩124页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

DeepSeekDeepSeek智能时代的全面到来和人机协作的新常态孙凌云教授计算机科学与技术学院2025年2月维基链接CommonCrawl数据总计4.64.6ThePilev164.66.4表:主要数据集大小汇总,以GB为单位。公开的数据集以粗体表示,确定的数据以斜体表示。CommonCrawl数据集过滤之前为45T来源:OpenAI团队,LanguageModelsareFew-ShotLearners,/abs/2005.14165,2022年7月22日34由AI(DeepSeekR1)搜集并整理,经人工检查4三体人如何学习地球知识?三体人如何学习地球知识?电磁波探测器拯救派电磁波地球文明信息原始数据、无目标性探测器探测器搜集数据集电磁波地球文明信息原始数据、无目标性探测器探测器搜集数据集精准观察、查漏补缺拯救派人类反馈实现对齐动态反馈、价值博弈三体人如何学习地球知识?拯救派人类反馈实现对齐动态反馈、价值博弈拯救派人类反馈实现对齐动态反馈、价值博弈电磁波地球文明信息原始数据、无目标性探测器搜集数据集精准观察、查漏补缺定向能力强化价值观校准原始数据基建定向能力强化价值观校准三体人如何学习地球知识?电磁波探测器拯救派人类反馈强化学习人类反馈强化学习预训练三体人如何学习地球知识?电磁波基础模型电磁波基础模型强化学习结合准确性奖励(数学、编程等任务的可验证结果)和格式奖励(强制输出结构化标签),通过GRPO算法优化模型三体人如何学习地球知识?电磁波基础模型电磁波基础模型强化学习数学题自动判分/编程题实战演练/阶梯进化结合准确性奖励(数学、编程等任务的可验证结果)和格式奖励(强制输出结构化标签),通过GRPO算法优化模型https://huggingface.co/papers/2501.12948TheuserasksaquesThereasoningprocessandanswerareenclosedwithin2025年1月22日Ahamoment顿悟时刻人类长期思考后的灵感闪现强化学习中的奖励信号引导结合准确性奖励(数学、编程等任务的可验证结果)和格式奖励(强制输出结构化标签),通过GRPO强化学习策略后训练V3模型Ahamoment顿悟时刻人类长期思考后的灵感闪现强化学习中的奖励信号引导结合准确性奖励(数学、编程等任务的可验证结果)和格式奖励(强制输出结构化标签),通过GRPO强化学习策略后训练V3模型来源:/think/topics/chain-of-thoughts20表格内容由AI生成,使用DeepSeekR1自动整理https://x.ai/blog/grok-3来源:/xai/status/18916997152987304822025年2月18日算力路线xAI发布会,DeepSeek白皮书训练成本估算2.1亿/5亿美元,含基础设施558万美元(单次训练成本)Axios成本报告技术特性2.7万亿参数动态架构通过ThinkMode分解问题(如火星轨道计算调用9个子模型协同)671B参数仅激活少量参数完成同类任务xAI技术文档,DeepSeek-V3技术表数学推理xAI基准测试,DeepSeek-V3数据表代码生成LiveCodeBench57%LiveCodeBench40.5%Radargit性能对比训练能耗相当于30万户家庭年用电相当于于3000户家庭年用电xAI发布会实录推理成本$0.015/次$0.0018/次Radargit成本对比生态策略封闭生态X平台,但提供实时数据接口开源策略允许开发者定制思维链展示规则Radargit行业分析使用DeepSeekR1自动整理,含第三方估计数据25DeepSeek-R1GPT-o1/通义千问QwQ-32B/天工Skyworko1/讯飞星火X1/GeminiUltra/Grok3-语言模式匹配与统计规律学习-上下文连贯性与生成流畅度-大规模数据泛化-复杂逻辑分析与多步骤推理-符号化规则与结构化思维链构建-逻辑验证准确性-基于Transformer的并行化生成-端到端模式识别-依赖提示工程提升表现-原子推理模块组合(如批判性思维、逐步推导)-需强化学习优化推理路径-开放域对话(客服机器人)-文本创作(小说/诗歌生成)-数学定理证明(如代数方程求解)-动态规划算法设计-实时决策系统(自动驾驶)),-FP8混合精度训练减少内存占用与计算量-强化学习直接用于基础模型(无需监督微调)-知识蒸馏技术缩短后训练周期-动态知识库与多模态引擎加速迭代-FP8混合精度框架首次验证超大规模模型可行性-负载均衡策略减少性能损失-知识蒸馏将大模型能力迁移至小模型(如15B参数模型)-动态稀疏注意力降低计算复杂度注:使用秘塔搜索(R1推理模型)总结,内容未经人工确认,格式经人工调整。详情参考:/s/ZYdtday/s/TM0D0rP/pdf/2311.02462.pdf/pdf/2311.02462.pdf/sites/jodiecook/2024/07/16/openais-5-levels-of-super-ai-agi-to-outperform-human-capability/2024年7月16日来源:ARKInvest/big-ideas-20242024年1月31日33能力涌现不可逆社会影响倒计时人机协作新常态来源:/technology/chatgpt-opens-door-to-four-day-week-says-nobel-prize-winner-20230406-p5cyki来源:ARKInvest/big-ideas-20242024年1月31日37来源:Stella,F.,DellaSantina,C.&Hughes,J.HowcanLLMstransformtheroboticdesignprocess.NatureMachineIntelligence.5,561–564(2023)./10.1038/s42256-023-00669-72023年6月7日来源:Stella,F.,DellaSantina,C.&Hughes,J.HowcanLLMstransformtheroboticdesignprocess.NatureMachineIntelligence.5,561–564(2023)./10.1038/s42256-023-00669-72023年6月7日https://twitter.com/gong_cn/status/1726501516https://huggingface.co/blog/lcm_lora2023年11月9日人类完成绝大部分工作人类设立任务目标其中某(几)个任务AI提供信息或建议人类自主结束工作人类和AI协作工作人类设立任务目标其中某(几)个任务AI完成初稿人类修改调整确认↓人类自主结束工作AI全权代理!任务拆分工具选择进度控制!AI全权代理!任务拆分工具选择进度控制!AI自主结束工作AI完成绝大部分工作设立目标提供资源监督结果来源:VIONWILLIAMS/s/AluYfD6BQOkLo6XpJMyQnQ2023年9月15日41蒸汽时代(1760-1840)蒸汽时代(1760-1840)水力、纺织、铁蒸汽、铁路、钢电、化学品、内燃机石油、天然气、硅电子互联网水力、纺织、铁蒸汽、铁路、钢电、化学品、内燃机石油、天然气、硅电子互联网信息时代(1950-第一波浪潮第二波浪潮第三波浪潮第四波浪潮第五波浪潮 60年 40年 动力运力电力通信信息观点来自:北京大学黄铁军教授,2023年3月31日42蒸汽时代(1760-1840)蒸汽时代(1760-1840)电气时代(1840-1950)信息时代(1950-以人工智能为代表的新型基础设施?以人工智能为代表的新型基础设施?动力 60年动力 通信 40年通信信息智力 信息智力运力电力观点来自:北京大学黄铁军教授,2023年3月31日43来源:ArtificialIntelligenceIndexReport2024/report/ModelsTableRankingshttps://lifearchitect.ai/models-table/2025年2月/100-gen-ai-apps-3/应用/平台集成时间核心功能与技术特性信息来源测DeepSeek降低了基础提示词的使用DeepSeek降低了基础提示词的使用来源:/technology/chatgpt-opens-door-to-four-day-week-says-nobel-prize-winner-20230406-p5cyki52来源:澎湃新闻/newsDetail_forward_207904

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论