版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
内容目录一、DeepSeek-V4布超长下的破架效率胜利 4大构新 5CSA+HCA:合注意机制 5mHC:形束连接 5Muon化替代AdamW 5型力评:Agentic力推能领源模,近级源型 6DeepSeek-V4助常工能大提升 8二、融本析务面,DeepSeek-V4据对优势 9三、DeepSeek-v4杂务评测 10Parquet件据析 10金券究官爬取 12A股场时测架 14风险示 15图表目录图表1:DeepSeek-V4个版与V3.2的格格对比 4图表2:API用础例 4图表3:API用心数 4图表4:CSA心构理 5图表5:DeepSeek-V4的AgenticSearch与RAG确度比 6图表6:DeepSeek-V4知识与Agentic能方面于沿 7图表7:DeepSeek-V4上下能提明显 7图表8:DeepSeek-V4-Pro-Max与他沿型比 8图表9:“领务”度上DeepSeek胜情况 8图表10:白任务各分维上DeepSeek得分 8图表11:CFLUE融评估据构成 9图表12:金应评结果 9图表13:数分任提示(选) 10图表14:ClaudeCode+DeepSeek-V4-PRO执据分任结果 11图表15:ClaudeCode+DeepSeek-V4-PRO执据分任更结果 11图表16:ClaudeCode+DeepSeek-V4-PRO执据分任更结果 12图表17:ClaudeCode+GLM-5.1执数分务更结果 12图表18:网爬任提示(选) 12图表19:ClaudeCode+DeepSeek-V4-PRO执络爬结果 13图表20:ClaudeCode+DeepSeek-V4-PRO执络爬更结果 13图表21:ClaudeCode+GLM-5.1执网爬果 14图表22:A回任示词节) 14图表23:ClaudeCode+DeepSeek-V4-PRO执测任结果 15图表24:ClaudeCode+GLM-5.1测务果 15一、DeepSeek-V4发布,超长上下文的突破与架构效率的胜利2026年4月4DepS-V4Hugingae此次版本迭代,DeepSeek-V4通过全新的架构设计实现了百万字超长上下文的突破,在Agent:Deepseek-v4-proDeepseek-v4-flash图表1:DeepSeek-V4两个版本与V3.2的规格与价格对比规格/价格Deepseek-v4-proDeepseek-v4-flashDeepsek-v32总参数1.6T284B671B激活参数49B13B37B上下文1M1M128K预训练数据33T32T15T输入(缓存命中)价格1元0.2元0.2元输入(缓存未命中)价格12元1元2元输出价格24元2元3元DeepSeek图表2:API调用基础示例DeepSeek图表3:API调用核心参数参数 值base_ul(OpnAI常用) htp:/p.epekcmAPI获取地址(填写ap_ke) htp:/ltomdese.omaikysdeepseek-v4-flashdeepseek-v4-prodeepseek-chat(目前对应deepseek-v4-flash的非思考模式,将modelreasoning_effortextra_body
于2026/07/24弃用)deepseek-reasoner(目前对应deepseek-v4-flash的思考模式,将于2026/07/24弃用)high(思考强度:高)max(对于复杂的Agen场景建议使用思考模式,设置强度为max)el)disabled()DeepSeek1.6T49BV4-ProV3.22.55月5日V-FlshV3.2V3.237B三大架构创新DeepSeek-V4V3.2,V4-ProtokenFLOPs27,KVCache10CSA+HCA1MtkensVahDepSek前MLAKVCacheDSADeepSeek-V41M,在CSA(HCA()CSACompressedSparseAttentionKVtop-k(V4-Pro1024,V4-Flash为5128个okesKV滑图表4:CSA核心架构原理DeepSeekHCAHeavilyCompressedAttention128tokensmHC传统的模型层与层之间是通过残差连接(ResidualConnection)通信的。4,DeepSeekManifold-Constrained(流形约Sinkhorn-KnoppDeepSeekMuonAdamWAdamWMuonV4的uonNetoSch(N832-33TpQApe)Ceforc)模型能力综评:AgenticDeepSeekDeepSeek-V4AgentClaude-Opus-4.6-MaxGPT-5.4-xHighGemini-3.1-Pro-HighAgenticDeepSeekV4ClaudeOpus4.6ClaudeOpus4.6的思考模式还有差距。AgenticDeepSeek-V4Agentic图表5:DeepSeek-V4的AgenticSearch与RAG准确度对比DeepSeek闭源模型能力相近。具体得分上,DeepSeek-V4-Pro-Max在研究生级别推理能力测试集GPQAHLEDeepSeek-V4STEM图表6:DeepSeek-V4在知识推理与Agentic能力方面居于前沿DeepSeekDeepSeek-V41MMRCRGemini-3.1-ProClaudeOpus4.6。DeepSeek-V4128K128K1MToken图表7:DeepSeek-V4长上下文能力提升明显DeepSeek完整测评数据如下。可以看到,在与国内其他前沿模型Kimi-K2.6Thinking和GLM-5.1ThinkingProMaxDeepSeek-V4AgentDeepSeek-V4图表8:DeepSeek-V4-Pro-Max与其他前沿模型对比DeepSeekDeepSeek-V4在V4(Wh-ColarTas)复杂企业生产力场景DeepSeek构建了包含30及精细的文档编辑,横跨金融、教育、法律和科技等13个关键行业。由于这些任务具有开放性,自动化指标往往难以捕捉高质量回答的细微之处。因此,DeepSeek图表9:“白领任务”各维上DeepSeek胜率情况 图表10:“白领任务”各细维上DeepSeek得分DeepSeek DeepSeekDeeSee-4-ProMaxu-4.-Ma,DeepSeek-V4-Pro-MaxOpus-4.6-Max二、金融文本分析任务方面,DeepSeek-V4占据绝对优势DeepSeek-V4,CFLUE125译、关系抽取、阅读理解与文本生成五类典型任务。具体细分项目如下:图表11:CFLUE金融应用评估数据集构成任务类型 任务子类型ESG分类/ESGClassification(14)ESG/ESGSentimentAnalysis(3)金融行业分类/IndustryClassification68)金融文本分类/Fin_TC(FinancialTextClassification)金融文本抽取/Fin_RE(FinancialTextExtraction)金融阅读理解/Fin_QA(FinancialQuestionAnswering)金融翻译/Fin_MT(FinancialTranslation)金融文本生成/Fin_TG(FinancialTextGeneration)
金融会议业务分类/ConferenceServicesClassification(3)金融事件分类/EventClassification(27)银行客服对话意图分类/BankingCustomerServiceIntentClassification77)行业情感信息抽取/IndustrySentimentInformationExtraction金融事件抽取/FinancialEventExtraction金融事件因果关系抽取/FinancialEventCausalityExtraction金融事件主体抽取/FinancialEventEntityExtraction---金融英中翻译/English-ChineseTranslation金融中英翻译/Chinese-EnglishTranslation金融术语解释/FinancialTermExplanation会议内容摘要/MeetingContentSummary客服对话摘要/CustomerServiceDialogueSummary资讯标题生成/NewsHeadlineGeneration研报标题生成/ResearchReportHeadlineGeneration图表12
阿里云F1ACCF1BertRougeBertBLEU模型名称
金融文本分类
金融文本抽取
金融阅读理解
金融文本生成
金融翻译准确度 F1分数 总得
保险文档问答
制度政策问答
研报观点问答
财报内容问答
似度
英译中中译英highDeepSeek-V4FlashmaxhighDeepSeek-V4PromaxDeepSeek-V3.2ReasonerDeepSeek-V3.2Speciale75.5653.4855.5355.2366.7362.4254.5139.9752.3925.8426.7916.39324.76115.68523.93871.1152.7477.9467.0566.3248.1530.1560.5466.6754.7557.9574.2252.0835.5562.3222.8221.88024.53077.7855.3058.2278.8174.5745.2037.0536.8336.7059.9830.7319.28631.02460.0053.8650.8555.0668.1638.4955.7425.8711.39921.82071.1151.6351.7164.7261.2844.5251.3328.1219.99127.619模型名称
金融文本分类
金融文本抽取
金融阅读理解
金融文本生成
金融翻译准确度 F1分数 总得
保险文档问答
制度政策问答
研报观点问答
财报内容问答
似度
英译中中译英ClaudeOpus4.766.6735.9550.0455.0569.0637.3633.6055.1227.4418.59524.994Gemini-3.1Flash60.0050.0649.5260.5471.0138.5132.0145.5113.922.3146.124Gemini-3.1Pro73.3347.0656.6579.3467.5641.3342.6452.3821.755.8276.073GPT-5.264.4429.0851.1155.9274.5736.4829.1659.4122.0117.54022.442GPT-5.468.8948.9554.2278.7366.3636.3728.3561.2921.3916.50823.573glm-5.160.0051.6452.7473.6167.9235.9727.7758.4122.964.4502.880kimi-k2.675.5648.0460.3376.7976.2045.0341.6661.9623.5418.83421.307minimax-m2.766.6746.8746.9552.1164.2038.0530.2150.2022.7119.29110.868DeepSeek,Claude,Gemini,GPT,Kimi,GLM,MiniMax在金融应用领域,DeepSeek-V4系列整体保持了在金融文本领域上的绝对优势,其中DeepSeek-V4ProClaudeOpus4.7Gemini-3.1Kimi-K2.6,比GLM-5.1、Minimax-M2.7整体来看,DeepSeek-V4依然是处理中文文本类任务的首要选择。三、DeepSeek-v4复杂任务评测数据分析、国金证券官网爬虫以及股票回测框架构建。这三项任务覆盖了实践中最常见的DeepSeek-v4模型在典型量化研发流程中的适配能力。所有评测任务均为在ClaudeCode中使用DeepSeek-v4-pro完成。Parquet在该任务中,我们向AI提供了一份覆盖2012年至2024年中国A股上市公司机构调研记录的大型Parquet数据文件。该文件包含超过十年的调研活动信息,涵盖机构调研的时间、参与主体、上市公司特征及相关元数据,数据规模较大、结构较复杂。我计划在这个项目中使用Python分析根目录下的parquet文件。20122024我计划在这个项目中使用Python分析根目录下的parquet文件。20122024A情况的整理。parquet析报告。从多个角度对已有数据进行分析,并给出结论。ClaudeCode,DeepSeek在输入指令后,模型经过了10分钟47秒完成了任务。图表14:ClaudeCode+DeepSeek-V4-PRO执行数据分析任务结果ClaudeCode,DeepSeek
我们随即二次输入提示词,明确要求模型补充数据可视化部分。图表15:ClaudeCode+DeepSeek-V4-PRO执行数据分析任务更新结果ClaudeCode,DeepSeek
MarkdownSeaborn图表16:ClaudeCode+DeepSeek-V4-PRO执行数据分析任务更新结果ClaudeCode,DeepSeek
图表17:ClaudeCode+GLM-5.1执行数据分析任务更新结果ClaudeCode,GLML.1DeeSeekGLM-5.1在该任务中,我们向DeepSeek-v4-prometa,AI需要尝使用python爬取国金证券研究业务的报告及内容:国 金 证 券 研 究 业 务 的 报 告 网 站 为 https://使用python爬取国金证券研究业务的报告及内容:国 金 证 券 研 究 业 务 的 报 告 网 站 为 https:///main/invest-advisory/research.html你需要为我爬取网页中的报告信息(报告标题、发布时间、报告类
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年医院年终工作计划
- 基于无氧阈的心脏康复运动处方个体化方案
- 基于情景分析的药品供应链成本预案
- 2026年幼儿园下半年月活动计划安排
- 2026年年度安全生产教育培训计划
- 2026年销售工作下半年计划
- 2026年国庆活动安排方案设计及流程
- 2026年年度安全生产检查计划
- 基于作业成本法的科室核算
- 2026年消防工作全年计划方案
- 中医病证诊断疗效
- GB/T 2970-2016厚钢板超声检测方法
- 智能农业实验报告
- GB/T 23445-2009聚合物水泥防水涂料
- 人工神经网络HOPFIELD神经网络
- 中小学生励志主题班会课件《告诉你孩子:几年的放纵-换来的是一生卑微和坎坷》
- 2022年山东司法警官职业学院单招综合素质考试笔试试题及答案解析
- 022pet热灌装饮料生产工艺及品质控制
- (完整版)英语高频词汇800词
- 墙板安装工艺流程
- 三年级下册语文教案- 习作八 这样想象真有趣 人教部编版
评论
0/150
提交评论