计算机行业国内顶尖大模型巡礼:MiniMax_第1页
计算机行业国内顶尖大模型巡礼:MiniMax_第2页
计算机行业国内顶尖大模型巡礼:MiniMax_第3页
计算机行业国内顶尖大模型巡礼:MiniMax_第4页
计算机行业国内顶尖大模型巡礼:MiniMax_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内容目录一、全栈自研大模型,打造全球领先AGI生 3二、技术前瞻全面转向MoE,超越GPT3.5、追赶GPT4 7三、万卡 力集群为基,平 及产品已获全球客户广泛认可 12么、风险 示 18表目录表1:MiniMax技术理念 3表2:公现有大模型部分布局 4表3:MiniMax开放平 文本大模型接口计费标准 4表4:MiniMax开放平 语音大模型接口计费标准 5表5:星野产品界面 5表6:海螺AI产品界面 6表7:MiniMax历史融资 6表8:GPT用户数高增长 7表9:MoE模型架构 8表10:MoE模型较Dense模型从指令微调中受益更多 8表11:GPT-4性能对比 9表12:Mixtral8x7b性能对比 9表13:Gemini1.5百万字符的上下文窗口远超 类模型 10表14:abab6.5测试结果 11表15:黄仁勋于英伟达GTC大会上表示GPT或采用1.8万亿参数的MoE结构 11表16:MiniMax开放平 部分合作伙伴 12表17:WPS文字一键起草工作周报 13表18:WPS文字秒 炼分析文档重点 13表19:WPS演示一键更换配色方案美化PPT 13表20:WPS演示自动生成演讲备注和演讲稿 13表21:WPSPDF生成可追文档概要 13表22:WPSPDF支持 文翻译与 炼 13表23:WPS表格调整表格陈列格式 14表24:WPS表格根据用户要求自动应用公式 14表25:MiniMax药师AI助手框架 14表26:MiniMax医生AI助手框架 14表27:MiniMax与高济健康签订合作 15表丰富的角色创建功能和对话 验 15表卡牌 荐 16表星野海 版)AppStore排名趋势 16表31:海螺AI阅读并分析MiniMax公众号文章 17表32:海螺AI语音交流界面 17表33:海螺AI 供一系列AI声音选择 17表34:海螺AI 供的文字版语音交流记录 18一、全栈自研大模型,打造全球领先AGI生态成立于20211)MiniMax202112Inligeceihrone202210CAIGlowGow403年3BMinMax2023年6C端市场的虚拟扮演社交软件CharacterAI。AI20239月,该软件的中文版星野登录AppStore20238月底,MiniMaxabab1)20239月,面向C端的海螺AI202311月,MiniMaxabab-speech-0120241月底,400家企业用户接入MiniMax2024年1全量发布大语言模型MoE大语言模型。在MoEabab6位时间内能够训练足够多的数据,计算效率也可以得到大幅提升。改进了abab5.5在处理更复杂、对模型输出有更精细要求场景中出现的问题。20244MiniMax发布国内首个万亿参数的MoEabab6.5。abab6.5系abab6.5abab6.5sabab6.5200ktokensabab6.5sabab6.5200ktokens13图表1:MiniMax技术理念资料来源:MiniMax官网,图表2:公司现有大模型部分布局资料来源:MiniMax官网,B端C端广泛布局,开放平台为企业提供API服务,星野、海螺为C基推出生产力工具海螺AIAI原生应用。MiniMax开放平台为企业和开发者提供安全、灵活、可靠的API服务,助力快速搭建AI应用。1、MiniMax开放平台:提供基于大语言模型的丰富API能力,以满足不同企业客户及专业开发者的需求。计价方式简单灵活,按量计费,满足不同业务规模。在文本大模型方面,MiniMaxChatCompletionPro、ChatCompletionV2、ChatCompletion、Embeddings(Retrieval()收费标准主要基于token数计费,不同服务和使用量对应不同的单价。例如,ChatCompletionPro0.1元/千tokens0.015/千tokens0.005元/tokensEmbeddings0.0005/tokenstokenepoch图表3:MiniMax开放平台文本大模型接口计费标准ChatCompletionChatCompletion:基于自然语言交互的文本生成能力接口,

计费项 单价abab6 0.1abab60.1元/tokensabab5.5 0.015元/tokensabab5.5s0.005abab5.5s0.005元/tokensabab5.5 0.015元/tokens适用于人设对话以及生产力等典型文本生成文本场景。适用于人设对话以及生产力等典型文本生成文本场景。0.005元/tokensabab5.5sEmbeddings(向量化):通过向量化技术将文本转化为高维索、知识库检索等能力。0.06元/tokens0.06元/tokensabab5.5(训练)Finetune(微调):除了提供定制模型微调服务,微调接口支持用户构造定制数据集对预训练模型进行多样化微调,使大模型更适合特定场景。资料来源:MiniMax官网,(注:abab6.5暂未公布更新)

embo-01 0.0005元/tokensembeddingtoken0.001embeddingtoken0.001元/tokens存储(向量数据) 1.5元/GB/天abab5.5(推理) 0.05元/千tokensabab5.5sabab5.5(推理) 0.05元/千tokensabab5.5s(推理) 0.015元/千tokens在语音大模型方面T2AT2AproT2AlargeT2Astream以及voice_clone()(1个汉字算21个字符T2Apro和T2Astream接口均以5元/万字符的价格计费,而T2Alarge则以2元/万字voice_clone0.6/tokens5元/图表4:MiniMax开放平台语音大模型接口计费标准计费项接口说明单价T2A支持音量、语调、语速调整和混音功能5元/万字符T2AproT2A5000字符输入,支持比特率、采样率相关参数调整特性,支持5元/万字符音频时长、音频大小等返回参数,支持字幕返回。T2AlargeT2A1000万字2元/万字符语音合成的超长文本场景。T2Astream 通话、语音聊天等需求流式的相关场景。

5元/万字符voice_clone(快速复刻

TTS可以在极短时间内完成音色复刻,并通过大语言模型加持,使复刻后的音色与原音色进行高质量还原,从而满足客户需求。

本接口暂时只提供邀请制客户使用。资料来源:MiniMax官网,Talkie星野:MiniMaxAI操作上,星野提供了丰富的自定义功能,用户可以创建自己的智能体,选择不同的音色和人物形象,以及自定义对话风格。图表5:星野产品界面资料来源:星野官网,3、海螺AI:MiniMax面向C端的AI生产力工具,致力于成为每一个人的AI伙伴。用户可以提出问题获得详尽的解决方案,上传文件成摘要笔记,粘贴网址抽取文章核心要点,甚至模拟语音通话和AI外教练习口语。图表6:海螺AI产品界面资料来源:海螺AI官网,创始人为商汤前副总裁闫俊杰,核心团队技术背景强大。1)在核心团队方面,MiniMax稀宇科技创始人为前商汤科技副总裁、商汤科技研究院副院长、通用智能技术负责人闫俊杰。2)在MiniMaxMiniMaxMiniMax闫俊杰100GoogleScholar30,000次,h-index达75。估值超25202435MiniMax超过25亿美元。图表7:MiniMax历史融资公布日期投资方交易金额融资轮次2021/12/31云启资本未披露天使轮2022/7/25

明势资本、米哈游、高瓴创投、IDG资本

未披露 Pre-A轮2023/5/31 腾讯资 超2.5美元 A轮2024/3/3 阿里巴 未披露 B轮资料来源:证券之星,天眼查,(根据公开消息,与实际情况可能存在差异)二、技术前瞻全面转向MoE,超越GPT3.5、追赶GPT4GPT引爆AIGC11首次推ChatGPTdemo20243月1.8OpenAI16访问。2)GPT2Gemini1.5Anthropic年3月更新至CladeMea的Llm(4年4Lama)MinstralMixtral8x7B图表8:GPT用户数高速增长资料来源:ExplodingTopics,目前业内大模型主要包括两种流派,Dense与MoE。1)在传统的Dense模型中,所有的参数都会对所有的输入数据进行处理。2)在MoE模型中,用户可以仅针对整个系专注于计算机视觉方面的MoE简单来说,MoE模型的核心在于将多个“专家”神经网络模型合并为一个更大的模型,以此来提高模型的准确性和性能。从架构来看,MoE模型包含以下几个关键部分:2)门控网络:1)2)路由器:1)在某些MoE图表9:MoE模型架构资料来源:HuggingFace,相比Dense架构,MoEMoEDenseDense3)oEDne模型。图表10:MoE模型较Dense模型从指令微调中受益更多资料来源:HuggingFace,全球主流大模型均已采用,MoE已成为业内共识。GPT-4:20236月,美国计算机专家GeorgeHotz推断8个MoE1.2(8x2200。20243GTCGPT确实采用MoE1.8万图表11:GPT-4性能对比资料来源:OpenAI官网,128MoEMixtral8x7b上的所有其他开放模型,且是第一个与图表12:Mixtral8x7b性能对比资料来源:MistralAI官网,Gemini1.5:20242月,谷歌发布Gemini1.5MoEMEGmini5图表13:Gemini1.5百万字符的上下文窗口远超同类模型资料来源:谷歌官网,MiniMax从2023年6月起全面转向。2023abab5.5GP-35abb.5MiniMax20236MoE20241MoEabab6,4MoEabab6.5。然而在MoEMoEabab6.5测评能力超越,全面接近信公众号,其对abab6.5、abab6.5s、、、Gemini1.5ProClaude3Opus、Claude3SonnetClaude3Haikuabb65均大致与GPT4GPT3.5200ktoken(针891abab6.5图表14:abab6.5测试结果资料来源:MiniMax官方微信公众号,GPT-4GTC采用的或是MoE1.8abab图表15:黄仁勋于英伟达GTC大会上表示GPT或采用1.8万亿参数的MoE结构资料来源:YouTube,英伟达,三、万卡算力集群为基,平台及产品已获全球客户广泛认可1、算力储备国内领先,万卡集群保证训推质量AIGCH100GPT3.5H100提升数倍至十倍GPT4或对应数万张A100,GPT5或对应数万张H100。截至2023大。1)20231228AI大模型企业MiniMax算力资源池。2)MiniMax与火山引擎合作建立了超大规模实验平台,实现千卡级常态化训练;超大规模推理平台有万卡级别的跨云高效计算系统,支撑单日过亿次调用。2、国内顶尖大模型开放平台,服务客户数超2万家2万、每日token量已达百亿。20234月,MiniMax20,0002024116abab6MiniMaxtoken图表16:MiniMax开放平台部分合作伙伴资料来源:MiniMax官网,MiniMax开放平台的典型客户案例包括但不限于办公、社交、医疗等多行业。WPSAI正式接入了MiniMax模型能力的AIWPSWPSAIWPSWPS文字:1)2)3)图表17:WPS文一键草工周报 图表18:WPS文秒速炼分文档重点资料来源:WPSAI官网, 资料来源:WPSAI官网,WPSPPT图表19:WPS演一键换配方案化PPT 图表20:WPS演自动成演备注和讲稿资料来源:WPSAI官网, 资料来源:WPSAI官网,WPSPDF:1)快速生成文档概要,且可追溯至原文;2)图表21:WPSPDF生成追溯档概要 图表22:WPSPDF支持文翻与提炼资料来源:WPSAI官网, 资料来源:WPSAI官网,WPS图表23:WPS表调整格陈格式 图表24:WPS表根据户要自动应公式资料来源:WPSAI官网, 资料来源:WPSAI官网,在医疗领域中,MiniMax开放平台与高济健康合作,优化医疗咨询服务,提升效率与专业性。MiniMax业提供了解决方案,通过协助药师定期回访并回答患者的专业问题,极大提高了服务效率和专业水平。凭借大模型强大的逻辑能力和丰富的知识储备,MiniMax能够在强思维模式下精确回答医疗领域的专业问题,并支持长记忆检索和知识库问答,为医疗咨询领域提供定制化的行业解决方案。图表25:MiniMax药师AI手架 图表26:MiniMax医生AI手架资料来源:MiniMax公众号, 资料来源:MiniMax公众号,外接iax.”是高济健康与MiniMaxMiniMax-abab80200。图表27:MiniMax与高济健康签订合作资料来源:MiniMax公众号,未来,MiniMax还将提供标准化工具链,支持客户自动化构建医疗智能助手。我们认为,MiniMax的这一趋势预计将会延续到其他行业,如办公、社交等,通过提供标准化的工具链,支持各行各业自动化构建智能助手,推动千行百业的数字化、智能化转型。3、C端标杆应用数据亮眼,商业化潜力广阔lieCaatraiAI形象。UGCAI-0ar会直接用AI2D2))akie图表28:Talkie丰富的角色创建功能和对话体验资料来源:Talkie官网,AICGAI2)AICG图表29:Talkie卡牌推荐资料来源:Talkie官网,宣发鼓励UGC9和创作更多AI10005Amazon电商202361627日开GooglePlay97GooglePlay52024422AppStore304.5根据MiniMax20244图表30:Talkie(星野海外版)AppSt

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论