舟行万里智启新象 -火山方舟与豆包大模型有力支撑AI应用落地_第1页
舟行万里智启新象 -火山方舟与豆包大模型有力支撑AI应用落地_第2页
舟行万里智启新象 -火山方舟与豆包大模型有力支撑AI应用落地_第3页
舟行万里智启新象 -火山方舟与豆包大模型有力支撑AI应用落地_第4页
舟行万里智启新象 -火山方舟与豆包大模型有力支撑AI应用落地_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

舟行万里,智启新象Copyright。2024VolcanoEngine.Allrightsreserved.大模型时代的背景和挑战Copyright。2024VolcanoEngine.Allrightsreserved.大模型时代下的机遇与挑战随着模型的不断发展,将来每个垂域一定会有功能强大和功能独特的超级应用,甚至有一个更加强大且通用超级应用诞生,很可能会产生新的一批现象级企业,也会有一些企业随着大模型的兴起而陨落。互联网时代的革命PC互联网移动互联网〉3G4G5G〉大模型〉对空间的突破对时间的突破对效率和体验的革新大模型如何帮企业省钱、赚钱?研发和应用成本如何与收入平衡?VS如何跟上模型的发展节奏?产品和技术壁垒在哪里?大量应用和场景正在被重构大模型如何帮企业省钱、赚钱?研发和应用成本如何与收入平衡?VS如何跟上模型的发展节奏?产品和技术壁垒在哪里?大量应用和场景正在被重构沉没数据正在被激活,产生新的价值模型的快速迭代给企业的技术更新提供更强的动力模型的潜力和流量为企业带来强大助力企业策略升级,更追求落地,追求ROI经过2023-2024年的初步探索,2025年更多企业在大模型的策略上,更追求落地和ROI不烧钱实现企业爆发式增长围绕数据沉默成本变成不烧钱实现企业爆发式增长围绕数据沉默成本变成新业务增长点小步快跑追求量级的效率提升诞生更多新鲜的赚钱应用模型效果需要有好的基础大模型做支撑才能解决复杂问题大模型场景落地的关键挑战模型效果需要有好的基础大模型做支撑才能解决复杂问题推理成本推理成本只有低成本的推理服务才能让大模型被广泛应用落地难度需要更多工具、平台和应用帮助企业做好场景落地落地难度需要更多工具、平台和应用帮助企业做好场景落地火山引擎如何解决这三个问题?更低价格更易落地更强模型更低价格更易落地更强模型Copyright。2024VolcanoEngine.Allrightsreserved.Copyright。2024VolcanoEngine.Allrightsreserved.真实业务场景,每日万亿级tokens打磨好模型3030万亿+日tokens使用量30+行业外部企业联合共创50+内部真实业务场景大模型应用加速渗透企业生产场景SNMSUNGSNMSUNGOPPOOPPOnetnetu美图豆包大模型1.6Doubao-Seed-1.6电商场景巡检场景更强模型效果,擅长处理复杂任务电商场景巡检场景模型优势思考长度调节,分为Miminal、Low、Medium、High四种模式支持多模态256K长上下文豆包大模型1.6Doubao-Seed-1.6-lite更高性价比,常见任务的最佳选择模型优势思考长度调节,分为Miminal、Low、Medium、High四种模式支持多模态256K长上下文71.9264.0471.9264.0483.3384.6783.3384.6780.6MMLUproGPQAdiamondDoubao-Seed-1.5-proDoubao-Seed-1.6-lite豆包大模型1.6Doubao-Seed-1.6-flash复杂场景物品定位视频识别与时空定位复杂场景物品定位视频识别与时空定位模型优势极致速度支持多模态256K长上下文豆包大模型1.6在线教育互动娱乐Doubao-Seed-1.6-thinking在线教育互动娱乐思考能力强化支持多模态模型优势思考能力强化支持多模态模型优势256K长上下文豆包视觉理解模型细节推理目标捕捉Doubao-Seed-1.6-vision细节推理目标捕捉模型优势主动调用工具视觉理解更精准支持ResponsesAPI,应用开发更高效更高模型性价比豆包角色扮演模型,个性化的角色创作个性化的角色创作能力,更强的上下文感知和剧情推动能力,满足灵活的角色扮演需求。上下文感知强:自适应不同用户的扮演或陪伴需求剧情推动能力强:主动牵引用户,引导聊天、生动有趣游戏NPC上下文感知强:自适应不同用户的扮演或陪伴需求剧情推动能力强:主动牵引用户,引导聊天、生动有趣游戏NPC模型优势应用场景…………是支持豆包APP、猫箱APP的主力模型之一5秒复刻高相似度跨语种迁移5秒即可实现声音1:1克隆,对音色相似度和自然度进行高度还原,支持声音的跨语种迁移仅需5秒即可复制一个高保真音色高度还原说话人声音特征和口音6大语种迁移,可模拟当地人表达超高识别率上下文感知多5秒复刻高相似度跨语种迁移5秒即可实现声音1:1克隆,对音色相似度和自然度进行高度还原,支持声音的跨语种迁移仅需5秒即可复制一个高保真音色高度还原说话人声音特征和口音6大语种迁移,可模拟当地人表达超高识别率上下文感知多方言支持更高的准确率及灵敏度,更低的语音识别延迟,支持多语种的正确识别在多个公开测试集中与国内公开发布的语音识别大模型相比,错误率降低10%-40%利用上下文信息进行推理,召回率提升15%支持一个模型识别多种中国方言,包括上海话、闽英文西班牙语葡萄牙语豆包语音合成模型能够根据上下文,智能预测文本的情绪、语调等信息,并生成超自然、高保真、个性化的语音,以满足不同用户的个性化需求更强的互动拟人感准呈现与场景匹配的语气、语调、停顿等,让交互充满真实沟通的自然感更饱满的情感演绎深度理解文字背后的情绪延续与变化,声音的情绪承接更饱满连贯更精准的指令遵循实现语速、情绪、声线、风格、音调的精准指令控制,提升语音表现可控性沉浸式听书视频配音语音导航跨语种内容生产游戏配音在线教育企业客服沉浸式听书视频配音语音导航跨语种内容生产游戏配音在线教育企业客服应用场景陪伴式AI交互豆包音乐模型,3秒生成高品质音乐字节跳动推出的音乐创作大模型,能够通过文本描述或图片,轻松生成一首包含旋律、歌词和演唱的3分钟高品质音乐作品,并支持10余种不同的风格和情绪的随心选3秒生成音乐3秒生成音乐模型优势音频token模型优势音频token、符号音乐token和声码器latent创作门槛低歌词更精准旋律更多样演唱更真实创作门槛低歌词更精准旋律更多样演唱更真实音乐创作音乐辅助教育广告音乐应用场景游戏电影电视剧配乐音乐创作音乐辅助教育广告音乐应用场景游戏电影电视剧配乐豆包同声传译模型提供超低延时且自然高质量的实时翻译,支持跨语言同音色翻译,打破沟通中的语言壁垒0样本声音复刻采样即可复刻声音,极低的语音延迟翻译延迟低至2-3降低超60%,实现“边听边说”对话超自然智能调整输出节奏,适配不同语言特性,0样本声音复刻采样即可复刻声音,极低的语音延迟翻译延迟低至2-3降低超60%,实现“边听边说”对话超自然智能调整输出节奏,适配不同语言特性,超长信息仍能保证自模型优势应用场景豆包图像编辑模型更强的图像编辑能力,大幅提升修图质量,解锁更多创新场景更强图像保持能力更强图像生成质量模型优势更强指令遵循能力更强图像保持能力更强图像生成质量模型优势更强指令遵循能力Prompt:帮我把照片里的场景变成冬天,并且覆盖上白雪Prompt:把“FAQ”换成“GHZ”Prompt:把场景替换成秋日枫树林,让女孩换上焦糖色针成装着枫叶的竹篮,把头上的草帽换成红色的毛线帽……应用场景豆包图像创作模型Doubao-Seedream-4.0多图灵活创作4K高清直出自适应画面比例秒级成图与文字渲染模型优势超强主体一致性多图灵活创作4K高清直出自适应画面比例秒级成图与文字渲染模型优势超强主体一致性Prompt:Prompt:Prompt:将海报分别改为上下排版、左右排版、包围式排版、四角式排版、三角形排版、中心排版的6种不同排版……应用场景……应用场景豆包视频生成模型Doubao-Seedance-1.0-pro通过精准语义理解、强大动态及运镜能力创作高质量视频,支持文本和图片生成两种模式多动作及随心运镜稳定运动与真实美感模型优势无缝多镜头叙事多动作及随心运镜稳定运动与真实美感模型优势无缝多镜头叙事电商广告影视创作…电商广告影视创作…应用场景娱乐游戏豆包视频生成模型Doubao-Seedance-1.0-lite视频生成模型系列的小参数量版本,兼顾效果、速度、性价比。更合理的运动交互更丰富的影视级运镜模型优势更精准的指令遵循更合理的运动交互更丰富的影视级运镜模型优势更精准的指令遵循运镜流畅自然人物互动合理画质超清细腻运镜流畅自然人物互动合理画质超清细腻电商广告影视创作动态壁纸电商广告影视创作动态壁纸…应用场景娱乐特效豆包UI-TARS模型ComputerUseAgent使用剪映将图片变为视频,添加音频发布MobileUseAgent通过12306自动完成高铁车票下单ComputerUseAgent使用剪映将图片变为视频,添加音频发布MobileUseAgent通过12306自动完成高铁车票下单领先的模型效果高执行效率更低延迟更高吞吐模型优势原生GUIAgent领先的模型效果高执行效率更低延迟更高吞吐模型优势用户提问“你好,我昨天下午在你们平台下的订单,现在想查下订单到哪个阶段了,大概什么时候能发货呀?智能模型路由SmartModelRouter用户提问“你好,我昨天下午在你们平台下的订单,现在想查下订单到哪个阶段了,大概什么时候能发货呀?用户提问“我上周三买了你们的‘冰箱+洗衣机家电组合套餐’,当时用储蓄卡付了全款,还额外加钱选了‘上门安装+3年延保’服务。现在问题是:1.冰箱送到后发现门体有划痕,我当天就拍了照片找客服申请换货,但客服说要先等‘售后质检’,这都3天了还没动静,质检一般要多久?2.洗衣机没问题,但我今天突然发现套餐里承诺的‘免费赠送给的厨房小家电’没收到,客服说赠品和主商品分开发,但我查不到赠品物流;3.我现在想把‘3年延保’换成‘5年的’,补差价就行,但客服说延保一旦下单不能改,可我记得下单时页面写了‘7天内可升级’,这到底以哪个为准?4.如果冰箱换货还要等很久,我能不能先退掉冰箱,只留洗衣机和延保?退款的话,储蓄卡付的钱会不会扣手续费?赠品没收到要不要一起退?”广泛模型支持模型路由ModelA广泛模型支持模型路由ModelA意图识别偏好选择ModelB意图识别偏好选择ModelBModelModelC14%14%效果优先模式效果:相比直接使用DeepSeek-V3.1效果优先模式效果:相比直接使用DeepSeek-V3.1平衡模式成本优先模式DeepSeek-V3.177.1%ModelNModelN0202Copyright。2024VolcanoEngine.Allrightsreserved.更强模型,更低价格,推动大模型在业务场景中落地更低的价格豆包大模型1.6统一定价模式下降7元/百万tokens7元/百万tokens7元/百万tokens综合成本对比:3:12.6元/百万tokens豆包大模型1.6豆包1.5豆包大模型1.6豆包1.5·深度思考模型DeepSeek-R190%的输入长度在0-32k以内元/百万元/百万tokens6.6Doubao-Seed-1.5-proDoubao-Seed-1.6-Doubao-Seed-1.5-proDoubao-Seed-1.6-lite更高的流量业界最高初始TPM和RPM支持大流量、高并发,确保业务高峰时稳定运行RPM300001200Qwenmax1001200Qwenmax100ERNIE4.5-8k-previewGPTGPT5TPM5000000TPM1000000500000100000500000GPT5ERNIE4.5-8k-previewQwenmax豆包大模型1.6备注:TPM(每分钟tokens)RPM(每分钟请求数)数据来源各产品官网,时间截止2025.10更灵活的批量推理方案,支持用户精细化运营(tokensperday)支持PrefixCache命中部分价格再批量推理相比在线推理价格降低50%(tokensperday)支持PrefixCache命中部分价格再批量推理相比在线推理价格降低50%↓x40%↓两种批量推理接入模式任选提交任务,从存储中批量读取数据,方便存量数据刷库直接调用模型接口,BatchonChat模式0改造成本,一秒接入超大的推理资源池,保障每日万亿Token批量推理需求超大的推理资源池,保障每日万亿Token批量推理需求对于考虑成本和数据量、时效性要求较低的在线业务用大模型发挥企业存量数据价值,处理存量数据的离线业务超低延迟的小时级推理保障包,保障超大规模业务稳定用户按需刻画所需资源,无需为业务波谷付费,节约成本15ms相较在线业务延迟下降高达20ms50%以Doubao-1.5-pro用户按需刻画所需资源,无需为业务波谷付费,节约成本15ms相较在线业务延迟下降高达20ms50%以Doubao-1.5-pro为例TPOT低至以DeepSeekR1为例TPOT低至刚性兑付库存,不担心大盘水位波动造成的服务质量波动灵活自定义的模型单元,实现更高资源利用率更精细的控制首Token时延、模型吐字部署方式选择弹性规则设置应用场景:精调后模型推理场景更快更省,上下文缓存帮助客户降低延迟和使用成本Context上下文缓存:更快,更省减少多轮对话的延迟,改善用户体验减少多轮对话的延迟,改善用户体验延迟下降50%某客户前缀命中的场景中,端到端延迟从2.7s降低到1.14s缓存命中部分2折,节省高达80%未使用cache费用使用cache费用输入输出输入(miss)输入(hit)存储输出无须重复对话,即可保留上下文Cache+RAG构建更有效的记忆方案Cache+ResponseAPI让Agent构造更Cache+RAG构建更有效的记忆方案PrefixPrefixcache助力一致性、高频命中场景API原生上下文管理支持多轮和多模态的链式上下文管理…………信息抽取数据分析信息抽取数据分析SessionSessioncache助力短时效、上下文记忆场景扩展更多模型使用Cache能力支持视觉理解模型、深度思考模型等更多模型…………客服助手客服助手社交陪聊0303如何解决大模型落地难的问题?Copyright。2024VolcanoEngine.Allrightsreserved.火山方舟,围绕一个中心、四个支撑保障模型服务落地一个中心四个支撑强劲的系统承载力,是充沛算力、推理层优化、系统调度能力的乘积海量资源充沛的公有云GPU资源池,资源潮汐调度,保障流量高峰业务稳定海量资源瞬时可用创建模型接入点后瞬时可用,路瞬时可用极致弹性分钟级完成千卡扩缩容,有效支撑突发流量和业务高峰,为企业降低成本极致弹性全周期安全可信,会话无痕03、环境强隔离03、环境强隔离通过多维度强制隔离,杜绝外部风险入侵和内部数据泄露可信容器沙箱细粒度网络隔离可信数据访问代理白屏化运维04、操作可审计影响用户数据资产的所有操作均有日在风险沙箱登录日志沙箱连接日志沙箱容器逃逸日志vArmor拦截日志KMS访问日志接入点访问日志02、数据高保密实现对用户数据的机密性保护保证用户数据非本人不可见密文从安全沙箱直写至分布式存储支持用户自定义密钥保证从用户到方舟安全计算环境之间是“端到端”的加密通信通道,防止用户数据在传输链路中被截获网络层的传输加密应用层的会话加密直接拦截涉及底线、红线类问题正向引导价值观、地域、思政类问题准确回答重大事件、历史知识、英烈等凭模型能力回答通识性问题全流程精准安全防控,内容无忧直接拦截涉及底线、红线类问题正向引导价值观、地域、思政类问题准确回答重大事件、历史知识、英烈等凭模型能力回答通识性问题核心核心价值观歧视内容商业违法侵犯他人合法权益无法满足特定服务颠覆国家政权颠覆国家政权危害国家安全危害国家安全煽动分裂国家煽动分裂国家…………信仰歧视信仰歧视年龄歧视年龄歧视…………侵犯他人侵犯他人知识产权违反商业道德违反商业道德泄露他人泄露他人商业秘密…………危害他人危害他人身心健康侵害他人侵害他人名誉权侵害他人侵害他人………………02、丰富的业务治理经验深耕业务治理场景,有丰富的风险对抗经验,海量的治理数据沉淀0102、丰富的业务治理经验深耕业务治理场景,有丰富的风险对抗经验,海量的治理数据沉淀01、全面的风险识别机制04、场景化的定制策略细化定制策略,能够针对细分的和业务诉求,定制化策略,更贴务发展的内容安全诉求针对生成式人工智能服务,有全面的内容安全识别能力,能提供妥善的处置建议03、专业的运营机制业务安全,持续推动业务增长场景合业字节跳动专业算法服务分析业务需求交付AI服务案例在某汽车厂商的智能座舱场景,字节跳动的算法工程师辅助客户共建大模型的解决方案。包括建立评测集,PromptEnginnering(提示工程),字节跳动专业算法服务分析业务需求交付AI服务案例在某汽车厂商的智能座舱场景,字节跳动的算法工程师辅助客户共建大模型的解决方案。包括建立评测集,PromptEnginnering(提示工程),精调数据建设、模型调优、联网、并在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论