豆包大模型家族更新!豆包每日Token调用量达30万亿,大涨523倍

作者 | 程茜

编辑 | 李水青

智东西10月16日报道,今天,在FORCE LINK AI创新巡展·武汉站上,火山引擎升级了豆包模型1.6,原生支持4种思考长度,并发布豆包模型1.6 lite、豆包语音合成模型2.0、豆包声音复刻模型2.0三款模型。

为了平衡企业在不同场景下对模型效果、时延、成本的不同需求,豆包大模型1.6支持Minimal、Low、Medium、High四种思考长度火山引擎总裁谭待称,这是国内首个原生支持“分档调节思考长度”的模型。

此外,为了帮助企业平衡模型效果与成本,火山引擎还发布“智能模型路由”方案,支持豆包大模型、DeepSeek、Qwen、Kimi等多种主流模型的智能选择调用。

豆包团队透露,以DeepSeek为例,经过实测,在效果优先模式下,智能路由后,模型效果相比直接使用DeepSeek-V3.1提升14%;在成本优先模式下,在实现DeepSeek-V3.1相似效果的条件下,模型的综合成本最高下降超过70%。

火山引擎总裁谭待透露,去年5月发布至今,豆包大模型的每日Token调用量达到1200亿,今年5月,达到1.6万亿,9月达到30万亿每天,实现了253倍的增长。在企业市场,根据IDC的报告,今年上半年火山引擎在中国公有云的这个大模型的服务调用量上居第一,市场份额达到49.2%。

一、国内首个分档调节思考长度模型,低强度模式总Token输出下降超70%

火山引擎总裁谭待提到,今年AI有三个比较明显的趋势,第一是具备多模态理解能力的深度思考模型不断,第二是视频图像等模型的能力已经逐步达到生产级水平,第三是企业级Agent正逐步走向成熟。

今年6月,豆包推出具有多模态理解能力的深度思考模型Doubao-Seed-1.6。

综合来看,Doubao-Seed-1.6实现了开启思考模型后,模型效果提升31%,但这也增加了推理成本,实时场景下CoT Tokens占总数出比例超77%,所以有82%的企业选择不打开深度思考模式。

基于此,昨天,豆包推出Doubao-Seed-1.6-1015新版本,支持分档深度思考长度,企业可以根据需求在不同场景下选择相应思考长度。

低强度模式下,Doubao-Seed-1.6-1015新版本可以在相同模型效果下,使得总输出Tokens下降77.5%,深度思考时间下降84.6%。

此外,豆包还发布了Doubao-Seed-1.6-lite,该模型尺寸更小,效果超越Doubao-Seed-1.5-Pro。0-32K上下文区间内,Doubao-Seed-1.6-lite总和成本相比Doubao-Seed-1.5-Pro下降了53%。

二、发布语音合成、声音复刻新模型,新推智能模型路由方案

在多模态模型方面,火山引擎此前发布最新图像创作模型Seed Dream 4.0,提升了文生图、图生图、图生图能力。一张照片生成对应手办、一张照片生成手帐等。

豆包语音模型已经逐步覆盖从语音合成到语音识别、声音复刻、实时语音、同声传译等不同的领域,以智能终端为例,目前豆包语音模型已经覆盖了超过4.6亿台的智能终端。

今天发布豆包语音合成模型2.0和声音复刻模型2.0,其采取对话式合成模式,并增强了在情感和演绎指令遵循。语音合成模型针对小学到高中全阶段的学科基本对应的公式,合成准确率达到90%以上。

对比传统的软件,Agent能端到端处理任务,自主解决更复杂问题,在编程方面,火山引擎不断开源开源矩阵,其国内首个AI原生IDE平台TRAE和AI Agent开发平台扣子已经服务了数百万开发者。

为了帮助企业进行智能模型选择,火山引擎还推出了智能模型路由方案,该方案支持不同的模式,如平衡模式、效果优先模式、成本优先模式,定好不同模式的目标之后,模型就会根据对应的请求自动选择最合适的模型。该平台支持豆包全系列模型以及DeepSeek、Qwen、Kimi等业界主流开源模型。

豆包团队透露,以DeepSeek为例,经过实测,在效果优先模式下,智能路由后,模型效果相比直接使用DeepSeek-V3.1提升14%;在成本优先模式下,在实现DeepSeek-V3.1相似效果的条件下,模型的综合成本最高下降超过70%。

三、将推扣子空间企业版,满足企业个性化定制需求

为了帮助企业做好AI转型,火山引擎还将Agent和传统的各种存量系统进行了打通,通过HiAgent平台,构造了一+N+X的体系,帮助企业打造统一Agent界面,包含1个统一交互入口、N个企业通用智慧助手以及X个企业定制智能体应用。

2024年,低代码Agent开发平台扣子发布,其中预置智能客服助手、写作助手等模版,还会提供插件、可视化界面、数据库等各项功能。

今年4月,火山引擎发布面向办公场景的AI Agent产品扣子空间,目前已经服务了上百万知识工作者,包括股票分析师、老师、电商运营等。

接下来,扣子空间计划推出企业版,满足企业的个性化需求。

其有两大特点,一是定制化的Agent,企业可以自定义更加符合自身业务需求的个性化智能体,二是MCP开发,企业可以通过API为自己的Agent增加私有化的技能,三是数据连接器、企业知识库,可以帮助企业链接内部数据,最后是企业级系统管理,为企业提供不同权限管理模式。

结语:火山引擎正帮企业进一步扫清落地障碍

火山引擎此次更新凸显出的关键是,其正在帮助企业更便捷、快速且在成本可控的程度下用上大模型,豆包大模型1.6版本首创四档思考长度调节功能,实现了模型性能与成本控制的动态平衡。

此前,Agent的商业化落地受困于高Token消耗带来的成本压力,此次火山引擎的更新为这一瓶颈提出了有效路径,或许可以加速Agent的规模化应用。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平