1万美元=4个Agent全年无休 MiniMax M2.5重构成本模型,AI规模化落地的临界点到了?

春节AI(人工智能)大战,MiniMax(HK00100,股价680.0港元,市值2132.72亿港元)没有缺席。

2月12日,MiniMax正式上线最新旗舰编程模型MiniMax M2.5。据悉,作为全球首个为Agent(智能体)场景原生设计的生产级模型,其编程智能体性能(Coding&Agentic)比肩国际顶尖模型,直接对标Claude Opus 4.6,支持PC(个人电脑)、App(应用程序)、跨端应用的全栈编程开发。

或受此消息影响,截至2月13日港股收盘,MiniMax股价上涨15.65%,总市值2132.72亿港元。

同样值得注意的是,M2.5-lightning版本支持100 TPS(每秒事务处理量)以上输出速度,是主流模型的2倍左右;输入价格约0.3美元/百万Token(令牌/词元),输出价格约2.4美元/百万Token。

若按每秒输出100 Token计算,连续运行一小时成本约1美元;若按50 Token计算,成本约0.3美元。这意味着,1万美元理论上可支持4个Agent连续工作一年。

春节前夕,各家AI企业的押注方向已经出现区别。当有的玩家押注多模态、有的抢滩C端(消费者端)入口,MiniMax却将筹码悉数押在Agent场景的“性能与成本双突破”上。这是价格战的前奏,还是加速AI商业化落地的新路径?

上线文本模型背后:MiniMax想要重构Agent经济?

就MiniMax M2.5这一模型的性能,快思慢想研究院院长田丰对《每日经济新闻》记者表示,从M2.5的定位来看,它是“原生Agent生产级模型”,其核心价值在于为Agent场景提供可靠的任务文本理解和复杂问题长程推理能力。

“在编程、工具调用、复杂任务拆解等Agent核心能力上,M2.5已经达到全球SOTA(State of the Art‌,最先进的)水平,这些能力是构建高效Agent的基石。”田丰表示。

种种迹象都表明,MiniMax对Agent的布局已然清晰。

过去108天,MiniMax从M2、M2.1迭代至M2.5,在SWE-Bench Verified(软件工程基准测试)成绩从69.4提升至80.2分。记者了解到,团队将这一跃迁归因于大规模Agent强化学习(RL Scaling)。

据了解,其自研Forge框架通过解耦训练引擎与Agent,实现对任意Agent脚手架和工具的泛化优化,并通过异步调度与树状合并策略实现约40倍训练加速。

同时,在算法层面采用CISPO优化与过程奖励机制,缓解长上下文场景中的信用分配问题,并将“任务真实耗时”纳入奖励函数,在效果与响应速度之间取得平衡。

2月12日,M2.5已在MiniMax Agent上线,并于13日全球开源支持本地化部署。不到一天,来自全世界的用户已经在MiniMax Agent上构建了1万多个专家,且数量仍在快速增长。

MiniMax表示,希望在持续提升模型能力的同时,构建一个可持续扩展的Agent生态——Agent Universe。

值得一提的是,在现阶段,AI企业的押宝重点更多在多模态大模型等方向,MiniMax在此时推出文本大模型,意欲何为?

就此,田丰表示,MiniMax把几乎所有资源都集中押在了基座模型能力的持续提升上,“M2.5的推出是这一战略的延续——先有底座模型能力,再向外辐射到具体应用场景”。

不过,他也提到,MiniMax是国内最早采用全模态模型技术路线的企业之一,推出纯文本模型并非放弃多模态,而是在已有全模态能力基础上,针对Agent场景进行专项优化。

艾媒咨询CEO张毅则向记者表示,MiniMax大力推进低成本大模型,背后是一条清晰的差异化路线:避开多模态竞争的红海赛道,直击Agent在落地过程中成本高、效率低的核心痛点。

除了性能上的进展,外界对M2.5的一大关注点便是成本控制。MiniMax方面认为,当性能与成本不再构成约束,Agent规模化部署的经济模型将发生根本变化。

就M2.5在成本控制上的表现,北京市社会科学院副研究员王鹏对记者表示,MiniMax等厂商将Agent使用成本压至极低水平,标志着AI商业化从“技术验证”进入“规模替代”阶段。

王鹏认为,过去,高昂的推理成本限制了Agent的应用场景(仅能用于高价值任务),而如今低成本使得企业可以批量部署AI,处理日常重复性工作(如客服、数据录入),甚至创造新的商业模式(如按结果付费的AI服务)。

行业是否会走向价格比拼?专家:更可能引发“价值战”

值得一提的是,春节前夕,不少AI企业都进行了Agent相关布局。

在产品上,各路玩家正在马不停蹄地抢占先机。2月11日,美团LongCat发布原生“深度研究”Agent。用户盲测显示,其攻略“整体可用率”达61.1%,优于ChatGPT的42.8%。目前该功能已在LongCat网页免费开放。

1月20日,MiniMax发布Agent2.0版本,定位“AI原生工作台”,不仅上线桌面端,支持Mac和Windows,还推出面向专业垂直场景的“专家Agents”。1月19日,阶跃星辰正式官宣,全新升级电脑端Agent产品“阶跃AI桌面伙伴”,并推出Windows版本,可以免费使用。

就模型方面而言,2月3日晚,阿里开源新一代智能体编程模型Qwen3-Coder-Next,仅激活3B,其智能体编程性能就可媲美DeepSeek-V3.2、GLM-4.7等顶级开源模型。

据了解,基于技术新突破,“小快灵”的Qwen3-Coder-Next推理成本显著降低,仅为同等性能模型成本开销的5%到10%,特别适用于家用电脑、轻量服务器等低成本智能体部署场景,也是目前Agent编程能力最强的小型开源编程模型。

阿里方面表示,面临现实世界中令Agent头疼的长上下文推理、工具使用、从执行失败中恢复等难题,千问这一新模型都能从容应对。

可以发现,就与Agent相关的大模型而言,降低成本是目前行业的主攻方向。这是否意味着,随着M2.5的入场,行业有可能走向价格比拼?

“这未必是烧钱换市场。”对此,张毅认为,其低价主要是通过技术优化实现的,不完全是补贴烧钱的老路。“至于是否可能引发价格战,得观察后续市场的变化。但可以肯定的是,它会加速(淘汰)低效的竞品,行业也转向性能加成本的双维竞争。”

田丰则认为,M2.5的低成本是技术架构优化和工程能力提升的必然结果,将推动Agent从“概念验证”走向“规模化商用”,更可能引发“价值战”而非传统“价格战”。

“我们预测,大模型行业每年降低10倍推理成本是很可能持续下去的趋势。M2.5的出现将加速这一趋势,推动整个行业向更高效、更低成本的方向发展。”田丰说。

他还提到,此前Agent产品的定价普遍较高,主要面向企业级客户,M2.5带来的成本优势有望让Agent走向更广泛的中小企业市场、开发者市场,甚至个人用户。“这或将扩大整个Agent市场的规模,而非单纯的价格竞争。”

在王鹏看来,Agent的爆发和成本下降,标志着AI从“技术奇点”走向“产品奇点”,“如同智能手机取代功能机,未来AI的竞争将不再是参数大小,而是能否真正融入工作流程、创造实际价值”。

春节AI大战如火如荼,AI规模化落地的临界点到了?

就行业集体押注Agent的原因,王鹏认为,其背后本质是技术范式从“被动响应”向“主动执行”的跃迁。

“传统大模型如同‘知识库’,而Agent更像‘数字员工’,能拆解任务、调用工具、处理异常,甚至自我优化。这种转变源于企业需求升级:用户不再满足于获取信息,而是要求AI直接完成工作闭环(如自动处理订单、生成财报)。”王鹏说。

随着新模型和新产品的集体上线,截至目前,就Agent赛道而言,各企业之间开始拉开差距了吗?

对此,田丰认为,Agent大模型赛道确实正在拉开差距,但这一差距更多体现在工程化能力、场景落地能力和成本效益三个维度,而非单纯的参数规模或基础能力。

值得一提的是,当前,各企业对Agent的布局背后离不开对AI商业化落地的迫切需求。

田丰便指出,M2.5被明确定位为“原生Agent生产级模型”,所有核心能力提升都围绕编程、工具调用、办公生产力等高价值经济任务展开。这种专业化路径的选择,体现了MiniMax对商业化落地的深刻理解。

同样值得注意的是,今年春节期间,AI已成为各大科技企业重点布局的赛道。尽管各家发力路径各有侧重,但行业已展现出逐渐趋同的共识与方向。

田丰提到,行业正从“拼参数”转向“拼营收”“拼利润”,单纯的技术领先已不足以确保市场胜利,谁能更快地将技术优势转化为可量化的商业收入,谁就能赢得最终胜利。

此外,他认为,无论是字节的“流量+场景”模式、阿里的“电商平台+生态”模式,还是MiniMax的“专业化+落地”模式,本质上都是在构建各自的不同生态壁垒。

张毅也提到,从春节的AI大战可以看出,已经由同质化“内卷”走向差异化的方向。“厂商发力方向明显出现分化,主要路径包括多模态、Agent效率和生态可落地等,根源在于不同厂商在技术化禀赋、商业化的阶段和场景诉求上存在不同。”

在他看来,这也标志着整个行业正从围绕参数规模的“军备竞赛”,转向更场景化、更落地、更细分的全新竞争阶段。

从“炫技”走向“商用”,从“尝鲜”走向“普及”,今年春节,AI赛道你方唱罢我登台,好不热闹。当AI的成本门槛被逐渐拉低,当用户开始越来越多地接触到AI产品,这场春节期间的密集竞演,或许将被后人视为AI从“节日烟火”走向“日用灯火”的历史性转折点。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平