谁来管住失控的token?

今年以来,Token经济概念火爆全球。但在刚刚过去的5月底,亚马逊却选择关闭内部AI使用榜单“KiroRank”。

这个榜单原本统计员工在Kiro开发平台上的Token消耗。然而,榜单启用后,一些员工让AI执行无意义任务,只为把使用量刷高。

亚马逊高级副总裁Dave Treadwell随后提醒员工,不要为了使用AI而使用AI。外媒报道称,亚马逊已经把考核重点从原始Token消耗转向“标准化部署”,也就是工程师用AI实际交付了多少可用结果。

企业AI第一轮热潮里,管理层最常问的是员工有没有用AI,部门有没有接入AI,业务有没有做Agent。KiroRank关闭后,第一批大规模应用AI的企业,开始面对另一个问题:AI用量被推高以后,谁能证明它带来了业务结果?

本月初,一个新词开始在美国企业AI圈层流行:AI sticker shock(AI账单震惊)。

按量计费的AI产品进入企业后,企业用户发现支出账单变得难以预测。Agent进入企业后,又面临海量Token消耗带来的成本攀升。

于是,一个问题被反复提及:企业真正需要的Agent平台,究竟应该是什么样?

这个由Agent生态引发的系统性问题,正在等待新一代企业级AI平台作答。

01

失控的Token

亚马逊关闭内部AI榜单“KiroRank”背后,是企业大量应用AI后,Token反而“失控”的现实。

亚马逊原本希望用榜单鼓励工程师使用Kiro开发平台,但结果是一些员工让AI执行无意义任务,把使用量刷高。

这是企业AI落地后的第一重困境:用量会失真。员工用了多少AI,部门建了多少Agent,都可以出现在汇报文档上。但企业真正关心的是,项目有没有推进,Agent做出了多少产出,人工链路有没有被缩短。

瑞典金融科技公司Klarna也在客服场景遇到了相似困境。

2024年,Klarna曾对外称,AI客服承担了相当于700名全职客服的工作。一年后,公司开始重新招聘人工客服。Klarna CEO Siemiatkowski承认,过度转向AI影响了服务质量。

Klarna前后两次动作,让行业开始重新审视:AI节省下来的成本,如果换来更多复核成本,就不能称得上是靠谱的生产力。

在组织管理侧,企业大规模引入AI后的资源配置问题也开始显现。

澳大利亚联邦银行CEO Matt Comyn在近期谈到,企业把AI用于更复杂任务后,相关成本会变得更难预测。他还批评低价值AI产出正在增加,用“work slop”(AI工作垃圾)形容那些看似完成工作,实际价值有限的内容。

换言之,AI消耗了很多Token,组织未必获得更多结果。

这也是一些咨询机构调低Agent项目预期的原因。

国际研究与咨询机构高德纳(Gartner)预计,到2027年底,超过40%的Agentic AI项目会因为成本上升、业务价值不清或风险控制不足被取消。Agent项目能否持续,不只取决于模型能力,也取决于企业能否把它放进真正的生产流程。

成本和效率之外,Agent进入企业生产流程后,还会把安全问题推到台前。

本月初,Meta一款用于Instagram账号支持的AI客服机器人,被安全研究人员发现存在漏洞。攻击者通过设计特殊话术诱导AI执行错误操作,最终获得多个高影响力账号的控制权限,其中包括奥巴马白宫账号,丝芙兰等知名品牌账号。

当Agent开始连接企业系统后,这类错误操作可能在更长链路中引发连锁反应。它不只是回答错一句话,而可能错误修改账号信息,触发业务操作,或者访问本不该访问的数据。

成本同样是绕不开的一环。

此前,一篇新加坡南洋理工团队的研究提到,在工具调用链场景下,Agent可能被引导进入极长调用链,实验中单次查询成本最高被放大658倍,能耗提升100到560倍。随着Agent接入MCP,插件和企业内部系统,传统按Token计费开始面临新的挑战。

企业今天面对的,已经不是简单的“接入AI”问题,而是如何让Agent真正实现有效产出。

“AI下半场更难的是寻找好问题,好场景和好环境。”

在近日举行的2026腾讯云AI产业应用大会上,腾讯首席AI科学家、腾讯混元大语言模型及AI Infra负责人姚顺雨这样说道。

行业高速变迁下,模型能做的事情越来越多,但企业仍要回答,什么才是值得被Agent解决的问题。

02

可靠的Agent,才能进入系统层

“今天AI原生服务的推理成本仍然较高,用户提交的任务复杂度不同,成本消耗差异也很大。”在会后的采访环节,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生,把问题拉回企业AI落地本身。

这也解释了为什么企业级Agent面临的“痛点”。当Agent真正进入生产流程后,企业更关心的是三件事:哪些业务场景值得做,Agent接入系统后能不能被安全管理,最后有没有形成可核算的业务结果。

会上,腾讯云智能体开发平台4.0的推出,让这一话题再度引发讨论。它瞄准的正是Agent进入企业生产环节后面对的这些问题,定位为企业级AgentOps平台,打通企业级Agent从构建、连接、分发到治理的全生命周期。

ADP 4.0要做的,是把这些问题放进一条可管理的生产链路里。

第一步是找场景。

当前,行业内的一个共性问题是,很多企业不是没有AI预算,而是不知道哪些流程适合做Agent。

ADP 4.0提供50多个场景化模板和行业精选应用,首批上线近40个精选Connector,并支持150多个Skills。企业可以把CRM,ERP,OA,工单,客服,企业网盘,知识库,文档系统等已有资源接入Agent,而不是手动搬运数据或重复整理材料。

这降低了企业从零试错的成本,不管是客服场景的接高频问题和工单流转需求,还是营销Agent商品推荐场景,都有对应的场景和Skill资源支持。

Claw模式则进一步降低了复杂Agent的构建门槛。

在原有LLM+RAG,工作流和Multi-Agent三种构建模式基础上,ADP 4.0新增支持Agentic Loop机制的Claw模式。创建者无需配置复杂表单,只需要用自然语言描述需求,平台即可自动生成提示词,挂载知识库,配置工具并编排工作流。

Claw模式面向更复杂,更长链路的业务任务。Agent可以在云端沙箱中自主编码运行,调用企业Skills,执行长时任务。创建完成后,可以通过API接口集成到企业业务系统中,也可以通过企业微信,微信等渠道触达员工和客户。

腾讯工业质检平台TI-AOI提供了一个样本。传统视觉检测高度依赖工程师现场经验,数据检查,日志查看,模型判断和参数调整,往往需要在多个页面之间切换。

基于Claw模式打造的质检Agent,可以闭环完成一系列工业流程。工程师只需用自然语言输入查询指令,Agent即可自动完成数据健康检查,训练可行性判断,并给出后续优化建议。

第二步是控风险。

一个Agent在进入企业核心流程之前,必须先知道它能做什么,不能做什么。

ADP 4.0将治理能力前置到开发源头。平台支持企业级,空间级,应用级的分层权限架构,并结合RBAC角色权限矩阵,实现功能权限与数据权限隔离。

企业可以根据组织架构,部门,岗位和角色配置访问范围,确保不同团队,不同应用,不同知识库之间权限边界清晰。

Skills治理也被纳入生产流程。员工提交的自定义Skill需要经过代码静态扫描,数据访问,网络出站,依赖白名单等安全检查及多级审批后,才能进入企业专区被调用。Skill不再是个人随手写的工具,而是经审批,可共享,可调度的企业资产。

Agent Portal负责跨平台纳管。企业可以对不同平台,不同业务场景中的Agent进行集中管理,查看调用量,活跃度,响应质量,运行成本和异常报错,并定位问题原因。

部署方式也开始决定Agent能不能进入核心数据流。ADP 4.0支持公有云,私有化,混合云和专有云四种部署模式。智能工作台与安全沙箱的私有化方案,也将支持在客户内网中安全运行代码,调用Skills和执行长时任务。

第三步是看结果。

在既有ADP落地中,伊利把导购,下单和营销做成智能体矩阵。导购智能体上线后,社群商品链接点击率提升15.7%,导购订单数增长26.02%。智能下单智能体接入语音识别,意图理解,商品推荐和下单跳转后,需求识别准确率达到93%,下单转化率提升39%。

而在酒旅场景下,华住基于腾讯云智能体开发平台升级“华小AI”,协同搭建38条工作流。住客提出“需要一瓶水”后,系统5秒内完成理解与响应,自动生成工单,并联动机器人完成配送。

目前,“华小AI”已落地上万家门店,累计执行近150万次任务,可自动处理70%以上高频问询。酒店服务里,Agent不再停留在问答,而是进入客需送物,酒店信息,服务设施,周边查询,续住开票等住中流程。

在大会上,腾讯云副总裁,腾讯云智能体开发平台负责人吴运声表示,企业级Agent不是比谁更快地搭建,而是比谁能让Agent稳定,安全,持续地运行在业务现场。

会后采访环节,字母AI提到,当前不少企业带着预算和业务场景进入AI建设,但真正落地时,需求往往并不清晰。很多企业知道“要做AI”,却并不确定哪些流程适合交给Agent,哪些环节真正能产生业务价值。

吴运声回应称,企业AI落地正在要求云厂商“往前走一步”。在他看来,云厂商不能只停留在模型和平台提供层,而是需要真正深入客户业务场景。“深入到客户的业务场景里面去了解他的业务,再让业务流程和模型能力更好结合。”

03

瞄准企业生态,进击的腾讯AI

ADP 4.0真正折射出的,是腾讯AI战略的一次重心切换——从追求模型打榜,转向聚焦场景、好用与提效。

过去几年中,腾讯的AI战略,更多时候把它放在内部效率和生态的存量优化里。

2023年,腾讯CEO马化腾曾在内部谈到,AI是几百年不遇的机会,但腾讯最开始不要急着争先。

到了2026年股东大会上,马化腾用“上船”形容腾讯在AI浪潮中的位置,并表示希望“船速能快一点”。

这种变化,很快反映在腾讯AI业务节奏里。

今年一季度,腾讯营收1964.58亿元,同比增长9%。资本开支319.36亿元,同比增长16%。腾讯管理层称,一季度资本开支大部分用于AI相关投入。

若剔除混元,元宝,CodeBuddy,WorkBuddy及QClaw等新AI产品影响,腾讯非国际财务报告准则下经营利润增速将从9%提高至17%。新AI产品单季影响经营利润约88亿元。

模型侧也在同步加速。

混元重构后推出Hy3 preview,主打性价比和实用性,在OpenRouter最新调用量月榜单中稳居前二。

但对腾讯而言,更大的变化发生在产品和组织层面。

去年,知名AI科学家、前OpenAI研究员姚顺雨加入后,腾讯把混元大模型和AI Infra放到更重要的位置。到了这次大会,腾讯讨论的重点已经从模型参数转向产品落地。

在上午的对谈中,姚顺雨解释了“AI下半场”的含义。他说,这个概念来自自己去年的一篇博客,“方法论已经变得非常成熟,但寻找问题变得更加困难。”在他看来,预训练和后训练让大模型像一个“万能锤子”,可以解决各种问题,接下来更重要的是找到好的问题、好的产品和好的环境。

汤道生则把AI时代的产品变化概括成“预制菜”和“开放式服务”的区别。

他表示,PC和移动互联网时代做产品,更多是产品方预先设计功能,用户在菜单里点选;但AI时代,用户可能用自然语言或语音提出需求,产品方并不知道用户会问什么,“所以要充分利用模型能力去理解用户的需求”,再通过推理和工具调用应对开放式需求。

而要做好AI时代的产品,汤道生认为,核心要具备三种能力。

一是场景联接能力,通过高频场景触点,把大模型嵌到真实业务流。二是工程驾驭能力,通过Harness体系,让Agent能够稳定,可信,持续运行。三是模型驱动力,依托模型和产品Co-Design,兼顾实用性,性价比和ROI。

汤道生的观点,从腾讯云ADP中,也能窥探一斑:腾讯云开始把Agent本身当成企业里的“新软件层”来做。

在场景连接方面,ADP 4.0 让Agent不只停留在对话,而是开始调用企业知识库、CRM、OA、工单系统和MCP工具;还把企业落地经验,沉淀成50多个行业应用模板,覆盖金融、文旅、交通、教育、传媒、零售等典型场景。企业不需要每次都从零开始,只需要一键复制模板,配置自己的知识库、权限和业务工具,就可以快速生成一个可运行的垂直Agent。

在工程驾驭方面,ADP云端Harness则负责把原本分散在个人端的Agent运行过程,统一纳入权限、日志、成本和安全体系,解决了企业级 Agent 的统一管理、稳定运行、长任务续跑和低成本运营。

在模型驱动方面,企业通过ADP可以使用腾讯混元,也能接入外部模型,平台提供多种模型,供企业根据不同场景需要灵活选择。

ADP的这套做法和腾讯整体AI方法论形成呼应。这一产品升级也意味着,腾讯正在把过去云计算时代“应用跑在云上”的逻辑,进一步推进到“Agent跑在企业系统里”。ADP承担的角色,也不只是Agent开发平台,而更像腾讯企业AI的一层运行中间件。

过去,腾讯更多把AI用在广告推荐,内容生产,游戏研发等内部场景赋能中。现在,腾讯云深入到各类企业业务场景的一线中。

毫无疑问,下一阶段企业AI的竞争,不会只看谁让员工多用AI,而会看谁能把Agent接进真实业务流程、守住安全边界、减少无效调用,最终,观察Agent运行的结果,能否体现在真实业务产出中。

腾讯云ADP 4.0想回答的,正是这个问题。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平