谁来管住失控的token？

今年以来，Token经济概念火爆全球。但在刚刚过去的5月底，亚马逊却选择关闭内部AI使用榜单“KiroRank”。

这个榜单原本统计员工在Kiro开发平台上的Token消耗。然而，榜单启用后，一些员工让AI执行无意义任务，只为把使用量刷高。

亚马逊高级副总裁Dave Treadwell随后提醒员工，不要为了使用AI而使用AI。外媒报道称，亚马逊已经把考核重点从原始Token消耗转向“标准化部署”，也就是工程师用AI实际交付了多少可用结果。

企业AI第一轮热潮里，管理层最常问的是员工有没有用AI，部门有没有接入AI，业务有没有做Agent。KiroRank关闭后，第一批大规模应用AI的企业，开始面对另一个问题：AI用量被推高以后，谁能证明它带来了业务结果？

本月初，一个新词开始在美国企业AI圈层流行：AI sticker shock（AI账单震惊）。

按量计费的AI产品进入企业后，企业用户发现支出账单变得难以预测。Agent进入企业后，又面临海量Token消耗带来的成本攀升。

于是，一个问题被反复提及：企业真正需要的Agent平台，究竟应该是什么样？

这个由Agent生态引发的系统性问题，正在等待新一代企业级AI平台作答。

失控的Token

亚马逊关闭内部AI榜单“KiroRank”背后，是企业大量应用AI后，Token反而“失控”的现实。

亚马逊原本希望用榜单鼓励工程师使用Kiro开发平台，但结果是一些员工让AI执行无意义任务，把使用量刷高。

这是企业AI落地后的第一重困境：用量会失真。员工用了多少AI，部门建了多少Agent，都可以出现在汇报文档上。但企业真正关心的是，项目有没有推进，Agent做出了多少产出，人工链路有没有被缩短。

瑞典金融科技公司Klarna也在客服场景遇到了相似困境。

2024年，Klarna曾对外称，AI客服承担了相当于700名全职客服的工作。一年后，公司开始重新招聘人工客服。Klarna CEO Siemiatkowski承认，过度转向AI影响了服务质量。

Klarna前后两次动作，让行业开始重新审视：AI节省下来的成本，如果换来更多复核成本，就不能称得上是靠谱的生产力。

在组织管理侧，企业大规模引入AI后的资源配置问题也开始显现。

澳大利亚联邦银行CEO Matt Comyn在近期谈到，企业把AI用于更复杂任务后，相关成本会变得更难预测。他还批评低价值AI产出正在增加，用“work slop”（AI工作垃圾）形容那些看似完成工作，实际价值有限的内容。

换言之，AI消耗了很多Token，组织未必获得更多结果。

这也是一些咨询机构调低Agent项目预期的原因。

国际研究与咨询机构高德纳（Gartner）预计，到2027年底，超过40%的Agentic AI项目会因为成本上升、业务价值不清或风险控制不足被取消。Agent项目能否持续，不只取决于模型能力，也取决于企业能否把它放进真正的生产流程。

成本和效率之外，Agent进入企业生产流程后，还会把安全问题推到台前。

本月初，Meta一款用于Instagram账号支持的AI客服机器人，被安全研究人员发现存在漏洞。攻击者通过设计特殊话术诱导AI执行错误操作，最终获得多个高影响力账号的控制权限，其中包括奥巴马白宫账号，丝芙兰等知名品牌账号。

当Agent开始连接企业系统后，这类错误操作可能在更长链路中引发连锁反应。它不只是回答错一句话，而可能错误修改账号信息，触发业务操作，或者访问本不该访问的数据。

成本同样是绕不开的一环。

此前，一篇新加坡南洋理工团队的研究提到，在工具调用链场景下，Agent可能被引导进入极长调用链，实验中单次查询成本最高被放大658倍，能耗提升100到560倍。随着Agent接入MCP，插件和企业内部系统，传统按Token计费开始面临新的挑战。

企业今天面对的，已经不是简单的“接入AI”问题，而是如何让Agent真正实现有效产出。

“AI下半场更难的是寻找好问题，好场景和好环境。”

在近日举行的2026腾讯云AI产业应用大会上，腾讯首席AI科学家、腾讯混元大语言模型及AI Infra负责人姚顺雨这样说道。

行业高速变迁下，模型能做的事情越来越多，但企业仍要回答，什么才是值得被Agent解决的问题。

可靠的Agent，才能进入系统层

“今天AI原生服务的推理成本仍然较高，用户提交的任务复杂度不同，成本消耗差异也很大。”在会后的采访环节，腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生，把问题拉回企业AI落地本身。

这也解释了为什么企业级Agent面临的“痛点”。当Agent真正进入生产流程后，企业更关心的是三件事：哪些业务场景值得做，Agent接入系统后能不能被安全管理，最后有没有形成可核算的业务结果。

会上，腾讯云智能体开发平台4.0的推出，让这一话题再度引发讨论。它瞄准的正是Agent进入企业生产环节后面对的这些问题，定位为企业级AgentOps平台，打通企业级Agent从构建、连接、分发到治理的全生命周期。

ADP 4.0要做的，是把这些问题放进一条可管理的生产链路里。

第一步是找场景。

当前，行业内的一个共性问题是，很多企业不是没有AI预算，而是不知道哪些流程适合做Agent。

ADP 4.0提供50多个场景化模板和行业精选应用，首批上线近40个精选Connector，并支持150多个Skills。企业可以把CRM，ERP，OA，工单，客服，企业网盘，知识库，文档系统等已有资源接入Agent，而不是手动搬运数据或重复整理材料。

这降低了企业从零试错的成本，不管是客服场景的接高频问题和工单流转需求，还是营销Agent商品推荐场景，都有对应的场景和Skill资源支持。

Claw模式则进一步降低了复杂Agent的构建门槛。

在原有LLM+RAG，工作流和Multi-Agent三种构建模式基础上，ADP 4.0新增支持Agentic Loop机制的Claw模式。创建者无需配置复杂表单，只需要用自然语言描述需求，平台即可自动生成提示词，挂载知识库，配置工具并编排工作流。

Claw模式面向更复杂，更长链路的业务任务。Agent可以在云端沙箱中自主编码运行，调用企业Skills，执行长时任务。创建完成后，可以通过API接口集成到企业业务系统中，也可以通过企业微信，微信等渠道触达员工和客户。

腾讯工业质检平台TI-AOI提供了一个样本。传统视觉检测高度依赖工程师现场经验，数据检查，日志查看，模型判断和参数调整，往往需要在多个页面之间切换。

基于Claw模式打造的质检Agent，可以闭环完成一系列工业流程。工程师只需用自然语言输入查询指令，Agent即可自动完成数据健康检查，训练可行性判断，并给出后续优化建议。

第二步是控风险。

一个Agent在进入企业核心流程之前，必须先知道它能做什么，不能做什么。

ADP 4.0将治理能力前置到开发源头。平台支持企业级，空间级，应用级的分层权限架构，并结合RBAC角色权限矩阵，实现功能权限与数据权限隔离。

企业可以根据组织架构，部门，岗位和角色配置访问范围，确保不同团队，不同应用，不同知识库之间权限边界清晰。

Skills治理也被纳入生产流程。员工提交的自定义Skill需要经过代码静态扫描，数据访问，网络出站，依赖白名单等安全检查及多级审批后，才能进入企业专区被调用。Skill不再是个人随手写的工具，而是经审批，可共享，可调度的企业资产。

Agent Portal负责跨平台纳管。企业可以对不同平台，不同业务场景中的Agent进行集中管理，查看调用量，活跃度，响应质量，运行成本和异常报错，并定位问题原因。

部署方式也开始决定Agent能不能进入核心数据流。ADP 4.0支持公有云，私有化，混合云和专有云四种部署模式。智能工作台与安全沙箱的私有化方案，也将支持在客户内网中安全运行代码，调用Skills和执行长时任务。

第三步是看结果。

在既有ADP落地中，伊利把导购，下单和营销做成智能体矩阵。导购智能体上线后，社群商品链接点击率提升15.7%，导购订单数增长26.02%。智能下单智能体接入语音识别，意图理解，商品推荐和下单跳转后，需求识别准确率达到93%，下单转化率提升39%。

而在酒旅场景下，华住基于腾讯云智能体开发平台升级“华小AI”，协同搭建38条工作流。住客提出“需要一瓶水”后，系统5秒内完成理解与响应，自动生成工单，并联动机器人完成配送。

目前，“华小AI”已落地上万家门店，累计执行近150万次任务，可自动处理70%以上高频问询。酒店服务里，Agent不再停留在问答，而是进入客需送物，酒店信息，服务设施，周边查询，续住开票等住中流程。

在大会上，腾讯云副总裁，腾讯云智能体开发平台负责人吴运声表示，企业级Agent不是比谁更快地搭建，而是比谁能让Agent稳定，安全，持续地运行在业务现场。

会后采访环节，字母AI提到，当前不少企业带着预算和业务场景进入AI建设，但真正落地时，需求往往并不清晰。很多企业知道“要做AI”，却并不确定哪些流程适合交给Agent，哪些环节真正能产生业务价值。

吴运声回应称，企业AI落地正在要求云厂商“往前走一步”。在他看来，云厂商不能只停留在模型和平台提供层，而是需要真正深入客户业务场景。“深入到客户的业务场景里面去了解他的业务，再让业务流程和模型能力更好结合。”

瞄准企业生态，进击的腾讯AI

ADP 4.0真正折射出的，是腾讯AI战略的一次重心切换——从追求模型打榜，转向聚焦场景、好用与提效。

过去几年中，腾讯的AI战略，更多时候把它放在内部效率和生态的存量优化里。

2023年，腾讯CEO马化腾曾在内部谈到，AI是几百年不遇的机会，但腾讯最开始不要急着争先。

到了2026年股东大会上，马化腾用“上船”形容腾讯在AI浪潮中的位置，并表示希望“船速能快一点”。

这种变化，很快反映在腾讯AI业务节奏里。

今年一季度，腾讯营收1964.58亿元，同比增长9%。资本开支319.36亿元，同比增长16%。腾讯管理层称，一季度资本开支大部分用于AI相关投入。

若剔除混元，元宝，CodeBuddy，WorkBuddy及QClaw等新AI产品影响，腾讯非国际财务报告准则下经营利润增速将从9%提高至17%。新AI产品单季影响经营利润约88亿元。

模型侧也在同步加速。

混元重构后推出Hy3 preview，主打性价比和实用性，在OpenRouter最新调用量月榜单中稳居前二。

但对腾讯而言，更大的变化发生在产品和组织层面。

去年，知名AI科学家、前OpenAI研究员姚顺雨加入后，腾讯把混元大模型和AI Infra放到更重要的位置。到了这次大会，腾讯讨论的重点已经从模型参数转向产品落地。

在上午的对谈中，姚顺雨解释了“AI下半场”的含义。他说，这个概念来自自己去年的一篇博客，“方法论已经变得非常成熟，但寻找问题变得更加困难。”在他看来，预训练和后训练让大模型像一个“万能锤子”，可以解决各种问题，接下来更重要的是找到好的问题、好的产品和好的环境。

汤道生则把AI时代的产品变化概括成“预制菜”和“开放式服务”的区别。

他表示，PC和移动互联网时代做产品，更多是产品方预先设计功能，用户在菜单里点选；但AI时代，用户可能用自然语言或语音提出需求，产品方并不知道用户会问什么，“所以要充分利用模型能力去理解用户的需求”，再通过推理和工具调用应对开放式需求。

而要做好AI时代的产品，汤道生认为，核心要具备三种能力。

一是场景联接能力，通过高频场景触点，把大模型嵌到真实业务流。二是工程驾驭能力，通过Harness体系，让Agent能够稳定，可信，持续运行。三是模型驱动力，依托模型和产品Co-Design，兼顾实用性，性价比和ROI。

汤道生的观点，从腾讯云ADP中，也能窥探一斑：腾讯云开始把Agent本身当成企业里的“新软件层”来做。

在场景连接方面，ADP 4.0 让Agent不只停留在对话，而是开始调用企业知识库、CRM、OA、工单系统和MCP工具；还把企业落地经验，沉淀成50多个行业应用模板，覆盖金融、文旅、交通、教育、传媒、零售等典型场景。企业不需要每次都从零开始，只需要一键复制模板，配置自己的知识库、权限和业务工具，就可以快速生成一个可运行的垂直Agent。

在工程驾驭方面，ADP云端Harness则负责把原本分散在个人端的Agent运行过程，统一纳入权限、日志、成本和安全体系，解决了企业级 Agent 的统一管理、稳定运行、长任务续跑和低成本运营。

在模型驱动方面，企业通过ADP可以使用腾讯混元，也能接入外部模型，平台提供多种模型，供企业根据不同场景需要灵活选择。

ADP的这套做法和腾讯整体AI方法论形成呼应。这一产品升级也意味着，腾讯正在把过去云计算时代“应用跑在云上”的逻辑，进一步推进到“Agent跑在企业系统里”。ADP承担的角色，也不只是Agent开发平台，而更像腾讯企业AI的一层运行中间件。

过去，腾讯更多把AI用在广告推荐，内容生产，游戏研发等内部场景赋能中。现在，腾讯云深入到各类企业业务场景的一线中。

毫无疑问，下一阶段企业AI的竞争，不会只看谁让员工多用AI，而会看谁能把Agent接进真实业务流程、守住安全边界、减少无效调用，最终，观察Agent运行的结果，能否体现在真实业务产出中。

腾讯云ADP 4.0想回答的，正是这个问题。

Published by

风君子

最新文章

标签

书签