暗潮汹涌,云厂商打响Agent Infra之战,阿里云凭什么冲出重围?

作者 | 陈骏达

编辑 | 漠影

“我的数据库……没了?”

今年7月,一位名为“Jason”的网友在X平台上分享了一场Vibe Coding灾难。他在开发平台Replit上使用其内置的Agent辅助编程,在一次操作中,Agent在没有明确用户指令的情况下,竟错误地执行了一个致命的数据库命令。

顷刻之间,他长达80小时的工作成果被清空。这无异于一位本应协助你的“数字员工”,在未经允许的情况下,走进你的办公室,将你写了数周的项目资料全部扔进了碎纸机。

Jason的遭遇绝非孤例,这揭示了Agent从原型演示到投入生产环境之间尚未跨越的鸿沟,即底层基础设施(Infra)的缺失。

当前,AI模型正在从被动的问答工具,转变为能够自主规划、执行任务的Agent数字员工。然而,如何为这些员工提供足够强大的算力和工具,并赋予长期记忆,又如何为它们设定权限红线,确保它们不会“误触红色按钮”,已成为Agent规模化普及前的巨大挑战。

没有坚实可靠的Agent Infra,再聪明的Agent也无法成为可信赖的生产力。Replit的这次事故,正是这种风险最生动的注脚。

而这也正是阿里云、AWS、谷歌云、微软Azure等云厂商争相发力Agent Infra的核心原因。他们试图打造的并非一个简单的工具集,而是一座现代化的 “智能车间”。

在这里,每个AI Agent都将在安全的环境中工作,拥有清晰的权限、稳定的工具和足够的数据,从而真正从实验室的原型,转变为真实生产环境中可靠数字员工。

一、Agent规模化落地挑战大,配套Infra已成必选项

企业为何需要这样一座Agent智能车间呢?

要让Agent在生产场景中发挥作用,我们需要为其提供足够的算力和数据(记忆),帮助Agent解决水土不服的问题。

例如,当Agent分析海量数据时,本地设备既无法承载庞大的数据洪流,也无法完成复杂的推理运算。这时,云端算力的支持就成了理所当然的选择。

此外,要让Agent做出正确的决策,就需要为其提供全面、准确且实时的信息,否则,其决策将基于不完整或过时的数据,导致输出结果不可靠,甚至产生错误。

但这仅仅是第一关,更大的隐患在于安全与权限控制的缺失。今年,知名AI搜索独角兽Perplexity旗下的Comet AI浏览器就曾爆出安全丑闻。

这款AI浏览器本质上就是一个能直接操纵用户设备的Agent,然而,由于缺乏安全机制,它在阅读到网页上植入的恶意指令后,能直接打开用户邮箱、收取验证码,还把验证码分享给外部黑客,一条龙完成盗号。

这一事件暴露了将拥有高权限的Agent直接部署在开放环境中的巨大风险,企业必须为Agent打造配套的基础设施

然而,Agent Infra极为复杂,涉及底层算力调度、安全沙箱、模型集成、记忆数据库、工具调用链路等一系列核心技术模块,企业自建成本高昂且技术门槛难以逾越,后续维护也需要持续投入顶尖的研发团队,并时刻应对层出不穷的新型安全威胁,堪称一个填不满的技术深坑。

采用云厂商们开发的现成Agent Infra套件,对大多数企业而言是更为现实的选择。例如,知名Agent产品Manus便是通过Agent Infra创企E2B打造的沙盒环境,让Manus的Agent获得了完整的终端访问权限,也提供了持久化的工作空间,这对于Manus广为人知的长链路任务而言,十分重要。

除了E2B外,AWS、谷歌云、微软Azure等云厂商也都已打造了相关套件。

AWS的AgentCore提供记忆管理、身份验证、代码执行和浏览器工具等,强调安全、可扩展和多Agent协作;

谷歌云的Vertex AI Agents聚焦构建和管理多Agent系统,支持任务调度、跨Agent协作以及与企业数据和云服务的集成;

微软Azure的Agent Factory强调身份认证、治理、内容安全和可观测性,同时结合Azure云服务和Copilot工具链,支持企业快速落地智能体应用。

总体来看,主流云厂商的思路均是:构建安全、可扩展、可组合的Agent Infra,让企业开发者能在已有基础设施和生态下快速部署、管理和监控多Agents系统,形成差异化服务能力,同时降低企业上手门槛。

二、国产Agent Infra突围,让Agent学会自我进化

在Agent Infra的布局上,国内厂商也丝毫不落后。今年4月,阿里云开启Agent Infra开发套件——无影AgentBay的公测,迅速吸引了大量开发者和企业关注。

AgentBay的核心定位是为AI Agent打造的“超级大脑”或“云上操作系统”。它能够动态调用云端算力、存储和工具链资源,将复杂任务接入高性能云电脑,突破了Agent在本地设备上的算力限制。

AgentBay不仅集成了云上沙箱环境、算力调度、持久化数据存储和企业级安全等核心功能,还内置了视觉理解、自然语言控制和任务解析等多项AI技术。尤其是云上沙箱环境,保障了Agent对本地环境的零侵入,给Agent执行加了一道保险。

同时,它支持原子化工具API、AI Agent API以及ASP远程串流协议等多种交互方式,极大地提升了自动化执行效率,使开发者能够在高性能、安全的云端环境中快速部署和管理AI Agent。

而在今年的云栖大会期间,AgentBay迎来重大升级,推出了自进化引擎、内存状态管理、安全围栏等全新能力。其中最引人关注的,是基于环境反馈的自进化引擎——Self-Evolving。

阿里云无影关注到了企业在利用第三方AI Infra部署AI Agent时的一大关键挑战。Agent并不能在执行任务过程中实现“自我提升”,最终其效果还需要人工调整,才能逐渐优化。这就好比你招募了一位员工,但他并不能主动从工作中总结经验和教训,始终未能进步。

对于AgentBay自进化引擎的工作原理,AgentBay产品经理屈立威向智东西解释道,自进化引擎可以理解为广义的强化学习,但并不直接训练模型。自进化引擎会针对提示词、工作流、Agent架构、工具等多个方向进行能力优化,每个方向使用的方法或算法各不相同。

例如在提示词优化方面,对于短序列任务,可以直接根据目标和实际结果进行修正;而对于长序列任务,由于难以直接获得最终结果,则会采用多种算法来优化执行效果,比如基于文本梯度(text grad)或微调推理(mipro)的方法。

通过这种模块化、服务化的设计,企业无需组建庞大AI团队,也能让Agent在执行过程中不断自我优化,提升与业务目标的匹配度。

AgentBay自进化引擎能够在任务执行中自动分析Agent的失败案例,并尝试生成和测试更优的提示词。它还能根据任务需求自主创建或封装新工具,不断拓展Agent能力边界。

这一机制不仅关注单个Agent的流程优化,也可在多Agent协作网络中智能部署最优工作流,提高整体效率。

此外,平台的记忆策略使Agent具备“过目不忘”和“选择性遗忘”的能力,可以对长期任务进行智能管理,适应复杂、长周期的应用场景。

三、Agent Infra加速发展,会成为下一代应用的跃升点吗?

AgentBay并非凭空出现,屈立威在采访中介绍道,在云电脑时代,阿里积累了多项核心技术能力,而AgentBay的许多技术依赖,与云电脑是“一脉相承”的。

例如,云电脑需要高流畅性和清晰的操作体验,而阿里云此前已自研了ASP端云实时通信协议,确保远程云环境操作体验接近本地,这也能让帮助Agent实现与云端执行环境之间的高效、实时交互。

大规模的资源调度能力和性能保障,也是阿里云此前打造云电脑时重点解决的问题。目前,AgentBay便依托阿里云的全球资源池进行部署,用户可以就近接入,保证了低延迟和高可用性。

然而,Agent也提出了新的技术挑战和升级需求。屈立威称,首先,Agent需要更强的感知与控制能力,不仅要像人一样“看懂画面”,判断鼠标点击、输入是否生效,还要支持文件系统操作、命令行以及撰写RPA脚本等多种工具操作。

其次,其风控与安全要求也更高,需要阻断敏感指令、过滤不安全内容、约束上网行为,保障企业私域安全。

此外,Agent任务的执行方式呈树状、多分支,每个节点都需打快照(checkpoint)、支持快速回滚,并复制克隆环境以实现并行执行,这对状态管理和多维度调度提出了更高要求,而这些都是云电脑时代所未涉及的关键能力,需要重点突破。

为此,阿里云自研了持久化文件系统,让AgentBay能够动态地按需保留用户状态和文件,确保了任务执行的连续性和状态的一致性,这对于需要执行长链条、多步骤任务的复杂Agent至关重要。

安全方面,AgentBay则构建了端到端安全体系,包括沙箱隔离、数据加密与RBAC访问控制、AI内容风险检测以及日志审计,保障任务安全、合规与可追溯。

除了给企业打造Agent Infra之外,阿里云还在云栖大会上,给个人用户也提供了一款跨终端、跨模态的智能计算平台——无影Agentic Computer。

Agentic Computer是一个拥有长期记忆的个人助手,具备云端弹性算力与多任务并行能力。它内置垂直场景Agent,实现办公、设计、研究等专业化支持。它将个人计算与云端智能协同起来,有望让更多用户体验到Agent带来的赋能作用。

从产业视角来看,Agent Infra的发展与移动互联网时代App生态的兴起有一大共性:基础设施成熟,为新形态产品快速落地提供了支撑。

移动互联网时代,智能终端、网络和云计算能力的完善,使海量App得以高效运行和广泛普及,催生了丰富的应用生态;如今,AI Infra依托全球化云资源、弹性算力调度和全栈安全体系,为AI Agent提供高性能、低延迟、可控的运行环境。

稳固的基础设施降低了创新门槛,推动Agent在企业自动化、内容生成等多样化场景中迅速落地,有望形成新一轮产业生态和创新循环。

结语:给Agent打好Infra地基,Agent离广泛落地又近一步

Agent Infra正逐步成为新一代数字化、智能化基础设施的组成部分,类似于移动互联网时代的云和网络,为AI Agent生态提供底层支撑。

同时,Agent Infra的发展正在改变产业创新节奏和生态构建方式。企业不再需要自行搭建复杂底层架构,而是可以在统一、安全、可扩展的平台上试验多样化Agent应用。

随着工具链标准化和安全机制完善,或许会有越来越多企业和开发者能够快速部署Agent,推动生产、服务和研发环节的自动化与智能化,从而催生新型业务模式和产业应用。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平