ICRA真机挑战赛唯一满分,一支中国具身新团队浮出水面

机器人前瞻(公众号:robot_pro)

作者 | 许丽思

编辑 | 漠影

近期,ICRA 2026、CVPR 2026 Workshops等机器人与具身智能相关会议、竞赛密集举行,围绕真实机器人任务的真机评测,正在成为行业观察具身智能落地能力的重要窗口。

在ICRA举办的REAL-I具身智能挑战赛中,一个比赛结果近期在机器人圈引发讨论:在48支来自全球的参赛队伍中,一支中国团队拿下线下真机操作任务唯一满分

ICRA真机挑战赛唯一满分,一支中国具身新团队浮出水面

这支名为deeptouch.ai队伍,由北京邮电大学教授、瞬恒智能首席科学家方斌领衔。比赛中,团队在人形机器人工业上料操作单项赛中取得满分,成为所有参赛队伍中唯一一支在线下真机操作任务中获得满分的队伍。

相比于在过去两年常被讨论的明星公司,方斌所带领的瞬恒智能此前极少发声,直到赛事成绩引发关注。

一、全球48支队伍参赛,聚焦真实机器人任务

REAL-I,全称The 1st Real-world Embodied AI Learning Challenge,汇集了来自全球各地的48支队伍线下参赛,是此次ICRA中线下真机参与队伍最多的赛项之一。和普通仿真评测或单次机器人演示不同,REAL-I的赛制重点放在真实机器人平台、真实工业任务和统一评测工具上。

参赛团队需要经历仿真、线上真机和线下现场挑战三个阶段。模型不仅要在虚拟环境中跑通,还要被真正部署到机器人上,在现场环境中接受任务检验。

据了解,线下挑战设置了三个典型工业任务:金属件姿态调整、日化瓶取放与上下料、快递包裹扫码分拣。这些任务并不追求视觉上的炫技,但都接近工业现场中常见的机器人操作需求。

ICRA真机挑战赛唯一满分,一支中国具身新团队浮出水面

在这些任务中,机器人需要实时识别物体位置,判断抓取方式,规划机械臂运动轨迹,并通过末端执行器完成真实物体操作。表面上看是抓取、移动和放置,背后则是感知、规划、控制和执行的完整闭环。

相比一次理想环境中的Demo,这类赛制更强调模型能否被部署到真实机器人上,并在现场条件下完成连续任务。

过去一年,具身智能行业并不缺少机器人演示视频。但真实产业场景中,客户关心的往往不是机器人能否在理想环境下完成一次动作,而是能否在物体位置变化、现场条件不确定、补充数据有限的情况下,持续稳定地完成任务。

二、连续三轮,满分验证真实操作稳定性

在人形机器人工业上下料操作任务中,方斌团队取得了全场唯一的满分,也因此引发大量关注。

ICRA真机挑战赛唯一满分,一支中国具身新团队浮出水面

在这一任务中,机器人需要从一个传送带上抓取物体,通过双臂协同完成交接,再将物体稳定放置到另一个传送带上。

对人来说,这是一组很自然的动作:看见物体,伸手拿起,递给另一只手,再放到指定位置。但对机器人而言,这个过程涉及多个连续环节。

现场任务中,物体位置会被随机重新摆放,传送带持续运动。机器人需要判断合适的抓取点,规划双臂运动轨迹,完成双手之间的交接,并在动态场景中准确放置。

任一环节出现偏差,都可能导致任务失败。抓取角度不准,物体可能拿不稳;双臂交接时序不对,物体可能掉落;放置位置偏差过大,也无法完成任务要求。

最难的是,REAL-I并不只看一次操作的完成度。按照比赛规则,机器人需要在物体随机重新摆放后连续完成三轮任务,并以平均成绩作为最终得分。因此,满分不仅代表一次成功操作,更代表模型在多轮扰动下仍能保持稳定输出。

对于正在走向产业落地的具身智能而言,这类能力的重要性正在上升。机器人演示可以选择最理想的一次结果,但真实工厂无法接受“偶尔成功”。在真实场景任务中,稳定性、可复现性和现场快速适配能力,往往比单次任务上限更关键。

三、专攻灵巧操作智能,让机器人实现价值创造

deeptouch.ai背后,是成立于2025年的瞬恒智能。

这是一家此前对外信息并不多的具身智能创业公司。经机器人前瞻了解,瞬恒智能聚焦机器人灵巧操作与触觉智能,试图从视触觉融合、触觉感知和末端操作模型等方向,解决机器人进入真实产业场景时面临的操作问题。

和一些从整机形态、运动能力或通用人形机器人故事切入的公司不同,瞬恒智能的技术路线聚焦于解决机器人价值创造的“最后1mm”。

这也是作为首席科学家的方斌长期的研究方向。公开资料显示,方斌曾任教于清华大学计算机系,现为北京邮电大学拔尖人才教授,博士生导师,具身智能专业负责人,兼任中国人工智能学会理事、认知系统与信息处理专委会秘书长、中国计算机学会智能机器人专委会常务委员,在视触觉感知、人机交互与操作大模型等具身智能方向上产出系列代表性创新成果。

机器人前瞻在与方斌的沟通中获知,此次比赛所采用的是统一的机器人平台,核心展现了团队在视觉感知、动作生成、双臂协同和真机部署方面的能力。但也正因如此,瞬恒智能核心专攻的视触觉技术并未在比赛中展现。

在精密装配、工件插接、高精度对位等真正对具身智能有需求的真实任务中,机器人进入接触阶段后,视觉常常会被工件或机械臂自身遮挡。仅凭视觉,模型很难自主完成偏差判断和毫米级的误差修正。

方斌目前带领瞬恒智能团队的主要方向之一,就是视触觉感知与操作模型深度融合,解决纯视觉模型在物理交互中精度不足、实时反馈缺失、仿真与现实脱节的问题。据透露,目前其在高精度工业任务中的装配成功率,相比纯视觉模型已提升了2.25倍。

这个方向并不是瞬恒智能一家公司的孤立判断。

在今年ICRA和CVPR相关机器人议题中,触觉正在被越来越频繁地放到具身智能核心能力框架下讨论。ICRA 2026期间,专项设置了视觉-触觉协同、触觉皮肤、机器人手指触觉传感器集成等多个相关Workshop和Tutorial,相关论文与技术创新数量正在快速增加。

这可能意味着,行业对机器人操作能力的理解正在发生变化。仅让机器人“看见”物体,已经不足以支撑更复杂的物理交互。尤其在抓取、插接、装配、交接等任务中,机器人需要的不只是视觉识别和轨迹规划,还包括对接触状态、受力变化和微小偏差的实时感知。

方斌在接受机器人前瞻采访时表示:“ICRA具身智能挑战赛验证了在纯视觉条件下我们操作模型完成真实任务部署的能力。但面向更复杂、更高精度的工业操作,仅靠视觉还不够。视触觉融合要解决的,就是机器人接触物体之后,如何感知偏差、理解受力,并完成最后的精细修正。

从这个角度看,deeptouch.ai在ICRA真机赛场拿下唯一满分,并不只是一次单项比赛结果。同时也让一个话题被再次关注:当机器人从展示走向真实作业,操作智能究竟要靠什么补上最后一段能力缺口。

至少在近期的国际会议和真实机器人挑战赛中,答案已经越来越清晰:视觉仍然重要,但触觉正在成为机器人真正进入物理世界时难以绕开的模态。

随着灵巧手、执行器等硬件在触觉感知上的不断成熟,谁能真正把触觉融入模型与操作闭环中,可能会成为具身智能行业的下一个“考点”。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平