大晓机器人开源具身操作VLA模型ACE-Ego
「大晓机器人联合香港中文大学发布ACE-Ego模型,在多项基准测试中刷新纪录,实现复杂零售操作,并已开源。」
大晓机器人今日正式宣布,联合香港中文大学多媒体实验室共同推出全新“一脑多型”具身操作VLA(Vision-Language-Action)模型ACE-Ego,并向行业全面开源。这一模型专注于提升机器人在复杂环境下的操作能力,尤其在零售场景中展现出令人瞩目的表现。
据官方介绍,ACE-Ego在国际公认的人形机器人操作基准RoboCasa GR1 TableTop上,以72.8%的平均成功率刷新当前最高纪录,夺得榜首。这一成绩大幅超越了英伟达GR00T、PI π₀.₅、京东JoyAI-RA等主流模型,显示出ACE-Ego在基础操作任务中的强大竞争力。此外,在高难度双臂操作基准RoboTwin 2.0的强域随机化测试中,ACE-Ego的成功率高达90.62%,远超行业平均水平,进一步验证了其在复杂、多变环境下的鲁棒性。
ACE-Ego模型的核心亮点在于其“一脑多型”架构设计,能够适配多种机器人形态,实现从单一任务到多任务操作的灵活迁移。目前,该模型已能稳定完成塑料袋打包、鞋子装入鞋盒等长周期、强接触的复杂零售操作。这些操作覆盖了商品整理、打包履约等典型线下零售环节,意味着ACE-Ego已具备在真实商业场景中落地的潜力。
从技术层面看,ACE-Ego采用视觉-语言-动作联合建模的方式,使机器人能够通过视觉输入理解环境,结合语言指令进行推理,并最终生成精确的动作序列。这种端到端的学习范式减少了传统机器人编程中繁琐的规则设定,显著提升了模型的泛化能力。开源策略的采用,则有助于吸引全球开发者共同参与迭代优化,加速具身智能技术的普及与应用。
大晓机器人此次开源ACE-Ego,不仅展示了其在具身操作领域的技术积累,也为行业提供了一个高性能、可复用的基础模型。随着更多开发者基于ACE-Ego进行二次开发,未来零售、物流、家庭服务等场景中的机器人应用有望迎来新一轮突破。
来源:Heooo AI工具导航