大晓机器人开源具身操作VLA模型ACE-Ego

大晓机器人今日正式宣布，联合香港中文大学多媒体实验室共同推出全新“一脑多型”具身操作VLA（Vision-Language-Action）模型ACE-Ego，并向行业全面开源。这一模型专注于提升机器人在复杂环境下的操作能力，尤其在零售场景中展现出令人瞩目的表现。

据官方介绍，ACE-Ego在国际公认的人形机器人操作基准RoboCasa GR1 TableTop上，以72.8%的平均成功率刷新当前最高纪录，夺得榜首。这一成绩大幅超越了英伟达GR00T、PI π₀.₅、京东JoyAI-RA等主流模型，显示出ACE-Ego在基础操作任务中的强大竞争力。此外，在高难度双臂操作基准RoboTwin 2.0的强域随机化测试中，ACE-Ego的成功率高达90.62%，远超行业平均水平，进一步验证了其在复杂、多变环境下的鲁棒性。

ACE-Ego模型的核心亮点在于其“一脑多型”架构设计，能够适配多种机器人形态，实现从单一任务到多任务操作的灵活迁移。目前，该模型已能稳定完成塑料袋打包、鞋子装入鞋盒等长周期、强接触的复杂零售操作。这些操作覆盖了商品整理、打包履约等典型线下零售环节，意味着ACE-Ego已具备在真实商业场景中落地的潜力。

从技术层面看，ACE-Ego采用视觉-语言-动作联合建模的方式，使机器人能够通过视觉输入理解环境，结合语言指令进行推理，并最终生成精确的动作序列。这种端到端的学习范式减少了传统机器人编程中繁琐的规则设定，显著提升了模型的泛化能力。开源策略的采用，则有助于吸引全球开发者共同参与迭代优化，加速具身智能技术的普及与应用。

大晓机器人此次开源ACE-Ego，不仅展示了其在具身操作领域的技术积累，也为行业提供了一个高性能、可复用的基础模型。随着更多开发者基于ACE-Ego进行二次开发，未来零售、物流、家庭服务等场景中的机器人应用有望迎来新一轮突破。