游戏训练AI代理获23亿美元估值
「General Intuition获3.2亿美元融资,估值23亿,其AI模型通过《堡垒之夜》等游戏学习空间推理,并成功迁移到实体机器人控制。」
一家名为General Intuition的AI初创公司近日宣布完成3.2亿美元融资,估值达到23亿美元。这家公司的核心主张颇为独特:通过电子游戏训练AI代理,使其能够理解并操控现实世界中的机器人。该公司首席执行官Pim de Witte向到访的媒体展示了其研发成果——一个正在连续运行100小时的AI代理,它正在《堡垒之夜》中自主游玩,而驱动这个虚拟游戏代理的“大脑”,同时也在控制着一台四足机器人。
在General Intuition位于纽约的研发中心,记者亲眼见证了这一幕。一个形似巨型昆虫的机器人依靠单摄像头进行探索,它缓缓走向访客,绕行一圈,然后继续在办公室内移动。尽管偶尔会碰到椅子腿或垃圾桶,但整个过程仅需八分钟的真实世界机器人数据,就能完成对AI模型的微调。值得注意的是,这些数据是在街头采集的,而非机器人当前所处的办公室环境。
这家初创公司是从Pim de Witte的另一家公司Medal中剥离出来的。Medal允许游戏玩家上传和分享游戏剪辑,这些长达数亿小时的游戏视频为General Intuition的模型提供了初始训练数据。但关键并非视频本身,而是这些剪辑中嵌入的动作标签——精确记录了玩家何时按下了哪个按钮。de Witte认为,大多数竞争对手试图仅从视频中推断动作,这是不够的。“我们拥有一个单一模型,既能响应《堡垒之夜》屏幕上的信息并采取行动,也能以LLM永远无法做到的方式应对真实世界的动态,”de Witte说。
在演示过程中,记者还体验了General Intuition的世界模型。这是一个逐帧生成的模拟环境,而非传统游戏引擎渲染的结果。当记者尝试在模拟环境中行走时,直接撞上了一堵墙。与其他同类演示不同,General Intuition的代理并没有在撞墙后卡住,而是表现出类似人类的反应——它后退一步,调整方向,然后继续前进。这种从游戏到模拟再到实体机器人的泛化能力,正是General Intuition存在的理由。
本轮融资由多家重量级投资者参与,使General Intuition的总披露融资额达到4.54亿美元。此前在去年十月,该公司在成立时已获得1.34亿美元融资。de Witte将这种训练方法称为“未来预训练的下一阶段”。他认为,通过游戏数据训练的模型,能够学习到空间-时间推理能力,即理解如何在空间和时间中移动,这种能力是传统语言模型所不具备的。
从技术路径来看,General Intuition的方法与当前主流的大语言模型路线截然不同。它不依赖海量文本数据,而是利用游戏中的交互数据来训练代理理解物理世界的因果关系。当AI代理在《堡垒之夜》中学会躲避子弹、寻找掩体、规划路线时,它实际上是在学习一种通用的空间推理能力。这种能力可以被迁移到现实世界的机器人上,使其能够自主导航、避障和执行任务。
对于AI行业而言,General Intuition的融资成功可能预示着一条新的技术路线正在获得资本认可。过去几年,大语言模型和图像生成模型占据了AI领域的大部分注意力,但具身智能——即能够与物理世界交互的AI——一直是学术界和工业界追求的目标。通过游戏数据训练通用代理,再将其部署到机器人上,这一思路为具身智能的发展提供了一条低成本、高效率的路径。
de Witte透露,公司计划利用新资金扩大模型训练规模,并探索更多应用场景。目前,General Intuition的模型已经在多个游戏环境中进行了测试,包括《堡垒之夜》和《我的世界》等热门游戏。下一步,团队将重点优化模型从虚拟到现实的迁移效率,减少对真实世界数据的依赖。如果这一目标能够实现,那么未来机器人或许不再需要大量的真实环境训练,而是可以直接从游戏经验中学习如何与物理世界互动。
来源:Heooo AI工具导航