数据矿工:Human Archive如何用印度零工数据训练机器人
「Human Archive完成820万美元融资,通过让印度零工佩戴摄像设备采集第一人称视角数据,为AI实验室训练机器人提供稀缺的物理世界行为数据。」
在通用机器人竞赛进入白热化的今天,高质量的现实世界行为数据已成为比算力更稀缺的战略资源。总部位于硅谷的初创公司Human Archive正在押注一个极具争议但也极具潜力的领域:通过让印度零工经济从业者佩戴摄像设备,采集“第一人称视角”视频数据,为AI实验室训练机器人“大脑”。
近日,Human Archive宣布完成820万美元的融资。本轮投资阵容堪称豪华,不仅包括Wing Venture Capital与Y Combinator,更吸引了来自OpenAI、Nvidia、Google、Meta等顶级AI公司及研究机构的高管与研究员以个人名义参投。这显示出科技界对“高质量物理世界数据”的极度渴望。
为了在同类竞品中脱颖而出,Human Archive不满足于单纯的视频采集。其技术壁垒在于多传感器同步:除了头戴式RGB-D摄像头,公司还开发并部署了触觉手套、全身动作捕捉服、手腕摄像头等装置;将运动轨迹、触觉压力、深度信息与第一人称视频在时间轴上进行毫秒级对齐;目前已在多地部署超过1,000套头戴设备和50多种复合传感器终端。
Human Archive采取了一种巧妙的众包模式:在合作的家政平台上,用户若同意工人在上门服务时采集数据,即可享受折扣服务费。对于消费者,视频记录不仅抵扣了费用,还能作为服务质量争议时的证据;对于工人,除了原本的劳务工资外,还能获得额外的每小时约1美元的采集酬劳。
尽管前景广阔,Human Archive的扩张之路并非坦途。印度家政平台巨头Urban Company和初创公司Pronto均公开拒绝了合作,Human Archive创始人与这些公司高管在社交平台X上发生了激烈交锋。其数据采集方式已引起印度电子和信息技术部的关注,重点核查其“知情同意”机制是否合规。虽然公司强调所有数据均已进行脱敏处理并模糊处理人脸,但仍面临巨大的合规压力。
尽管在印度市场遭遇巨头抵制,但Human Archive的野心远不止于此。目前,公司已开始向东南亚和美国市场扩张,并计划构建一个全球化的数据采集平台。随着OpenAI、Figure等机器人先锋企业加速推进人形机器人进入家庭与工厂,人类日常工作的“第一人称数据集”已成为决定模型成败的命门。Human Archive试图在“劳动力众包”与“机器人底层基础设施”之间建立起一座桥梁。对于Human Archive而言,接下来的挑战不在于技术,而在于其能否在保持扩张速度的同时,处理好与本土家政巨头的关系,并证明其数据采集行为在法律与道德层面不仅是合规的,更是具备长久商业价值的。
来源:Heooo AI工具导航