行业资讯

xAI被曝用Anthropic数据训练模型

Heooo 06月08日15时00分 2 阅读

「马斯克旗下xAI被曝在API权限被撤销后,仍通过个人账户和第三方服务提取Claude数据训练编码模型,折射行业合成数据依赖与内部动荡。」

据《The Information》披露,埃隆·马斯克旗下的AI初创公司xAI曾利用Anthropic旗下Claude模型的输出数据,来训练自己的编码模型。尽管Anthropic已于2026年1月撤销了xAI的官方API访问权限,但xAI工程师随后转入“地下”,继续通过个人账户及第三方中间服务Blackbox AI进行数据提取。这一操作方式引发了业界对AI训练数据合规性与行业灰色实践的广泛讨论。

此前,马斯克曾在法庭上承认xAI“部分”使用了OpenAI的模型进行训练,并称这种利用头部模型输出进行合成数据流转的做法已成为“行业标准”。然而,外部依赖未能掩盖其内部研发的动荡。目前xAI的预训练团队已缩减至不足五人,包括四位Grok代码负责人在内的多位联合创始人已于近几个月内相继离职。更严重的是,近期发生员工意外删除关键训练数据、导致两至三周工作成果付诸东流的重大失误,这迫使xAI的算力资源目前只能通过SpaceX临时转租给谷歌等企业。

这一事件不仅将xAI推至风口浪尖,也折射出当前生成式AI行业在高质量训练数据枯竭背景下的普遍焦虑。在合规开源数据触及天花板的当下,通过“知识蒸馏”和擦边球式的合成数据提取来提升模型性能,已成为后来者追赶第一梯队的灰色捷径。xAI此次面临的技术路线依赖与核心团队流失,预示着单纯依赖算力堆叠和外部数据嫁接的模式正遭遇瓶颈。AI独角兽企业亟需在底层自主创新与组织稳定性上寻找更稳固的支撑,以避免在激烈的技术竞赛中被淘汰。

# xAI # Anthropic # 合成数据 # 模型训练 # 行业动态

来源:Heooo AI工具导航