Claude Opus 4.8被指蒸馏中国开源模型
「Anthropic最新发布的Claude Opus 4.8模型在API测试中频繁出现身份混淆,自称是阿里巴巴Qwen或DeepSeek等中国开源模型,引发业界对蒸馏技术的争议。」
美国AI公司Anthropic于近日正式发布了其旗舰大模型Claude Opus 4.8,该模型在多项性能榜单上取得了亮眼成绩,但随之而来的技术争议却迅速成为业界焦点。大量开发者和网友通过API测试发现,该模型在无约束的底层交互中表现出严重的“认知混乱”,多次错误地自称为阿里巴巴的“千问(Qwen)”或“DeepSeek”等中国主流开源大模型。
这一现象最早由部分技术爱好者在社交媒体上披露,随后引发了广泛讨论。测试者通过直接调用底层API(应用程序编程接口)向模型询问其身份时,模型给出的回答并非Claude系列,而是明确指向中国开源模型。例如,有用户表示,当输入“你是谁?”这样的简单查询时,模型回复称自己是“由阿里巴巴开发的Qwen模型”或“DeepSeek”。这种身份混淆在多次独立测试中高频复现,显示出并非个例。
值得注意的是,部分在网页端进行测试的用户表示无法复现该问题,并据此认为模型并未蒸馏中国大模型。然而,相关开发者解释称,网页端对话通常包含系统提示词(System Prompt)的严格约束,这些提示词会强制模型保持身份一致性,从而掩盖了底层的异常。而在没有任何约束的底层API测试中,模型则暴露出其训练或微调过程中可能存在的技术问题。这一解释得到了多数技术社区的认可,并直接指向一个核心推测:美国顶尖大模型在训练或微调过程中,极有可能大量使用了中国开源大模型的生成数据进行“蒸馏”。
蒸馏(Distillation)是一种常见的模型优化技术,指利用一个大型、高性能的教师模型(Teacher Model)的输出来训练一个更小、更高效的学生模型(Student Model)。在此次事件中,Claude Opus 4.8被指在训练或微调阶段可能大量采用了Qwen、DeepSeek等中国开源模型的生成数据作为训练素材,从而导致模型在无约束环境下出现身份混淆。这一推测之所以引发巨大争议,与Anthropic公司此前在技术政策上的强硬立场密切相关。该公司曾联合美国国防部等部门推动相关法案,试图将“大模型蒸馏”定义为一种敌对的攻击行为,并呼吁美国政府加大对华芯片与软件出口限制,甚至提出要在2028年实现美国AI领先中国两年的战略目标。如今其自家旗舰模型被指蒸馏中国开源模型,无疑在技术伦理和商业诚信层面引发了强烈质疑。
从技术角度看,此次事件也折射出当前AI开源生态的复杂局面。中国开源大模型如Qwen、DeepSeek等在全球范围内拥有广泛影响力,其高质量的训练数据和生成结果被许多开发者用于二次开发或模型优化。然而,当这种技术交流被政治化或双标化时,便容易引发信任危机。对于开发者而言,这一事件提醒他们在使用蒸馏技术时需更加谨慎,确保模型身份标识的清晰性与可追溯性,避免因训练数据来源混杂而导致认知混乱。同时,这也为AI社区敲响了警钟:在全球化技术合作日益紧密的今天,任何试图割裂技术生态的封闭行为,最终都可能反噬自身。
目前,Anthropic公司尚未就此事发表正式回应。业界普遍关注该公司是否会承认技术失误,或对模型进行紧急修复。无论结果如何,Claude Opus 4.8的“认知混乱”事件都已为AI行业提供了一个关于技术伦理、开源合作与商业诚信的深刻案例。
来源:Heooo AI工具导航