里约热内卢自研大模型被指模型合并

近日，一项关于巴西里约热内卢市政府下属机构IplanRIO发布的“自研”大语言模型Rio-3.5-Open-397B的争议引发了AI社区的广泛关注。根据开源社区GitHub上的一则详细报告，该模型被指控并非原创，而是通过对现有模型进行权重合并（merge）而来，且未进行任何额外的独立训练。

报告由Nex-AGI团队发布，他们声称Rio-3.5-Open-397B的权重实际上是其自身模型Nex-N2与阿里云通义千问系列开源模型Qwen3.5-397B-A17B的逐元素混合。具体而言，该模型大约由60%的Nex-N2和40%的Qwen3.5构成。这一指控的核心依据来自两个相互独立的验证方法。

第一种方法基于模型的行为测试。报告指出，当移除Rio模型硬编码的系统提示“You are Rio”后，该模型在79%的情况下会自我识别为“Nex，来自Nex-AGI”，而从未自称为“Rio”。更令人惊讶的是，模型甚至能逐字复述Nex-AGI组织的专属背景故事。这一现象强烈暗示，模型的核心知识源自Nex，而非里约市政府宣称的独立训练成果。

第二种方法则从模型权重本身入手，提供了更为量化的证据。报告作者声称，他们对Rio模型的所有60层网络及每个组件进行了分析，发现每一个权重张量都与Nex和Qwen的0.6/0.4混合比例高度吻合，偏差在数千个标准差之内。这种精确的数学对应关系，使得模型被解释为经过微调（finetune）的可能性极低，因为任何真正的微调过程都无法被简单地描述为两个预训练模型的线性插值。