MiniMax M3开源：原生多模态与百万上下文

稀宇科技（MiniMax）近日正式开源其旗舰模型MiniMax M3，并同步发布了MSA（MiniMax Sparse Attention）技术论文。M3是一款原生多模态模型，总参数达到428B，激活参数为23B，是首个从Step 0开始进行多模态混合训练的开源模型。

据官方介绍，M3在Artificial Analysis综合智能指数排行榜上取得了全球开源模型的最高排名。该模型支持百万级别的上下文长度，能够处理更复杂的任务场景，如长文档理解、多轮对话和跨模态推理。

在性能方面，MiniMax M3在编码与智能体评测中达到行业顶尖水平。它具备自主任务拆解、工具调用与多步推理能力，官方宣称其生成的代码目标是直接可交付，而非“能跑但需要人改”。这标志着M3在实用性上迈出了重要一步，尤其适合开发者生态中的自动化编程和智能体应用。

针对发布后访问量激增带来的体验问题，MiniMax团队持续优化模型响应速度。目前，M3的输出速度已从上线时的约30 TPS提升至约80 TPS，官方表示接下来还会继续提速30-40%，使模型响应更加流畅。这种迭代优化体现了开源社区对实时性需求的快速响应。

M3的开源版本已在Hugging Face平台发布，开发者可获取模型权重并进行本地部署或二次开发。MSA技术论文的同步发布，则为研究人员提供了稀疏注意力机制的详细实现，有助于推动多模态大模型在效率与性能上的进一步突破。

此次开源不仅巩固了MiniMax在AI技术前沿的地位，也为全球开发者社区提供了一个强大的多模态基座模型。随着上下文窗口的扩展和推理速度的提升，M3有望在智能体、代码生成、多模态理解等场景中发挥关键作用。