MiniMax M3开源:原生多模态与百万上下文
「稀宇科技开源MiniMax M3旗舰模型,总参数428B,激活参数23B,原生多模态混合训练,百万上下文窗口,在开源模型智能指数中排名最高。」
稀宇科技(MiniMax)近日正式开源其旗舰模型MiniMax M3,并同步发布了MSA(MiniMax Sparse Attention)技术论文。M3是一款原生多模态模型,总参数达到428B,激活参数为23B,是首个从Step 0开始进行多模态混合训练的开源模型。
据官方介绍,M3在Artificial Analysis综合智能指数排行榜上取得了全球开源模型的最高排名。该模型支持百万级别的上下文长度,能够处理更复杂的任务场景,如长文档理解、多轮对话和跨模态推理。
在性能方面,MiniMax M3在编码与智能体评测中达到行业顶尖水平。它具备自主任务拆解、工具调用与多步推理能力,官方宣称其生成的代码目标是直接可交付,而非“能跑但需要人改”。这标志着M3在实用性上迈出了重要一步,尤其适合开发者生态中的自动化编程和智能体应用。
针对发布后访问量激增带来的体验问题,MiniMax团队持续优化模型响应速度。目前,M3的输出速度已从上线时的约30 TPS提升至约80 TPS,官方表示接下来还会继续提速30-40%,使模型响应更加流畅。这种迭代优化体现了开源社区对实时性需求的快速响应。
M3的开源版本已在Hugging Face平台发布,开发者可获取模型权重并进行本地部署或二次开发。MSA技术论文的同步发布,则为研究人员提供了稀疏注意力机制的详细实现,有助于推动多模态大模型在效率与性能上的进一步突破。
此次开源不仅巩固了MiniMax在AI技术前沿的地位,也为全球开发者社区提供了一个强大的多模态基座模型。随着上下文窗口的扩展和推理速度的提升,M3有望在智能体、代码生成、多模态理解等场景中发挥关键作用。
来源:Heooo AI工具导航