技术进展

MiniMax M3发布,编程与多模态能力全面超越

Heooo 06月02日09时00分 1 阅读

「稀宇科技发布新一代大模型MiniMax M3,在编程、多模态等权威评测中超越GPT-5.5,并采用稀疏注意力架构实现算力大幅提升。」

国内人工智能领域迎来重大技术突破。稀宇科技正式发布了新一代大模型MiniMax M3,该模型不仅具备前沿的编程能力,还支持高达1M(100万)的超长上下文。更引人瞩目的是,它还同步支持包括图片、视频输入以及电脑桌面操作在内的原生多模态能力,成为国内首个集齐这三项核心能力的开源模型。

在业界公认的硬核编程评测集SWE-Bench Pro中,MiniMax M3凭借59.0%的优异得分,一举超越了GPT-5.5和Gemini 3.1 Pro,其表现已经极为接近顶尖的Opus 4.7。而在专门评估AI智能体能力的Claw-Eval测试,以及多模态文档理解测试集OmniDocBench中,M3同样斩获了令人惊艳的最高分与领先成绩。这些评测结果充分证明了M3在多个技术维度上的全面优势,尤其是在编程和智能体任务中的表现,已经达到或超越了当前国际主流模型。

性能飙升的背后,得益于M3采用了全新的稀疏注意力架构(MSA)。在处理100万字超长上下文的极端场景下,其单token计算量仅为上一代模型的二分之一,这使得模型在理解阶段提速超9倍,生成答案阶段更是提速超过15倍。这种架构创新不仅大幅降低了计算成本,还显著提升了模型在长文本处理和多模态任务中的响应速度与准确性。目前,该模型的API已正式开放使用,且官方承诺模型权重与技术报告将在10天内向全球开发者开源。这一开源举措将进一步推动AI社区的技术交流与创新,为开发者提供强大的基础模型支持。

MiniMax M3的发布标志着国产大模型在编程能力、多模态理解和长上下文处理等关键领域取得了实质性突破。其稀疏注意力架构的引入也为行业提供了新的技术路径,有望在降低算力需求的同时提升模型性能。随着API的开放和后续开源,M3有望在智能编程、文档分析、多模态交互等场景中发挥重要作用,推动AI技术的广泛应用与落地。

# MiniMax # 大模型 # 多模态 # 编程 # 稀疏注意力

来源:Heooo AI工具导航