MiniMax发布M3大模型,编程能力超越GPT-5.5
「稀宇科技发布新一代大语言模型M3,在编程评测中超越GPT-5.5和Gemini3.1Pro,采用稀疏注意力架构实现效率飞跃,并承诺开源。」
国内大模型赛道迎来硬核技术突破。稀宇科技正式发布了新一代大语言模型——MiniMax M3,在多项权威评测中展现出强劲实力,尤其在编程能力上力压GPT-5.5等竞品,引发行业广泛关注。
在极具挑战性的编程评测集SWE-Bench Pro上,M3取得了59.0%的优异得分,这一成绩不仅超越了GPT-5.5和Gemini3.1Pro,更逼近了行业标杆Claude3.5Opus。此外,在考验AI智能体调度能力的Claw-Eval评测,以及考察多模态文档解析能力的OmniDocBench测试中,M3均斩获了行业最高分或超越了Gemini3.1Pro。
M3能够在性能飙升的同时保持高效运转,核心得益于其底层架构的重大创新。该模型采用了全新的稀疏注意力架构MSA(MiniMax Sparse Attention)。在这种底层逻辑的加持下,模型在处理100万超长上下文时,每个Token的计算量压缩至上一代模型的二分之一。这直接带来了速度上的飞跃:在Prefilling(预填充)阶段,模型运行加速超过9倍;而在Decoding(解码生成)阶段,加速更是超过15倍,大幅降低了算力开支。
作为原生多模态模型,M3不仅能够深度理解文本,还支持图片、视频的主动输入,甚至能直接完成高难度的电脑桌面自动化操作。伴随模型的发布,MiniMax同步升级了旗下的AI编程助手产品MiniMax Code,并面向开发者推出了全新的Token Plan订阅方案,共分为Plus(49元/月)、Max(119元/月)和Ultra(469元/月)三档,以满足不同体量的开发需求。
目前,M3的API接口已正式对公众开放使用。为了吸引更多开发者卡位生态,官方还上线了限时福利,其512k上下文版本将开展为期7天的限时5折优惠。此外,MiniMax官方承诺,该模型的完整权重以及详细的技术报告将在10天内面向全球开发者正式开源。这种“底牌全露”的开源底气,无疑将进一步加速端侧与应用层AI创新的爆发。
来源:Heooo AI工具导航