行业资讯

摩尔线程完成MiniMax M3大模型适配

Heooo 06月13日13时00分 4 阅读

「摩尔线程旗舰AI显卡MTT S5000已完成对MiniMax M3模型的Day-0适配,通过全链路优化支撑超长上下文与多模态推理。」

6月12日,MiniMax新一代原生多模态旗舰模型M3正式开源。同日,摩尔线程宣布其旗舰级AI训推一体智算卡MTT S5000已完成对该模型的Day-0适配,意味着开发者可在发布首日即基于摩尔线程平台部署该模型。

针对MiniMax M3的核心技术特性,MTT S5000从硬件算力、软件栈到开源框架进行了全链路精准匹配与深度优化。在支撑超长上下文方面,M3采用的MSA架构带来了超长上下文窗口,对推理阶段的KV Cache存储和访存带宽提出了极高要求。MTT S5000凭借硬件级原生FP8加速,单卡AI算力(稠密)高达1000 TFLOPS;同时配备80GB大容量显存与1.6TB/s的超高带宽,为百万token级长序列提供充足的缓存空间与卓越的数据吞吐能力。此外,依托MUSA C++与Triton-MUSA等抽象层,M3的新算子结构可实现快速迁移,确保摩尔线程平台能够快速完成架构适配。

在赋能前沿Coding与Agentic能力方面,面向M3重点强化的编程与智能体场景,摩尔线程基于此前对DeepSeek-V4、MiniMax M2.7、GLM-5.1等多款国产旗舰模型的Day-0适配经验,已形成一套高效、系统化的复杂推理任务优化方法论。本次适配通过原生算子定制,在保障模型精度无损的前提下,显著提升推理吞吐、降低响应延迟;同时,摩尔线程完成了vLLM与SGLang两大主流推理框架的同步拉起,以MUSA开放架构拥抱开源生态,为开发者提供灵活多样的部署选择。

在推动原生多模态推理方面,M3作为从Step 0即进行多模态混合训练的模型,更适配当下Agentic AI多元场景的需求,同时这也要求算力底座具备多元化算力。MTT S5000智算卡覆盖从FP8至FP64全计算精度,可无缝适配从模型研发到商业化落地的完整链路,助力国产旗舰大模型快速完成生态普及。

随着MiniMax M3在MTT S5000上完成适配,开发者现在即可基于MUSA软件栈与vLLM/SGLang双框架完成部署,并持续获得算子级性能优化。这一合作不仅展示了国产AI硬件与模型生态的快速协同能力,也为多模态大模型的高效推理提供了新选择。

# 摩尔线程 # MiniMax # M3模型 # 大模型适配 # AI推理

来源:Heooo AI工具导航