技术进展

四台Mac Studio集群跑通万亿参数大模型

Heooo 06月23日01时34分 6 阅读

「LM Studio与苹果在WWDC2026上演示,仅用四台Mac Studio组成集群,成功运行月之暗面万亿参数大模型Kimi K2.6,打破云端依赖,推动本地AI部署新边界。」

在刚刚落幕的WWDC2026上,LM Studio与苹果联合完成了一场令人瞩目的技术演示——仅用四台Mac Studio组成的集群,就成功运行了月之暗面(Moonshot AI)的万亿参数大模型Kimi K2.6。这一成果打破了“万亿模型必须依赖云端GPU集群”的固有认知,让消费级硬件承载前沿AI算力成为现实。

Kimi K2.6总参数规模高达1万亿,采用MoE(混合专家)架构,激活参数为320亿,支持长上下文、多模态输入及智能体任务处理。此次演示中,四台Mac Studio通过苹果的内存共享和互联技术组成集群,统一内存总量约达1.5TB,足以满足这一巨型模型的推理需求。此前开发者测试显示,在类似配置下Kimi K2.6可达到约28 tokens/s的生成速度,而功耗远低于传统GPU方案。

更值得关注的是,演示中还展示了LM Studio的LM Link远程访问功能。用户可以在MacBook Neo笔记本和iPhone上安全地远程连接到Mac Studio集群,与正在运行的模型实时交互,而所有数据和通信始终保持本地化处理,不走云端。LM Link已更新至LM Studio的Mac应用和Locally AI的iOS应用中,支持端到端加密连接。这一设计让用户即使手握轻量设备,也能随时调用集群级的AI算力,同时不必担心隐私泄露风险。

配合苹果Thunderbolt 5 RDMA等多设备内存共享技术,整个生态在AI本地化部署方面的技术闭环正在加速成型。此次合作释放了一个清晰信号:本地部署万亿参数大模型不再是遥不可及的实验室概念,而是正在走向开发者案头的工程现实。随着苹果硬件互联能力的持续进化,消费级设备承载大规模AI推理的边界,有望被进一步拓宽。

# 万亿参数 # 本地部署 # Mac Studio # LM Studio # AI推理

来源:Heooo AI工具导航