开源项目

面壁智能开源1B模型MiniCPM5-1B,性能超越2B参数模型

Heooo 05月27日12时00分 2 阅读

「面壁智能联合清华大学、OpenBMB开源社区发布MiniCPM5-1B端侧模型,以1B参数在AA-Index上超越所有2B以下模型,INT4量化后权重仅0.5GB,可运行于手机和浏览器。」

面壁智能近日联合清华大学与OpenBMB开源社区,正式发布并开源了最新一代端侧文本基座大模型——MiniCPM5-1B。这款模型以仅1B(10亿)参数的规模,在权威评测榜单AA-Index(Artificial Analysis Intelligence Index)上超越了所有2B参数以下的模型,展现出极高的性能效率比。

与3个月前发布的Qwen3.5-2B相比,MiniCPM5-1B不仅在效果上更优,参数量还减少了一半,这意味着开发者可以用更少的计算资源获得更强的模型能力。官方数据显示,该模型经过INT4量化后,权重仅占0.5GB存储空间,能够直接运行在手机上,甚至可以在浏览器中完成推理,极大降低了端侧AI部署的门槛。

MiniCPM5-1B的Base Model版本由面壁智能自主研发的AI训练框架ForgeTrain完成预训练。ForgeTrain框架针对小参数模型的高效训练进行了优化,使得MiniCPM5-1B在有限的参数量下依然能够学习到丰富的语言表征和推理能力。这种“小模型、大能力”的技术路线,为端侧AI应用提供了新的可能性,尤其是在隐私保护、离线使用和低延迟场景中具有显著优势。

目前,MiniCPM5-1B已全面开源,包括模型权重、训练数据集以及完整的部署方案。开发者可以基于这些资源,快速将模型集成到移动应用、浏览器插件或物联网设备中,无需依赖云端算力。这一开源举措不仅推动了端侧AI技术的普及,也为社区贡献了一个高质量的小参数基座模型基准。

从技术角度看,MiniCPM5-1B的成功表明,通过精细化的训练策略和架构设计,小参数模型完全可以在特定任务上与大参数模型竞争,甚至超越。这对于降低AI应用的成本、扩大AI在边缘设备上的覆盖范围具有重要意义。未来,随着端侧芯片性能的提升和量化技术的进步,类似MiniCPM5-1B这样的轻量级模型有望成为智能设备上AI功能的核心引擎。

# 面壁智能 # MiniCPM5-1B # 端侧模型 # 开源

来源:Heooo AI工具导航