技术进展

Liquid AI开源8.3B端侧大模型LFM2.5

Heooo 05月30日00时00分 1 阅读

「Liquid AI发布并开源端侧大模型LFM2.5,采用8.3B参数MoE架构,激活仅1.5B参数,支持128K上下文,推理性能强劲,可在手机笔记本上运行。」

人工智能初创公司Liquid AI近日正式发布并开源了全新的端侧大模型LFM2.5,标志着端侧大模型在架构与性能上取得重要突破。该模型采用稀疏混合专家(MoE)设计,总参数量为8.3B,但在每个Token生成时仅激活1.5B参数,这种稀疏性使得模型能够流畅地在手机及笔记本电脑等本地设备上运行,兼顾了高性能与低资源消耗。

在长文本扩展与推理能力方面,LFM2.5相比前代产品实现了显著升级。其上下文窗口从32K大幅扩展至128K词元,预训练数据量也从12T提升至38T。作为一款纯推理模型,LFM2.5会在输出最终答案前生成显式的思维链,且其高压缩率的词表能更高效地处理中文、阿拉伯文等九种语言。为了解决长推理中的逻辑死循环与幻觉问题,开发团队在训练中引入了两阶段强化学习(RL)。其中,偏好优化有效减少了长链路推理中的“死循环”,而专门的防幻觉奖励机制则让模型在面对超出知识库的问题时能够主动拒绝回答,提升了模型的可靠性与安全性。

在端侧性能表现上,LFM2.5实现了爆发式增长。其在逻辑推理与反幻觉基准测试中的得分大幅超越前代,甚至在指令遵循上媲美更大参数量的模型。在工具调用方面,模型默认输出高效的Python函数调用,并支持在系统提示词中无缝切换为JSON格式,为开发者提供了极大的灵活性。该模型在发布首日便获得了主流推理生态的全面支持,包括llama.cpp、MLX、vLLM和SGLang。在硬件实测中,它在M5 Max芯片上的解码速度高达每秒253字节,而在手机端也能达到每秒约30字节,完美兼顾了端侧运行的私密性与高效率,为AI应用的本地化部署提供了强大动力。

# 端侧大模型 # LFM2.5 # 开源 # 混合专家模型 # AI推理

来源:Heooo AI工具导航