技术进展

Liquid AI开源8.3B端侧大模型LFM2.5

Heooo 05月30日00时00分 24 阅读

「Liquid AI发布并开源端侧大模型LFM2.5，采用8.3B参数MoE架构，激活仅1.5B参数，支持128K上下文，推理性能强劲，可在手机笔记本上运行。」

人工智能初创公司Liquid AI近日正式发布并开源了全新的端侧大模型LFM2.5，标志着端侧大模型在架构与性能上取得重要突破。该模型采用稀疏混合专家（MoE）设计，总参数量为8.3B，但在每个Token生成时仅激活1.5B参数，这种稀疏性使得模型能够流畅地在手机及笔记本电脑等本地设备上运行，兼顾了高性能与低资源消耗。

在长文本扩展与推理能力方面，LFM2.5相比前代产品实现了显著升级。其上下文窗口从32K大幅扩展至128K词元，预训练数据量也从12T提升至38T。作为一款纯推理模型，LFM2.5会在输出最终答案前生成显式的思维链，且其高压缩率的词表能更高效地处理中文、阿拉伯文等九种语言。为了解决长推理中的逻辑死循环与幻觉问题，开发团队在训练中引入了两阶段强化学习（RL）。其中，偏好优化有效减少了长链路推理中的“死循环”，而专门的防幻觉奖励机制则让模型在面对超出知识库的问题时能够主动拒绝回答，提升了模型的可靠性与安全性。

在端侧性能表现上，LFM2.5实现了爆发式增长。其在逻辑推理与反幻觉基准测试中的得分大幅超越前代，甚至在指令遵循上媲美更大参数量的模型。在工具调用方面，模型默认输出高效的Python函数调用，并支持在系统提示词中无缝切换为JSON格式，为开发者提供了极大的灵活性。该模型在发布首日便获得了主流推理生态的全面支持，包括llama.cpp、MLX、vLLM和SGLang。在硬件实测中，它在M5 Max芯片上的解码速度高达每秒253字节，而在手机端也能达到每秒约30字节，完美兼顾了端侧运行的私密性与高效率，为AI应用的本地化部署提供了强大动力。

# 端侧大模型 # LFM2.5 # 开源 # 混合专家模型 # AI推理

来源：Heooo AI工具导航

热门工具

起号兽

# 生产力工具

起号兽

起号兽，你的AI短视频运营助手。智能规划内容、生成脚本、指导拍摄、优化发布，一站式帮你打造个人IP。支持抖音、快手、小红书、视频号多平台运营。

# 生产力工具访问官网

豆包

# 对话机器人

豆包

豆包是你的 AI 聊天智能对话问答助手，写作文案翻译编程全能工具。豆包为你答疑解惑，提供灵感，辅助创作，也可以和你畅聊任何你感兴趣的话题。

# 对话机器人访问官网

巨量创意（字节跳动）

# 视频生成

巨量创意（字节跳动）

抖音/巨量引擎官方AI创意平台，支持图文/视频广告自动生成、A/B测试与智能优化。

# 视频生成访问官网

TRAE - IDE

# 代码助手

TRAE - IDE

TRAE AI IDE | 国内首款 AI 原生集成开发环境，深度集成 Doubao-1.5-pro 与 DeepSeek 模型，支持中文自然语言一键生成完整代码框架，实时预览前端效果并智能修复 BUG。首创 Builder 模式实现需求到代码的自动化开发，兼容 Windows/macOS 系统，官网下载即用。

# 代码助手访问官网