技术进展

GraphBit框架:基于DAG的确定性智能体编排方案

Heooo 05月15日12时18分 3 阅读

「GraphBit是一种基于有向无环图(DAG)的智能体编排框架,通过Rust引擎实现确定性路由与状态管理,在GAIA基准测试中取得67.6%准确率且零幻觉。」

大型语言模型(LLM)智能体框架正面临一个核心矛盾:当依赖模型自身进行工作流编排时,虽然获得了一定灵活性,却也引入了幻觉路由、无限循环和不可复现执行等严重问题。近期发表于arXiv的一篇论文提出了一种名为GraphBit的框架,试图从根本上解决这一困境。

GraphBit的核心创新在于将智能体工作流从“提示驱动”转向“引擎编排”。在现有大多数框架中,LLM需要自行决定下一步调用哪个工具或执行哪个子任务,这种模式本质上依赖于模型的即时推理能力。然而,当任务链条变长或涉及复杂分支时,模型容易产生“幻觉路由”——即错误地选择不存在的工具或路径,导致执行失败。GraphBit则采用有向无环图(DAG)来显式定义工作流,每个节点代表一个智能体(被实现为类型化函数),而一个基于Rust构建的轻量级引擎负责所有路由、状态转换和工具调用。这种设计确保了执行过程完全确定、可审计且可复现。

在技术架构上,GraphBit引入了三层内存系统以隔离上下文:临时暂存空间(ephemeral scratch space)用于单步计算中的中间结果;结构化状态(structured state)维护全局工作流进度;外部连接器(external connectors)则负责与数据库、API等外部资源交互。这种分层设计有效防止了“上下文膨胀”问题——在长流程任务中,若所有历史信息都堆积在单一上下文窗口中,会严重稀释模型对当前步骤的注意力,从而降低推理质量。通过隔离不同阶段的内存,GraphBit保证了每个智能体仅访问其所需的最小上下文,显著提升了长流程任务的稳定性。

实验结果表明,GraphBit在GAIA基准测试中表现出色。该基准涵盖三类任务:零工具任务(纯推理)、文档增强任务(需要从文档中检索信息)以及Web驱动任务(需要调用在线工具)。GraphBit以67.6%的准确率超越其他六种主流框架(包括AutoGPT、LangChain Agent、ReAct等),同时实现了零框架诱导幻觉——即所有错误均来自模型自身能力限制,而非框架编排失误。在性能方面,GraphBit仅引入11.9毫秒的额外延迟,且吞吐量最高,这得益于Rust引擎的高效执行以及DAG结构的并行分支支持。

消融实验进一步揭示了各组件的重要性:确定性执行对工具密集型任务的贡献最大,准确率提升超过15个百分点;三层内存架构中,结构化状态层的贡献最为显著,尤其是在需要跨步骤状态追踪的场景中。这表明,对于真实世界中常见的多工具协作任务(如数据抓取、报告生成、自动化测试等),GraphBit的设计理念具有明显优势。

GraphBit的出现并非要完全否定现有智能体框架,而是提供一种新的设计范式:在需要高可靠性、可审计性和可复现性的企业级应用中,引擎编排的确定性路径可能比模型自编排的灵活性更具价值。未来,该框架的开发者计划进一步探索动态DAG生成(根据任务描述自动构建工作流图)以及多模态智能体的编排支持。对于正在构建生产级LLM应用的团队而言,GraphBit提供了一种值得关注的替代方案。

# GraphBit # 智能体编排 # DAG # GAIA基准 # Rust引擎

来源:Heooo AI工具导航

📰

资讯不存在

该资讯可能已被删除或不存在

返回资讯列表