提交/推广产品 —

英伟达开源Polar框架，Codex性能飙升594% 封面图

开源项目

英伟达开源Polar框架，Codex性能飙升594%

Heooo 05月28日15时00分 26 阅读

「英伟达发布开源AI框架Polar，通过GRPO训练方法使代码智能体Codex在SWE-Bench测试中性能提升近600%，训练效率提高5倍。」

英伟达研究团队近日发布了一个全新的开源AI框架——Polar，旨在解决现有代码智能体框架在强化学习训练中的适配难题。该框架允许Codex、Claude Code、Qwen Code等智能体框架接入广义相对策略优化（GRPO）训练方法，而无需改变其原有的工具调用、上下文组织和补丁提交方式，为智能体性能提升开辟了新路径。

GRPO是一种针对强化学习的优化技术，通过奖励信号调整模型策略，帮助模型在多步决策任务中学习更优行为。在这项研究中，GRPO主要用于代码智能体的训练，让模型在实际的工具调用和补丁提交流程中不断改进表现。研究表明，智能体的强化学习正从单步任务转向更复杂的长流程任务，如代码仓库操作、浏览器交互和操作系统控制，这些任务依赖现有执行框架，涉及多轮调用和工具使用，直接改写为传统强化学习环境接口会导致关键训练信号丢失。

Polar框架架构图

Polar框架的独特之处在于不重写智能体框架，而是在模型API边界处放置智能体，保持原有运行逻辑不变。它兼容多种请求风格，能记录关键数据并将其转化为训练信息。系统架构包括任务提交、会话调度和状态持久化等功能，通过优化初始化、运行和后处理流程，显著提升训练效率。实验结果显示，使用Polar与GRPO训练的智能体在SWE-Bench Verified测试中表现大幅提升，Codex的pass@1分数从3.8%跃升至26.4%，增长幅度达594.74%。

此外，该框架在效率方面同样出色，训练时间减少了约5.39倍，GPU平均利用率显著提升。这一突破为未来智能体训练提供了更强大的支持，表明开源社区在代码智能体强化学习领域迈出了重要一步。

# 英伟达 # Polar # 开源框架 # GRPO # 代码智能体

来源：Heooo AI工具导航

热门工具

起号兽

# 生产力工具

起号兽

起号兽，你的AI短视频运营助手。智能规划内容、生成脚本、指导拍摄、优化发布，一站式帮你打造个人IP。支持抖音、快手、小红书、视频号多平台运营。

# 生产力工具访问官网

豆包

# 对话机器人

豆包

豆包是你的 AI 聊天智能对话问答助手，写作文案翻译编程全能工具。豆包为你答疑解惑，提供灵感，辅助创作，也可以和你畅聊任何你感兴趣的话题。

# 对话机器人访问官网

巨量创意（字节跳动）

巨量创意（字节跳动）

抖音/巨量引擎官方AI创意平台，支持图文/视频广告自动生成、A/B测试与智能优化。

# 视频生成访问官网

TRAE - IDE

TRAE - IDE

TRAE AI IDE | 国内首款 AI 原生集成开发环境，深度集成 Doubao-1.5-pro 与 DeepSeek 模型，支持中文自然语言一键生成完整代码框架，实时预览前端效果并智能修复 BUG。首创 Builder 模式实现需求到代码的自动化开发，兼容 Windows/macOS 系统，官网下载即用。

# 代码助手访问官网

剪映

剪映

字节跳动旗下AI视频剪辑工具，支持智能抠图、自动字幕等。

# Ai大模型访问官网

智谱AI

智谱AI

智谱AI推出的GLM大模型系列，支持多场景智能应用。

# Ai大模型访问官网

Qoder

Qoder

Qoder 是一个由 AI 驱动的智能体编码平台，用于真正的软件开发。Experience 提供智能代码生成、基于对话的编程和高级开发者工具。

# 代码助手访问官网

度加剪辑

度加剪辑

百度推出的AI视频编辑工具，主打语音转字幕和智能成片。

# 视频生成访问官网

Coze

Coze

字节跳动推出的AI Bot开发平台，支持多场景应用。

# Ai大模型访问官网

WebTerm

# 生产力工具

WebTerm

一个用于无忧学习CLI的浏览器终端沙箱

# 生产力工具访问官网

不知道选什么工具？3步搞定

AI帮你精准匹配