Agent-desktop:面向AI代理的原生桌面自动化CLI
开源项目

Agent-desktop:面向AI代理的原生桌面自动化CLI

Heooo 05月03日12时03分 2 阅读

「基于Rust开发的开源CLI工具,为AI代理提供桌面自动化能力,依赖系统无障碍树,无需截图与像素匹配。」

近日,一款面向AI代理的原生桌面自动化CLI工具Agent-desktop在GitHub开源发布,该工具基于Rust构建,通过操作系统无障碍树实现对任意应用的结构化访问,无需依赖截图、像素匹配或浏览器,为AI代理提供高效、可靠的桌面交互能力。

Agent-desktop:面向AI代理的原生桌面自动化CLI

Agent-desktop的核心优势在于其原生Rust实现,作为单二进制文件运行,无 runtime 依赖,同时提供C-ABI cdylib库支持,可被Python、Swift、Go、Ruby等多语言直接加载调用,避免了每次调用都fork CLI的性能损耗。目前该工具已包含53项命令,覆盖观察、交互、键盘鼠标操作、剪贴板管理、窗口控制等全场景桌面自动化需求。

Agent-desktop:面向AI代理的原生桌面自动化CLI

针对Slack、VS Code这类界面元素密集的应用,Agent-desktop推出了渐进式骨架遍历功能,通过浅层次概览+针对性深度钻取的方式,可将AI处理所需的token数量减少78%至96%,大幅降低大模型调用成本。同时,工具支持快照与元素引用功能,通过@e1、@e2这类确定性元素引用,实现AI优化的工作流。

Agent-desktop:面向AI代理的原生桌面自动化CLI

在交互逻辑上,Agent-desktop采用AX-first策略,所有操作优先通过纯无障碍API执行,仅在API不可用时才回退到鼠标事件,确保操作的准确性与稳定性。工具输出结构化JSON格式数据,包含错误码与恢复提示,便于AI代理解析处理。

Agent-desktop:面向AI代理的原生桌面自动化CLI

Agent-desktop支持多种安装方式,用户可通过npm全局安装,或使用npx直接调用,也可通过源码编译。目前该工具仅支持macOS 13.0+系统,需要授予终端应用无障碍权限,用户可通过命令行触发权限请求对话框,或手动在系统设置中配置。

Agent-desktop:面向AI代理的原生桌面自动化CLI

对于需要进程内调用的开发者,每个GitHub版本都会附带预编译的C-ABI cdylib库,支持Python、Swift等多语言直接加载调用,无需fork-exec。开发者可通过校验和文件或Sigstore来源验证下载包的完整性,确保使用安全。目前项目已提供完整的消费者指南,涵盖错误处理、所有权规则、线程约束等细节,帮助开发者快速集成。

# 桌面自动化 # AI代理 # Rust开源工具

来源:Heooo AI工具导航

📰

资讯不存在

该资讯可能已被删除或不存在

返回资讯列表