CLI-Anything:AI Agent操作专业软件的工程化突破
CLI-Anything通过7阶段自动化管道为专业软件生成生产级CLI工具,让AI Agent直接调用真实软件能力。项目包含2280+测试用例,支持30+软件生态,并创新CLI-Hub实现工具自主选择,为Agent-Native架构提供基础设施级解决方案。

CLI-Anything:AI Agent操作专业软件的工程化突破
当AI Agent需要操作专业软件时,开发者常陷入三种困境:UI自动化脆弱易碎、有限API功能残缺、简化重实现丢失核心能力。HKUDS团队推出的CLI-Anything项目提供了更具野心的解决方案——为任何软件自动生成保留完整专业能力的CLI接口。
直击Agent操作痛点
当前AI Agent与专业软件交互存在明显断层。让大模型进行逻辑推理已相当成熟,但使其可靠操作GIMP、Blender等专业工具仍面临挑战。现有方案普遍存在三大缺陷:
- UI自动化依赖视觉识别,界面微调即可导致脚本失效
- 封闭API使大部分专业功能无法被调用
- 功能阉割的简化实现丢失软件核心价值
CLI-Anything提出根本性改进:CLI是Agent最友好的交互接口。通过自动生成调用真实软件后端的CLI工具,既保留100%专业能力,又提供机器可读的结构化输出。
七阶段自动化工程体系
项目核心在于完整的自动化生成管道,单条命令即可完成从源码分析到生产部署的全流程:
bash
/cli-anything ./gimp
该流程包含七个严谨阶段:
- 代码扫描:映射GUI操作到API调用路径
- 架构设计:定义命令组与状态模型
- 功能实现:构建Click框架CLI与REPL环境
- 测试规划:生成单元测试与E2E测试方案
- 测试开发:实现覆盖核心功能的测试套件
- 文档生成:输出验收报告与使用指南
- 发布部署:创建安装包并注册系统PATH
最终产出的CLI工具附带2280+测试用例,确保生产环境可靠性。以Blender为例,生成的CLI可完整控制场景创建、模型操作、渲染输出等全流程。
技术架构深度解析
真实软件集成机制
生成的CLI并非替代原软件,而是通过创建标准文件格式(如ODF、MLT XML)调用真实应用。例如LibreOffice CLI生成文档后,实际执行libreoffice --headless完成PDF导出,确保功能完整性。
双模式交互设计
- REPL模式:提供带品牌标识的交互式会话,支持命令历史与状态管理
- 子命令模式:适配脚本调用与管道操作,支持JSON结构化输出
bash
## JSON输出示例
$ cli-anything-libreoffice --json document info
{
"name": "Q1 Report",
"pages": 1,
"modified": true
}
Agent-Native特性
每个命令内置--json参数,机器可读输出与人类可读表格并存。这种设计使CLI既能被Agent解析,又保留人工调试的便利性。
生态扩展:CLI-Hub元技能
项目创新的CLI-Hub机制允许AI Agent自主选择工具。通过安装cli-anything-hub技能,Agent可:
- 浏览20+个社区CLI目录
- 根据任务需求自动安装合适工具
- 读取SKILL.md获取详细用法
bash
openclaw skills install cli-anything-hub
"Find appropriate CLI and complete: <task>"
这种自主工具发现机制,标志着AI Agent向真正自治迈出关键一步。
已验证的软件生态
项目已为六大领域30+软件生成CLI harness:
| 领域 | 代表工具 | 测试覆盖 |
|---|---|---|
| 创意设计 | GIMP, Blender, Inkscape | 678 tests |
| 办公生产力 | LibreOffice, OBS Studio | 333 tests |
| AI/ML工具 | ComfyUI, Ollama | 168 tests |
| 视频处理 | Kdenlive, Shotcut | 335 tests |
| 数据分析 | QGIS, FreeCAD | 93 tests |
| 网络工具 | AdGuard Home, Exa | 76 tests |
所有harness均通过单元测试、端到端测试和子进程验证三重保障。
落地实践指南
安装配置
Claude Code用户可通过插件市场快速部署:
bash
/plugin marketplace add HKUDS/CLI-Anything
/plugin install cli-anything
迭代优化
初次生成可能需补充功能,使用refine命令扩展能力:
bash
/cli-anything:refine ./gimp "add batch processing"
关键注意事项
- 需要Claude Opus 4.6+等前沿模型保障生成质量
- 目标软件需提供源代码分析
- 真实软件必须预先安装到系统环境
- 通常需1-2次迭代完善功能覆盖
工程价值再思考
CLI-Anything的突破性体现在四个维度:
- 方法论封装:HARNESS.md将成功经验转化为可复用的工程规范
- 质量保障:万行测试代码构建可靠防线
- 生态演进:CLI-Hub建立工具自主发现机制
- 零妥协设计:坚持调用真实后端,拒绝功能降级
该项目标志着AI Agent基础设施层的重要演进,为专业软件与智能体的深度集成提供标准解决方案。当Agent能像人类专家般操作专业工具时,人机协作将进入全新阶段。
项目仓库:https://github.com/HKUDS/CLI-Anything
CLI-Hub文档:https://hkuds.github.io/CLI-Anything/