AI 代理 — RoqueClaw
"在服务器上安装 Plex","打开终端并显示磁盘使用情况","研究今天的 Hacker News 并在 Notes 中生成摘要"
RoqueClaw(基于 OpenClaw)是您 RoqueOS 的 自主操作员。与只回复文本的聊天机器人不同,它在您的服务器和桌面上 执行实际操作: 安装容器、打开应用、写入文件、触发通知、浏览网页、在终端执行命令。
实际区别?您说"我需要一个媒体服务器",它会安装 Jellyfin、配置它、在浏览器中打开它,并在准备就绪时通知您。而不是您打开 5 个标签页,阅读教程并遵循 20 个步骤。
它能做什么
🐳 通过自然语言安装 Docker 容器
您: "为我安装 Nextcloud,带 2GB RAM"
RoqueClaw: ✓ 正在安装 nextcloud:latest...
✓ 配置 2GB RAM 和持久卷
✓ 容器在端口 8080 上启动
✓ 我在您的浏览器中打开了它。初始登录: admin/admin在底层,它使用预安装在服务器上的 roqueos-cli(参见下面的部分)调用 RoqueOS Server API。相同的 App Store、相同的目录、相同的 installApp(appId, config) — 只是由自然语言而不是点击触发。
💻 在您的桌面上操作
- 打开特定的应用(
打开 Finder,打开 VS Code,在 google.com 打开浏览器) - 在 Files 中创建文件(
将此摘要保存为 /home/user/notes/reuniao.md) - 发送通知(
备份完成时通知我) - 显示对话框(
在继续之前询问用户是否批准此步骤)
🌐 浏览和自动化网络
- 在隔离容器内打开 Chromium(不是您的浏览器 — 安全)
- 抓取、填写表单、下载文件
- 截图以让您视觉跟踪进度
🤖 执行复杂的多步骤任务
不是单个提示 → 单个响应。这是一个 自主循环:
- 您描述目标
- RoqueClaw 计划步骤
- 执行每个步骤(您通过 VNC 实时查看)
- 如果出错,调整并重试
- 最后,向您总结所做的工作 + 他采取的行动
架构
3 层:
- Frontend: 聊天 + 通过 noVNC 实时桌面可视化
- Backend: 管理会话、容器和消息/步骤流。公开接收来自 CLI 命令并在连接的前端触发操作的
/agent/actions/*端点。 - RoqueClaw 容器: Ubuntu 22.04 + XFCE + VNC + Chromium + Node.js + OpenClaw + 预安装的
roqueos-cli用于回调服务器。
🔧 CLI roqueos-cli(代理的力量,也是您的力量)
roqueos-cli 是代理和 RoqueOS Server 之间的通道。它 预安装在两个位置:
| 位置 | 谁使用 |
|---|---|
RoqueClaw 容器(/usr/local/bin/roqueos-cli) | 代理 在执行其操作时通过子进程调用 |
| Terminal 应用 容器(服务器每个用户一个) | 您,通过 shell,每当您需要时 — 即使没有代理 |
这意味着您也可以 直接使用 CLI,无需通过代理。打开 Terminal 应用,输入 roqueos-cli ...,完成。
可用命令
通过在 Terminal 应用中运行 roqueos-cli --help 查看完整参考 — 这是事实的来源。6 个规范操作:
roqueos-cli notify <title> <message> # RoqueOS 桌面通知
roqueos-cli open-app <appId> # 打开应用(finder、vscode、browser 等)
roqueos-cli open-url <url> # 在 Roque Browser 中打开 URL
roqueos-cli create-file <path> # 从 stdin 读取内容创建文件
roqueos-cli run-terminal <command> # 执行命令 + 返回 stdout
roqueos-cli show-dialog <message> [--type X] # confirm/alert/info 模态框实用示例:
# 向您的 RoqueOS 桌面发送通知
roqueos-cli notify "备份完成" "23 GB 已同步到 Cloudflare R2"
# 打开特定应用
roqueos-cli open-app finder
# 在浏览器中打开 URL
roqueos-cli open-url "https://github.com/roqueribeiro"
# 创建/写入文件(从 stdin 读取)
echo "会议记录..." | roqueos-cli create-file "/home/user/notes/reuniao.md"
# 执行命令 + 接收结果作为通知
roqueos-cli run-terminal "df -h"
# 确认模态(在继续之前等待用户响应)
roqueos-cli show-dialog "删除 50GB 的旧日志?" --type confirm语法使用 位置参数(不是
--title/--message标志)。如果您的 CLI 版本不同,请在容器内通过apt-get install --reinstall roqueos-cli更新。
实际使用案例
当发生某事时通知的 cron 脚本:
# 每天运行的 Crontab,通知您磁盘使用情况
0 9 * * * df -h | grep -E '^/' | awk '$5+0 > 80 {print $6, $5}' | \
xargs -I {} roqueos-cli notify "磁盘几乎已满" "{}"部署工作流:
# 完成时在 VS Code 中打开日志的构建脚本
yarn build && roqueos-cli open-app vscode && \
roqueos-cli notify "构建 OK" "请查看 /tmp/build.log 中的日志"与其他容器集成:
# 另一个容器内的作业(如 Plex 转码)通知用户
roqueos-cli notify "Plex" "4K 转码完成。电影准备好了。"后面的 HTTP API 在 75-agent-module.md(服务器内部规则)的 "Actions" 部分中有文档。与前端通过 WebSocket 使用的相同操作 — notify、open-app、open-url、create-file、run-terminal、show-dialog。
支持的 AI 模型
RoqueClaw 与主要的 LLM 提供商一起工作:
| 提供商 | 推荐模型 | 配置 |
|---|---|---|
| OpenAI | GPT-4o、GPT-4-turbo | 容器中的 OPENAI_API_KEY env var |
| Anthropic | Claude 3.5 Sonnet、Claude 4.6 Sonnet | ANTHROPIC_API_KEY env var |
模型的选择会影响操作的速度和质量。对于复杂的网络自动化,Claude Sonnet 4.6 或 GPT-4o 通常通过 VNC 提供更好的视觉控制。
实际使用案例
| 场景 | 任务 | 结果 |
|---|---|---|
| 设置新服务器 | "安装 Plex、qBittorrent 和 Sonarr,配置它们一起工作" | ~3 分钟内 3 个容器启动并互联 |
| 研究 | "研究 2026 年最佳的 5 个 JavaScript 框架,并在 Notes 中生成比较文章" | MD 文章保存在 /home/user/notes/ + 在 Finder 中打开 |
| 诊断 | "检查为什么服务器很慢" | 运行 top、df、free、docker stats — 在 Notes 中生成报告 |
| 自动化 | "下载昨天的 Google Drive 备份并在 /data 中解压" | OAuth 登录 + 下载 + 通过 tar 解压 |
| 开发 | "创建一个 Python 脚本来监控我的 API 并在它崩溃时通知我" | 脚本保存在 /home/user/projects/ + 配置 cron |
| 智能家居 | "连接 Home Assistant 并显示哪些灯亮着" | 实时列表 + 通过聊天关闭的选项 |