© 2026FindAgent  · @simprr
返回列表
s

superagent-ai/grok-cli

An open-source autonomous agent powered by Grok.

agentsaiclicodecoding-agentgrokxai
⭐

2.6k

Stars

🔱

332

Forks

👁

27

Watchers

📋

12

Issues

TypeScriptMIT创建于 2025/7/14更新于 今天
在 GitHub 上查看
README
由 Gemini 翻译整理

代码代理虽多,但这才是 Grok 的。

CI npm License: MIT TypeScript Bun

市面上的其他工具大多相互借鉴。我们汲取了所有工具的优点,并将它们与 Grok 相连——实现了实时 X 搜索、网页搜索、grok-code-fast-1 及完整的 Grok 模型系列支持。默认开启子代理(sub-agents),支持 Telegram 远程控制(只需配对一次,CLI 运行时即可通过手机操控代理),并提供了一个绝不显得仓促凌乱的终端 UI。

开源、原生终端体验。基于 Bun 和 OpenTUI 构建。如果你既追求格调又看重效率,那么你来对地方了。

本项目由社区构建,非官方项目。本项目与 xAI 无关联,亦未获得其认可,非官方 Grok CLI。

https://github.com/user-attachments/assets/7ca4f6df-50ca-4e9c-91b2-d4abad5c66cb


安装

npm i -g grok-dev

CLI 二进制文件名为 grok(是的,包名和命令名不一致,请知悉)。

前置条件: Node 18+(用于全局安装),从 x.ai 获取的 Grok API key,以及一个用于交互式 OpenTUI 体验的现代终端模拟器。无界面的 --prompt 模式不依赖终端 UI 支持。


运行

交互模式(默认) — 启动 OpenTUI 代码代理:

grok

支持的终端

为了获得最可靠的交互式 OpenTUI 体验,请使用现代终端模拟器。我们目前记录并推荐:

  • WezTerm (跨平台)
  • Alacritty (跨平台)
  • Ghostty (macOS 和 Linux)
  • Kitty (macOS 和 Linux)

其他现代终端或许也能工作,但以上是我们目前推荐并记录的交互式终端应用。

选择项目目录:

grok -d /path/to/your/repo

无界面(Headless)模式 — 执行单条指令后退出(适用于脚本、CI、自动化):

grok --prompt "run the test suite and summarize failures"
grok -p "show me package.json" --directory /path/to/project
grok --prompt "refactor X" --max-tool-rounds 30
grok --prompt "summarize the repo state" --format json

继续已保存的会话:

grok --session latest
grok -s 

交互模式下同样支持该标志。

结构化无界面输出:

grok --prompt "summarize the repo state" --format json

--format json 会输出换行符分隔的 JSON 事件流,而不是默认的人类可读文本输出。事件是语义化的、步骤级的记录,例如 step_start、text、tool_use、step_finish 和 error。

调度(Scheduling)

调度功能允许 Grok 按循环计划或单次执行无界面提示。你可以用自然语言提出要求,例如:

Create a schedule named daily-changelog-update that runs every weekday at 9am
and updates CHANGELOG.md from the latest merged commits.

循环调度需要后台守护进程:

grok daemon --background

在 TUI 中使用 /schedule 查看已保存的调度。单次调度会立即在后台启动;只要守护进程处于活动状态,循环调度就会持续运行。

列出 Grok 模型及定价提示:

grok models

直接传递初始消息,无需额外提示:

grok fix the flaky test in src/foo.test.ts

通过聊天生成图像或短视频:

grok "Generate a retro-futuristic logo for my CLI called Grok Forge"
grok "Edit ./assets/hero.png into a watercolor poster"
grok "Animate ./assets/cover.jpg into a 6 second cinematic push-in"

图像和视频生成功能作为代理工具在常规聊天会话中提供。会话过程中你依然使用文本模型,Grok 默认将生成的媒体保存在 .grok/generated-media/ 下,除非你指定了输出路径。


你实际得到了什么

特性含义
Grok 原生为 Grok 调优的默认设置;支持 grok-code-fast-1、grok-4-1-fast-reasoning、grok-4.20-multi-agent-0309 以及旗舰版和快速版模型——运行 grok models 查看完整列表。
X + 网页搜索search_x 和 search_web 工具——提供实时帖子和文档,无需假装互联网停留在 2023 年。
媒体生成内置 generate_image 和 generate_video 工具,支持文生图、图像编辑、文生视频和图生视频流程。生成的文件保存在本地,以便在 xAI 链接过期后继续使用。
子代理(默认行为)前台 task 委托。
贡献者
hcMzSbjSMU
项目信息
默认分支main
LicenseMIT License
创建时间2025/7/14
最近更新今天
GAI 中文摘要

grok-cli 是一个基于 TypeScript 构建的开源自主 AI 编程代理工具,旨在通过集成 xAI 的 Grok 模型能力,为开发者提供高效的终端交互式编程体验。它通过整合实时网络搜索和代码执行功能,帮助用户在本地或自动化环境中快速处理复杂的开发任务。

支持实时 X 平台搜索、网页搜索以及多种 Grok 模型版本,确保获取信息的即时性与准确性。 内置默认开启的子代理机制,具备更强的任务执行能力和自动化处理逻辑。 提供支持 Telegram 远程控制功能,用户可通过手机实时操控正在运行的终端 CLI 代理。 配备交互式终端界面(OpenTUI),支持 JSON 格式的结构化输出,便于脚本调用与自动化集成。 具备灵活的定时任务调度功能,支持通过自然语言设置周期性或单次的后台任务执行。

适用于追求开发效率的后端工程师、前端开发者及自动化运维人员,常用于日常编码辅助、重复性脚本编写及 CI/CD 流程中的 AI 自动化作业。