Peekaboo is a macOS CLI & optional MCP server that enables AI agents to capture screenshots of applications, or the entire system, with optional visual question answering through local or remote AI models.
Peekaboo 是一个专为 macOS 开发的命令行工具及可选的 MCP 服务器,旨在为 AI Agent 提供强大的屏幕交互能力。通过集成屏幕截图、视觉分析及 GUI 自动化操作,该项目实现了让 AI 对桌面应用进行“观察”并执行点击、输入等复杂控制。
它能够精确捕捉全屏或特定窗口的高保真截图,并支持 Retina 2x 倍率采样。内置多种 GUI 自动化指令,支持点击、滚动、按键模拟以及针对特定后台进程的交互。通过集成 AI 模型,支持基于自然语言指令的视觉分析与界面自动化任务。提供结构化的菜单与菜单栏发现功能,无需物理点击即可解析界面结构。具备跨环境的通用性,既可以通过原生命令行直接调用,也能作为 MCP 服务器与 Claude Code 或 Cursor 等 AI 开发工具集成。
该项目适用于需要实现 macOS 桌面自动化流程的开发者,以及希望构建具备视觉感知能力的 AI Agent 的研究人员,特别适合处理重复性的 UI 交互任务或构建端到端的 GUI 测试自动化脚本。