Peekaboo is a macOS CLI & optional MCP server that enables AI agents to capture screenshots of applications, or the entire system, with optional visual question answering through local or remote AI models.
Peekaboo 是一款专为 macOS 设计的自动化工具,它通过命令行界面(CLI)和 MCP 服务器,使 AI 智能体能够实时获取屏幕截图并进行视觉分析。该项目旨在赋予 AI 操控图形用户界面的能力,实现对应用程序及系统层面的自动化操作与交互。
精确捕捉窗口、屏幕或菜单栏的高清像素级截图,并支持 Retina 高清缩放。 提供包含点击、输入、滚动、快捷键及菜单操作在内的完整 UI 自动化控制指令。 支持多种主流 AI 模型,包括 GPT、Claude、Grok、Gemini 及本地运行的 Ollama 模型,实现强大的视觉问答与分析。 通过 MCP 服务器无缝集成至 Claude Desktop 和 Cursor,使 AI 助手能够直接调用系统工具执行任务。 具备结构化的 JSON 菜单发现机制,无需额外点击即可获取应用界面信息。
适用于需要进行 UI 自动化测试的开发人员,以及希望通过 AI 智能体跨应用完成复杂桌面操作的高级用户。