© 2026FindAgent  · @simprr
返回列表
p

pasky/chrome-cdp-skill

Give your AI agent access to your live Chrome session — works out of the box, connects to tabs you already have open

⭐

2.7k

Stars

🔱

162

Forks

👁

7

Watchers

📋

5

Issues

JavaScriptMIT创建于 2026/3/13更新于 今天
在 GitHub 上查看
README
由 Gemini 翻译整理

chrome-cdp

让你的 AI Agent 能够查看并与正在运行的 Chrome 会话进行交互——包括你已经打开的标签页、已登录的账户以及当前的页面状态。无需浏览器自动化框架,无需启动独立的浏览器实例,也无需重新登录。

开箱即用,支持任何 Chrome 安装环境。只需开启一个开关,无需安装其他任何组件。

为什么这很重要

大多数浏览器自动化工具会启动一个全新的、隔离的浏览器实例。而本工具会连接到你当前正在运行的 Chrome,因此你的 Agent 可以:

  • 读取你已登录的页面(Gmail、GitHub、内部工具等)
  • 与你正在活跃使用的标签页进行交互
  • 查看页面在工作流程中的实时状态,而不是通过重新加载后的干净页面

安装

作为 pi skill 使用

pi install git:github.com/pasky/chrome-cdp-skill@v1.0.1

其他 Agent(Amp、Claude Code、Cursor 等)

直接克隆或复制 skills/chrome-cdp/ 目录到你的 Agent 加载技能或上下文的路径中即可。唯一的运行时依赖是 Node.js 22+ ——无需执行 npm install。

在 Chrome 中开启远程调试

导航至 chrome://inspect/#remote-debugging 并切换开关即可。就是这么简单。

该 CLI 工具会自动检测 macOS、Linux 和 Windows 平台上的 Chrome、Chromium、Brave、Edge 和 Vivaldi。如果你的浏览器将 DevToolsActivePort 存储在非标准位置,请将 CDP_PORT_FILE 环境变量设置为该文件的完整路径。

使用方法

scripts/cdp.mjs list                              # 列出打开的标签页
scripts/cdp.mjs shot                      # 截图 → 存入 runtime 目录
scripts/cdp.mjs snap                      # 获取无障碍树 (精简、语义化)
scripts/cdp.mjs html    [".selector"]     # 获取完整 HTML 或指定 CSS 选择器的内容
scripts/cdp.mjs eval    "expression"      # 在页面上下文中执行 JS
scripts/cdp.mjs nav     https://...       # 导航并等待页面加载
scripts/cdp.mjs net                       # 网络资源计时
scripts/cdp.mjs click   "selector"        # 通过 CSS 选择器点击元素
scripts/cdp.mjs clickxy             # 在指定的 CSS 像素坐标处点击
scripts/cdp.mjs type    "text"            # 在聚焦元素处输入 (支持跨域 iframe)
scripts/cdp.mjs loadall  "selector"       # 循环点击“加载更多”直至消失
scripts/cdp.mjs evalraw   [json]  # 透传原始 CDP 命令
scripts/cdp.mjs open   [url]                      # 打开新标签页 (会触发“允许调试”提示)
scripts/cdp.mjs stop   [target]                   # 停止守护进程

`` 是由 list 命令显示的 targetId 的唯一前缀。

为什么不使用 chrome-devtools-mcp?

chrome-devtools-mcp 在执行每条命令时都会重新连接,这会导致 Chrome 的“允许调试”弹窗反复出现,并且在打开多个标签页时,目标枚举过程会超时。chrome-cdp 为每个标签页维护一个持久的守护进程(daemon)——弹窗仅会出现一次,且能够可靠地处理 100 个以上的标签页。

工作原理

直接连接到 Chrome 的远程调试 WebSocket——不使用 Puppeteer,无需中间件。当首次访问某个标签页时,会启动一个轻量级的后台守护进程来保持会话开启。Chrome 的“允许调试”弹窗每个标签页仅会出现一次;后续命令将静默复用该守护进程。守护进程在 20 分钟无活动后会自动退出。

这种方法也是它能够可靠地处理 100+ 个打开标签页的原因,而在相同场景下,基于 Puppeteer 构建的工具往往会在目标枚举阶段超时。

贡献者
pyf
项目信息
默认分支main
LicenseMIT License
创建时间2026/3/13
最近更新今天
GAI 中文摘要

chrome-cdp-skill 是一个旨在让 AI Agent 直接接入并操作用户实时 Chrome 会话的工具库。它通过连接已打开的浏览器实例,解决了传统自动化工具需要重新启动浏览器、重新登录账号或处理隔离环境的痛点。

该工具支持直接读取和交互当前正在浏览的网页,无需安装额外的浏览器自动化框架。系统通过轻量级的后台守护进程管理会话,确保 AI 对页面状态的获取具有高度的实时性和稳定性。它能无缝兼容 Chrome、Edge、Brave 等主流浏览器,并在连接后支持同时管理上百个标签页。相较于其他同类工具,它通过持久化连接机制避免了频繁弹出调试确认窗口的问题。

该项目非常适合需要 AI 辅助处理网页工作流的开发者或极客,可用于将 AI Agent 集成到 Cursor、Claude Code 等开发工具中,实现对 Gmail、GitHub 等已登录网页的自动化操作。