The SOTA Open-Source Browser Agent for autonomously performing complex tasks on the web
Index 是一个先进的开源浏览器智能体,旨在自主执行复杂的网页自动化任务。它能够将任意网站转化为可调用的 API,从而简化网页交互流程并无缝集成到开发者的项目中。
支持多种具备视觉能力的推理型大模型,包括 Claude 3.7 Sonnet、Gemini 2.5 Pro/Flash 以及 OpenAI o4-mini。 提供结构化输出功能,支持通过 Pydantic 定义模型以实现高可靠性的网页数据抓取。 具备浏览器状态持久化功能,允许用户连接个人 Chrome 实例以保持登录状态。 内置深度观测与追踪系统,支持通过命令行交互或 Serverless API 两种方式灵活部署。 提供实时流式响应和人性化的交互式终端界面,并支持人工干预控制。
该项目适用于需要进行大规模网页数据提取、自动化工作流构建或复杂在线任务处理的开发者。它能够帮助用户在无需编写复杂爬虫脚本的情况下,通过自然语言指令快速实现网页操作的自动化。