The SOTA Open-Source Browser Agent for autonomously performing complex tasks on the web
Index 是一个处于行业领先水平的开源浏览器智能体,旨在通过自主操作网页来执行复杂的自动化任务。它能够将任意网站转化为可调用的 API,从而大幅降低 Web 自动化的开发门槛与复杂度。
该项目内置了对 Claude 3.7 Sonnet、Gemini 2.5 系列以及 OpenAI o4-mini 等主流视觉推理模型的多样化支持。支持通过 Pydantic 模式输出结构化数据,确保网页信息提取的准确性与稳定性。提供直观的交互式命令行界面,支持浏览器会话持久化及实时操作流更新。支持以无服务器 API 的方式集成至现有生产环境,并配有专门的链路观测平台用于任务追踪。
该工具适用于需要进行大规模网页自动化测试、竞品调研、自动化数据采集以及构建网页版自动化工作流的开发者与企业用户。通过简单的代码集成即可实现复杂业务场景的自动化,极大提升处理跨网页任务的效率。