Large Action Model framework to develop AI Web Agents
LaVague 是一个开源的大动作模型框架,旨在帮助开发者快速构建 AI Web 智能体。该框架能够理解用户设定的网页目标,并自动生成并执行相应的操作代码,从而实现网页流程的自动化。
项目通过世界模型分析当前网页状态并生成指令,再由动作引擎将指令转化为 Selenium 或 Playwright 等自动化工具可执行的代码。它具备强大的跨步骤任务拆解能力,能够完成从网页导航到具体信息抓取等复杂任务。此外,项目还专门提供了针对 QA 工程师的自动化测试工具,支持将 Gherkin 规格描述转化为高效的自动化测试脚本。
该框架主要面向软件开发者和 QA 测试工程师,适用于需要构建自动网页任务执行器、进行大规模自动化测试以及简化网页流程操作的各种应用场景。