欢迎来到 LaVague

LaVague：面向开发者的 Web Agent 框架

LaVague 是一个开源框架，专为希望创建 AI Web Agent 以实现终端用户流程自动化的开发者而设计。

我们的 Web Agent 可以接收一个目标（例如：“打印 Hugging Face Diffusers 库的安装步骤”），并生成并执行实现该目标所需的动作。

LaVague Agent 由以下部分组成：

World Model（世界模型）：接收目标和当前状态（即当前网页），并输出一组适当的指令。
Action Engine（动作引擎）：将这些指令“编译”成动作代码（例如 Selenium 或 Playwright）并执行它们。

LaVague QA：专为 QA 工程师打造的工具

🌊 基于 LaVague 构建

LaVague QA 是一款为利用我们框架的 QA 工程师量身定制的工具。

它允许你通过将 Gherkin 规范转换为易于集成的测试用例，从而实现测试编写的自动化。LaVague QA 是一个在底层利用 LaVague 框架的项目，旨在使 Web 测试的效率提高 10 倍。

如需详细信息和安装指南，请访问 LaVague QA 文档。

🚀 快速上手

演示

以下是 LaVague 如何通过多个步骤来实现“浏览 PEFT 快速入门指南”这一目标的示例：

实践

你可以按照以下步骤进行操作：

下载 LaVague：

pip install lavague

使用我们的框架构建一个 Web Agent 并实现目标：

from lavague.core import  WorldModel, ActionEngine
from lavague.core.agents import WebAgent
from lavague.drivers.selenium import SeleniumDriver

selenium_driver = SeleniumDriver(headless=False)
world_model = WorldModel()
action_engine = ActionEngine(selenium_driver)
agent = WebAgent(world_model, action_engine)
agent.get("https://huggingface.co/docs")
agent.run("Go on the quicktour of PEFT")

# 启动 Gradio Agent 演示
agent.demo("Go on the quicktour of PEFT")

有关此示例及如何使用 LaVague 的更多信息，请参阅我们的 quick-tour（快速入门）。

注意：这些示例使用了我们默认的 OpenAI API 配置，为了使其正常运行，你需要设置本地环境变量 OPENAI_API_KEY 为一个有效的 API 密钥。

若要查看 LaVague 的端到端示例，请参考 Google Colab 中的 quick-tour notebook。

核心功能

✅ 内置上下文（即配置）
✅ 可定制化配置
✅ 测试运行器，用于测试和评估 LaVague 的性能
✅ Token 计数器，用于估算 Token 使用量和成本
✅ 日志工具
✅ 可选的交互式 Gradio 界面
✅ 调试工具
✅ Chrome 扩展程序

支持的驱动程序

我们支持三种驱动选项：

Selenium Webdriver
Playwright Webdriver
Chrome 扩展驱动

请注意，并非所有驱动程序都支持所有 Agent 功能：

功能	Selenium	Playwright	Chrome 扩展
无头（Headless）Agent	✅	⏳	N/A
处理 iframe	✅	✅	❌
打开多个标签页	✅	⏳	✅
高亮显示元素	✅	✅	✅

✅ 已支持 ⏳ 即将推出 ❌ 不支持

🔎 支持

如果你在使用 LaVague 时遇到任何问题，可以：

查看我们的故障排除指南，其中列出了常见问题的相关信息和修复方案。
在 GitHub 上提交 Issue 描述你的问题。
在我们的 Discord 服务器的 '#support' 频道中给我们留言。

🙋 贡献

我们热忱欢迎你的帮助和支持，共同构建一个健壮且可靠的 Web 自动化 Large Action Model。

为了避免多人重复工作，我们制定了以下贡献流程：

📢 我们会列出任务清单。

lavague-ai/LaVague