Agent Lightning⚡

点亮 AI Agent 的终极训练器。

欢迎加入我们的 Discord 社区，与其他用户和贡献者交流。

⚡ 核心功能

无需重构代码（几乎！），让你的 Agent 瞬间具备深度优化能力。💤
支持任何 Agent 框架（如 LangChain、OpenAI Agent SDK、AutoGen、CrewAI、Microsoft Agent Framework 等），甚至无需框架（直接使用 Python OpenAI API）亦可。任君挑选！🤖
支持在多 Agent 系统中有选择性地优化一个或多个 Agent。🎯
集成多种算法，包括强化学习（Reinforcement Learning）、自动提示词优化（Automatic Prompt Optimization）、监督微调（SFT）等。🤗

详情请参阅我们的官方文档网站。

⚡ 安装

pip install agentlightning

若需获取最新的 nightly 构建版本（包含前沿功能），可从 Test PyPI 安装：

pip install --upgrade --index-url https://test.pypi.org/simple/ --extra-index-url https://pypi.org/simple/ --pre agentlightning

更多详情请参考我们的安装指南。

要开始使用 Agent-lightning，请查看我们的文档和示例代码。

⚡ 文章

2025/12/17 采用轨迹级聚合以实现更快的训练 - Agent-lightning 官方博客。
2025/11/4 使用 Tinker ✕ Agent-lightning 调优任意 AI Agent - Medium 文章。另请参阅第二部分。
2025/10/22 告别重标记化漂移：在 Agent RL 中使用 OpenAI 兼容 API 返回 Token ID 至关重要 - vLLM 博客。另见知乎专栏文章。
2025/8/11 通过强化学习训练 AI Agent 编写并自修正 SQL - Medium 文章。
2025/8/5 Agent Lightning: 使用强化学习训练任意 AI Agent - arXiv 论文。
2025/7/26 我们发现了一种无需重构代码即可通过强化学习训练任意 AI Agent 的方法。 - Reddit 讨论。
2025/6/6 Agent Lightning - 微软研究院 - 项目主页。

⚡ 社区项目

DeepWerewolf — 一个基于 AgentScope 和 Agent Lightning 构建的狼人杀游戏 Agent RL 训练案例研究。
AgentFlow — 一个模块化的多 Agent 框架，结合了规划器、执行器、验证器和生成器 Agent，利用 Flow-GRPO 算法解决长视界、稀疏奖励的任务。
Youtu-Agent — Youtu-Agent 让你可以轻松构建和训练 Agent。通过 Agent Lightning 的修改分支，Youtu-Agent 验证了在数学、代码和搜索能力上高达 128 GPU 的 RL 训练，并实现了稳定的收敛。同时参阅训练配方和他们的博客：告别 Agent RL 的纠结：Youtu-Agent 如何轻松实现稳定、128 GPU 规模的扩展。

⚡ 架构

Agent Lightning 将变动部分保持在最低限度，让你能够专注于核心创意而非底层设施。你的 Agent 将按原样运行，你可以继续使用任何喜欢的 Agent 框架；你只需插入轻量级的 agl.emit_xxx() 辅助函数，或让追踪器自动收集每一个提示词、工具调用和奖励。这些事件将转换为结构化的跨度（Spans），并汇入 Lightning 系统中。

microsoft/agent-lightning

Agent Lightning⚡

⚡ 核心功能

⚡ 安装

⚡ 文章

⚡ 社区项目

⚡ 架构