© 2026FindAgent  · @simprr
返回列表
m

microsoft/agent-lightning

The absolute trainer to light up AI agents.

agentagentic-aillmmlopsreinforcement-learning
⭐

15.6k

Stars

🔱

1.3k

Forks

👁

81

Watchers

📋

144

Issues

PythonMIT创建于 2025/6/18更新于 今天
在 GitHub 上查看访问主页
README
由 Gemini 翻译整理

Agent Lightning⚡

Unit Tests Documentation PyPI version License Ask DeepWiki Discord

点亮 AI Agent 的终极训练利器。

欢迎加入我们的 Discord 社区,与其他用户和贡献者交流。

⚡ 核心特性

  • 零代码改动(几乎)即可将你的 Agent 变成可优化的超级模型!💤
  • 支持任何 Agent 框架(如 LangChain、OpenAI Agent SDK、AutoGen、CrewAI、Microsoft Agent Framework 等),甚至无需框架(仅使用 Python OpenAI SDK)也可以使用!🤖
  • 支持在多 Agent 系统中有选择地优化一个或多个 Agent。🎯
  • 内置多种算法,包括强化学习(Reinforcement Learning)、自动提示词优化(Automatic Prompt Optimization)、有监督微调(Supervised Fine-tuning)等。🤗

更多信息请访问我们的 文档网站。

⚡ 安装

pip install agentlightning

若需安装最新的 Nightly 版本(包含前沿特性),可从 Test PyPI 安装:

pip install --upgrade --index-url https://test.pypi.org/simple/ --extra-index-url https://pypi.org/simple/ --pre agentlightning

请参阅我们的 安装指南 以获取更多详情。

要开始使用 Agent-lightning,请查看我们的 文档 和 示例项目。

⚡ 相关文章

  • 2025/12/17 采用轨迹级聚合技术实现更快训练 Agent-lightning 博客。
  • 2025/11/4 使用 Tinker ✕ Agent-lightning 调试任意 AI Agent Medium 文章。另见 第二部分。
  • 2025/10/22 拒绝重新 Token 化漂移:在 Agent RL 中返回 Token ID 的重要性 vLLM 博客。另见 知乎文章。
  • 2025/8/11 通过强化学习训练 AI Agent 编写和自校正 SQL Medium 文章。
  • 2025/8/5 Agent Lightning: 通过强化学习训练任意 AI Agent arXiv 论文。
  • 2025/7/26 我们发现了一种无需修改代码(几乎)即可通过强化学习训练任意 AI Agent 的方法。 Reddit 讨论。
  • 2025/6/6 Agent Lightning - 微软研究院 项目主页。

⚡ 社区项目

  • DeepWerewolf — 基于 AgentScope 和 Agent Lightning 构建的中文狼人杀游戏 Agent 强化学习训练案例研究。
  • AgentFlow — 一个模块化的多 Agent 框架,结合了规划器、执行器、验证器和生成器 Agent,利用 Flow-GRPO 算法解决长时程、稀疏奖励任务。
  • Youtu-Agent — Youtu-Agent 让构建和训练 Agent 变得轻松。基于 Agent Lightning 的 修改分支 构建,Youtu-Agent 已在数学/代码任务及搜索能力上验证了高达 128 张 GPU 的强化学习训练,并表现出稳定的收敛性。查看 方案说明 以及他们的博客:停止与你的 Agent RL 搏斗:Youtu-Agent 如何轻松实现 128 GPU 的稳定扩展。

⚡ 架构

Agent Lightning 将复杂性降至最低,让你专注于创意而非底层实现。你的 Agent 将照常运行;你可以继续使用任何你喜欢的 Agent 框架;只需插入轻量级的 agl.emit_xxx() 辅助函数,或者让追踪器(tracer)自动收集每一个 Prompt、工具调用和奖励。这些事件将转化为结构化的 Span,并汇入 Lightning 系统。

贡献者
uawJhzlcdK
项目信息
默认分支main
LicenseMIT License
创建时间2025/6/18
最近更新今天
GAI 中文摘要

Agent-lightning 是一个专为 AI 智能体设计的训练与优化框架,旨在通过标准化的训练流程提升智能体的表现。该工具能够解决智能体开发中模型行为难以迭代的问题,帮助开发者高效优化智能体的决策能力与任务完成效率。

实现近乎零代码修改即可将现有智能体接入优化流程,降低了技术迁移成本。 兼容包括 LangChain、AutoGen、CrewAI 及原生 Python OpenAI 等在内的多种主流开发框架。 支持在复杂的多智能体系统中进行选择性优化,能够灵活指定单个或多个目标智能体进行针对性训练。 内置强化学习、自动提示词优化及监督微调等多种先进算法,为提升智能体性能提供丰富的技术支持。

该项目适用于希望提升智能体执行准确率与稳定性的 AI 开发者及 MLOps 工程师,特别是在需要通过持续训练和反馈优化智能体行为的应用场景中具有显著价值。