areal-project/AReaL

The RL Bridge for LLM-based Agent Applications. Made Simple & Flexible.

agentllmllm-agentllm-reasoningmachine-learning-systemsmlsysreinforcement-learningrl

GAI 中文摘要

AReaL 是一个专为大语言模型智能体应用设计的强化学习基础设施，由清华大学交叉信息院及蚂蚁集团的研究团队联合打造。该系统构建于完全异步的强化学习训练范式之上，旨在为智能体模型的推理能力和代理行为提供高效、可扩展的训练方案。

该系统支持针对黑盒智能体应用的深度定制，通过简单的接口替换即可实现灵活的智能体强化学习和在线强化学习训练。采用完全异步的训练架构，在保证训练稳定性的同时，实现了行业领先的运行速度。支持多领域的前沿智能体开发，在数学推理、代码生成、搜索辅助及客服智能体等任务上表现优异。具备高度的模块化设计，通过与 Scaffoldings 等先进工具集成，实现了智能体执行、奖励计算与轨迹获取的有效解耦。

AReaL 适用于需要提升智能体推理与复杂决策能力的开发者及研究人员，特别是在追求大规模高效训练、需要灵活适配各类黑盒模型以及致力于构建生产级智能体应用的场景中具有显著优势。

⭐

5.2k

Stars

🔱

513

Forks

👁

Watchers

📋

Issues

PythonApache-2.0创建于 2025/2/24更新于今天

在 GitHub 上查看访问主页

README

由 Gemini 翻译整理

AReaL: 大规模异步强化学习系统

论文	文档	中文文档	Ask DeepWiki	🤗 模型与数据	微信群

AReaL 是一套强化学习（RL）基础设施，旨在架起基础模型训练与现代智能体（Agent）应用之间的桥梁。它最初由清华大学交叉信息研究院（IIIS）和蚂蚁集团 AReaL 团队的研究人员与工程师共同开发。

AReaL 基于全异步 RL 训练范式构建，针对效率和可扩展性进行了深度优化，特别适用于大规模推理和智能体模型的训练。

AReaL 的使命是让广大开发者和研究人员能够简单、高效、低成本地构建 AI 智能体。

就像奶茶一样——可定制、可扩展、令人愉悦——我们希望 AReaL 能为您的 AI 开发体验带来灵活性与乐趣。干杯！

AReaL 亮点

⚡ 灵活性：通过简单替换 base_url，即可为黑盒智能体应用实现智能体 RL 和在线 RL 训练的无缝定制。
📈 可扩展性：稳定的全异步 RL 训练，具备行业领先的速度。
✨ 前沿性能：支持最先进的数学、编程、搜索及客户服务智能体。

📰 新闻

[2026/04/23] 🚀 我们很高兴发布与 Scaffoldings 的集成，用于智能体 RL 训练 —— 现已在我们的示例库中上线！衷心感谢 @narutolhy 和 @WeiHaocheng 的贡献 🙌。Scaffoldings 的模块化设计实现了智能体执行、奖励计算和轨迹获取的彻底解耦。这使得开发者在实现智能体 RL 方法时可以复用现有模块，从而专注于自己的创新模块。

[2026/04/18] 我们激动地宣布，AReaL 首届社区双周会已成功举办！感谢所有参与的朋友。会议资料现已上传至此处。下一次会议定于 2026/05/01，届时仍将以中文进行；英语会议将在未来安排。热烈欢迎大家参与！更多详情请参阅社区说明。

[2026/03/02] 我们提供了一个完整示例，只需将 base_url 和 api_key 替换为 AReaL 的 RL 服务，即可训练您自己的 🦞 OpenClaw 智能体 —— 无需复杂的依赖，无需修改代码，适用于任何智能体运行时！

📋 过往发布

[2026/02/06] 我们很高兴推出 AReaL-SEA，这是一个自我演进的数据合成引擎。结合 AReaL 的 RL 训练，235B MoE 模型超越了 GPT-5，并在 $\tau^2$-bench 上达到了与 Gemini 3.0 Pro 相当的性能！查看论文、模型、数据和代码。

[2026/01/15] 祝贺我们的伙伴 CAMEL-AI 开源了 SETA，这是他们使用 AReaL 训练的终端智能体 RL 项目！查看他们的训练工作流以及 X 平台上的公告。

[2026/01/01] 新年快乐！感谢 @HwVanICI 的杰出贡献，我们很高兴正式宣布稳定支持在 昇腾（Ascend）NPU 设备 上进行 AReaL 训练！代码正在积极维护中，并持续更新在 ascend 分支中。查看我们的文档即可开始，欢迎反馈任何问题！

[2025/08/30] 隆重推出 ASearcher，这是一个基于 AReaL 端到端异步 RL 训练构建的最先进搜索智能体。查看论文和开源代码库！

[2025/07/31] (AReaL-lite) 我们推出了 AReaL-lite，这是专为 AI 研究人员和快速原型开发设计的 轻量级 AReaL 版本。AReaL-lite 采用 算法优先 的 API 设计，在保持原生支持全异步特性的同时，更加注重易用性和算法开发。