The RL Bridge for LLM-based Agent Applications. Made Simple & Flexible.
AReaL 是一个专为大语言模型智能体应用设计的强化学习基础设施,由清华大学交叉信息院及蚂蚁集团的研究团队联合打造。该系统构建于完全异步的强化学习训练范式之上,旨在为智能体模型的推理能力和代理行为提供高效、可扩展的训练方案。
该系统支持针对黑盒智能体应用的深度定制,通过简单的接口替换即可实现灵活的智能体强化学习和在线强化学习训练。采用完全异步的训练架构,在保证训练稳定性的同时,实现了行业领先的运行速度。支持多领域的前沿智能体开发,在数学推理、代码生成、搜索辅助及客服智能体等任务上表现优异。具备高度的模块化设计,通过与 Scaffoldings 等先进工具集成,实现了智能体执行、奖励计算与轨迹获取的有效解耦。
AReaL 适用于需要提升智能体推理与复杂决策能力的开发者及研究人员,特别是在追求大规模高效训练、需要灵活适配各类黑盒模型以及致力于构建生产级智能体应用的场景中具有显著优势。