A live stream development of RL tunning for LLM agents
OpenManus-RL 是一个由 Ulab-UIUC 与 MetaGPT 联合发起的开源项目,旨在探索大语言模型智能体(LLM Agents)的强化学习(RL)微调范式。该项目通过公开持续的研究进展与训练结果,致力于提升智能体在复杂推理、工具使用及环境交互方面的能力。
项目集成 verl 框架以增强强化学习训练效能,支持对主流智能体基准测试进行深度验证。提供高质量的智能体指令微调数据集,辅助开发者进行模型训练与性能优化。涵盖从奖励模型训练、推理策略探索到轨迹测试时扩展等全链路研发方案。通过实时更新的研究动态与测试结果,推动智能体任务规划与动作执行的深度进化。
该项目适用于大模型研究人员、AI 智能体开发者以及对强化学习算法优化感兴趣的学术群体,常用于智能体推理能力提升、复杂任务执行环境下的模型微调及智能体基准评测。