An End-to-End Infrastructure for Training and Evaluating Various LLM Agents
AgentCPM 是由清华大学自然语言处理实验室、中国人民大学及 ModelBest 等机构联合打造的开源端到端智能体基础设施。该项目旨在解决大模型智能体在处理复杂长链路任务、自主决策及泛化能力方面的局限性,提供从训练到评估的全流程解决方案。
项目内置深度搜索智能体 AgentCPM-Explore,在仅 4B 参数规模下实现行业领先性能,打破了端侧智能体的能力边界。项目提供 AgentCPM-Report 深度研究智能体,能够胜任复杂的报告生成任务,其性能可媲美 Gemini-2.5-pro-DeepResearch 等顶级商用系统。框架集成了完整的训练、推理代码以及配套的工具沙箱环境,支持开发者进行快速的二次开发与应用部署。提供涵盖 GAIA、HLE 及 BrowseComp 等多个主流评测基准,确保智能体在长视域任务中的表现客观可靠。
该项目适用于追求高性能、轻量化智能体研究的开发者,以及需要在本地环境构建自主深度搜索与研究系统的科研团队和企业用户。