AgentCPM

概述

AgentCPM 是一系列由清华大学自然语言处理实验室 (THUNLP)、中国人民大学、面壁智能 (ModelBest) 和 OpenBMB 社区联合开发的开源 LLM 智能体。为了解决智能体在实际应用中面临的挑战（如长期任务规划能力受限、自主性不足及泛化能力差等），我们提出了一系列模型构建方法。近期，团队致力于全面构建智能体的 Deep Research 能力，发布了深度搜索 LLM 智能体 AgentCPM-Explore 和深度研究 LLM 智能体 AgentCPM-Report。

模型列表

模型	下载链接	开源内容	技术报告	使用方法
AgentCPM-Explore	🤗 Hugging Face 🤖 ModelScope	AgentDock: 统一工具沙箱管理与调度平台 AgentRL: 全异步智能体强化学习框架 AgentToLeaP: 一键式智能体工具学习能力评估框架	AgentCPM-Explore: Realizing Long-Horizon Deep Exploration for Edge-Scale Agents	README.md
AgentCPM-Report	🤗 Hugging Face 🤖 ModelScope	UltraRAG: 低代码 RAG 框架	AgentCPM-Report: Interleaving Drafting and Deepening for Open-Ended Deep Research	README.md

AgentCPM-Explore

AgentCPM 团队致力于系统性地构建智能体的 Deep Research 能力，并发布了 AgentCPM-Explore，这是一款深度搜索 LLM 智能体。AgentCPM-Explore 是首个以 4B 参数规模出现在 GAIA、XBench 等八个广泛使用的长期智能体基准测试榜单上的开源智能体模型。

核心亮点：

4B 规模下的 SOTA 性能：同尺寸模型中表现最佳，对标甚至超越 8B 模型，并可与部分 30B+ 及闭源 LLM 媲美。
深度探索：支持 100+ 轮的持续交互，具备多源交叉验证和动态策略调整能力。
端到端开源：提供完整的训练与评估基础设施，便于社区开发与自定义扩展。

演示

演示案例（加速版）：

https://github.com/user-attachments/assets/f2b3bb20-ccd5-4b61-8022-9f6e90992baa

快速上手

多模型、多工具协作环境配置：首先启动 AgentDock 工具沙箱平台，以提供统一的 MCP (Model Context Protocol) 工具服务。若使用基于 API 的模型，请配置模型的 BASE_URL 和 API_KEY；若使用本地托管的模型，请确保模型服务可访问。在 config.toml 文件中配置所需的工具参数。
启动环境：开箱即用，一键启动。AgentDock 统一工具沙箱平台支持……

OpenBMB/AgentCPM

AgentCPM

最新动态

目录

概述

模型列表

AgentCPM-Explore

演示

快速上手