Memento-Teams/Memento

Official Code of Memento: Fine-tuning LLM Agents without Fine-tuning LLMs

GAI 中文摘要

Memento 是一个基于内存的持续学习框架，旨在帮助大模型智能体通过经验积累实现性能提升，且完全无需更新模型的内部权重。该项目通过引入基于案例推理的规划器和执行器架构，解决了智能体在复杂任务中难以进行长期优化的问题。

项目采用内存增强的马尔可夫决策过程，将持续学习转化为基于案例的在线强化学习，从而实现经验的高效存储与复用。采用两阶段规划器与执行器架构，通过案例驱动的任务分解和 MCP 工具集成，确保任务处理的逻辑性与准确性。支持多种 MCP 工具接入，包括网页爬取与查询感知的内容压缩，有效降低 Token 消耗并提升执行效率。提供参数化与非参数化的案例推理支持，并兼容 vLLM 等本地部署方案以满足多样化的算力需求。

该项目适用于希望在不通过昂贵微调的前提下，提升大模型智能体任务处理能力和长期记忆水平的开发者与研究人员。特别适合需要构建复杂自动化工作流、要求智能体具备持续演进和案例复用能力的实际应用场景。

⭐

2.4k

Stars

🔱

285

Forks

👁

Watchers

📋

Issues

PythonMIT创建于 2025/6/20更新于昨天

在 GitHub 上查看访问主页

README

由 Gemini 翻译整理

Memento：无需微调 LLM 的 LLM Agent 微调框架

一个基于记忆的持续学习框架，旨在帮助 LLM Agent 从经验中进化，而无需更新模型权重。

规划器-执行器架构 • 基于案例的推理 (CBR) • MCP 工具集成 • 记忆增强学习

Memento 在 GAIA 验证集和测试集上与基线模型的对比。 Memento 在各项基准测试中的消融研究。 不同记忆设计下的持续学习曲线。 Memento 在 OOD（分布外）数据集上的准确率提升。

📰 最新动态

[2025.10.05] 我们很高兴地宣布，参数化基于案例的推理 (CBR) 推理代码现已正式开源！🎉
[2025.09.05] 我们增加了对使用 vLLM 部署本地 LLM 作为执行器的支持，请参阅 client/agent_local_server.py。🎉
[2025.09.03] 我们建立了微信群，以便于围绕本项目进行协作和交流。欢迎加入群组分享想法、提出问题或贡献创意！🔥 🔥 🔥 立即加入我们的微信群！
[2025.08.30] 我们很高兴地宣布，非参数化基于案例的推理 (CBR) 推理代码现已正式开源！🎉
[2025.08.28] 我们创建了 Discord 服务器，以简化围绕本项目的讨论和协作。欢迎加入并分享你的想法、提出问题或贡献创意！🔥 🔥 🔥 加入我们的 Discord！
[2025.08.27] 感谢大家对我们工作的关注！我们将在下周发布 CBR 代码，并在下个月发布参数化记忆 (Parametric Memory) 代码。我们将持续更新后续开发进展。
[2025.08.27] 我们在 server/ai_crawler.py 中添加了一个新的 Crawler MCP，用于网络爬取和感知查询的内容压缩，以降低 Token 成本。
[2025.08.26] 我们添加了 SerpAPI (https://serpapi.com/search-api) MCP 工具，帮助您避免使用 Docker 搜索并加速开发。

🔥 核心特性

无需更新 LLM 权重。 Memento 将持续学习重新定义为在记忆增强 MDP（马尔可夫决策过程）上的基于记忆的在线强化学习。神经案例选择策略指导操作；经验通过高效的读/写操作进行存储和重用。
两阶段规划器-执行器循环。 基于 CBR 的规划器 (Planner) 分解任务并检索相关案例；执行器 (Executor) 作为 MCP 客户端运行每个子任务，编排工具并写回结果。
完善的工具生态系统。 通过统一的 MCP 接口，内置了对网页搜索、文档处理、代码执行、图像/视频分析等的支持。
强大的基准性能。 在 GAIA、DeepResearcher、SimpleQA 和 HLE 等基准测试中均表现出极具竞争力的性能。

🧠 核心理念

从经验中学习，而非通过梯度。 Memento 将成功和失败的轨迹记录到案例库 (Case Bank) 中，并通过价值检索来引导规划与执行——从而实现低成本、可迁移的在线持续学习。

🏗️ 架构

核心组件

元规划器 (Meta-Planner)：使用 GPT-4.1 将高层级查询分解为可执行的子任务。
执行器 (Executor)：使用 o3 或其他模型，通过 MCP 工具执行独立的子任务。
案例记忆 (Case Memory)：存储最终步骤元组 (s_T, a_T, r_T) 以进行经验回放。
MCP 工具层 (MCP Tool Layer)：外部工具和服务的统一接口。

工具生态

网络研究：通过 SearxNG 进行实时搜索和受控爬取。
文档处理：支持多种格式（PDF、Office、图像、音频、视频）。
代码执行：带有安全控制的沙盒 Python 工作区。
数据分析：Excel 处理、数学计算。
媒体分析：图像描述生成、视频旁白生成、音频转录。

🚀 快速上手

前置条件

Python 3.11+
OpenAI API Key（或兼容的 API 端点）
用于网页搜索的 SearxNG 实例
FFmpeg（视频处理所需的系统级二进制文件）
PyTorch 2.0+（支持 CUDA，用于参数化记忆）

📖 详细安装说明请参阅 INSTALL.md

安装

方法 1：使用 uv（推荐 - 快速且现代化）

# 克隆仓库
git clone https://github.com/Agent-on-the-Fly/Memento
cd Memento

# 如果尚未安装 uv，请运行此命令
curl -LsSf https://astral.sh/uv/install.sh | sh

# 同步依赖并自动创建虚拟环境
uv sync

# 激活虚拟环境
source .venv/bin/activate  # Windows 下使用: .venv\Scripts\activate

方法 2：使用 pip 和 requirements.txt

# 克隆仓库
git clone https://github.com/Agent-on-the-Fly/Memento
cd Memento

# 创建并激活虚拟环境
python -m venv .venv
source .venv/bin/activate  # Windows 下使用: .venv\Scripts\activate

# 安装依赖
pip install -r requirements.txt

PyTorch 安装

针对 GPU 支持（推荐用于参数化记忆）：

# 请根据您的 CUDA 版本按照 PyTorch 官网建议安装
# 例如：
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121