Official Code of Memento: Fine-tuning LLM Agents without Fine-tuning LLMs
Memento 是一个基于内存的持续学习框架,旨在帮助大模型智能体通过经验积累实现性能提升,且完全无需更新模型的内部权重。该项目通过引入基于案例推理的规划器和执行器架构,解决了智能体在复杂任务中难以进行长期优化的问题。
项目采用内存增强的马尔可夫决策过程,将持续学习转化为基于案例的在线强化学习,从而实现经验的高效存储与复用。采用两阶段规划器与执行器架构,通过案例驱动的任务分解和 MCP 工具集成,确保任务处理的逻辑性与准确性。支持多种 MCP 工具接入,包括网页爬取与查询感知的内容压缩,有效降低 Token 消耗并提升执行效率。提供参数化与非参数化的案例推理支持,并兼容 vLLM 等本地部署方案以满足多样化的算力需求。
该项目适用于希望在不通过昂贵微调的前提下,提升大模型智能体任务处理能力和长期记忆水平的开发者与研究人员。特别适合需要构建复杂自动化工作流、要求智能体具备持续演进和案例复用能力的实际应用场景。