Official Code of Memento: Fine-tuning LLM Agents without Fine-tuning LLMs
Memento 是一个基于内存的持续学习框架,旨在帮助大语言模型(LLM)智能体在不更新模型权重的前提下,通过积累和复用过往经验实现能力的自我进化。该项目通过重构智能体的学习方式,有效解决了大模型在处理复杂任务时难以实时更新知识及适应新场景的问题。
该框架采用独特的规划器与执行器架构,通过案例推理机制实现任务分解与历史经验检索。
它支持内存增强型学习,能够高效存储并重用智能体的行动决策,从而实现持续的性能优化。
系统深度集成了 MCP 工具协议,确保智能体可以灵活调用外部工具并执行复杂任务。
框架能够实现零权重更新下的在线强化学习,大幅降低了模型训练与适应的算力成本。
该项目适用于希望在不重新训练大模型的情况下,让智能体具备持续学习能力的开发者与研究人员,特别适合需要处理复杂任务、需实时迭代优化效果的应用场景。