SkillOpt is a text-space optimizer that trains reusable natural-language skills for frozen LLM agents through trajectory-driven edits, validation-gated updates, and deployable best_skill.md artifacts.
SkillOpt 是一个创新的文本空间优化框架,旨在通过模拟深度学习训练过程来迭代优化大语言模型代理的技能。它无需修改模型参数,而是将技能文档视为可训练状态,通过轨迹驱动的编辑和验证门控机制实现代理能力的系统性提升。
该项目通过优化器模型对技能文档执行精确的增删改编辑,确保仅在验证分数提升时才采纳变更。它引入了文本学习率预算和周期性更新策略,使得技能进化过程具有极高的稳定性和可复现性。最终产出的轻量级 best_skill.md 文档可直接部署,在不增加推理成本的前提下显著提升代理在多种任务中的准确率。优化的技能具备跨模型规模和跨执行环境的通用性,能在不同 benchmark 环境下保持稳健表现。
适用于希望在不微调底层模型的前提下,通过系统化方法提升 AI 代理任务执行效果的研究人员与开发者。该工具特别适合需要构建可复用、高可控性代理技能,并追求在多种 CLI 或交互式场景下实现性能量化增长的应用场景。