AI agents running research on single-GPU nanochat training automatically
autoresearch 是一个旨在实现人工智能自主研究循环的框架,通过赋予 AI Agent 修改训练代码并进行实验的权限,让其在单卡 GPU 环境下自动迭代优化模型。该项目通过模拟自主研究工作流,解决人工手动调参效率低下的问题,实现全天候的自动化模型性能提升。
该项目提供了一个包含模型定义、优化器及训练循环的核心代码库,允许 Agent 对其进行全方位的架构和参数调整。 它设定了严格的五分钟训练时间预算,以确保实验可以在短时间内快速迭代并获得反馈。 采用 val_bpb 作为衡量模型性能的核心指标,确保在修改架构后不同实验结果之间具备可比性。 通过独立的 Markdown 配置文件,用户无需直接修改代码,只需编写任务目标和指令即可引导 Agent 完成研究。
该项目适用于对大模型底层训练感兴趣的研究人员或开发者,适合在有限的单卡 GPU 计算资源下进行高频次的实验与模型性能探索。