© 2026FindAgent  · @simprr
返回列表
u

uditgoenka/autoresearch

Claude Autoresearch Skill — Autonomous goal-directed iteration for Claude Code. Inspired by Karpathy's autoresearch. Modify → Verify → Keep/Discard → Repeat forever.

aiautonomous-agentautoresearchclaudeclaude-codeiterationkarpathyproductivityskill
⭐

2.7k

Stars

🔱

192

Forks

👁

11

Watchers

📋

2

Issues

ShellMIT创建于 2026/3/13更新于 今天
在 GitHub 上查看访问主页
README
由 Gemini 翻译整理

Claude Autoresearch

将 Claude Code 打造为一台不懈的优化引擎。

基于 Karpathy 的 autoresearch — 约束条件 + 机械化指标 + 自主迭代 = 复合收益。

Claude Code Skill Version License: MIT

Based on Follow @iuditg Support

"设定目标 → Claude 运行循环 → 醒来获取结果"

你不需要 AGI,你只需要一个目标、一个度量指标,以及一个永不停止的循环。

工作原理 · 命令 · 快速开始 · 指南 · 常见问题


为什么存在这个项目

Karpathy 的 autoresearch 展示了通过一个 630 行的 Python 脚本,遵循简单原则(单一指标、约束范围、快速验证、自动回滚、Git 作为记忆),即可实现彻夜自主优化机器学习模型——每晚 100 次实验。

Claude Autoresearch 将这些原则推广到了任何领域。 不仅仅是机器学习,还包括代码、内容、市场营销、销售、人力资源、DevOps,或任何你可以量化的事物。


工作原理

LOOP (FOREVER or N times):
  1. Review current state + git history + results log
  2. Pick the next change (based on what worked, what failed, what's untried)
  3. Make ONE focused change
  4. Git commit (before verification)
  5. Run mechanical verification (tests, benchmarks, scores)
  6. If improved → keep. If worse → git revert. If crashed → fix or skip.
  7. Log the result
  8. Repeat. Never stop until you interrupt (or N iterations complete).

每一次改进都会叠加,每一次失败都会自动回滚。进度将以 TSV 格式记录。

设置阶段

在循环开始前,Claude 会执行一次性设置:

  1. 读取上下文 — 读取所有范围内的文件。
  2. 定义目标 — 提取或请求一个机械化度量指标。
  3. 定义范围 — 哪些文件可修改,哪些是只读的。
  4. 建立基准 — 对当前状态执行验证(第 0 次迭代)。
  5. 确认并开始 — 展示设置信息,然后开始循环。

8 项关键准则

#准则
1循环直到完成 — 无界:永远运行;有界:运行 N 次后总结
2先读后写 — 在修改前完全理解上下文
3每次迭代只做一项修改 — 原子化变更。如果出错,你知道原因
4仅限机械化验证 — 不要使用“看起来不错”的主观判断。必须使用指标
5自动回滚 — 失败的更改会立即撤销
6简单取胜 — 结果相同但代码更少 = 保留
7Git 即记忆 — 实验提交带有 experiment: 前缀,git revert 在历史中保留了失败的实验,Agent 必须在每次迭代前读取 git log 和 git diff
8卡住时深度思考 — 重读、组合失败方案、尝试激进的修改

命令

命令作用
/autoresearch运行自主迭代循环(无限制)
Iterations: N添加到内联配置中,以运行确切的 N 次迭代后停止
/autoresearch:plan交互式向导:目标 → 范围、指标、验证配置
/autoresearch:security自主 STRIDE + OWASP + 红队安全审计
/autoresearch:ship通用发布工作流(代码、内容、营销、销售、研究、设计)
/autoresearch:debug自主查错循环 — 科学方法 + 迭代调查
/autoresearch:fix自主修复循环 — 迭代修复错误直到归零
/autoresearch:scenario场景驱动的用例生成器 — 探索情况、边缘案例、衍生场景
/autoresearch:predict多角色预测 — 在行动前从 5 个专家视角分析代码
/autoresearch:learn自主文档引擎 — 扫描代码库、生成/更新文档、验证、修复循环
Guard: 可选的安全网 — 必须通过才能保留更改

所有命令在调用时如果不带参数,都会使用 AskUserQuestion 进行交互式设置。 只需输入命令,Claude 就会根据你的代码库智能预设,逐步询问你的需求。进阶用户可以通过内联标志跳过向导。

快速决策指南

我想要...使用
自主运行改进循环/autoresearch
构建发布流程/autoresearch:ship
修复错误/ Bug/autoresearch:fix 或 /autoresearch:debug
生成文档/autoresearch:learn
贡献者
utdp
项目信息
默认分支master
LicenseMIT License
创建时间2026/3/13
最近更新今天
GAI 中文摘要

Claude Autoresearch 是一个基于 Shell 的自动化工具,旨在为 Claude Code 提供一种持续迭代的改进机制。该项目借鉴了 Karpathy 的自动研究理念,通过设定明确目标、量化指标及自动验证循环,让 AI 能够自主执行任务并不断优化成果。

核心功能包括: 支持在目标明确的情况下进行不间断的自主循环迭代。 通过原子化修改和快速反馈,确保每次变更后都能立即进行机械化验证。 内置自动回滚机制,一旦验证失败或性能下降,系统会自动恢复至上一个稳定版本。 利用 Git 作为实验记忆存储,完整保留每一次尝试记录,实现实验结果的可追溯性。 支持跨领域应用,不仅限于机器学习,还可扩展至代码开发、内容创作及 DevOps 等任何可量化的业务场景。

该项目适用于需要进行大量重复性实验、代码优化或流程自动化的开发者及研究人员。特别适合在面对具有明确量化指标的任务时,通过“设置目标、自动循环、获取成果”的工作流,大幅提升生产效率与迭代速度。