© 2026FindAgent  · @simprr
返回列表
s

shareAI-lab/learn-claude-code

Bash is all you need - A nano claude code–like 「agent harness」, built from 0 to 1

agentagent-developmentai-agentclaudeclaude-codeeducationalllmpythonteachingtutorial
⭐

41.6k

Stars

🔱

6.4k

Forks

👁

212

Watchers

📋

83

Issues

TypeScriptMIT创建于 2025/6/29更新于 今天
在 GitHub 上查看访问主页
README
由 Gemini 翻译整理

English | 中文 | 日本語

学习 Claude Code —— 构建真实 Agent 的工程实践

模型本身就是 Agent

在讨论代码之前,我们先明确一个核心前提:

Agent 是模型。它不是框架,不是 Prompt 链,也不是拖拽式的流程编排工具。

什么是 Agent

Agent 本质上是一个神经网络——无论是 Transformer、RNN 还是某种学习函数。它通过在动作序列数据上进行数十亿次的梯度更新训练而成,能够感知环境、推演目标并采取行动以实现这些目标。在 AI 领域,“Agent”一词的定义始终如一:一个学会了如何行动的模型。

人类本身就是一种 Agent。人类是一个生物神经网络,经过数百万年的进化训练,通过感官感知世界,通过大脑进行推理,并通过躯体采取行动。当 DeepMind、OpenAI 或 Anthropic 提到“Agent”时,他们表达的含义与该领域创立之初如出一辙:一个学会了行动的模型。

历史证明了一切:

  • 2013 年 —— DeepMind DQN 玩转 Atari 游戏。 单一的神经网络仅通过原始像素和游戏得分,学会了 7 款 Atari 2600 游戏,超越了此前所有的算法,并在其中 3 款游戏中击败了人类专家。到 2015 年,该架构扩展至 49 款游戏,并达到了职业人类测试员的水平,成果发表于《自然》杂志。没有针对游戏的硬编码规则,也没有决策树。一个模型,通过经验学习。那个模型,就是 Agent。

  • 2019 年 —— OpenAI Five 征服 Dota 2。 五个神经网络在 10 个月内通过自博弈进行了相当于 45,000 年的 Dota 2 对局,在旧金山的直播赛中以 2-0 击败了当时 TI8 的世界冠军 OG 战队。在随后的公开竞技场中,AI 在 42,729 场对局中胜率高达 99.4%。没有脚本策略,没有元编程的团队协调逻辑。模型完全通过自博弈学会了团队配合、战术和实时适应。

  • 2019 年 —— DeepMind AlphaStar 精通《星际争霸 II》。 AlphaStar 在闭门比赛中以 10-1 的比分击败职业选手,随后在欧服达到了宗师段位——位列 9 万名玩家中的前 0.15%。这是一个包含不完全信息、实时决策且组合动作空间远超国际象棋和围棋的游戏。它的 Agent 是什么?是一个模型。它是训练出来的,而不是写脚本写出来的。

  • 2019 年 —— 腾讯绝悟(Jueyu)称霸《王者荣耀》。 腾讯 AI Lab 的“绝悟”在世界冠军杯的 5v5 比赛中击败了 KPL 职业选手。在 1v1 模式下,职业选手仅在 15 场对局中赢了 1 场,且从未撑过 8 分钟。训练强度惊人:一天相当于人类 440 年的练习量。到 2021 年,“绝悟”已能在全英雄池中超越 KPL 职业选手。没有手工编写的对线表,没有硬编码的阵容组合。这是一个通过自博弈从零开始掌握整个游戏的模型。

  • 2024-2025 年 —— LLM Agent 重塑软件工程。 Claude、GPT、Gemini——这些在海量人类代码和推理数据上训练出来的大语言模型——被部署为编程 Agent。它们能够阅读代码库、编写实现、调试故障、在团队中协作。其架构与之前的每一个 Agent 完全一致:一个经过训练的模型,置于环境中,并配备了感知和行动的工具。唯一的区别在于它们所学知识的规模以及所解决任务的通用性。

上述每一个里程碑都共享同一个真理:“Agent”绝非外围的代码。Agent 永远是模型本身。

Agent 不是什么

“Agent”一词已经被一整套廉价的“提示词工程(Prompt plumbing)”产业所绑架。

拖拽式的流程构建器、无代码“AI Agent”平台、Prompt 链编排库。它们都有一个共同的误区:认为通过 if-else 分支、节点图和硬编码的路由逻辑将 LLM API 调用串联起来,就叫“构建 Agent”。

事实并非如此。它们构建的是鲁布·戈德堡机械(Rube Goldberg machine)——一种过度工程化且脆弱的程序规则管道,其中 LLM 仅仅充当了一个美其名曰“文本补全”的节点。那不是 Agent,那只是自以为是的 Shell 脚本。

所谓“提示词工程 Agent”是那些不训练模型的程序员的幻想。 他们试图通过堆砌程序逻辑(庞大的规则树、节点图、提示词瀑布流)来强行通过暴力破解实现智能,并祈祷大量的胶水代码能神奇地产生自主行为。这不可能实现。你无法通过工程手段“攒”出智能。智能是习得的,而不是编程编出来的。

这些系统注定会失败:它们脆弱、无法扩展,且从根本上不具备泛化能力。它们是 GOFAI(经典老派 AI)的现代复活——即该领域早年间那些被抛弃的符号规则系统。

贡献者
CG
项目信息
默认分支main
LicenseMIT License
创建时间2025/6/29
最近更新今天
GAI 中文摘要

learn-claude-code 是一个以教学为核心的开源项目,通过从零构建一个类 Claude Code 的 AI Agent 工具,帮助开发者深入理解智能体(Agent)的本质。该项目主张回归模型驱动的智能体设计原则,通过简洁的 Bash 环境实操,引导用户剥离复杂的框架封装,直接触及 Agent 的工程实现原理。

项目提供了一个极简的 Agent 工具框架原型,通过核心逻辑展示如何将模型与环境进行有效对接。通过自定义的工具集定义,演示了智能体如何感知环境状态并执行相应操作。该项目详细讲解了指令执行与模型反馈的闭环机制,揭示了 Agent 与环境互动的底层工程细节。通过配套的教程,引导用户手动复现 Agent 的关键组件,从而提升对大规模语言模型在任务处理中执行逻辑的理解。

该项目非常适合希望深入探究 Agent 原理的开发者及 AI 学习者,特别适用于那些想要跳过繁琐的高层封装框架、追求从底层逻辑彻底搞懂智能体工程实现的研发人员。通过此项目,开发者可以在教学与实验场景中,快速构建起属于自己的轻量级 AI Agent 系统。