© 2026FindAgent  · @simprr
返回列表
S

SakanaAI/AI-Scientist-v2

The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search

⭐

3.5k

Stars

🔱

532

Forks

👁

37

Watchers

📋

54

Issues

PythonNOASSERTION创建于 2025/4/8更新于 今天
在 GitHub 上查看
README
由 Gemini 翻译整理

The AI Scientist-v2:基于智能体树搜索的研讨会级自动化科学发现

📚 [论文] | 📝 [博客文章] | 📂 [ICLR 2025 研讨会实验]

完全自主的科学研究系统正变得日益强大,AI 在改变科学发现方式的过程中发挥着关键作用。我们非常激动地推出 The AI Scientist-v2,这是一个通用的端到端智能体系统,它生成了第一篇完全由 AI 撰写并通过同行评审的研讨会论文。

该系统能够自主生成假设、运行实验、分析数据并撰写科学论文。与前身 (AI Scientist-v1) 不同,AI Scientist-v2 不再依赖人工编写的模板,能够在不同的机器学习 (ML) 领域进行泛化,并采用由实验管理智能体引导的渐进式智能体树搜索 (Agentic Tree Search) 方法。

注意: AI Scientist-v2 并不一定比 v1 产生更好的论文,特别是在有强大的初始模板可用时。v1 遵循定义良好的模板,成功率较高;而 v2 采取的是更广泛、更具探索性的方法,成功率相对较低。v1 最适用于目标明确且基础扎实的任务,而 v2 则专为开放式科学探索而设计。

警告! 本代码库会执行由大语言模型 (LLM) 编写的代码。这种自主性伴随着各种风险和挑战,包括潜在的危险包使用、不受控的网络访问以及产生意外进程的可能性。请确保在受控的沙盒环境(例如 Docker 容器)中运行此代码。请自行承担使用风险。

目录

  1. 环境要求
    • 安装
    • 支持的模型与 API Key
  2. 生成研究思路
  3. 运行 AI Scientist-v2 论文生成实验
  4. 引用 The AI Scientist-v2
  5. 常见问题解答
  6. 致谢

环境要求

本代码旨在 Linux 环境下配合 NVIDIA GPU、CUDA 和 PyTorch 使用。

安装

# 创建新的 conda 环境
conda create -n ai_scientist python=3.11
conda activate ai_scientist

# 安装支持 CUDA 的 PyTorch(请根据您的设置调整 pytorch-cuda 版本)
conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia

# 安装 PDF 和 LaTeX 工具
conda install anaconda::poppler
conda install conda-forge::chktex

# 安装 Python 包依赖
pip install -r requirements.txt

安装过程通常不会超过一小时。

支持的模型与 API Key

OpenAI 模型

默认情况下,系统使用 OPENAI_API_KEY 环境变量来调用 OpenAI 模型。

Gemini 模型

默认情况下,系统通过 OpenAI API 使用 GEMINI_API_KEY 环境变量来调用 Gemini 模型。

通过 AWS Bedrock 使用 Claude 模型

若要使用 Amazon Bedrock 提供的 Claude 模型,请安装额外的必要包:

pip install anthropic[bedrock]

接下来,通过设置以下环境变量来配置有效的 AWS Credentials 和目标 AWS Region:AWS_ACCESS_KEY_ID、AWS_SECRET_ACCESS_KEY、AWS_REGION_NAME。

Semantic Scholar API(文献搜索)

我们的代码可以选择使用 Semantic Scholar API Key (S2_API_KEY),以便在文献搜索阶段获得更高的吞吐量 如果您有的话。此 Key 在构思和论文写作阶段都会用到。系统即便没有它也能工作,但在构思时可能会遇到速率限制或创新性检查能力下降的情况。如果您在使用 Semantic Scholar 时遇到问题,可以在论文生成过程中跳过引用阶段。

设置 API Key

确保为准备使用的模型提供必要的 API Key 作为环境变量。例如:

export OPENAI_API_KEY="YOUR_OPENAI_KEY_HERE"
export S2_API_KEY="YOUR_S2_KEY_HERE"
# 如果使用 Bedrock,请设置 AWS 凭证
# export AWS_ACCESS_KEY_ID="YOUR_AWS_ACCESS_KEY_ID"
# export AWS_SECRET_ACCESS_KEY="YOUR_AWS_SECRET_KEY"
# export AWS_REGION_NAME="your-aws-region"

生成研究思路

在运行完整的 AI Scientist-v2 实验流程之前,您首先需要使用 ai_scientist/perform_ideation_temp_free.py 脚本来生成潜在的研究想法。该脚本利用 LLM 根据您提供的高级主题描述进行头脑风暴和想法精炼,并与 Semantic Scholar 等工具交互以检查创新性。

  1. 准备主题描述
贡献者
ckrRSoed
项目信息
默认分支main
LicenseOther
创建时间2025/4/8
最近更新今天
GAI 中文摘要

AI-Scientist-v2 是一个全自动化的科学研究系统,旨在通过代理智能体树搜索技术实现从假设生成到论文撰写的全流程科研闭环。该项目摆脱了对预设模板的依赖,能够跨机器学习领域进行自主探索,从而推动科学发现方式的革新。

系统能够自动构思科学假设并设计相应的实验方案。

具备强大的实验管理能力,支持运行复杂的科研代码并进行数据分析。

通过代理树搜索算法,在开放式的问题空间中进行深入的科学探索。

能够根据实验结果自主撰写完整的科学论文。

适用于需要进行大规模开放式科学研究的科研人员,或者希望探索 AI 自主科研潜力的技术开发者,特别适合在受控的沙箱环境中开展前沿领域的探索性实验。