Biomni：通用生物医学 AI 智能体

概述

Biomni 是一个通用生物医学 AI 智能体，旨在跨多个生物医学子领域自主执行各类研究任务。通过将前沿的大语言模型（LLM）推理与检索增强规划及基于代码的执行相结合，Biomni 能够帮助科学家显著提升研究效率并生成可验证的假设。

快速入门

安装

由于我们的软件环境规模较大，我们提供了一个 setup.sh 脚本来执行环境配置。请先参考此文件完成环境部署。

随后，激活 E1 环境：

conda activate biomni_e1

接着，安装 Biomni 官方 pip 包：

pip install biomni --upgrade

若要获取最新更新，请从 GitHub 源码安装，或执行：

pip install git+https://github.com/snap-stanford/Biomni.git@main

最后，请通过以下任一方式配置您的 API Key：

点击展开

选项 1：使用 .env 文件（推荐）

在项目目录下创建一个 .env 文件：

# 复制示例文件
cp .env.example .env

# 使用您的实际 API Key 编辑 .env 文件

您的 .env 文件内容应如下所示：

# 必须：用于 Claude 模型的 Anthropic API Key
ANTHROPIC_API_KEY=your_anthropic_api_key_here

# 可选：OpenAI API Key（若使用 OpenAI 模型）
OPENAI_API_KEY=your_openai_api_key_here

# 可选：Azure OpenAI API Key（若使用 Azure OpenAI 模型）
OPENAI_API_KEY=your_azure_openai_api_key
OPENAI_ENDPOINT=https://your-resource-name.openai.azure.com/

# 可选：AI Studio Gemini API Key（若使用 Gemini 模型）
GEMINI_API_KEY=your_gemini_api_key_here

# 可选：groq API Key（若使用 groq 作为模型提供商）
GROQ_API_KEY=your_groq_api_key_here

# 可选：设置 LLM 的来源，例如：
#"OpenAI", "AzureOpenAI", "Anthropic", "Ollama", "Gemini", "Bedrock", "Groq", "Custom"
LLM_SOURCE=your_LLM_source_here

# 可选：AWS Bedrock 配置（若使用 AWS Bedrock 模型）
AWS_BEARER_TOKEN_BEDROCK=your_bedrock_api_key_here
AWS_REGION=us-east-1

# 可选：自定义模型服务配置
# CUSTOM_MODEL_BASE_URL=http://localhost:8000/v1
# CUSTOM_MODEL_API_KEY=your_custom_api_key_here

# 可选：Biomni 数据路径（默认为 ./data）
# BIOMNI_DATA_PATH=/path/to/your/data

# 可选：超时设置（默认为 600 秒）
# BIOMNI_TIMEOUT_SECONDS=600

选项 2：使用 Shell 环境变量

或者，也可以在 bash 配置文件 ~/.bashrc 中配置 API Key：

export ANTHROPIC_API_KEY="YOUR_API_KEY"
export OPENAI_API_KEY="YOUR_API_KEY" # 如果仅使用 Claude，此项可选
export OPENAI_ENDPOINT="https://your-resource-name.openai.azure.com/" # 除非使用 Azure，否则此项可选
export AWS_BEARER_TOKEN_BEDROCK="YOUR_BEDROCK_API_KEY" # AWS Bedrock 模型可选
export AWS_REGION="us-east-1" # 可选，Bedrock 默认为 us-east-1
export GEMINI_API_KEY="YOUR_GEMINI_API_KEY" # 如果要使用 gemini 模型，此项可选
export GROQ_API_KEY="YOUR_GROQ_API_KEY" # 可选：设置此项以使用 Groq 提供的模型
export LLM_SOURCE="Groq" # 可选：设置此项以使用 Groq 提供的模型

⚠️ 已知包冲突

由于依赖关系冲突，部分 Python 包在 Biomni 环境中并未默认安装。如果您需要这些功能，必须手动安装这些包，并可能需要取消代码库中相关代码的注释。详情请查阅 docs/known_conflicts.md 中的最新列表和说明。

基本使用

进入环境后，即可开始使用 Biomni：

from biomni.agent import A1

# 初始化智能体并指定数据路径，数据湖（Data lake）将在首次运行时自动下载（约 11GB）
agent = A1(path='./data', llm='claude-sonnet-4-20250514')

# 使用自然语言执行生物医学任务
agent.go("Plan a CRISPR screen to identify genes that regulate T cell exhaustion, generate 32 genes that maximize the perturbation effect.")
agent.go("Perform scRNA-seq annotation at [PATH] and generate meaningful hypothesis")
agent.go("Predict ADMET properties for this compound: CC(C)CC1=CC=C(C=C1)C(C)C(=O)O")

控制数据湖（Datalake）加载

默认情况下，Biomni 在创建智能体时会自动下载数据湖文件（约 11GB）。您可以控制此行为：

# 跳过自动下载数据湖（初始化速度更快）
agent = A1(path='./data', llm='claude-sonnet-4-20250514', expected_data_lake_files = [])

此功能适用于：

更快速的测试与开发
存储空间或带宽有限的环境
仅需使用特定工具而无需数据湖文件的场景如果您计划使用 Azure 模型，请务必在模型名称前添加 azure- 前缀（例如 llm='azure-gpt-4o'）。

Gradio 界面

为 Biomni 启动一个交互式 Web UI：

from biomni.agent import A1

agent = A1(path='./data')