© 2026FindAgent  · @simprr
返回列表
s

snap-stanford/Biomni

Biomni: a general-purpose biomedical AI agent

agentaibiomedicine
⭐

2.9k

Stars

🔱

529

Forks

👁

32

Watchers

📋

63

Issues

PythonApache-2.0创建于 2025/3/19更新于 今天
在 GitHub 上查看访问主页
README
由 Gemini 翻译整理

Biomni: 通用生物医学 AI Agent

概述

Biomni 是一个通用生物医学 AI agent,旨在自主执行跨多个生物医学细分领域的广泛研究任务。通过将尖端的 LLM 推理与检索增强规划(Retrieval-augmented planning)及基于代码的执行相结合,Biomni 能够帮助科学家显著提高研究效率并生成可验证的假设。

快速入门

安装

我们的软件环境较为庞大,因此我们提供了一个 setup.sh 脚本来进行统一设置。请首先按照此文件完成环境配置。

随后,激活环境 E1:

conda activate biomni_e1

接着安装官方的 biomni pip 包:

pip install biomni --upgrade

如需获取最新更新,请从 GitHub 源码版本安装,或执行:

pip install git+https://github.com/snap-stanford/Biomni.git@main

最后,通过以下任一方式配置你的 API keys:

选项 1:使用 .env 文件(推荐)

在项目目录下创建一个 .env 文件:

# 复制示例文件
cp .env.example .env

# 使用你的实际 API keys 编辑 .env 文件

你的 .env 文件应如下所示:

# 必需:用于 Claude 模型的 Anthropic API Key
ANTHROPIC_API_KEY=your_anthropic_api_key_here

# 可选:OpenAI API Key (如果使用 OpenAI 模型)
OPENAI_API_KEY=your_openai_api_key_here

# 可选:Azure OpenAI API Key (如果使用 Azure OpenAI 模型)
OPENAI_API_KEY=your_azure_openai_api_key
OPENAI_ENDPOINT=https://your-resource-name.openai.azure.com/

# 可选:AI Studio Gemini API Key (如果使用 Gemini 模型)
GEMINI_API_KEY=your_gemini_api_key_here

# 可选:groq API Key (如果使用 groq 作为模型提供商)
GROQ_API_KEY=your_groq_api_key_here

# 可选:设置 LLM 的来源,例如:
#"OpenAI", "AzureOpenAI", "Anthropic", "Ollama", "Gemini", "Bedrock", "Groq", "Custom"
LLM_SOURCE=your_LLM_source_here

# 可选:AWS Bedrock 配置 (如果使用 AWS Bedrock 模型)
AWS_BEARER_TOKEN_BEDROCK=your_bedrock_api_key_here
AWS_REGION=us-east-1

# 可选:自定义模型服务配置
# CUSTOM_MODEL_BASE_URL=http://localhost:8000/v1
# CUSTOM_MODEL_API_KEY=your_custom_api_key_here

# 可选:Biomni 数据路径 (默认为 ./data)
# BIOMNI_DATA_PATH=/path/to/your/data

# 可选:超时设置 (默认为 600 秒)
# BIOMNI_TIMEOUT_SECONDS=600

选项 2:使用 Shell 环境变量

或者,在你的 bash 配置文件 ~/.bashrc 中配置 API keys:

export ANTHROPIC_API_KEY="YOUR_API_KEY"
export OPENAI_API_KEY="YOUR_API_KEY" # 如果只使用 Claude 则可选
export OPENAI_ENDPOINT="https://your-resource-name.openai.azure.com/" # 除非使用 Azure,否则可选
export AWS_BEARER_TOKEN_BEDROCK="YOUR_BEDROCK_API_KEY" # AWS Bedrock 模型可选
export AWS_REGION="us-east-1" # 可选,Bedrock 默认为 us-east-1
export GEMINI_API_KEY="YOUR_GEMINI_API_KEY" # 如果要使用 Gemini 模型则可选
export GROQ_API_KEY="YOUR_GROQ_API_KEY" # 可选:设置此项以使用 Groq 托管的模型
export LLM_SOURCE="Groq" # 可选:设置此项以使用 Groq 托管的模型

⚠️ 已知的包冲突

由于依赖冲突,某些 Python 包在 Biomni 环境中默认未安装。如果你需要这些功能,必须手动安装这些包,并且可能需要取消代码库中相关代码的注释。请参阅 docs/known_conflicts.md 获取最新的详细列表。

基础用法

进入环境后,即可开始使用 Biomni:

from biomni.agent import A1

# 使用数据路径初始化 agent,数据湖将在首次运行时自动下载(约 11GB)
agent = A1(path='./data', llm='claude-sonnet-4-20250514')

# 使用自然语言执行生物医学任务
agent.go("Plan a CRISPR screen to identify genes that regulate T cell exhaustion, generate 32 genes that maximize the perturbation effect.")
agent.go("Perform scRNA-seq annotation at [PATH] and generate meaningful hypothesis")
agent.go("Predict ADMET properties for this compound: CC(C)CC1=CC=C(C=C1)C(C)C(=O)O")

控制数据湖(Datalake)加载

默认情况下,当你创建 agent 时,Biomni 会自动下载数据湖文件(约 11GB)。你可以通过以下方式控制此行为:

# 跳过自动下载数据湖(初始化速度更快)
agent = A1(path='./data', llm='claude-sonnet-4-20250514', expected_data_lake_files = [])

这适用于:

  • 更快的测试与开发
  • 存储或带宽受限的环境
  • 仅需使用特定工具而不需要数据湖文件的情况

如果你计划使用 Azure 作为模型来源,请务必在模型名称前加上 azure- 前缀(例如 llm='azure-gpt-4o')。

Gradio 界面

为 Biomni 启动交互式 Web UI:

from biomni.agent import A1

agent = A1(path='./data')
# 启动 Gradio 界面
agent.launch_ui()
贡献者
skpPSskmHi
项目信息
默认分支main
LicenseApache License 2.0
创建时间2025/3/19
最近更新今天
GAI 中文摘要

Biomni 是一个通用型生物医学人工智能代理,旨在自主执行跨多个生物医学子领域的复杂研究任务。该项目通过整合大语言模型的推理能力、检索增强规划以及代码执行技术,帮助科研人员显著提升研究效率并生成可验证的科学假设。

该系统支持自主规划并执行跨学科的生物医学研究任务。集成检索增强机制以获取专业领域知识,确保研究过程的准确性。利用代码执行环境完成数据分析与处理工作。通过模块化设计支持大规模生物医学数据的自动化处理与分析。

适用于生物医学研究人员、计算生物学家及数据科学家,主要用于自动化科研流程、文献调研、数据分析及辅助探索性假设生成等场景。