Biomni: a general-purpose biomedical AI agent
3.2k
Stars
587
Forks
36
Watchers
68
Issues
Biomni 是一个通用生物医学 AI 智能体,旨在跨多个生物医学子领域自主执行各类研究任务。通过将前沿的大语言模型(LLM)推理与检索增强规划及基于代码的执行相结合,Biomni 能够帮助科学家显著提升研究效率并生成可验证的假设。
由于我们的软件环境规模较大,我们提供了一个 setup.sh 脚本来执行环境配置。请先参考此 文件 完成环境部署。
随后,激活 E1 环境:
conda activate biomni_e1
接着,安装 Biomni 官方 pip 包:
pip install biomni --upgrade
若要获取最新更新,请从 GitHub 源码安装,或执行:
pip install git+https://github.com/snap-stanford/Biomni.git@main
最后,请通过以下任一方式配置您的 API Key:
点击展开
在项目目录下创建一个 .env 文件:
# 复制示例文件
cp .env.example .env
# 使用您的实际 API Key 编辑 .env 文件
您的 .env 文件内容应如下所示:
# 必须:用于 Claude 模型的 Anthropic API Key
ANTHROPIC_API_KEY=your_anthropic_api_key_here
# 可选:OpenAI API Key(若使用 OpenAI 模型)
OPENAI_API_KEY=your_openai_api_key_here
# 可选:Azure OpenAI API Key(若使用 Azure OpenAI 模型)
OPENAI_API_KEY=your_azure_openai_api_key
OPENAI_ENDPOINT=https://your-resource-name.openai.azure.com/
# 可选:AI Studio Gemini API Key(若使用 Gemini 模型)
GEMINI_API_KEY=your_gemini_api_key_here
# 可选:groq API Key(若使用 groq 作为模型提供商)
GROQ_API_KEY=your_groq_api_key_here
# 可选:设置 LLM 的来源,例如:
#"OpenAI", "AzureOpenAI", "Anthropic", "Ollama", "Gemini", "Bedrock", "Groq", "Custom"
LLM_SOURCE=your_LLM_source_here
# 可选:AWS Bedrock 配置(若使用 AWS Bedrock 模型)
AWS_BEARER_TOKEN_BEDROCK=your_bedrock_api_key_here
AWS_REGION=us-east-1
# 可选:自定义模型服务配置
# CUSTOM_MODEL_BASE_URL=http://localhost:8000/v1
# CUSTOM_MODEL_API_KEY=your_custom_api_key_here
# 可选:Biomni 数据路径(默认为 ./data)
# BIOMNI_DATA_PATH=/path/to/your/data
# 可选:超时设置(默认为 600 秒)
# BIOMNI_TIMEOUT_SECONDS=600
或者,也可以在 bash 配置文件 ~/.bashrc 中配置 API Key:
export ANTHROPIC_API_KEY="YOUR_API_KEY"
export OPENAI_API_KEY="YOUR_API_KEY" # 如果仅使用 Claude,此项可选
export OPENAI_ENDPOINT="https://your-resource-name.openai.azure.com/" # 除非使用 Azure,否则此项可选
export AWS_BEARER_TOKEN_BEDROCK="YOUR_BEDROCK_API_KEY" # AWS Bedrock 模型可选
export AWS_REGION="us-east-1" # 可选,Bedrock 默认为 us-east-1
export GEMINI_API_KEY="YOUR_GEMINI_API_KEY" # 如果要使用 gemini 模型,此项可选
export GROQ_API_KEY="YOUR_GROQ_API_KEY" # 可选:设置此项以使用 Groq 提供的模型
export LLM_SOURCE="Groq" # 可选:设置此项以使用 Groq 提供的模型
由于依赖关系冲突,部分 Python 包在 Biomni 环境中并未默认安装。如果您需要这些功能,必须手动安装这些包,并可能需要取消代码库中相关代码的注释。详情请查阅 docs/known_conflicts.md 中的最新列表和说明。
进入环境后,即可开始使用 Biomni:
from biomni.agent import A1
# 初始化智能体并指定数据路径,数据湖(Data lake)将在首次运行时自动下载(约 11GB)
agent = A1(path='./data', llm='claude-sonnet-4-20250514')
# 使用自然语言执行生物医学任务
agent.go("Plan a CRISPR screen to identify genes that regulate T cell exhaustion, generate 32 genes that maximize the perturbation effect.")
agent.go("Perform scRNA-seq annotation at [PATH] and generate meaningful hypothesis")
agent.go("Predict ADMET properties for this compound: CC(C)CC1=CC=C(C=C1)C(C)C(=O)O")
默认情况下,Biomni 在创建智能体时会自动下载数据湖文件(约 11GB)。您可以控制此行为:
# 跳过自动下载数据湖(初始化速度更快)
agent = A1(path='./data', llm='claude-sonnet-4-20250514', expected_data_lake_files = [])
此功能适用于:
azure- 前缀(例如 llm='azure-gpt-4o')。为 Biomni 启动一个交互式 Web UI:
from biomni.agent import A1
agent = A1(path='./data')
Biomni 是一个基于 Python 开发的通用型生物医学 AI 智能体,旨在协助科研人员自主执行跨学科的复杂研究任务。该项目通过整合大语言模型的推理能力、检索增强规划以及代码执行功能,显著提升了生物医学领域的研究效率并支持生成可验证的科学假设。
提供自主化的研究任务执行能力,覆盖多种生物医学子领域。 集成大语言模型以实现深度推理与规划。 支持检索增强技术,确保科研过程中的信息获取更精准。 具备代码执行功能,能够处理复杂的数据分析与逻辑推演任务。 内置自动化数据湖管理,支持灵活的数据加载与环境配置。
适用于生物医学研究人员、计算生物学家及数据科学家,主要用于自动化科研流程、快速筛选海量文献以及辅助科研假设的制定。