dzhng/deep-research

An AI-powered research assistant that performs iterative, deep research on any topic by combining search engines, web scraping, and large language models. The goal of this repo is to provide the simplest implementation of a deep research agent - e.g. an agent that can refine its research direction overtime and deep dive into a topic.

agentaigpto3-miniresearch

GAI 中文摘要

Open Deep Research 是一个基于人工智能的深度研究助手，旨在通过整合搜索引擎、网页抓取技术与大语言模型，自动执行迭代式的主题深度挖掘任务。该项目致力于提供深度研究智能体最精简的实现方案，通过极简的代码库帮助开发者轻松理解并在此基础上进行二次开发。

该系统能够根据研究目标自动生成并优化搜索指令，实现多轮迭代式的信息检索与分析。支持用户根据需求灵活配置研究的广度与深度，确保信息获取既有覆盖面又能触及核心细节。具备智能追问机制，通过与用户互动不断修正研究方向，从而更精准地定位目标信息。支持并发处理机制，大幅提升了搜索与内容抓取及处理的整体效率。最终能够将复杂的调研过程转化为详尽的 Markdown 格式分析报告并自动生成引用来源。

该项目非常适合需要进行快速行业洞察、学术资料调研或市场分析的研究人员与开发者使用。适用于任何需要从海量互联网信息中提取深度分析报告，且希望深入理解大模型自动化调研工作流的场景。

⭐

19.0k

Stars

🔱

2.0k

Forks

👁

109

Watchers

📋

Issues

TypeScriptMIT创建于 2025/2/4更新于今天

在 GitHub 上查看

README

由 Gemini 翻译整理

Open Deep Research

这是一个基于 AI 的研究助手，通过结合搜索引擎、网页抓取和大型语言模型（LLM），对任何主题进行迭代式的深度研究。

本项目的目标是提供一个深度研究智能体的极简实现，例如：一个能够随时间推移不断优化研究方向并深入挖掘主题的智能体。项目的目标是保持代码库的简洁。

流程图

graph TD
    Q[Research Question] --> DR[Deep Research]
    B[Breadth] --> DR
    D[Depth] --> DR

    DR --> SQ[SERP Queries]
    SQ --> PR[Process Results]

    subgraph Results[Results]
        direction TB
        NL((Learnings))
        ND((Directions))
    end

    PR --> NL
    PR --> ND

    DP{depth > 0?}

    RD["Next Direction:
    - Prior Goals
    - New Questions
    - Learnings"]

    MR[Markdown Report]

    %% Main Flow
    Q & B & D --> DR

    %% Results to Decision
    NL & ND --> DP

    %% Circular Flow
    DP -->|Yes| RD
    RD -->|New Context| DR

    %% Final Output
    DP -->|No| MR

    %% Styling
    classDef input fill:#7bed9f,stroke:#2ed573,color:black
    classDef process fill:#70a1ff,stroke:#1e90ff,color:black
    classDef recursive fill:#ffa502,stroke:#ff7f50,color:black
    classDef output fill:#ff4757,stroke:#ff6b81,color:black
    classDef results fill:#a8e6cf,stroke:#3b7a57,color:black

    class Q,B,D input
    class DR,SQ,PR process
    class DP,RD recursive
    class MR output
    class NL,ND results

功能特性

迭代式研究：通过迭代生成搜索查询、处理结果并根据发现深入挖掘，从而进行深度研究。
智能查询生成：利用 LLM 根据研究目标和先前发现生成针对性的搜索查询。
深度与广度控制：提供可配置参数，以控制研究的广度（breadth）和深度（depth）。
智能追问：生成后续问题，以更好地理解研究需求。
综合报告：生成包含研究发现和来源的详细 Markdown 报告。
并发处理：并行处理多个搜索和结果分析，提高执行效率。

系统要求

Node.js 环境
API Key：
- Firecrawl API（用于网页搜索和内容提取）
- OpenAI API（用于 o3 mini 模型）

安装与配置

Node.js

克隆仓库
安装依赖：

npm install

在 .env.local 文件中设置环境变量：

FIRECRAWL_KEY="your_firecrawl_key"
# 如果你想使用自托管的 Firecrawl，请添加以下内容：
# FIRECRAWL_BASE_URL="http://localhost:3002"

OPENAI_KEY="your_openai_key"

若要使用本地 LLM，请注释掉 OPENAI_KEY，改为取消注释 OPENAI_ENDPOINT 和 OPENAI_MODEL：

将 OPENAI_ENDPOINT 设置为你的本地服务器地址（例如 "http://localhost:1234/v1"）
将 OPENAI_MODEL 设置为本地服务器中加载的模型名称。

Docker

克隆仓库
将 .env.example 重命名为 .env.local 并配置你的 API Key。
构建 Docker 镜像：

docker build -f Dockerfile -t deep-research .

运行 Docker 容器：

docker compose up -d

在容器中执行 npm run docker：

docker exec -it deep-research npm run docker

使用方法

启动研究助手：

npm start

你将被提示：

输入研究主题
指定研究广度（建议值：3-10，默认值：4）
指定研究深度（建议值：1-5，默认值：2）
回答后续问题以细化研究方向

系统随后将：

生成并执行搜索查询
处理并分析搜索结果
根据发现的内容进行递归式的深度探索
生成一份综合的 Markdown 报告

最终报告将保存为工作目录下的 report.md 或 answer.md（取决于你选择的模式）。

并发处理

如果你有 Firecrawl 的付费版本或本地版本，可以通过设置 CONCURRENCY_LIMIT 环境变量来增加并发限制，从而加快运行速度。

如果你使用的是免费版，有时可能会遇到速率限制错误，此时你可以将该限制调低至 1（但运行速度会变慢）。

DeepSeek R1

深度研究在 R1 模型上表现出色！我们使用 Fireworks 作为 R1 模型的主要供应商。要使用 R1，只需设置一个 Fireworks API Key：

FIREWORKS_KEY="api_key"

当检测到该 Key 时，系统将自动切换为使用 R1 而非 o3-mini。

自定义端点与模型

另有两个可选的环境变量，允许你调整端点（适用于 OpenRouter 或 Gemini 等其他兼容 OpenAI 的 API）以及自定义模型名称：

OPENAI_ENDPOINT="custom_endpoint"
CUSTOM_MODEL="custom_model"

工作原理

初始设置
- 接收用户查询及研究参数（广度与深度）
- 生成后续问题以更好地理解研究需求
深度研究过程
- 根据研究目标生成多个 SERP 查询
- 处理搜索结果以提取关键见解
- 生成后续研究方向