© 2026FindAgent  · @simprr
返回列表
i

infiniflow/ragflow

RAGFlow is a leading open-source Retrieval-Augmented Generation (RAG) engine that fuses cutting-edge RAG with Agent capabilities to create a superior context layer for LLMs

agentagenticagentic-aiagentic-workflowaiai-searchcontext-engineeringcontext-retrievaldeep-researchdeepseekdeepseek-r1document-parserdocument-understandinggraphragllmmcpollamaopenairagretrieval-augmented-generation
⭐

76.5k

Stars

🔱

8.6k

Forks

👁

331

Watchers

📋

3175

Issues

PythonApache-2.0创建于 2023/12/12更新于 今天
在 GitHub 上查看访问主页
README
由 Gemini 翻译整理

RAGFlow

文档 | 路线图 | Twitter | Discord | 演示

📕 目录

  • 💡 什么是 RAGFlow?
  • 🎮 在线演示
  • 📌 最新更新
  • 🌟 核心功能
  • 🔎 系统架构
  • 🎬 快速开始
  • 🔧 配置说明
  • 🔧 构建 Docker 镜像
  • 🔨 从源码启动开发服务
  • 📚 文档
  • 📜 路线图
  • 🏄 社区
  • 🙌 参与贡献

💡 什么是 RAGFlow?

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,它将尖端的 RAG 技术与智能体(Agent)能力深度融合,为 LLM 提供了卓越的上下文层。RAGFlow 提供了一套精简的 RAG 工作流,能够适配各种规模的企业。得益于融合的 上下文引擎 和预构建的智能体模板,开发者能够以极高的效率和精度,将复杂数据转化为高保真、生产就绪的 AI 系统。

🎮 在线演示

请访问 https://cloud.ragflow.io 体验我们的演示。

🔥 最新更新

  • 2025-12-26 支持 AI 智能体“记忆”功能。
  • 2025-11-19 支持 Gemini 3 Pro。
  • 2025-11-12 支持从 Confluence、S3、Notion、Discord、Google Drive 同步数据。
  • 2025-10-23 支持 MinerU 和 Docling 作为文档解析方法。
  • 2025-10-15 支持可编排的数据摄取流水线。
  • 2025-08-08 支持 OpenAI 最新的 GPT-5 系列模型。
  • 2025-08-01 支持智能体工作流和 MCP。
  • 2025-05-23 为智能体添加了 Python/JavaScript 代码执行组件。
  • 2025-05-05 支持跨语言查询。
  • 2025-03-19 支持使用多模态模型解读 PDF 或 DOCX 文件中的图像。

🎉 保持关注

⭐️ 如果你喜欢我们的项目,请给仓库点个 Star,以便及时获取最新功能和改进!获取新版本的即时通知!🌟

🌟 核心功能

🍭 “高质量输入,高质量输出”

  • 基于 深度文档理解 从格式复杂的非结构化数据中提取知识。
  • 在海量数据(Token 数量几乎不受限)中精准定位“大海捞针”的信息。

🍱 基于模板的分块(Chunking)

  • 智能且可解释。
  • 提供多种模板选项供选择。

🌱 有据可依的引用,降低幻觉

  • 可视化文本分块,支持人工干预。
  • 提供关键参考资料的快速视图,并可追踪引用来源,确保回答有据可依。

🍔 兼容异构数据源

  • 支持 Word、PPT、Excel、TXT、图像、扫描件、结构化数据、网页等多种格式。

🛀 自动化且轻松的 RAG 工作流

  • 为个人和大型企业量身打造的精简 RAG 编排。
  • 可配置的 LLM 以及 Embedding 模型。
  • 多路召回配合融合重排序(Re-ranking)。
  • 直观的 API,实现与业务系统的无缝集成。

🔎 系统架构

🎬 快速开始

📝 前置准备

  • CPU >= 4 核
  • 内存 >= 16 GB
  • 磁盘 >= 50 GB
  • Docker >= 24.0.0 & Docker Compose >= v2.26.1
  • gVisor: 仅当你需要使用 RAGFlow 的代码执行器(沙箱)功能时才需要。

[!TIP] 如果你的本地机器(Windows, Mac 或 Linux)尚未安装 Docker,请参考 安装 Docker Engine。

🚀 启动服务器

  1. 确保 vm.max_map_count >= 262144:

    检查 vm.max_map_count 的值:

    $ sysctl vm.max_map_count
    

    如果值小于 262144,请将其重置为至少 262144:

    # 在此示例中,我们将其设置为 262144:
    $ sudo sysctl -w vm.max_map_count=262144
    

    此更改在重启系统后会重置。为了使其永久生效,请在 /etc/sysctl.conf 中添加或更新 vm.max_map_count 的值:

    vm.max_map_count=262144
    
  2. 克隆仓库:

    $ git clone https://github.com/infiniflow/ragflow.git
    
  3. 使用预构建的 Docker 镜像启动服务器:

[!CAUTION] 所有 Docker 镜像均为 x86 平台构建。目前我们不提供 ARM64 平台的 Docker 镜像。 如果你在 ARM64 平台上,请按照 此指南 构建适配你系统的 Docker 镜像。

下面的命令将下载 v0.24.0 版本的 RAGFlow Docker 镜像。下表展示了不同 RAGFlow 版本的描述。

贡献者
cKwJyydaWM
项目信息
默认分支main
LicenseApache License 2.0
创建时间2023/12/12
最近更新今天
GAI 中文摘要

RAGFlow 是一款基于深度文档理解的开源检索增强生成引擎,旨在为大语言模型提供高质量的上下文支持。该项目深度融合了前沿的 RAG 技术与智能体能力,能够有效解决传统 RAG 系统在处理复杂文档时的信息提取与上下文构建难题。

支持多种复杂文档格式的深度解析与结构化提取,确保检索内容的高度准确性。内置强大的智能体工作流引擎,支持自动化完成从文档理解到逻辑推理的复杂任务。具备灵活的上下文工程能力,能够为各类 LLM 提供精准、相关的知识库支撑。支持深度研究模式与图结构检索,进一步提升复杂查询场景下的响应质量。兼容主流大模型生态,可无缝对接 DeepSeek、OpenAI 及 Ollama 等多种模型服务。

适用于需要构建企业级私有知识库、自动化文档分析系统以及智能 Agent 应用的开发者和技术团队。特别适合处理格式复杂、具有高度专业性的文档,并对 AI 检索准确度和上下文推理能力有严苛要求的业务场景。