© 2026FindAgent  · @simprr
返回列表
b

bytebot-ai/bytebot

Bytebot is a self-hosted AI desktop agent that automates computer tasks through natural language commands, operating within a containerized Linux desktop environment.

agentagentic-aiagentsaiai-agentsai-toolsanthropicautomationbytebotcomputer-usecomputer-use-agentcuadesktopdesktop-automationdockergeminillmmcpopenai
⭐

10.7k

Stars

🔱

1.4k

Forks

👁

79

Watchers

📋

73

Issues

TypeScriptApache-2.0创建于 2025/2/3更新于 今天
在 GitHub 上查看访问主页
README
由 Gemini 翻译整理

Bytebot: 开源 AI 桌面智能体

一个拥有专属电脑、能为您完成任务的 AI

Deploy on Railway

Docker License Discord

🌐 网站 • 📚 文档 • 💬 Discord • 𝕏 Twitter

Deutsch | Español | français | 日本語 | 한국어 | Português | Русский | 中文


https://github.com/user-attachments/assets/f271282a-27a3-43f3-9b99-b34007fdd169

https://github.com/user-attachments/assets/72a43cf2-bd87-44c5-a582-e7cbe176f37f

什么是桌面智能体(Desktop Agent)?

桌面智能体是一个拥有专属计算机的 AI。与仅限浏览器的智能体或传统 RPA 工具不同,Bytebot 提供了一个完整的虚拟桌面环境,它可以:

  • 使用任何应用程序(浏览器、电子邮件客户端、办公套件、IDE 等)
  • 使用其自带的文件系统下载并整理文件
  • 使用密码管理器登录网站和应用程序
  • 阅读并处理文档、PDF 和电子表格
  • 跨不同程序完成复杂的多步骤工作流

您可以将其想象成一名拥有专属电脑的虚拟员工,它能看到屏幕、移动鼠标、敲击键盘,并像人类一样完成任务。

为什么要让 AI 拥有自己的电脑?

当 AI 能够访问完整的桌面环境时,它将解锁仅靠浏览器智能体或 API 集成无法实现的能力:

任务完全自主化

给 Bytebot 下达任务,例如“从我们的供应商门户网站下载所有发票并整理到文件夹中”,它将能够:

  • 打开浏览器
  • 导航至各个门户网站
  • 处理身份验证(包括通过密码管理器进行 2FA 验证)
  • 将文件下载到其本地文件系统
  • 将它们整理到指定的文件夹中

处理文档

将文件直接上传到 Bytebot 的桌面,它可以:

  • 将整个 PDF 文档读入其上下文
  • 从复杂文档中提取数据
  • 在多个文件之间交叉引用信息
  • 基于分析创建新文档
  • 处理 API 无法访问的格式

使用真实应用程序

Bytebot 不局限于 Web 界面。它可以:

  • 使用桌面应用程序,如文本编辑器、VS Code 或电子邮件客户端
  • 运行脚本和 CLI 工具
  • 根据需要安装新软件
  • 为特定工作流配置应用程序

快速开始

2 分钟部署

选项 1:Railway(最简单) Deploy on Railway

只需点击并添加您的 AI 提供商 API Key 即可。

选项 2:Docker Compose

git clone https://github.com/bytebot-ai/bytebot.git
cd bytebot

# Add your AI provider key (choose one)
echo "ANTHROPIC_API_KEY=sk-ant-..." > docker/.env
# Or: echo "OPENAI_API_KEY=sk-..." > docker/.env
# Or: echo "GEMINI_API_KEY=..." > docker/.env

docker-compose -f docker/docker-compose.yml up -d

# Open http://localhost:9992

查看完整部署指南 →

工作原理

Bytebot 由四个集成组件组成:

  1. 虚拟桌面:一个预装了应用程序的完整 Ubuntu Linux 环境
  2. AI 智能体:理解您的任务并控制桌面以完成它们
  3. 任务界面:Web UI,您可以在此创建任务并实时查看 Bytebot 的工作情况
  4. API:用于以编程方式创建任务和控制桌面的 REST 端点

核心功能

  • 自然语言任务:只需描述您需要完成的工作
  • 文件上传:将文件拖放到任务中供 Bytebot 处理
  • 实时桌面视图:实时观看 Bytebot 工作
  • 接管模式:当您需要协助或进行配置时,可随时手动接管
  • 密码管理器支持:安装 1Password、Bitwarden 等以实现自动身份验证
  • 持久化环境:安装的程序将保留,供未来的任务使用

任务示例

基础示例

"Go to Wikipedia and create a summary of quantum computing"
"Research flights from NYC to London and create a comparison document"
"Take screenshots of the top 5 news websites"

文档处理

"Read the uploaded contracts.pdf and extract all payment terms and deadlines"
"Process these 5 invoice PDFs and create a summary report"
"Download and analyze the latest financial statements"
贡献者
azdmqnorad
项目信息
默认分支main
LicenseApache License 2.0
创建时间2025/2/3
最近更新今天
GAI 中文摘要

Bytebot 是一个开源的自托管 AI 桌面智能体,旨在通过自然语言指令在容器化的 Linux 桌面环境中自动化执行各种计算机任务。它通过模拟人类操作鼠标和键盘,实现跨应用程序的复杂工作流程,从而将 AI 的执行能力从单一网页扩展到完整的桌面环境。

Bytebot 提供完整的虚拟桌面环境,支持调用浏览器、邮件客户端、办公软件及集成开发环境等多种桌面应用程序。它具备处理复杂任务的自主能力,能够自动完成登录验证、文件组织、多步工作流协同及各类文档处理。该系统支持上传本地文件进行深入的数据提取与分析,并能与外部密码管理工具联动处理身份验证。

该项目适用于需要批量处理重复性电脑操作的个人或企业用户,特别适合通过自然语言指令完成跨平台文档整理、自动化数据录入及复杂任务流自动化的场景。