© 2026FindAgent  · @simprr
返回列表
m

microsoft/RD-Agent

Research and development (R&D) is crucial for the enhancement of industrial productivity, especially in the AI era, where the core aspects of R&D are mainly focused on data and models. We are committed to automating these high-value generic R&D processes through R&D-Agent, which lets AI drive data-driven AI. 🔗https://aka.ms/RD-Agent-Tech-Report

agentaiautomationdata-miningdata-sciencedevelopmentllmresearch
⭐

12.1k

Stars

🔱

1.4k

Forks

👁

85

Watchers

📋

149

Issues

PythonMIT创建于 2024/4/3更新于 今天
在 GitHub 上查看访问主页
README
由 Gemini 翻译整理

🖥️ 在线演示 | 🎥 演示视频 ▶️YouTube | 📖 文档 | 📄 技术报告 | 📃 论文

CI CodeQL Dependabot Updates Lint PR Title Release.yml Platform PyPI PyPI - Python Version Release GitHub pre-commit Checked with mypy Ruff Chat Documentation Status Readthedocs Preview
arXiv

📰 新闻动态

🗞️ 新闻📝 说明
Web UI 发布我们发布了全新的前端,可通过 rdagent server_ui 构建并运行,用于实时交互和追踪查看(目前暂不支持 data_science 场景)。
NeurIPS 2025 收录我们很高兴地宣布,我们的论文 R&D-Agent-Quant 已被 NeurIPS 2025 收录。
技术报告发布涵盖整体框架描述及在 MLE-bench 上的测试结果。
R&D-Agent-Quant 发布将 R&D-Agent 应用于量化交易场景。
MLE-Bench 结果发布R&D-Agent 目前在 MLE-bench 上名列前茅,是 性能最强的机器学习工程 Agent。
支持 LiteLLM 后端我们现在全面支持 LiteLLM 作为默认后端,以集成多种 LLM 提供商。
通用数据科学 AgentData Science Agent
Kaggle 场景发布我们发布了 Kaggle Agent,欢迎体验新功能!
官方微信群我们建立了微信群,欢迎加入!(🗪二维码)
官方 Discord我们在 Discord 开设了首个交流频道 (🗪Chat)
首次发布R&D-Agent 在 GitHub 正式开源

🏆 性能最强的机器学习工程 Agent!

MLE-bench 是一个全面的基准测试,旨在评估 AI Agent 在机器学习工程任务中的表现。MLE-bench 利用来自 75 个 Kaggle 竞赛的数据集,为 AI 系统在真实机器学习工程场景下的能力提供了可靠的评估。

R&D-Agent 目前在 MLE-bench 上位列第一,是性能最强的机器学习工程 Agent:

AgentLow == Lite (%)Medium (%)High (%)All (%)
R&D-Agent o3(R)+GPT-4.1(D)51.52 ± 6.919.3 ± 5.526.67 ± 030.22 ± 1.5
R&D-Agent o1-preview48.18 ± 2.498.95 ± 2.3618.67 ± 2.9822.4 ± 1.1
AIDE o1-preview34.3 ± 2.48.8 ± 1.110.0 ± 1.916.9 ± 1.1

注意:

  • O3(R)+GPT-4.1(D):此版本为...
贡献者
yXpWqSxTRH
项目信息
默认分支main
LicenseMIT License
创建时间2024/4/3
最近更新今天
GAI 中文摘要

RD-Agent 是由微软推出的一个智能研发代理框架,旨在利用人工智能驱动数据科学与模型研发流程。该项目致力于自动化处理工业研发中高价值的通用环节,通过 AI 赋能数据分析与模型开发,大幅提升研发效率。

自动化执行从数据探索、特征工程到模型构建的全链路研发任务。 通过内置的智能代理机制驱动数据挖掘与科学实验过程。 支持高效的研发流程闭环,实现数据驱动的模型优化与升级。 提供标准化的研发工作流框架,降低复杂研发任务的人工干预需求。

该项目适用于从事数据科学、量化研究及 AI 模型开发的专业人士和研发团队,特别适合需要在大规模数据处理和模型迭代中提升自动化水平的场景。