The Cradle framework is a first attempt at General Computer Control (GCC). Cradle supports agents to ace any computer task by enabling strong reasoning abilities, self-improvment, and skill curation, in a standardized general environment with minimal requirements.
Cradle 是一个专为实现通用计算机控制(GCC)而设计的开源框架,旨在赋予基础模型像人类一样操作计算机的能力。通过将屏幕截图作为视觉输入,并模拟键盘与鼠标操作作为输出,该框架能够使 AI 智能体完成复杂的计算机任务。
利用强推理能力和自我提升机制,实现对各类软件和游戏的自主任务处理。 支持以标准化的方式接入多模态模型,通过统一的接口与计算机环境交互。 提供技能库管理功能,支持智能体对操作经验进行积累、整理与持续优化。 广泛适配各类桌面应用及复杂游戏环境,包括网页浏览、办公软件及开放世界游戏等。
该项目适用于研究 AI 智能体通用交互能力的开发者和学者,特别适合在自动化办公、复杂软件操控以及游戏智能体开发等领域进行探索和应用。