The Cradle framework is a first attempt at General Computer Control (GCC). Cradle supports agents to ace any computer task by enabling strong reasoning abilities, self-improvment, and skill curation, in a standardized general environment with minimal requirements.
Cradle 是一个专为通用计算机控制(GCC)设计的开源框架,旨在赋予基础模型像人类一样操作计算机的能力。该项目通过标准化的环境接口,使智能体能够利用视觉与操作反馈,自主完成各类复杂的计算机软件及游戏任务。
通过模拟人类的操作逻辑,以屏幕截图作为输入并输出键盘鼠标指令,实现对计算机的直接控制。 具备强大的逻辑推理能力,能够拆解复杂任务并做出相应的决策。 支持模型的自我提升机制,通过历史操作不断积累经验以优化任务表现。 提供标准化的通用环境,极大地降低了接入各种软件和游戏的门槛。 通过技能编排与沉淀功能,让智能体能够应对从办公软件到复杂游戏等多场景的挑战。
该项目适用于研究人员与开发者,旨在探索人工智能在桌面自动化、游戏AI以及人机交互领域的广阔应用场景。