AndroidWorld is an environment and benchmark for autonomous agents
AndroidWorld 是一个专为自主计算机控制智能体设计的模拟环境与基准测试平台。它基于真实的安卓模拟器构建,旨在通过一系列标准化任务评估智能体在移动应用中的操作能力与决策水平。
该平台预置了覆盖 20 个常用应用的 116 项手工设计任务,并支持动态随机生成参数以创造数百万种任务变化。它提供了持久的奖励信号机制,确保对智能体性能进行可靠且可量化的评估。该项目具有轻量级设计,对硬件资源占用较小,并支持 Docker 以保证实验环境的稳定与可复现。它还无缝集成了 MiniWoB++ 等现有的网页自动化基准测试,并允许用户轻松扩展和添加新的测试任务。
该项目主要面向人工智能研究人员和开发者,适用于开发、训练和评估需要在 Android 系统中执行自动化任务的智能体模型。