DeepMind Lab

DeepMind Lab 是一个基于 id Software 的 Quake III Arena（通过 ioquake3 实现）以及其他开源软件构建的 3D 学习环境。

DeepMind Lab 为学习型 Agent 提供了一套极具挑战性的 3D 导航和解谜任务。其主要目的是作为人工智能（尤其是深度强化学习）研究的测试平台。

关于

免责声明：这不是 Google 的官方产品。

如果您在研究中使用了 DeepMind Lab 并希望引用该环境，我们建议您引用 DeepMind Lab 论文。

您可以发送邮件至 lab@deepmind.com 与我们联系。

Linux 入门指南

从 bazel.io 获取 Bazel。
克隆 DeepMind Lab，例如运行：

$ git clone https://github.com/deepmind/lab
$ cd lab

要运行一个随机 Agent 的实时示例，请执行：

lab$ bazel run :python_random_agent --define graphics=sdl -- \
               --length=10000 --width=640 --height=480

这里有更详细的构建文档，其中包括在缺少依赖项时如何安装它们。

要启用编译器优化，请在每个 bazel build、bazel test 和 bazel run 命令中添加标志 --compilation_mode=opt（简写为 -c opt）。为了简洁起见，上述示例中省略了此标志，但在进行真实的训练和评估（性能至关重要）时，应使用该标志。

以人类身份试玩

要使用人类输入控件来测试游戏，请运行：

lab$ bazel run :game -- --level_script=tests/empty_room_test --level_setting=logToStdErr=true
# 或者：
lab$ bazel run :game -- -l tests/empty_room_test -s logToStdErr=true

关闭 logToStdErr 设置可禁用大部分日志输出。

通过为每个感兴趣的观测添加标志 --observation OBSERVATION_NAME，可以在每一步打印环境暴露的观测值。

lab$ bazel run :game -- --level_script=lt_chasm --observation VEL.TRANS --observation VEL.ROT

训练 Agent

DeepMind Lab 在 python/random_agent.py 中提供了一个随机 Agent 示例，该示例可作为实现学习型 Agent 的起点。要让此 Agent 与 DeepMind Lab 进行交互以进行训练，请运行：

lab$ bazel run :python_random_agent

Python API 用于 Agent 与环境之间的交互。我们还提供了连接 DeepMind 通用强化学习 API "dm_env" 的接口，以及构建自包含 PIP 包的方法；详情请参阅相关文档。

DeepMind Lab 附带了实现不同任务的不同关卡。如 Lua API 文档所述，这些任务可以使用 Lua 脚本进行配置。

上游来源

DeepMind Lab 是基于 ioquake3 游戏引擎构建的，并使用 q3map2 和 bspc 工具进行地图创建。源自这些项目的 Bug 修复和清理工作，最好在上游进行修复，然后再合并到 DeepMind Lab 中。

bspc 取自 github.com/TTimo/bspc，版本号 d9a372db3fb6163bc49ead41c76c801a3d14cf80。实际上没有本地修改，尽管我们将此代码与主要的 ioq3 代码集成，且不使用其 deps 目录中的副本。我们预计该代码是稳定的。
q3map2 取自 github.com/TTimo/GtkRadiant，版本号 d3d00345c542c8d7cc74e2e8a577bdf76f79c701。进行了一些轻微的本地修改以增加同步功能。我们同样预计该代码是稳定的。
ioquake3 取自 github.com/ioquake/ioq3，版本号 29db64070aa0bae49953bddbedbed5e317af48ba。该代码包含大量的修改和添加。我们旨在偶尔合并上游的更改。

我们非常感谢这些代码仓库的维护者，感谢他们为维护高质量代码库所付出的辛勤努力。

外部依赖、先决条件和移植说明

DeepMind Lab 目前仅以源代码形式提供。它依赖于一些外部软件库，我们通过几种不同的方式提供这些库：

zlib、glib、libxml2、jpeg 和 png 库作为外部 Bazel 源引用，并提供了 Bazel BUILD 文件。依赖代码本身应该是相当可移植的，但我们随附的 BUILD 规则是针对 x86 Linux 的。要在其他平台上构建，您很可能必须编辑这些 BUILD 文件。
消息摘要算法包含在本包中（位于 //third_party/md），取自 th