SnakeAI

简体中文 | English | 日本語

本项目包含了经典游戏“贪吃蛇”的程序脚本，以及一个能够自动进行游戏的人工智能 Agent。该智能体通过深度强化学习（Deep Reinforcement Learning）进行训练，包含两个版本：基于多层感知机（MLP）的 Agent 和基于卷积神经网络（CNN）的 Agent，其中后者的平均游戏得分更高。

文件结构

├───main
│   ├───logs
│   ├───trained_models_cnn
│   ├───trained_models_mlp
│   └───scripts
├───utils
│   └───scripts

项目的核心代码位于 main/ 文件夹中。其中 logs/ 包含了训练过程的终端文本和数据曲线（可通过 Tensorboard 查看）；trained_models_cnn/ 和 trained_models_mlp/ 分别存储了卷积神经网络和感知机模型在不同阶段的模型权重文件。你可以通过运行 test_cnn.py 和 test_mlp.py 来观察这两个智能体在不同训练阶段的实际游戏表现。

另一个文件夹 utils/ 包含两个实用脚本。check_gpu_status/ 用于检查 PyTorch 是否可以调用 GPU；compress_code.py 可以移除代码中的所有缩进和换行符，将其压缩为紧凑的单行文本，便于在向 GPT-4 咨询代码建议时使用（GPT-4 对代码的理解能力远超人类，且不需要缩进、换行等格式）。

运行指南

本项目基于 Python 编程语言，主要使用了 Pygame、OpenAI Gym、Stable-Baselines3 等外部代码库。程序运行使用的 Python 版本为 3.8.16。建议使用 Anaconda 来配置 Python 环境。以下安装流程已在 Windows 11 系统上通过测试。后续命令均在控制台/终端（Console/Terminal/Shell）中运行。

环境配置

# 创建一个名为 SnakeAI 的 conda 环境，指定 Python 版本为 3.8.16
conda create -n SnakeAI python=3.8.16
conda activate SnakeAI

# [可选] 若要使用 GPU 进行训练，需手动安装完整版的 PyTorch
conda install pytorch=2.0.0 torchvision pytorch-cuda=11.8 -c pytorch -c nvidia

# [可选] 运行脚本测试 PyTorch 是否能成功调用 GPU
python .\utils\check_gpu_status.py

# 安装外部依赖库
pip install -r requirements.txt

运行测试

项目的 main/ 文件夹包含了基于 Pygame 库开发的经典贪吃蛇游戏脚本。你可以直接运行以下命令来游玩游戏：

cd [项目父文件夹路径]/snake-ai/main
python .\snake_game.py

完成环境配置后，你可以运行 main/ 文件夹下的 test_cnn.py 或 test_mlp.py，测试并观察两个智能体在不同训练阶段的实际表现。

cd [项目父文件夹路径]/snake-ai/main
python test_cnn.py
python test_mlp.py

模型权重文件存储在 main/trained_models_cnn/ 和 main/trained_models_mlp/ 文件夹中。两个测试脚本默认调用已训练好的模型。如果你想观察 AI 在不同训练阶段的表现，可以修改测试脚本中的 MODEL_PATH 变量，将其指向其他模型文件的路径。

模型训练

如果你需要重新训练模型，可以运行 main/ 文件夹下的 train_cnn.py 或 train_mlp.py。

cd [项目父文件夹路径]/snake-ai/main
python train_cnn.py
python train_mlp.py

查看训练曲线

本项目包含了训练过程的 Tensorboard 曲线图。你可以使用 Tensorboard 查看详细数据。推荐直接使用 VSCode 中集成的 Tensorboard 插件进行查看，或者使用传统方式：

cd [项目父文件夹路径]/snake-ai/main
tensorboard --logdir=logs/

在浏览器中打开默认的 Tensorboard 服务地址 http://localhost:6006/，即可查看交互式的训练过程曲线图。

致谢

本项目使用的外部代码库包括 Pygame、OpenAI Gym、Stable-Baselines3。感谢所有为开源社区无私奉献的软件开发者们！

本项目中使用的卷积神经网络参考了 Nature 论文：

[1] Human-level control through deep reinforcement learning

linyiLYi/snake-ai