AI 基础知识 - GPU 架构、CUDA 编程、大模型基础及AI Agent 相关知识
AI-fundermentals 是一个全面的人工智能基础设施学习资源库,旨在为开发者提供从底层硬件架构到上层集群运维的系统性技术栈知识。通过解析 GPU 架构、CUDA 编程及分布式计算等核心内容,该项目致力于帮助用户解决构建和优化高效 AI 计算环境中的各类技术难题。
深入解析 NVIDIA GPU、TPU 等计算芯片的硬件架构及 PCIe、NVLink 等高速互连技术原理。 提供 GPU 监控、InfiniBand 网络运维及 NCCL 分布式通信测试等实战指南,保障 AI 集群的高性能运行。 涵盖基于 Kubernetes 的云原生 AI 平台建设方案,详细阐述容器化环境下的 GPU 资源调度与管理机制。 整合了大语言模型、异构融合芯片及性能评估等前沿技术资料,构建完整的 AI 工程化技术体系。
该项目适用于 AI 基础设施工程师、系统架构师及 GPU 编程开发者,特别适合在构建高性能 AI 计算集群、优化大模型训练性能或进行云原生 AI 平台部署时作为参考指南。