AI 基础知识 - GPU 架构、CUDA 编程、大模型基础及AI Agent 相关知识。
AI-fundamentals 是一个全面覆盖人工智能底层技术栈的学习资源库,旨在为开发者提供从硬件架构到生产环境部署的系统化知识路径。项目重点解决了 AI 从业者在理解计算芯片原理、构建高性能集群及优化云原生部署时面临的技术门槛。
项目涵盖 GPU、TPU 等核心计算芯片的设计原理与异构融合架构分析。深入解析 PCIe、NVLink 及 GPUDirect 等高速互联与数据传输技术。提供包含 GPU 监控、InfiniBand 网络运维及 NCCL 通信库调优的集群管理实战指南。构建基于 Kubernetes 的 AI 基础设施,包含 GPU 资源切分、调度优化及高性能分布式存储的架构实践。
该项目适合 AI 系统架构师、GPU 编程开发者以及大模型基础设施工程师,是构建和维护企业级 AI 计算平台的核心参考手册。