An MCP Multimodal AI Agent with eyes and ears!
Kubrick Course 是一个免费的开源教学项目,旨在教开发者构建能够理解图像、视频、音频和文本等多模态数据的智能体。该项目通过构建名为 Kubrick 的多模态 AI 系统,解决了开发者在复杂多模态应用落地过程中遇到的技术门槛问题。
利用 Pixeltable 实现多模态数据处理与状态化智能体构建。 通过 FastMCP 创建包含资源、提示词和工具的复杂 MCP 服务器。 构建基于 Groq 和 Llama 等先进模型的自定义 MCP 客户端与智能体。 使用 Opik 对智能体系统进行全链路监控、追踪及提示词版本管理。
本课程适用于希望提升 AI 系统开发能力的软件工程师和开发者,特别适合那些想深入掌握多模态视频处理、MCP 协议应用以及生产级 LLMOps 实践的学习者。