Multi-modal Generative Media Skills for AI Agents (Claude Code, Cursor, Gemini CLI). High-quality image, video, and audio generation powered by muapi.ai.
Generative-Media-Skills 是一套为 AI Agent 设计的多模态生成工具集,专门集成于 Claude Code、Cursor 和 Gemini CLI 等开发环境。它通过高度标准化的架构,让 AI 能够高效地调用顶级模型进行高质量的图像、视频和音频生成与编辑。
项目提供由 muapi-cli 驱动的命令行接口,支持跨平台的媒体生成任务并能直接在本地系统查看结果。内置的专家知识库将复杂的创作逻辑转化为专业指令,涵盖电影级摄影、UI 设计和品牌徽标创建。系统包含 MCP 服务器支持,能够无缝接入 Claude Desktop 等代理工具,实现开箱即用的多模态生成工作流。支持包括 Midjourney v7、Flux、Kling 3.0 等百余种主流 AI 模型,并具备本地文件自动上传与处理能力。
该项目非常适合 AI 开发者、自动化工作流构建者以及需要通过命令行高效生成多媒体资产的创意工作者,适用于构建智能内容生产管线或增强 AI Agent 的视觉与媒体处理能力。