Multi-modal Generative Media Skills for AI Agents (Claude Code, Cursor, Gemini CLI). High-quality image, video, and audio generation powered by muapi.ai.
Generative-Media-Skills 是一套专为 AI Agent 设计的多模态生成工具集,旨在通过标准化架构为 Claude Code、Cursor 和 Gemini CLI 等环境提供高效的媒体处理能力。该项目利用 muapi.ai 驱动底层 API,帮助开发者在自动化工作流中实现高质量图像、视频和音频的生成、编辑与展示。
核心功能包括:通过 CLI 实现结构化的 JSON 输出与语义化指令,支持 100 多种主流 AI 模型(如 Midjourney、Kling、Flux 等)的一键调用。内置专业级的专家知识库,将摄影、UI 设计及品牌逻辑转化为 AI 可执行的指令。提供原生的 MCP 服务支持,能够无缝接入 Claude Desktop 等代理平台。具备自动化的媒体预览与本地文件上传功能,简化了跨平台的创意生产流程。
该项目适用于从事 AI 自动化开发、创意内容生成以及需要构建智能工作流的开发者与技术团队,特别适合在编程辅助工具中集成复杂的媒体生成任务,如自动剪辑、视觉设计生成及影视级视频创作。