Realtime AI Voice Agents with OpenAI Realtime, Gemini, Grok, ElevenLabs, Hume on Arduino ESP32 with >15 minutes uninterrupted conversations globally for AI Toys, AI Companions, AI Devices and more
ElatoAI 是一个专为 Arduino ESP32 硬件设计的实时语音人工智能框架,旨在通过集成主流云端 AI 语音服务实现低延迟、持续超过 15 分钟的流畅对话体验。该项目解决了嵌入式设备上运行高质量语音交互的技术门槛,让开发者能够轻松为各类硬件赋予类人的语音沟通能力。
支持接入 OpenAI、Gemini、Grok、ElevenLabs 和 Hume AI 等前沿实时语音模型 API。利用安全的 WebSocket 和 Deno 边缘计算功能,确保在全球范围内的稳定长连接通信。具备完善的硬件适配方案,支持通过 Arduino IDE 或 PlatformIO 快速构建设备原型。提供多设备协同部署能力,并新增了对本地化 AI 模型和 TTS 推理的支持。
适用于对智能玩具、AI 陪伴机器人或定制化智能语音设备感兴趣的嵌入式开发者和创客,常用于需要深度集成实时语音对话功能的硬件项目开发。