A framework for building realtime voice AI agents 🤖🎙️📹
LiveKit Agents 是一个用于构建实时、可编程多模态 AI 代理的 Python 开发框架。该项目旨在帮助开发者快速创建能够实时听、看并与用户进行自然语言交互的智能对话机器人。
提供高度灵活的集成生态,支持根据需求自由组合语音转文字、大语言模型、文字转语音及实时 API。内置任务调度与分发 API,实现终端用户与智能代理的无缝连接。提供完善的 WebRTC 客户端支持,覆盖所有主流平台以实现低延迟音视频通信。集成电话栈功能,使 AI 代理能够直接接入电话网络进行呼入或呼出通话。具备先进的语义轮次检测与 MCP 协议支持,能够精准判断用户对话结束点并一键接入外部工具。
该项目适用于需要开发实时客服机器人、语音助手或多模态交互应用的开发者。特别适合希望在私有服务器上部署全套开源 WebRTC 媒体方案,并构建低延迟、高互动性 AI 应用的场景。