© 2026FindAgent  · @simprr
返回列表
v

vocodedev/vocode-core

🤖 Build voice-based LLM agents. Modular + open source.

⭐

3.7k

Stars

🔱

652

Forks

👁

49

Watchers

📋

3

Issues

PythonMIT创建于 2023/2/24更新于 今天
在 GitHub 上查看访问主页
README
由 Gemini 翻译整理

Hero

Twitter GitHub Repo stars pypi Downloads

社区 | 文档 | 控制台

  vocode

在几分钟内构建基于语音的 LLM 应用

Vocode 是一个开源库,旨在简化构建基于语音的 LLM 应用的过程。使用 Vocode,您可以构建与 LLM 进行实时流式对话的应用,并将其部署到电话通话、Zoom 会议等场景中。您还可以构建个人助理或语音驱动的国际象棋等应用。Vocode 提供了便捷的抽象层和集成方式,让您只需一个库即可满足所有需求。

我们正在积极寻找社区维护者,如果您有兴趣,请随时联系我们!

⭐️ 功能特性

  • 🗣 使用系统音频开启对话
  • ➡️ 📞 设置一个由 LLM 驱动的智能体响应的电话号码
  • 📞 ➡️ 通过您自己的电话号码发起由 LLM 驱动的智能体呼叫
  • 🧑‍💻 拨入 Zoom 会议
  • 🤖 在 Langchain 智能体中使用对外呼叫功能拨打真实电话号码
  • 开箱即用的集成服务:
    • 转录服务,包括:
      • AssemblyAI
      • Deepgram
      • Gladia
      • Google Cloud
      • Microsoft Azure
      • RevAI
      • Whisper
      • Whisper.cpp
    • LLM,包括:
      • OpenAI
      • Anthropic
    • 合成服务,包括:
      • Rime.ai
      • Microsoft Azure
      • Google Cloud
      • Play.ht
      • Eleven Labs
      • Cartesia
      • Coqui (OSS)
      • gTTS
      • StreamElements
      • Bark
      • AWS Polly

查看我们的 React SDK 点击这里!

🫂 贡献与路线图

我们是一个开源项目,非常欢迎贡献者添加新功能、集成和文档!请随时与我们联系并开启您的构建之旅。

有关贡献的更多信息,请参阅我们的 贡献指南。

同时请查看我们的 路线图。

欢迎在 Discord 上与我们交流新想法或讨论如何贡献!

🚀 快速入门

pip install vocode
import asyncio
import signal

from pydantic_settings import BaseSettings, SettingsConfigDict

from vocode.helpers import create_streaming_microphone_input_and_speaker_output
from vocode.logging import configure_pretty_logging
from vocode.streaming.agent.chat_gpt_agent import ChatGPTAgent
from vocode.streaming.models.agent import ChatGPTAgentConfig
from vocode.streaming.models.message import BaseMessage
from vocode.streaming.models.synthesizer import AzureSynthesizerConfig
from vocode.streaming.models.transcriber import (
    DeepgramTranscriberConfig,
    PunctuationEndpointingConfig,
)
from vocode.streaming.streaming_conversation import StreamingConversation
from vocode.streaming.synthesizer.azure_synthesizer import AzureSynthesizer
from vocode.streaming.transcriber.deepgram_transcriber import DeepgramTranscriber

configure_pretty_logging()


class Settings(BaseSettings):
    """
    Settings for the streaming conversation quickstart.
    These parameters can be configured with environment variables.
    """

    openai_api_key: str = "ENTER_YOUR_OPENAI_API_KEY_HERE"
    azure_speec
贡献者
aKHzsJavMe
项目信息
默认分支main
LicenseMIT License
创建时间2023/2/24
最近更新今天
GAI 中文摘要

vocode-core 是一个开源的 Python 库,旨在简化基于大型语言模型(LLM)的语音应用程序开发。它为开发者提供了高度模块化的抽象接口,支持实时流式语音交互,能够轻松构建和部署能够进行语音对话的智能体。

支持通过系统音频启动实时对话,实现人机交互。 能够配置电话号码并接入 LLM 智能体,处理呼入或执行呼出任务。 具备连接 Zoom 会议的能力,实现自动化参会功能。 集成 LangChain 框架,支持构建具备复杂逻辑处理能力的语音智能体。 预置了大量主流语音转文字服务、LLM 模型及语音合成服务的连接器,开箱即用。

该项目适用于希望快速开发语音助手、电话自动应答系统或互动式语音应用的开发者及企业。特别适合需要将 LLM 能力集成到电话通讯或视频会议场景中的应用开发需求。