A generative speech model for daily dialogue.
ChatTTS 是一款专为日常对话场景设计的文本转语音(TTS)生成模型,旨在提升大语言模型交互时的语音自然度和表现力。该项目通过优化语音韵律和情感控制,解决了传统 TTS 模型在对话场景中生硬、缺乏交互感的问题。
该模型专门针对对话任务进行优化,能够生成极其自然且具有表现力的语音。支持多说话人合成,能够流畅处理各类互动式对话场景。具备出色的细粒度控制能力,可精准预测并输出笑声、停顿及语气词等口语化特征。在韵律表现方面优于多数开源 TTS 模型,提供预训练模型以支持深度的科研与开发工作。
该项目适用于需要为 AI 助手、数字人或智能客服构建高质量语音交互功能的开发者与研究人员。用户可将其应用于各类对话机器人或实时语音交互系统中,以获得更加拟人化的听觉体验。