A generative speech model for daily dialogue.
ChatTTS 是一款专为对话场景设计的生成式语音合成模型,主要针对大语言模型助手等交互需求进行深度优化。它能够生成极其自然且富有表现力的语音,有效提升了机器交互的拟人化体验。
支持中英文双语的高质量语音合成,具备出色的多说话人交互能力。
能够精准预测并控制语音中的韵律细节,包括笑声、停顿和语气词等非语言元素。
在自然语言韵律表现上优于大多数开源语音合成模型,为学术研究与二次开发提供坚实的技术基础。
支持流式音频生成,满足实时对话应用的需求。
该项目适用于大语言模型开发者、语音合成技术研究人员,以及需要构建高拟真语音对话系统的产品开发者。常见使用场景包括构建交互式 AI 助理、自动化对话机器人或需要高度自然感语音播报的应用程序。