🔥实时更新 频道/群组搜索 登录
TGSO.PRO
资源分享 10-16 15:46:15

#GitHub #TTS 🗣 F5-TTS - 上海交大开源超逼真声音克隆 TTS ▎项目功能:文本转语音 ▎项目介绍:一款基于流匹配的全非自回归文本到语音转换系统,零样本,支持声音克隆、速度控制、控制语音情感表现、长文本合成、中英文多语言合成,并支持商用。 不需要复杂的设计如持续时间模型、文本编码器和音素对齐,能够快速训练并实现实时因素(RTF)0.15 的推理速度,显著优于当前基于扩散的 TTS 模型。 F5-TTS 在公共的 100K 小时多语言数据集上进行训练,展现出高自然性和表现力的零样本能力、无缝代码切换能力和速度控制效率。 ▎项目地址:点击打开

附件:[文件]