🔥实时更新 频道/群组搜索 登录
TGSO.PRO
黑洞资源笔记 05-14 00:44:21

VITA-Audio:一款高效的语音语言模型,能够快速生成音频和文本内容。 低延迟,首次音频生成时间从236毫秒缩短到53毫秒;推理速度提升3-5倍;开源数据训练,包含20万小时音频

附件:[图片]