在 Hugging Face 上部署语音转语音模型

胥望雅 · 2025-6-2 00:03:03

介绍

S2S (语音到语音) 是 Hugging Face 社区内存在的一个令人兴奋的新项目，它结合了多种先进的模型，创造出几乎天衣无缝的体验: 你输入语音，系统会用合成的声音进行回复。
该项目利用 Hugging Face 社区中的 Transformers 库提供的模型实现了流水话处理。该流程处理由以下组件组成:

声音活动检测 (VAD)
语音识别 (STT)
语言模型 (LLM)
文本转语音 (TTS)

除此之外，S2S 项目支持多语言！目前支持英语、法语、西班牙语、中文、日语和韩语。您可以使用单语言模式运行此流程或通过 auto 标志进行语言自动检测。请查看这里的仓库获取更多详情。
[code]>
来源：程序园用户自行投稿发布，如果侵权，请联系站长删除
免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

寿爹座 · 2025-10-16 12:13:15

东西不错很实用谢谢分享

昝琳怡 · 2025-10-23 21:42:10

分享、互助让互联网精神温暖你我

洪思思 · 2025-11-6 20:14:52

热心回复！

归筠溪 · 2025-11-23 18:22:03

这个好，看起来很实用

蒲善思 · 前天 20:46

yyds。多谢分享

账号		自动登录	找回密码
密码			立即注册

在 Hugging Face 上部署语音转语音模型

相关帖子

回复

浏览过的版块

签约作者

在 Hugging Face 上部署语音转语音模型

相关帖子

相关推荐

回复

浏览过的版块

签约作者