AI语音领域迎来强劲对手,初创公司Resemble AI正式发布名为“Chatterbox Turbo”的开源文本转语音(Text-to-Speech, TTS)模型,直接对标ElevenLabs和Cartesia等行业巨头。
人工智能语音领域迎来强力竞争者,初创公司 Resemble AI 正式发布了名为“Chatterbox Turbo”的开源文本转语音模型,其矛头直指 ElevenLabs 和 Cartesia 等行业巨头。 这款模型在性能上实现了显著突破,仅需五秒钟的参考音频即可精准克隆目标语音,并在短短150毫秒内输出首个音频片段。这种极致的低延迟表现,使其成为构建实时 AI 代理、自动化客户支持、动态游戏角色 ...
Chatterbox Turbo 采用 MIT 许可证发布,支持免费商用、修改与再分发。模型已在 Hugging Face、RunPod、Modal、Replicate 和 Fal 上线,完整代码托管于 GitHub。Resemble AI 同时提供托管服务,并计划推出低延迟版本。模型内置 “PerTh” 水印,便于监管行业验证语音是否由 AI 生成。
IT之家 12 月 16 日消息,当地时间 12 月 16 日,红帽(Red Hat)宣布收购 AI 私营公司 Chatterbox Labs,将“AI 安全”能力纳入其企业级 AI 产品体系。 红帽表示,该公司是模型无关型 AI 安全与生成式 AI 防护(guardrails)领域的先行者,此次交易将进一步强化红帽 AI 产品 ...
在人工智能领域,语音合成技术一直以来都由一些大型企业所主导,然而随着开源技术的崛起,这一局面正在发生变化。想象一下,如果我们能够生成几乎无法与人声区分的逼真语音,而无需依赖昂贵的专有软件,会是怎样的一种体验?如今,开源AI语音合成技术已达到一个新的里程碑,为开发者和创作者提供了前所未有的可能性。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果