面壁智能 VoxCPM 1.5 语音生成 AI 模型开源:高采样音频克隆,生成效率翻倍

→ 源码教程下载地址见 →右侧下载链接 →点“登录购买”→注册登录购买后可见→
→ 这里没有广告,只有干货! 给力项目更多教程,点此加入VIP会员,即可免费下载!
→ 每日分享你意想不到的网络思维!加入红帽VIP会员,感受一下网络赚钱的快感,点击进入了解。

12 月 10 日消息,面壁智能今日官宣,VoxCPM 1.5 版本正式上线,在持续优化开发者开发体验的同时,也带来了多项核心能力升级。

VoxCPM 是一个 0.5B 参数尺寸的语音生成基座模型,于今年 9 月首次发布。

附 VoxCPM 1.5 更新亮点:

  • 高采样音频克隆:AudioVAE 采样率从 16kHz 提升至 44.1kHz,模型可根据高质量音频,克隆效果更佳、细节更丰富的声音;

  • 生成效率翻倍:在模型参数有所增加的前提下,VoxCPM 1.5 仅需 6.25 个 token 即可生成 1 秒音频,较此前版本提高一倍,在保持速度的同时提升了音频生成质量;

  • 开发者友好:新增 LoRA 和全量微调脚本,支持深度定制;

  • 增强稳定性:减少音频伪影,优化长文本音频的生成效果。

目前,VoxCPM 1.5 模型已在 Github、Hugging Face 开源。

  • Huggingface:https://huggingface.co/openbmb/VoxCPM1.5

  • Github:https://github.com/OpenBMB/VoxCPM


温馨提示:
1、如非特别声明,本内容转载于网络,版权归原作者所有!
2、本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
3、本内容若侵犯到你的版权利益,请联系我们,会尽快给予删除处理!
我要投诉
红帽SEO工作室 » 面壁智能 VoxCPM 1.5 语音生成 AI 模型开源:高采样音频克隆,生成效率翻倍
在线客服 购买特价主机

服务热线

139-3511-2134

关注红帽网络

微信客服

微信客服