面壁智能 VoxCPM 1.5 语音生成 AI 模型开源：高采样音频克隆，生成效率翻倍-网络资讯-红帽SEO工作室

当前位置：红帽SEO工作室网络资讯面壁智能 VoxCPM 1.5 语音生成 AI 模型开源：高采样音频克隆，生成效率翻倍

→ 源码教程下载地址见 →右侧下载链接 →点“登录购买”→注册登录购买后可见→
→ 这里没有广告，只有干货！给力项目更多教程，点此加入VIP会员,即可免费下载！
→ 每日分享你意想不到的网络思维！加入红帽VIP会员，感受一下网络赚钱的快感，点击进入了解。

12 月 10 日消息，面壁智能今日官宣，VoxCPM 1.5 版本正式上线，在持续优化开发者开发体验的同时，也带来了多项核心能力升级。

VoxCPM 是一个 0.5B 参数尺寸的语音生成基座模型，于今年 9 月首次发布。

附 VoxCPM 1.5 更新亮点：

高采样音频克隆：AudioVAE 采样率从 16kHz 提升至 44.1kHz，模型可根据高质量音频，克隆效果更佳、细节更丰富的声音；
生成效率翻倍：在模型参数有所增加的前提下，VoxCPM 1.5 仅需 6.25 个 token 即可生成 1 秒音频，较此前版本提高一倍，在保持速度的同时提升了音频生成质量；
开发者友好：新增 LoRA 和全量微调脚本，支持深度定制；
增强稳定性：减少音频伪影，优化长文本音频的生成效果。

目前，VoxCPM 1.5 模型已在 Github、Hugging Face 开源。

温馨提示：
1、如非特别声明，本内容转载于网络，版权归原作者所有！
2、本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
3、本内容若侵犯到你的版权利益，请联系我们，会尽快给予删除处理！
我要投诉
红帽SEO工作室 » 面壁智能 VoxCPM 1.5 语音生成 AI 模型开源：高采样音频克隆，生成效率翻倍

分享到：