面壁智能开源新一代全模态旗舰 AI 模型 MiniCPM-o 4.5，仅靠 9B 参数实现 SOTA-网络资讯-红帽SEO工作室

当前位置：红帽SEO工作室网络资讯面壁智能开源新一代全模态旗舰 AI 模型 MiniCPM-o 4.5，仅靠 9B 参数实现 SOTA

→ 源码教程下载地址见 →右侧下载链接 →点“登录购买”→注册登录购买后可见→
→ 这里没有广告，只有干货！给力项目更多教程，点此加入VIP会员,即可免费下载！
→ 每日分享你意想不到的网络思维！加入红帽VIP会员，感受一下网络赚钱的快感，点击进入了解。

2 月 4 日消息，面壁智能今日（2 月 4 日）开源了新一代全模态旗舰模型 MiniCPM-o 4.5。

作为原生全双工的全模态大模型，MiniCPM-o 4.5 通过“边看、边听、主动说”的全模态能力，让 AI 告别死板的“对讲机”回合制交互，号称成为行业首个“即时自由对话”的大模型，感知不中断、对话不死板、提醒无需问。

MiniCPM-o 4.5 已在 GitHub、Hugging Face 等平台开源。此外，基于统一系统软件栈 FlagOS 的跨平台能力，MiniCPM-o 4.5 在天数智芯、华为昇腾、平头哥、海光、沐曦等 6 款芯片上均获得端到端推理性能提升。

沿袭面壁小钢炮一贯的“高密度”特点，MiniCPM-o 4.5 仅靠 9B 参数，在全模态、视觉理解、文档解析、语音理解和生成、声音克隆等方面，均做到了全模态模型 SOTA 水准。

在“能效比”方面，MiniCPM-o 4.5 通过更低的显存占用、更快的响应速度，确保在提供 SOTA 级全模态表现的同时，实现了更好的推理效率和更低的推理开销。

MiniCPM-o 4.5 通过新的模型设计和数据方法，让语音生成的音色、拟人度、声音表现力等方面获得了全方位的提升，在音频输出过程中，会自动选择最为合适的语气、音色。

值得一提的是，MiniCPM-o 4.5 也解决了长语音合成中音色不统一、语气不自然、效果不稳定难题。

在声音克隆上，MiniCPM-o 4.5 提供了更多的声音选择，可以基于几秒的声音样本克隆定制新音色，并基于克隆音色进行角色扮演的语音对话。

MiniCPM-o 4.5 采用了端到端的全模态架构，并加入了全双工多模态实时流机制、主动交互机制、可配置语音建模设计。

附 MiniCPM-o 4.5 开源地址如下：

https://github.com/OpenBMB/MiniCPM-o

温馨提示：
1、如非特别声明，本内容转载于网络，版权归原作者所有！
2、本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
3、本内容若侵犯到你的版权利益，请联系我们，会尽快给予删除处理！
我要投诉
红帽SEO工作室 » 面壁智能开源新一代全模态旗舰 AI 模型 MiniCPM-o 4.5，仅靠 9B 参数实现 SOTA

分享到：