Files
ai-guide/AI/Deepseek行业资讯/2025-04/MiniMax Audio 发布 Speech-02 模型,单次输入支持 20 万字符.md
T
2025-04-03 15:34:12 +08:00

18 lines
1.2 KiB
Markdown
Raw Blame History

This file contains invisible Unicode characters
This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# MiniMax Audio 发布 Speech-02 模型,单次输入支持 20 万字符
MiniMax Audio  正式发布了全新的 Speech-02 系列语音模型,支持将任何文件或 URL 转换为逼真的音频。用户只需一次输入,即可轻松创建有声读物和播客,最多可输入 20 万个字符,支持 30 多种语言的音频生成,效果自然流畅。
![](https://static.oschina.net/uploads/space/2025/0402/182343_cVnE_2720166.png)
Speech-02 模型支持 30 多种语音,一次性可以输入 20 万字符。为用户带来更真实、更流畅、更便捷的音频体验。
![](https://static.oschina.net/uploads/space/2025/0402/182628_p3an_2720166.png)
据官方介绍,该系列在多语言覆盖能力上实现了显著提升,能够更准确、更地道地呈现多种语言的发音。Speech-02 的人声相似度高达 99%,这意味着合成的语音听起来更加自然、贴近真人。
此外,该模型还实现了零节奏故障,彻底解决了音频播放过程中可能出现的卡顿和节奏不稳问题,保证了听感的连贯性和流畅性。
使用地址: [https://www.minimax.io/audio](https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fwww.minimax.io%2Faudio)
> 来源:oschina.net