ai-guide/AI/Deepseek行业资讯/2025-04/MiniMax Audio 发布 Speech-02 模型，单次输入支持 20 万字符.md

# MiniMax Audio 发布 Speech-02 模型，单次输入支持 20 万字符

MiniMax Audio  正式发布了全新的 Speech-02 系列语音模型，支持将任何文件或 URL 转换为逼真的音频。用户只需一次输入，即可轻松创建有声读物和播客，最多可输入 20 万个字符，支持 30 多种语言的音频生成，效果自然流畅。

![](https://static.oschina.net/uploads/space/2025/0402/182343_cVnE_2720166.png)

Speech-02 模型支持 30 多种语音，一次性可以输入 20 万字符。为用户带来更真实、更流畅、更便捷的音频体验。

![](https://static.oschina.net/uploads/space/2025/0402/182628_p3an_2720166.png)

据官方介绍，该系列在多语言覆盖能力上实现了显著提升，能够更准确、更地道地呈现多种语言的发音。Speech-02 的人声相似度高达 99%，这意味着合成的语音听起来更加自然、贴近真人。

此外，该模型还实现了零节奏故障，彻底解决了音频播放过程中可能出现的卡顿和节奏不稳问题，保证了听感的连贯性和流畅性。

使用地址： [https://www.minimax.io/audio](https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fwww.minimax.io%2Faudio)

> 来源：oschina.net