小米MiMo-V2.5语音模子正式发布,一句话生成声响、克隆真人音色
时间:2026-04-24 12:16:28
小编:china
阅读:
4月24日消息,今日,小米正式发布MiMo-V2.5语音模型,带来MiMo-V2.5-TTS系列与MiMo-V2.5-ASR。
这是一套面向Agent时代的全链路语音模型系列,覆盖识别与合成两大核心能力,让语音的输入与输出都可以被语言自由调度。
在语音合成方面,MiMo-V2.5-TTS系列提供三大模型,分别对应不同创作场景:
首先是MiMo-V2.5-TTS,内置多款高质量精品音色,经过专业调优,发音自然、情感贴合,并支持语速、情绪、语气等精细化控制,开箱即用,满足多场景表达。

其次是MiMo-V2.5-TTS-VoiceDesign,支持通过一句自然语言描述生成全新音色,无需任何参考音频。
用户可从年龄、性别、口音、音质乃至性格气质等多个维度自由定义,例如低沉略带嘶哑的老年学者”或元气满满的少女”,模型即可自动生成对应声音形象。
依托大规模预训练能力,模型对复杂、模糊、甚至相互矛盾的描述也能合理解读,而不局限于男/女/青年/老年这类粗粒度标签。
第三是MiMo-V2.5-TTS-VoiceClone,主打音色克隆能力,用户仅需提供数秒参考音频,无需训练或微调,即可复刻真人播客、配音演员、品牌代言人,或者用户本人声音。
复刻后的声音不仅保留了原始说话人的音色身份,也保留了气息、节奏、习惯性停顿等个人特征。
同时,克隆音色可继续叠加自然语言指令、音频标签、导演剧本级脚本,实现更高自由度的语音创作。
作为全链路语音模型系列的听觉基座,MiMo-V2.5-ASR在中英双语、中文方言、Code-Switch、强噪音、多说话人、高知识密度等复杂真实场景下均达到业界领先水平。


目前,MiMo-V2.5-TTS、MiMo-V2.5-TTS-VoiceDesign、MiMo-V2.5-TTS-VoiceClone已在Xiaomi MiMo API开放平台限时免费。

-
小米MiMo-V2.5语音模子正式发布,一句话生成声响、克隆真人音色4月24日消息,今日,小米正式发布MiMo-V2 5语音模型,带来MiMo-V2 5-TTS系列与MiMo-V2 5-ASR。这是一套面向Agent时代的全链路语音模型系列时间:2026-04-24 - 爱喝无糖饮料的人天塌了,无糖饮料只是无蔗糖 但用甜味剂4月24日消息,据报道,无糖饮料通常不含蔗糖、白砂糖等传统糖类,但会添加赤藓糖醇、阿斯巴甜等代糖(甜味剂),以提供甜味而不带来过多热时间:2026-04-24
- 24岁女孩下了一个非凡跑腿单 效果来了好多个骑手4月24日消息,据报道,广东佛山一位生病住院的女孩,在跑腿软件上下了一张特殊的订单,只想有人陪自己坐两小时,没想到引来一群骑手接力守时间:2026-04-24
-
雷军,小米YU7 10个月累计交付231000台4月24日消息,今天北京车展小米汽车发布会上,雷军公布最新成绩单,小米YU7上市10个月,累计交付已经达到231000台,这个速度在同级别SUV里时间:2026-04-24 -
千匹马力、续航超700km,小米YU7 GT车厘子红官图发布4月24日消息,在今日开幕的2026北京国际车展上,雷军预告了小米YU7GT相关信息,据悉,该车拥有1003马力、极速300km h、CLTC续航里程带705km时间:2026-04-24
热门阅读
-
哥哥抚慰腮腺炎弟弟 得知传染秒变脸
阅读:105
-
华为FreeClip 2推送鸿蒙OS 6晋级,支撑星闪音频 抗搅扰才能提拔
阅读:79
-
刘文祥塌房紫薯精改吃大理寺米线 网友,筹办整理升咖
阅读:44
-
这才是东北春季最霸气的开场,百万只大雁春季迁移
阅读:43
-
95岁广东白叟扮演一字马火了 自己谈长命诀要,1天喝2瓶可乐
阅读:42










