当前位置：2d2d手游网 → 新闻 → 小米自研大模型 MiMo-V2.5 API 永久降价最高 99%：不再区分上下文长度

小米自研大模型 MiMo-V2.5 API 永久降价最高 99%：不再区分上下文长度

时间：2026-05-27 20:31:58

小编：china

阅读：

在手机上看

手机扫描阅读

5 月 27 日消息：今日，小米正式宣布，旗下「MiMo-V2.5」系列大模型 API 迎来永久降价。

据介绍，相比原始API定价，MiMo-V2.5系列新价格最高降幅可达99%，并且不再区分上下文窗口长度。

本次调价已于北京时间5月27日0:00正式生效，全球同步调整。

具体来看，此次降价覆盖MiMo-V2.5和MiMo-V2.5 Pro两个版本。

小米自研大模型 MiMo-V2.5 API 永久降价最高 99%：不再区分上下文长度

其中，MiMo-V2.5 Pro输入缓存命中价格降至0.025元/百万tokens，最高降幅达99%；MiMo-V2.5输入缓存命中价格降至0.02元/百万tokens，最高降幅达98%。

输出价格方面，MiMo-V2.5 Pro降至6元/百万tokens，最高降幅86%；MiMo-V2.5降至2元/百万tokens，最高降幅93%。

除了API价格下调外，MiMo的Token Plan计费体系也同步迎来重大优化。

优化后的Token Plan在加量不加价的基础上，用量提升至原来的5至8倍，同时引入Credits概念，让计费规则更清晰、更易理解。

小米自研大模型 MiMo-V2.5 API 永久降价最高 99%：不再区分上下文长度

小米称，本次价格调整背后，离不开技术团队在推理系统上的持续优化。

据了解，小米基于SGLang HiCache完整支持SWA（Sliding Window Attention），将KV Cache在GPU显存、CPU内存、SSD等多级存储之间的数据搬运量降低至优化前的近1/7，并将可缓存token数量提升至优化前的近5倍，从而显著提升缓存命中率和推理效率。

同时，小米还通过优化专家并行方案、输入长度分桶策略等方式，进一步提升集群输入吞吐能力，在保障服务质量的前提下，持续降低单位token服务成本。

火爆手游

下载掼蛋打牌苹果
手机游戏 61.3M

下载
扑克干瞪眼的规则和玩法
手机游戏 66.5M

下载
边锋掼蛋比赛版下载官网
手机游戏 45.5M

下载
下载掼蛋打牌到手机上
手机游戏 62.3M

下载
1234人
手机游戏 118.8 MB

下载
火柴人拆卸大师纯净版
手机游戏 41.4 MB

下载

小米自研大模型 MiMo-V2.5 API 永久降价最高 99%：不再区分上下文长度

热门阅读

火爆手游