技术进展
小米MiMo突破万亿参数千token每秒输出
Heooo 06月09日19时27分 2 阅读
「小米与TileRT联合发布MiMo-V2.5-Pro-UltraSpeed,首次在万亿参数模型上实现超1000 tokens/s输出速度,限时开放API体验。」
小米旗下AI模型MiMo近日迎来重大性能突破。据小米创办人雷军介绍,MiMo在昨晚正式发布V2.5-Pro-UltraSpeed版本,这标志着业界首次在1万亿参数规模的模型上实现超过1000 tokens/秒的输出速度。该成果由小米与TileRT联合完成,展示了双方在高速推理优化方面的技术积累。
MiMo-V2.5-Pro-UltraSpeed的API同步上线,采用限时体验价策略,定价为原版MiMo-V2.5-Pro的3倍,但输出速度提升约10倍。这一价格与性能的对比,使得该版本更适合对实时性要求极高的应用场景,如实时对话系统、在线内容生成等。
由于高速推理资源供给有限,本次UltraSpeed版本采取申请制限时开放。申请通过的用户可限时接入API体验,体验窗口为2026年6月9日至6月23日23:59。通过审核的用户可获得限时免费的Chat体验,但需遵守严格的资源使用规则:每个账号每日最多成功进入队列10次;单次会话时长上限为30分钟;如果会话空闲超过5分钟,系统将自动释放资源。这些措施旨在保障资源受限条件下的体验质量与使用公平性。
MiMo-V2.5-Pro-UltraSpeed的发布,不仅展示了小米在超大规模模型推理加速方面的技术实力,也为行业树立了新的性能标杆。万亿参数模型通常面临推理速度瓶颈,而突破1000 tokens/s意味着模型能够以接近实时的速度响应用户请求,这对于提升用户体验和拓展应用场景具有重要意义。未来,随着高速推理资源的逐步扩展,这一技术有望在更多领域落地应用。
# 小米 # MiMo # 万亿参数 # 推理速度 # 高速模型
来源:Heooo AI工具导航