这个工具主要提供哪些服务？

提供大模型、全模态能力及语音技术，兼容主流工具链。

适合什么人群使用？

适合个人开发者至企业级用户，满足多场景开发需求。

该工具的收费模式是怎样的？

采用Token包月或包年订阅，每号仅享一次首购优惠。

是否提供免费版本？

未提及免费版本，请访问官网了解具体方案。

小米MiMo

热度 5

一次购买，畅用 MiMo-V2-Pro/Omni 两款全新顶级旗舰模型，更有 TTS 模型全档位套餐限时免费。诚邀全球用户释放 Xiaomi MiMo 大模型的强大生产力

付费 # Ai大模型 # 多模态 # 多模型 # AI语音 # 中文适配 # 中文优化 # API集成

提供 API

访问官网

不知道选什么工具？AI帮你推荐3步搞定

只需回答3个简单问题，精准匹配你的需求

立即匹配

小米MiMo 介绍

小米MiMo 是一个提供多模态大模型与语音技术服务的平台。

它能帮你处理图像、视频、音频和文本的跨模态理解，也能用来做复杂的智能体任务调度以及高保真的语音合成与识别工作。你可以通过官方网页直接体验各个版本的模型，或者接入主流开发工具链进行日常应用搭建。

主要功能

全模态内容理解

原生支持图像、视频、音频和文本的理解与长程推理。

智能体自主执行

具备浏览、理解、推理与操作的能力，在复杂任务场景下表现稳定。

语音合成与克隆

内置多款音色并支持精细化控制，能根据少量音频样本快速复刻目标声音。

高精度语音转写

支持中英双语、多种方言及歌词转写，在复杂声学环境或专业内容中识别准确。

使用场景

需要处理包含图文与音视频的超长资料并执行相关操作

问题

传统方式难以同时理解多模态长文档，且手动完成信息提取与后续步骤耗时

解决

调用支持全模态感知与超长上下文的基础模型，自动浏览、理解跨模态内容并完成推理与操作任务

项目需要快速生成带有特定情绪或语气的语音素材，且无法进行真人录音

问题

常规录音设备与人员排期限制制作周期，难以快速产出定制化语音内容

解决

使用内置精品音色与风格指令理解的语音合成系列，通过设置参数直接生成符合需求的音频，或通过一句话定义并克隆目标音色以创建专属发音

会议或访谈记录涉及中文、英文及多种地方方言

问题

常规语音转写工具在混合语言与方言场景下识别准确率不足，需人工逐句核对修正

解决

接入支持中英双语及方言的语音识别模型，将多口音音频直接转换为结构化文字，减少后期校对工作量

使用建议

如果你是个人开发者或者团队在做应用搭建，直接用它的开放接口会省不少事，因为平台本身就兼容市面上常见的开发工具链。

要是你经常需要处理带背景噪音的录音、方言对话，或者想快速生成带情绪控制的配音，把它的语音识别和合成模块接进去会特别顺手。

套餐详情

Lite

¥ 411.84 / 年

支持全新旗舰模型 mimo-v2.5-pro、全模态基座模型 mimo-v2.5、语音识别模型 mimo-v2.5-asr、语音合成模型 mimo-v2.5-tts-voiceclone、 mimo-v2.5-tts-voicedesign、mimo-v2.5-tts，及 V2 系列共 9 款模型
49,200,000,000 Credits 套餐年总量
支持 OpenClaw、Claude Code、OpenCode、KiloCode 等国内外主流编程工具
非高峰期(北京时间每日00:00-08:00) 0.8x 系数消耗
TTS 系列模型限时免费使用

Standard

¥ 1045.44 / 年

支持全新旗舰模型 mimo-v2.5-pro、全模态基座模型 mimo-v2.5、语音识别模型 mimo-v2.5-asr、语音合成模型 mimo-v2.5-tts-voiceclone、 mimo-v2.5-tts-voicedesign、mimo-v2.5-tts，及 V2 系列共 9 款模型
132,000,000,000 Credits 套餐年总量
2.7倍 Lite 套餐用量
支持 OpenClaw、Claude Code、OpenCode、KiloCode 等国内外主流编程工具
非高峰期(北京时间每日00:00-08:00) 0.8x 系数消耗
TTS 系列模型限时免费使用

Pro

¥ 3474.24 / 年

支持全新旗舰模型 mimo-v2.5-pro、全模态基座模型 mimo-v2.5、语音识别模型 mimo-v2.5-asr、语音合成模型 mimo-v2.5-tts-voiceclone、 mimo-v2.5-tts-voicedesign、mimo-v2.5-tts，及 V2 系列共 9 款模型
456,000,000,000 Credits 套餐年总量
9.3倍 Lite 套餐用量
支持 OpenClaw、Claude Code、OpenCode、KiloCode 等国内外主流编程工具
非高峰期(北京时间每日00:00-08:00) 0.8x 系数消耗
TTS 系列模型限时免费使用

Max

¥ 6959.04 / 年

支持全新旗舰模型 mimo-v2.5-pro、全模态基座模型 mimo-v2.5、语音识别模型 mimo-v2.5-asr、语音合成模型 mimo-v2.5-tts-voiceclone、 mimo-v2.5-tts-voicedesign、mimo-v2.5-tts，及 V2 系列共 9 款模型
984,000,000,000 Credits 套餐年总量
20倍 Lite 套餐用量
支持 OpenClaw、Claude Code、OpenCode、KiloCode 等国内外主流编程工具
非高峰期(北京时间每日00:00-08:00) 0.8x 系数消耗
TTS 系列模型限时免费使用

常见问题

用户评分

—

0 人评分

5星

4星

3星

百度智能云推出的AI编程助手，深度融合文心大模型。

访问官网

#Ai大模型

182

小米MiMo

小米MiMo 介绍

主要功能

全模态内容理解

智能体自主执行

语音合成与克隆

高精度语音转写

使用场景

需要处理包含图文与音视频的超长资料并执行相关操作

项目需要快速生成带有特定情绪或语气的语音素材，且无法进行真人录音

会议或访谈记录涉及中文、英文及多种地方方言

使用建议

套餐详情

常见问题

用户评分

相关工具推荐

剪映

剪映

智谱AI

智谱AI

Coze

Coze

Groq

Groq

通义灵码

通义灵码

千问

千问

MiniMax

MiniMax

百度Comate

百度Comate

最新资讯

TIDAL封禁AI音乐创收，保护原创艺术

机器人手公司和解特斯拉诉讼并获千万融资

Omen AI实时监控液冷系统防菌堵

低资源LLM框架分析阅读障碍者AI体验

统一智能体训练范式实现世界模型规划