理想马赫VLA与基座大模型双线进化

在今日举行的理想汽车软件与具身智能发布会上，理想官方宣布了其智能驾驶与基座大模型的双线进化路线图。其中，马赫VLA（视觉语言动作模型）将在下半年迎来持续升级：第三季度AD Max将推送全新马赫VLA，第四季度则计划对齐特斯拉FSD V14的能力。这一规划标志着理想在端到端自动驾驶技术路径上的坚定投入。

据官方介绍，双马赫M100芯片算力达到2560TOPS，为模型运行提供了强大的硬件基础。在此基础上，模仿学习规模提升50%、强化学习规模提升15倍、模型参数量提升10倍、模型计算量提升15倍。这些参数的大幅跃升，意味着马赫VLA在处理复杂驾驶场景时的泛化能力和决策精度将显著增强。

与此同时，理想还公布了自研的全新基座大模型——马赫Mind-4系列，包括马赫Mind-Pro和马赫Mind-Edge。马赫VLA主打机器智能，而Mind-4系列则聚焦语言智能。马赫Mind-Pro在多个权威基准测试中表现优异：在IFEval指令跟随、LongBench-v2超长文本理解、AIME26高阶数学推理、BFCL-v4工具调用等榜单中，全部稳居行业第一梯队。在Agent专项领域，其在Claw系列榜单和PinchBench-v2实景实测中的综合性能超越大多数主流Agent模型。

对比某闭源模型S，马赫Mind-4-Pro的Token平均消耗下降38%、工具调用冗余轮下降47%，模型TPS峰值达到208 token/s。这一效率提升意味着在车载场景下，模型能够以更低的计算成本实现更快的响应。值得一提的是，马赫Mind-Pro的核心是原生Agent智能体能力，目前已经全面落地，赋能L9 Livis车载智能系统，为用户提供更自然的语音交互和任务执行体验。

马赫Mind-Edge则被官方称为“行业真正量产落地的端侧原生具身智能体”。它采用多模态流式时序建模，让模型能够连续理解动态的物理世界，同时具备因果推理和自主决策能力。与云端模型不同，Mind-Edge可以直接输出动作，实时调用车辆硬件。Always-On全天候主动感知、人车交互、自主控车、多模态问答，全都在车端本地完成，且数据完全不上传，有效保障了用户隐私。理想强调，Mind-Edge并非云端模型的阉割版，而是从底层就为车载场景原生打造的模型，是真正的端侧原生具身智能体。

整体来看，理想此次发布的技术矩阵覆盖了从底层芯片到上层模型的完整链路，其VLA与Mind-4系列的双线布局，既瞄准了自动驾驶能力的持续进化，也强化了车载智能交互的体验。随着下半年马赫VLA的迭代和对标FSD V14的推进，理想在智能驾驶领域的竞争力有望进一步提升。