理想马赫VLA与基座大模型双线进化
「理想汽车发布马赫VLA与Mind-4基座大模型,下半年能力持续升级,第四季度对标特斯拉FSD V14。」
在今日举行的理想汽车软件与具身智能发布会上,理想官方宣布了其智能驾驶与基座大模型的双线进化路线图。其中,马赫VLA(视觉语言动作模型)将在下半年迎来持续升级:第三季度AD Max将推送全新马赫VLA,第四季度则计划对齐特斯拉FSD V14的能力。这一规划标志着理想在端到端自动驾驶技术路径上的坚定投入。
据官方介绍,双马赫M100芯片算力达到2560TOPS,为模型运行提供了强大的硬件基础。在此基础上,模仿学习规模提升50%、强化学习规模提升15倍、模型参数量提升10倍、模型计算量提升15倍。这些参数的大幅跃升,意味着马赫VLA在处理复杂驾驶场景时的泛化能力和决策精度将显著增强。
与此同时,理想还公布了自研的全新基座大模型——马赫Mind-4系列,包括马赫Mind-Pro和马赫Mind-Edge。马赫VLA主打机器智能,而Mind-4系列则聚焦语言智能。马赫Mind-Pro在多个权威基准测试中表现优异:在IFEval指令跟随、LongBench-v2超长文本理解、AIME26高阶数学推理、BFCL-v4工具调用等榜单中,全部稳居行业第一梯队。在Agent专项领域,其在Claw系列榜单和PinchBench-v2实景实测中的综合性能超越大多数主流Agent模型。
对比某闭源模型S,马赫Mind-4-Pro的Token平均消耗下降38%、工具调用冗余轮下降47%,模型TPS峰值达到208 token/s。这一效率提升意味着在车载场景下,模型能够以更低的计算成本实现更快的响应。值得一提的是,马赫Mind-Pro的核心是原生Agent智能体能力,目前已经全面落地,赋能L9 Livis车载智能系统,为用户提供更自然的语音交互和任务执行体验。
马赫Mind-Edge则被官方称为“行业真正量产落地的端侧原生具身智能体”。它采用多模态流式时序建模,让模型能够连续理解动态的物理世界,同时具备因果推理和自主决策能力。与云端模型不同,Mind-Edge可以直接输出动作,实时调用车辆硬件。Always-On全天候主动感知、人车交互、自主控车、多模态问答,全都在车端本地完成,且数据完全不上传,有效保障了用户隐私。理想强调,Mind-Edge并非云端模型的阉割版,而是从底层就为车载场景原生打造的模型,是真正的端侧原生具身智能体。
整体来看,理想此次发布的技术矩阵覆盖了从底层芯片到上层模型的完整链路,其VLA与Mind-4系列的双线布局,既瞄准了自动驾驶能力的持续进化,也强化了车载智能交互的体验。随着下半年马赫VLA的迭代和对标FSD V14的推进,理想在智能驾驶领域的竞争力有望进一步提升。
来源:Heooo AI工具导航