阿里发布Qwen-Robot系列具身智能大模型
「阿里巴巴推出千问具身智能大模型Qwen-Robot系列,包含操作、导航和世界模型,为机器人提供通用底座。」
阿里巴巴近日发布了千问具身智能大模型Qwen-Robot系列,这是千问大模型家族首个完整的具身智能模型系列。该系列包含三大模型:VLA操作模型Qwen-RobotManip、VLN移动模型Qwen-RobotNav和世界模型Qwen-RobotWorld,分别为机器人提供了灵巧的手、认路的脚和会思考的大脑。
Qwen-RobotNav作为物理智能体的行动入口,通过可控观测编码和工具接口,将视觉语言能力接入移动控制。它统一了指令跟随、点/目标导航、目标追踪和自动驾驶四类任务,让机器人能够更智能地规划路径和移动。
Qwen-RobotManip是物理智能体的交互基石,通过规范状态-动作空间和相机坐标系下的末端执行器增量位姿,将视觉语言能力接入操作控制。该模型基于完全由开源数据构建的超过38100小时语料库,实现了大规模多机型训练,让机器人能够执行精细的操作任务。
Qwen-RobotWorld是物理智能体的无限世界,通过自然语言动作接口,将视觉语言能力接入世界动态预测。同一个世界模型能够跨操作、驾驶和导航场景预测符合物理规律的未来,为机器人的决策提供更全面的环境理解。
这三个模型既可单独部署,也能协同运转,让不同形态的机器人迈向真实落地有了可靠的“通用底座”。阿里巴巴通过这一系列模型,展示了其在具身智能领域的深厚积累和创新能力。
此外,阿里巴巴在5月20日发布了全新一代千问旗舰模型Qwen3.7-Max,在三方机构Arena全球大模型盲测总榜中,Qwen3.7-Max超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini最强模型接近,位列国产模型第一,进一步巩固了其在AI领域的领先地位。
来源:Heooo AI工具导航