阿里通义千问新旗舰Qwen3.7预览版发布
「阿里云推出Qwen3.7-Max与Plus预览版,专注思考模式,在数学、编程等基准测试中跻身全球前十,视觉排名跃升第五。」
阿里云旗下通义千问大模型迎来关键迭代,全新旗舰预览版Qwen3.7-Max-Preview与Qwen3.7-Plus-Preview已正式上线大模型竞技场Arena AI及官方Qwen Chat平台。作为新一代大模型的先行版本,这两款模型预计将在即将召开的阿里云峰会上正式向公众发布,标志着阿里在基础模型研发上迈入新阶段。
从官方披露的产品特性来看,两款新模型在预览阶段仅支持“思考模式”,这意味着它们将更专注于高难度的逻辑推理与深度计算,而此前备受关注的网页搜索和代码解释器等辅助工具在现阶段暂不可用。这一设计策略表明,阿里云希望率先在核心推理能力上打磨极致体验,为后续完整功能版本奠定坚实基础。
在业界公认的大模型基准测试中,新模型的表现堪称惊艳。在文本处理领域,Qwen3.7 Max Preview的综合排名成功冲入全球第13位,这也直接助力阿里通义千问在整体实验室排名中挺进全球前六。而在更为细分的专业技术领域,该模型同样展现出了极强的统治力:它在数学领域位列全球第7,在专家级应用、软件与IT、以及纯编程能力等关键子榜单中也悉数杀入全球前十。这些硬核数据不仅验证了阿里在基础算法与训练框架上的深厚积累,也反映出中国大模型在专业垂直方向上的快速追赶态势。
除了强大的文本与逻辑推理能力,此次同步亮相的高性能模型Qwen3.7 Plus Preview在视觉领域同样表现不俗,综合排名位居全球第16位。这一成绩使得通义千问在视觉榜单上的实验室总排名跃升至全球第5。值得注意的是,在专门针对高难度复杂指令的“专家竞技场”细分赛道中,Qwen3.7 Max Preview稳稳占据了全球第9的位置。这一系列突破表明,阿里云在多模态与深度垂直应用领域的研发已经步入世界前列,为未来在自动驾驶、医学影像、工业质检等场景的落地提供了坚实的技术底座。
来源:Heooo AI工具导航