Antigravity 2.0登顶OpenSCAD建筑3D基准测试

近日，ModelRift发布了一项针对大型语言模型（LLM）在3D建模领域能力的基准测试——OpenSCAD LLM Benchmark。该测试以古罗马万神殿（Pantheon）为建模目标，评估了六款主流AI编码工具在生成参数化CAD代码方面的表现。结果显示，Google推出的Antigravity 2.0模型在综合能力上位居榜首，展现了其在空间几何推理与复杂建筑结构生成上的显著优势。

本次测试的六款工具包括：Codex 5.5 High、Claude Sonnet、Claude Opus、Cursor Composer、Google Antigravity以及ModelRift。测试任务要求每款工具根据万神殿的参考图像，使用OpenSCAD语言构建包含圆形大厅、穹顶、门廊、柱廊、山花等标志性元素的完整3D模型。ModelRift团队强调，这并非简单的语法测试——所有主流LLM都能轻松生成“带孔的立方体”这类基础模型，但万神殿的复杂性恰好处于一个“中间地带”：它既有径向对称的圆形穹顶与柱廊，又有笔直的门廊与三角形山花，需要模型在布尔运算、旋转对称、拉伸等操作中保持结构准确性。

为什么选择OpenSCAD？ModelRift在解释其技术选型时指出，OpenSCAD是一种纯文本的编程式建模语言，其词汇紧凑、语法清晰，非常适合LLM的推理模式。模型可以通过嵌套变换、布尔运算、循环和命名模块来描述建筑结构，这比要求LLM通过UI操作驱动3D应用要自然得多。例如，LLM可以直接在源代码中写出“围绕半径创建28根重复的柱子”或“从穹顶中减去一个圆洞”这样的指令。生成的结果可检查、可复现，且易于修改——如果柱间距有误，通常只需调整参数或循环逻辑，无需处理隐藏的场景状态变化。

测试过程采用了统一的视觉提示：要求模型基于参考图像构建万神殿，并明确包含圆形大厅、穹顶、门廊、柱廊、山花及可识别的正面细节。模型通过OpenSCAD CLI进行渲染预览，并允许迭代优化。最终结果按模型分组展示，每张缩略图均标注了使用的客户端和模型名称。

从结果对比来看，Antigravity 2.0在整体结构比例、细节还原度以及代码效率上均表现突出。它不仅准确捕捉了万神殿的径向对称布局，还成功处理了穹顶与门廊之间的空间关系，生成的模型在视觉上最接近真实建筑。相比之下，其他模型虽然也能生成类似穹顶建筑的外形，但在柱廊数量、山花角度、圆洞位置等细节上存在不同程度的偏差。

ModelRift团队表示，这项基准测试的核心目的是跟踪LLM在空间几何处理能力上的进步，因为这直接影响到他们平台能否高效地将3D模型转化为OpenSCAD代码。随着AI编码工具在参数化建模领域的应用日益深入，类似万神殿这样的复杂建筑测试将成为衡量模型空间推理能力的重要标尺。未来，ModelRift计划引入更多建筑类型和几何约束，进一步推动LLM在CAD领域的实用化进程。