BrickAnything:从3D形状自动生成可搭建砖结构
「BrickAnything提出一种几何条件自回归框架,通过结构感知树分词与约束解码,从点云生成物理可搭建的砖结构,提升几何保真与结构稳定性。」
在3D形状生成领域,从数字模型到物理实体的转换一直是研究热点。对于砖结构而言,生成过程不仅需要还原目标几何形状,还必须满足离散部件约束和结构稳定性要求。传统方法依赖启发式优化,但遇到复杂形状时容易失效;而基于序列生成的方法往往忽略底层3D几何与装配关系。最新发表于arXiv的论文《BrickAnything: Geometry-Conditioned Buildable Brick Generation with Structure-Aware Tokenization》提出了一种全新的解决方案。
BrickAnything是一个几何条件自回归框架,能够从多种3D表示(如网格、体素或点云)生成可搭建的砖结构。该框架将点云作为统一几何接口,通过预测砖块序列来重建目标形状,同时严格遵循装配约束。其核心创新在于引入了一种结构感知的树分词(structure-aware tree tokenization)方法。传统序列生成通常按空间顺序排列砖块,但这种方法忽略了砖块之间的局部附着关系,容易导致中间状态无效。树分词通过将砖结构表示为局部附着关系的树形结构,使序列生成更符合物理搭建过程,显著减少了无效中间状态的出现。
为了进一步提升生成结构的可构建性,BrickAnything还集成了多项优化技术。偏好对齐后训练(preference-based alignment post-training)让模型在训练后能够根据稳定性、几何保真度等目标进行微调;有效性约束解码(validity-constrained decoding)在推理阶段强制每一步输出都满足物理约束;自适应回滚(adaptive rollback)机制则允许在检测到无效状态时自动回退并重新生成,从而避免整个序列的失败。这些技术的组合使得BrickAnything在几何保真度和物理可实现性之间取得了良好平衡。
实验结果表明,BrickAnything生成的砖结构在几何上忠实于输入形状,同时能够实际搭建。与传统排序策略相比,所提出的树分词方法有效降低了回滚和重新生成的频率。研究团队在多种3D形状上进行了测试,包括简单几何体、建筑模型以及有机形状,均取得了令人满意的结果。这一工作为数字制造、机器人搭建以及教育领域提供了新的可能性——例如,用户只需提供一个3D模型,系统就能自动生成一套可执行的砖块搭建方案。
从技术演进角度看,BrickAnything代表了从“仅关注外观”到“兼顾可制造性”的重要转变。它解决了生成式模型在物理世界应用中的一个关键痛点:如何确保输出不仅是视觉合理的,而且是物理上可实现的。未来,该框架有望扩展到更多材料类型和搭建约束场景,成为连接数字设计与物理建造的桥梁。
来源:Heooo AI工具导航