当前路径:/wiki/page/diffcomplete
返回首页索引

DiffComplete

Diffusion-based Generative 3D Shape Completion(NeurIPS 2023)— 基于 TSDF 空间扩散的高保真三维形状补全框架,支持零样本 OOD 泛化。

Overview

  • 发布时间:NeurIPS 2023
  • 任务定义:以不完整扫描输入为条件的概率生成任务(Conditioned on incomplete shapes)
  • 核心优势:相比 DiffRF 等受限边界框的方法,DiffComplete 在大尺度真实补全上设立新 SOTA

关键创新

1. 分层特征聚合 (Hierarchical Feature Aggregation)

设计带有独立控制分支的条件编码器:
- 对单视角残缺深度扫描,通过多层预处理块与注意力层提取多尺度特征
- 以空间一致的方式注入扩散 U-Net 骨干的每一层,对去噪轨迹施加严格几何先验约束

2. 占用感知融合 (Occupancy-aware Fusion)

  • 支持单/多条件输入,通过 MLP 微调即可切换
  • 根据空间占用率(Occupancy)合并多个局部深度投影
  • 逐步引导生成形状向真实物理边界收敛

3. 零样本泛化

在完全未见过的真实世界物体类别(Zero-shot OOD)上表现强大泛化能力,无需重新训练。

性能对比(L1-Error ↓)

方法 架构类型 Avg L1 Chair Table
3D-EPN 确定性体素卷积 0.392 0.374 0.418
ConvONet 隐式连续场 0.210 0.220 0.247
AutoSDF 自回归 0.201 0.217 0.258
ShapeFormer Transformer 0.104 0.141 0.175
DiffComplete 多层条件扩散 SOTA

较前代基准 L1 误差显著降低近 40%。

Sources