Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer
基于 3D 潜在扩散 Transformer 的可扩展图像到三维生成,NeurIPS 2024
Overview
Direct3D 提出端到端的图像到三维生成框架,利用 3D 潜在扩散 Transformer 生成高分辨率 3D 内容。通过将 3D 数据编码到紧凑潜在空间,实现高效可扩展的生成。
Key facts / claims
- 3D 潜在扩散 Transformer 架构
- 单图像到 3D 的端到端生成
- NeurIPS 2024 接收
- 与 Compress3D、CRM、TRELLIS 等同属 2024-2025 年的 3D 生成热潮
Related
- compress3d — Compress3D,压缩潜空间 3D 生成
- crm — CRM,卷积重建模型
- diffusion-model-3d — 三维扩散模型架构
Sources
- direct3d.pdf (NeurIPS) — NeurIPS 2024