Arouse the Memory of Large-Scale Video Generative Model for Multi-View Generation

唤醒大规模视频生成模型记忆用于多视图生成

Overview

利用大规模视频生成模型的记忆能力实现多视图 3D 生成。通过视频模型的内隐 3D 知识，无需显式 3D 训练数据即可生成一致的多视图图像。

Key facts / claims

利用视频生成模型的隐式 3D 知识
无需 3D 标注数据的多视图生成
与 Zero-1-to-3 等专用多视图模型路线不同

diffusion-model-3d — 扩散模型的 3D 应用
conditional-generation-3d — 条件 3D 生成

Sources

arouse-memory-multiview.pdf (arXiv) — 2403.12010，2024-03