Arouse the Memory of Large-Scale Video Generative Model for Multi-View Generation
唤醒大规模视频生成模型记忆用于多视图生成
Overview
利用大规模视频生成模型的记忆能力实现多视图 3D 生成。通过视频模型的内隐 3D 知识,无需显式 3D 训练数据即可生成一致的多视图图像。
Key facts / claims
- 利用视频生成模型的隐式 3D 知识
- 无需 3D 标注数据的多视图生成
- 与 Zero-1-to-3 等专用多视图模型路线不同
Related
- diffusion-model-3d — 扩散模型的 3D 应用
- conditional-generation-3d — 条件 3D 生成
Sources
- arouse-memory-multiview.pdf (arXiv) — 2403.12010,2024-03