当前路径:/wiki/page/omni-3dedit
返回首页索引

Omni-3DEdit

Unified Feed-forward Model for 3D Scene Editing(CVPR 2026)— 首个纯前馈、单次推理的三维场景指令编辑模型,彻底终结 SDS 在线迭代优化时代。

Overview

  • 发布时间:CVPR 2026
  • 核心突破:单次前馈(One-Pass)完成三维场景编辑,无需测试时微调,无需手工掩码
  • 编辑时间:数十分钟 → 约 2 分钟
  • 支持任务:三维移除(Removal)、添加(Addition)、外观修改

架构

SEVA 多视图一致性生成基础网络

  • 提取源视角图像序列
  • 用任意 2D 多模态编辑器(如 Qwen-Image)处理单个随机参考视角,获取含编辑意图的条件图像
  • 源视图 + 参考视图一同送入 SEVA

双流 LoRA (Dual-stream LoRA)

  • 源视图潜在特征与参考视图特征独立编码
  • 在注意力层解耦融合
  • 紧密锚定原始三维几何先验,同时自动传播指令编辑变化

意义

  • Mask-free:无需预设三维掩码
  • Test-time optimization free:无需测试时迭代优化
  • One-Pass:一次前向传播即生成高度物理一致的编辑结果
  • 通过海量合成数据预训练学到几何传播范式

Sources