当前路径:/wiki/page/w2m
返回首页索引

Write Where It Matters (W2M): Policy-Guided Watermarks for 3D Gaussian Splatting

强化学习自适应策略水印(CVPR 2026)

Overview

W2M 彻底颠覆手动设计固定频域/空间敏感度阈值的范式,将水印嵌入升级为"动态自适应强化决策"。以马尔可夫决策过程(MDP)形式化水印能量分配问题。

Key facts / claims

核心创新:
- MDP 形式化:将 3DGS 空间内的水印能量分配问题建模为马尔可夫决策过程
- 策略网络 (Policy Network):轻量级智能体,输入当前高斯局部密度、相机视点频次和几何曲率,动作空间控制每个基元分配的微调梯度比例
- 奖励函数:惩罚高频渲染感知损失(LPIPS),重奖跨多视角解码比特准确率
- PPO 训练:在多次迭代中学会绕过视觉显著区域,在几何交叉、反射死角等视觉"安全区"极限注入高能量

实验结果:
- 同等画质下比传统方案高 0.8dB+ PSNR
- 在 Blender 和 Mip-NeRF 360 上均能找到 Pareto 最优折中
- 抗模型剪裁、抗常规攻击表现稳定

劣势与漏洞

  • 强化学习奖励收敛极慢,早期易崩溃
  • 单场景微调 > 15 分钟(所有方法中最慢之一)
  • 超参数敏感,难以直接部署到高并发分发平台

Sources