Write Where It Matters (W2M): Policy-Guided Watermarks for 3D Gaussian Splatting

首个 RL 框架自适应学习水印嵌入位置和强度（CVPR 2026 | Li et al.）

Overview

W2M 首个将强化学习引入 3DGS 水印领域，彻底颠覆手动设计固定频域/空间敏感度阈值的范式。将水印嵌入问题建模为马尔可夫决策过程（MDP），策略网络根据即时奖励信号自适应学习每个高斯原语的最佳嵌入位置和强度，在 Blender / LLFF / Mip-NeRF360 上达到 SOTA。

Key facts / claims

核心创新：
- MDP 形式化：将 3DGS 空间内的水印能量分配问题建模为 MDP。状态空间由当前高斯局部密度、相机视点频次和几何曲率构成；动作空间控制每个基元分配的微调梯度比例
- 策略网络 (Policy Network)：轻量级智能体，输入当前场景状态，输出每个高斯原语的嵌入强度决策。基于即时 reward 分配精确高斯更新
- Anchor 结构操作：基于 Scaffold-GS 锚点框架，策略网络引导逐 anchor 梯度缩放，使水印能量更精准地分配到对渲染质量影响最小的锚点区域
- 奖励函数：惩罚高频渲染感知损失（LPIPS），重奖跨多视角解码比特准确率
- PPO 训练：在多次迭代中学会绕过视觉显著区域，在几何交叉、反射死角等视觉"安全区"极限注入高能量

实验结果：
- 在 Blender、LLFF、Mip-NeRF360 上均达到 SOTA
- 同等画质下比传统方案高 0.8dB+ PSNR
- Pareto 最优——在保真度和鲁棒性之间找到最优折中
- 抗模型剪裁、抗常规攻击表现稳定

劣势与漏洞

强化学习奖励收敛极慢，早期易崩溃
单场景微调 > 15 分钟（所有方法中最慢之一）
超参数敏感，难以直接部署到高并发分发平台

guardsplat — GuardSplat CLIP引导SH偏移水印
gaussianmarker — GaussianMarker 不确定性估计
compmarkgs — CompMarkGS 锚点压缩水印
mark4d — Mark4D 4DGS时序一致水印
robust3dgsw — Robust3DGSW 量化感知水印
3d-watermarking-overview — 3D 水印技术总览

Sources

3DGSWatermarking.pdf — 2026-05-27
CVPR 2026 OpenAccess — Li et al.

Write Where It Matters (W2M): Policy-Guided Watermarks for 3D Gaussian Splatting

Overview

Key facts / claims

劣势与漏洞

Related

Sources