Write Where It Matters (W2M): Policy-Guided Watermarks for 3D Gaussian Splatting
强化学习自适应策略水印(CVPR 2026)
Overview
W2M 彻底颠覆手动设计固定频域/空间敏感度阈值的范式,将水印嵌入升级为"动态自适应强化决策"。以马尔可夫决策过程(MDP)形式化水印能量分配问题。
Key facts / claims
核心创新:
- MDP 形式化:将 3DGS 空间内的水印能量分配问题建模为马尔可夫决策过程
- 策略网络 (Policy Network):轻量级智能体,输入当前高斯局部密度、相机视点频次和几何曲率,动作空间控制每个基元分配的微调梯度比例
- 奖励函数:惩罚高频渲染感知损失(LPIPS),重奖跨多视角解码比特准确率
- PPO 训练:在多次迭代中学会绕过视觉显著区域,在几何交叉、反射死角等视觉"安全区"极限注入高能量
实验结果:
- 同等画质下比传统方案高 0.8dB+ PSNR
- 在 Blender 和 Mip-NeRF 360 上均能找到 Pareto 最优折中
- 抗模型剪裁、抗常规攻击表现稳定
劣势与漏洞
- 强化学习奖励收敛极慢,早期易崩溃
- 单场景微调 > 15 分钟(所有方法中最慢之一)
- 超参数敏感,难以直接部署到高并发分发平台
Related
- guardsplat — GuardSplat CLIP引导SH偏移水印
- gaussianmarker — GaussianMarker 不确定性估计
- compmarkgs — CompMarkGS 锚点压缩水印
- 3d-watermarking-overview — 3D 水印技术总览
Sources
- 3DGSWatermarking.pdf — 2026-05-27