
7 天前
你以为AI生成的图片带着隐形水印就万无一失?一支研究团队用信号分析的方法,在没拿到谷歌官方编码器的情况下,精准破解了SynthID水印的核心机制——甚至能在让图片画质几乎不受影响的前提下,把水印“手术式”移除。他们靠的不是模糊、压缩这类粗暴手段,而是抓住了SynthID最核心的软肋:它的水印藏在图像的频谱里,而且位置会跟着图片分辨率变。这就像给不同大小的箱子配了不同位置的暗格,只要摸透每个暗格的坐标,就能精准掏走里面的东西。
要理解这个破解思路,得先搞懂SynthID是怎么藏水印的。你可以把一张图片想象成一首交响乐,像素是乐器的演奏,而频谱就是这首曲子的乐谱——不同频率对应不同的音色和节奏。SynthID的水印不是在乐谱上随便画个标记,而是在特定的“音符”位置上,悄悄改了一点点音高,而且这个“音符”的位置还会跟着曲子的长度(也就是图片分辨率)变:1024×1024的图片,水印在第9、9个音符位置;换成1536×2816的,就跳到了第768、704个位置。
研究团队的第一步,就是用纯黑、纯白的AI生成图片“探路”——因为这些图片没有内容干扰,水印的频谱特征会暴露得格外明显。他们收集了上百张不同分辨率的纯黑、纯白图,用傅里叶变换把它们转换成频谱,终于摸清楚了不同分辨率下,那些被改动的“音符”的精准坐标,还发现这些“音符”的音高(相位)在所有同模型生成的图片里都一模一样,尤其是绿色通道的水印信号最强。

摸清楚坐标还不够,要精准移除水印又不破坏图片,得有个“密码本”。研究团队做的就是这个——一个叫多分辨率频谱码本的东西,把每个分辨率对应的水印“音符”位置、音高和音量都存进去。
当要移除某张图片的水印时,这个码本会先自动匹配图片的分辨率,找到对应的“暗格坐标”,然后在频谱里精准地把那个被改动的“音符”改回原来的音高——这就像手术时只切除病变组织,不碰周围的健康器官。和传统的模糊、压缩比起来,这种方法的精度高得吓人:移除后图片的峰值信噪比(PSNR)超过43dB,相当于你几乎看不出前后的差别;结构相似性(SSIM)达到0.997,意味着图片的细节和结构完全没被破坏。

当然,这个方法也不是万能的。如果遇到码本里没有的新分辨率,它会先把图片 resize 到最接近的分辨率再处理,效果会打一点折扣;而且它只能针对SynthID的水印,换别的AI水印系统可能就不管用了。
这场破解和反破解的游戏,其实早就开始了。之前有人试过用JPEG压缩、加噪声这类“暴力”手段,最多只能把水印的检测置信度降到40%,还是能被查出来;用扩散模型重绘倒是能去掉水印,但图片细节会损失一大半。而这次的频谱移除方法,第一次做到了“无损”去水印,这给所有AI水印系统都提了个醒:只要你的水印是藏在某个可被分析的特征里,就总有被破解的可能。
更值得深思的是,水印本身的伦理边界。比如有人发现,SynthID的水印虽然能防篡改,但如果在带水印的文本里插入20%以上的有害内容,检测系统还是会判定这是AI生成的——这就相当于给恶意内容开了一张“合法通行证”。而且现在的水印技术,还面临着容量、透明性和鲁棒性的三角困境:要藏更多信息,就得牺牲隐蔽性;要更难被破坏,就得更明显地改动内容。
当AI生成的内容越来越多地渗透进我们的生活,水印本应是区分真实与生成、保护版权的一道防线,但这次的破解让我们看到,这道防线远没有想象中坚固。技术的攻防永远在赛跑,今天我们破解了SynthID的频谱密码,明天可能就会有更隐蔽的水印技术出现,后天又会有新的破解方法。
真正的防线,从来都不是单一的技术手段,而是技术、法规和认知的结合——就像研究团队反复强调的,他们的工具只用于学术研究,不能用来伪造内容。技术是中立的,但使用技术的人,得守住自己的边界。水印防不住人心,只能守住技术的底线。
点击充电,成为大圆镜下一个视频选题!