互联网60%的句子由AI生成?谷歌放大招开源SynthID Text,火眼金睛鉴别AI,还能为AI生成的多媒体内容添加隐形水印!

愤怒的蜗牛

谷歌正在推出其 SynthID Text 技术,让开发者能够对生成式 AI 模型生成的文本进行水印token和检测,并且该技术现在已经全面开放。


互联网60%的句子由AI生成?谷歌放大招开源SynthID Text,火眼金睛鉴别AI,还能为AI生成的多媒体内容添加隐形水印! 图片


SynthID Text 可以通过 AI 平台 Hugging Face 和谷歌更新后的负责任生成式 AI 工具包下载。


https://huggingface.co/spaces/google/synthid-text


谷歌的这项成果已经被nature接收了!在这篇论文中,谷歌详细揭秘了水印的工作原理。


互联网60%的句子由AI生成?谷歌放大招开源SynthID Text,火眼金睛鉴别AI,还能为AI生成的多媒体内容添加隐形水印! 图片

https://www.nature.com/articles/s41586-024-08025-4


那么,SynthID Text 究竟是如何工作的呢?


一、SynthID的AI查重:哪个“token”最可能出自AI之手


假设给出一个类似“你最喜欢的水果是什么?”的问题,文本生成模型会预测哪个“token”最有可能跟在另一个token之后——逐个token生成。token可以是单个字符或单词,它们是生成模型用来处理信息的基本构件。


互联网60%的句子由AI生成?谷歌放大招开源SynthID Text,火眼金睛鉴别AI,还能为AI生成的多媒体内容添加隐形水印! 图片


以 "我最喜欢的热带水果是____"为例。LLM 可能会从 "芒果"、"荔枝"、"木瓜 "或 "榴莲 "等标记词开始完成句子,并为每个标记词分配一个概率分数。当有一系列不同的标记可供选择时,SynthID 可以在不影响输出质量、准确性和创造性的情况下,调整每个预测标记的概率分数。



互联网60%的句子由AI生成?谷歌放大招开源SynthID Text,火眼金睛鉴别AI,还能为AI生成的多媒体内容添加隐形水印!




谷歌表示,SynthID Text 通过“调节生成token的可能性”在这种token分布中插入了额外信息。


互联网60%的句子由AI生成?谷歌放大招开源SynthID Text,火眼金睛鉴别AI,还能为AI生成的多媒体内容添加隐形水印! 图片



上图:LLM 文本生成通常是通过从左到右生成文本的方式,反复从 LLM 分布中进行采样。下图:生成式水印方案通常由三个组成部分构成,如蓝色框中所示:随机种子生成器、采样算法和评分函数。这些组件可以用于提供一种文本生成方法和水印检测方法。在 SynthID-Text 生成式水印方案中,我们使用的是锦标赛采样算法。



“模型的词汇选择的最终分数模式与调整后的概率分数结合,被视为水印,”该公司在博客文章中写道。“此分数模式与水印和非水印文本的预期分数模式进行比较,从而帮助 SynthID 检测文本是否由 AI 工具生成,或可能来自其他来源。”


谷歌声称,自今年春季以来,SynthID Text 已与其 Gemini 模型集成,并且不会影响文本生成的质量、准确性或速度,即使在文本被裁剪、改写或修改后依然有效。


这种技术可用于少至三句话的内容。随着文本长度的增加,SynthID 的稳健性和准确性也会提高。


二、SynthID的多模态进展:音频、视频也有水印


谷歌表示,使用谷歌模型生成的AI音频、视频,也已经“自带水印”。


1.音频


在音频方面,SynthID 会把 Lyria 模型生成的音频加上水印。


SynthID的技术是,先将音频波(声音的一维表现形式)转换为频谱图。



互联网60%的句子由AI生成?谷歌放大招开源SynthID Text,火眼金睛鉴别AI,还能为AI生成的多媒体内容添加隐形水印!



计算出频谱图后,SynthID会将数字水印加入其中。最后,将频谱图转换回波形。在这一转换步骤中,SynthID 利用音频特性确保人耳听不到水印,从而不会影响听觉体验。水印对许多常见的修改(如添加噪音、MP3 压缩或加快和减慢音轨)都很稳健。


SynthID 还能扫描音轨,检测不同点是否存在水印,以帮助确定其中的部分是否由 Lyria 生成。


2.视频


SynthID 将人眼无法察觉的数字水印直接添加到AI图像和视频中。


而且,即使经过各种技术操作,比如裁剪、添加滤镜、改变颜色、改变帧频和使用各种有损压缩等,也无法摆脱这个水印。


互联网60%的句子由AI生成?谷歌放大招开源SynthID Text,火眼金睛鉴别AI,还能为AI生成的多媒体内容添加隐形水印! 图片


三、写在最后


不过,谷歌承认其水印方法存在局限性。


例如,SynthID Text 在处理短文本、改写或从其他语言翻译的文本时表现不佳,或者在处理回答事实性问题时效果较差。“在回答事实性提示时,调整token分布的机会较少,且不会影响事实准确性。”这包括像“法国的首都是哪里?”之类的问题,或者像“背诵威廉·华兹华斯的诗”这样几乎没有变化空间的请求,此类输出很难被识别。


谷歌并不是唯一一家致力于 AI 文本水印技术的公司。OpenAI 多年来一直在研究水印方法,但由于技术和商业方面的考虑,推迟了发布。


如果文本水印技术被广泛采用,它可以帮助应对日益流行但常常错误token的“AI 检测器”问题,这些检测器会错误地将以较为通用的语气撰写的文章或论文token为 AI 生成的。然而,问题在于,这些技术是否会被广泛采用,以及是否有某一组织的标准或技术会胜出。


未来可能会有法律机制迫使开发者采用这些技术。中国已经引入了对 AI 生成内容强制加水印的规定,加利福尼亚州也正计划采取类似措施。


形势十分紧迫。根据欧盟执法机构的一份报告,到 2026 年,90% 的在线内容可能会是由 AI 合成生成的,这将带来关于虚假信息、宣传、欺诈和欺骗的新执法挑战。据 AWS 研究显示,由于 AI 翻译工具的广泛使用,当前网络上约 60% 的句子可能已经是 AI 生成的。


参考链接:

1.https://techcrunch.com/2024/10/23/google-releases-tech-to-watermark-ai-generated-text/

2.https://deepmind.google/technologies/synthid/


您需要 登录账户 后才能发表评论

发表评论

快捷回复: 表情:
AddoilApplauseBadlaughBombCoffeeFabulousFacepalmFecesFrownHeyhaInsidiousKeepFightingNoProbPigHeadShockedSinistersmileSlapSocialSweatTolaughWatermelonWittyWowYeahYellowdog
评论列表 (暂无评论,11人围观)

还没有评论,来说两句吧...

目录[+]

取消
微信二维码
微信二维码
支付宝二维码