给AI“投毒”后,AI再也没办法画画了

而上面你所看到的,正是经过Nightshade干扰的AI,在没有中毒前,AI的确能准确地输出一张狗和车的照片,而在500次和1000次“有毒”训练数据的训练后,AI开始输出乱七八糟的内容。

Nightshade便是一个具有攻击性和操纵性的工具,需要的艺术家可以下载这个工具,对AI进行错误的训练并导致其故障,用以保护自己的作品。

Stable Diffusion是一个生成式AI模型,简单点来说就是一个会画画的AI,当你输入一个关键词后,它就能创作出一个相关的图像。

比如,让他画一个骑在马上的宇航员,它就能很快创作一张(看起来像是真的)相关照片。

画得挺好

AI 难道已经可以变成可以替代人类的画家了吗?然而,有一些Stable Diffusion XL(以下简称SD-XL)似乎得了病,变得不那么“聪明”,还输出了一些莫名其妙的东西。

当你要求SD-XL画一只狗,它:

而病得更重SD-XL则输出了一只猫。

怎么回事啊!AI怎么忽然指猫为狗了,而更奇怪的是,当你让AI画一辆车,它则输出了一只牛。

在下面这张图片中,你可以看到,AI确实病得不轻,狗、车、帽子最后都变成了完全不相关的猫、牛、蛋糕。它似乎没办法再输出一张像上文描述的“宇航员”一样准确的以假乱真的图片。

第1排是正常SD-XL生成的图片,而第2、3、4排分别是由病的不同程度的SD-XL生成的图片。|参考资料1

之所以会这样,是因为人们开发了一款让生成式AI“中毒”的软件。

Nightshade由芝加哥大学的研究人员发布,是一种能够破坏生成式AI模型的工具。AI靠大量训练数据来更新迭代,变得更加聪明,而Nightshade所做的,就是在训练数据中加入一些肉眼难以看见的“毒素”,干扰AI的学习,从而让AI模型以混乱且不可预测的方式崩溃

而上面你所看到的,正是经过Nightshade干扰的AI,在没有中毒前,AI的确能准确地输出一张狗和车的照片,而在500次和1000次“有毒”训练数据的训练后,AI开始输出乱七八糟的内容。

经过“毒害”后,AI没办法再按照指令作画了。|参考资料1

要给AI“下毒”的原因,与我们在AI时代不得不面对的种种问题相关。自生成式AI变得越来越聪明以来,制造AI的科技巨头们也面对着接连不断的诉讼和争议,艺术家们认为,他们的作品是受到版权和知识产权保护的,但OpenAI、Meta、Google 和 Stability AI却直接拿作品来进行数据训练,这是一种“窃取”行为。

2024年虽然才过去1个月,但AI与知识版权相关的争议已经闹得沸沸扬扬。2023年12月27日,《纽约时报》对微软和OpenAI提起诉讼,指控OpenAI侵犯其文章版权,进行大规模复制来训练生成式AI。

1月25日,社交平台X限制了平台上对泰勒·斯威夫特的名字搜索,原因是X上流传着大量和她相关的假图。这个令人震惊的事件更是一个警醒,它意味着,任何人的照片都可以被AI制成令人难以忍受的假图,我们很可能因为这个而受到严重的伤害。

Nightshade便是一个具有攻击性和操纵性的工具,需要的艺术家可以下载这个工具,对AI进行错误的训练并导致其故障,用以保护自己的作品。而为了不让AI“中毒”,开发AI科技巨头们也将不得不正视并解决一个问题:如何尊重艺术家的作品版权。

在自今年1月18日发布后的五天内,Nightshade的下载量就已经达到了25万次。

事实上,在开发Nightshade之前,芝加哥大学的这个团队还推出过另外一款保护艺术家的免费应用程序:Glaze。和Nightshade类似,Glaze也是给图片施加一些微小的改变,让AI难以辨认一幅作品的风格

第1、2列是艺术家的风格,第3列是没有用Glaze时,AI的仿制品。

第4列是用了Glaze时,AI以为自己看到的。第5、6列则是AI在学习经Glaze处理过后的图片后,生成的(风格完全不相关的)“仿制品”。|参考资料3

当一位艺术家用Glaze“改造”了自己的抽象风格作品(举个例子),然后将其发布到网上,被AI抓取学习后,AI可能会将其错误地理解为写实风格。日后也会输出一些毫不相关的东西。Glaze这个工具主要是保护艺术家,以免他们独特的风格被AI学走。而Nightshade则主要是为了攻击不顾版权的AI。

这些工具是如何给AI“投毒”的呢?此项目负责人Ben·Zhao在接受科技媒体采访时解释道:这是因为AI和我们人类感知世界的方式存在根本性的差距。

他说:“正是因为这两个世界如此不同,我们就可以实现机器学习视角中,效果如此显著的失真,而在人类视角中失真的程度最小。”

在人眼看来,经Glaze处理过的图片(右)和原图(左)差别很小。|参考资料3

而由于生成式AI的特性,这种“投毒”也会污染到其他相关的词,当它污染了“狗”,也会相应地污染“哈士奇”、“狼”等类似的词。而且在截图、拍照后,这种“毒素”依然存在。

还有一些工具,比如DeepMind团队在2023年8月推出的SynthID,则是给AI生成的作品加上一个“看不见的”水印,这样大家以后可能就知道哪些照片是AI伪造的。

除了图片,SynthID还能给AI生成的音乐也加上“听不见的”水印。

如今,创建Nightshade和Glaze团队还提出要把这两种软件集成在一起。不过,工具也需要不断更新,Glaze团队自己也提到,这“并不是对抗 AI 模仿的永久解决方案,我们今天使用的技术总有可能被未来的算法所挑战。”

不过如今,有越来越多的人尝试用这种工具来保护自己,证明它的有效性,在这个过程中,我们也许可以渐渐弄清我们与AI的关系到底意味着什么。

参考资料:

[1]https://arxiv.org/abs/2310.13828

[2]https://nightshade.cs.uchicago.edu/whatis.html

[3]https://glaze.cs.uchicago.edu/media.html

[4]https://venturebeat.com/ai/ai-poisoning-tool-nightshade-received-250000-downloads-in-5-days-beyond-anything-we-imagined/

[5]https://www.nytimes.com/2023/12/27/business/media/new-york-times-open-ai-microsoft-lawsuit.html

[6]https://theconversation.com/taylor-swift-deepfakes-a-legal-case-from-the-singer-could-help-other-victims-of-ai-pornography-222113

[7]https://techcrunch.com/2023/03/17/glaze-generative-ai-art-style-mimicry-protection


本文来自微信公众号:把科学带回家 (ID:steamforkids),作者:Skin,审校:阿娴

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年2月5日
下一篇 2024年2月5日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日