生成式AI是工具,真正的原创者还在反击

“以变革性方式使用受保护内容并不构成侵权”

国外关于生成式AI是否构成侵权的争议,更多地落在用于训练大模型的数据集是否利用了受版权保护的内容,从而造成了侵权这一点上。

今年7月至9月间,包括《权力的游戏》原著作者乔治·马丁、好莱坞编剧萨拉·西弗曼在内的一众作者,和美国作家协会一起,陆续提起了多桩诉讼,他们的主要诉求是:OpenAI和Meta公司在未经许可或未支付报酬的情况下批量复制他们的作品,并将受版权保护的材料输入大型语言模型。

近日,北京互联网法院有关人工智能生成图片版权归属的一项裁决,迈出了生成式AI发展历史上具有里程碑意义的一步。

案件本身并不复杂;原告使用AI生成图片,发布于某社交平台上;被告发布文章时使用了该图片,原告因此起诉。

案件的核心点在于:使用人工智能创作的内容,是否构成作品,并享有著作权?

对此,北京互联网法院认为,涉案人工智能生成图片具备“独创性”要件,体现了人的独创性智力投入,应当被认定为作品,受到著作权法保护等。

“现阶段,AI仍只是工具”

生成式人工智能自诞生之日起,其版权归属问题一直引发热议。一般而言,著作权通常归属于创作者,但在人工智能生成内容的情境下,“创作者”的定义边界变得更加模糊。

一种观点主张,AI及其生成的内容版权归属,应该类似于照相机和照片之间的关系,即照相机在制作初始图像时做了大量的机械工作,人类摄影师做出各种决定(主题、构图、布光、后期等)才决定了最终的结果。同样地,使用AI来生成内容的创作者,不仅仅是点击几次按钮而已,而是需要尝试不同的提示词,做出多种组合,并对生成结果做适当的编辑和组合,才得到了最终的结果。

在上述案件中,北京互联网法院认为:从原告构思涉案图片起,到最终选定涉案图片止,整个过程来看,原告进行了一定的智力投入,比如设计人物的呈现方式、选择提示词、安排提示词的顺序、设置相关的参数、选定哪个图片符合预期等。涉案图片体现了原告的智力投入,具备了“智力成果”要件。

法院认为,现阶段,“人们利用人工智能模型生成图片时……本质上仍然是人利用工具进行创作,即整个创作过程中进行智力投入的是人而非人工智能模型。鼓励创作,被公认为著作权制度的核心目的……人工智能生成图片,只要能体现出人的独创性智力投入,就应当被认定为作品,受到著作权法保护。”

但这一判决,没有穿透至“真正的原创者”:生成式AI在训练中,用到的原作者的作品,同样存在保护问题。如果使用大模型生成图片的原告,都可以主张权益,那么,那些受到保护的著作权人,在作品被用于大模型的训练时,难道不可以主张自己的权益吗?

“以变革性方式使用受保护内容并不构成侵权”

国外关于生成式AI是否构成侵权的争议,更多地落在用于训练大模型的数据集是否利用了受版权保护的内容,从而造成了侵权这一点上。

今年7月至9月间,包括《权力的游戏》原著作者乔治·马丁、好莱坞编剧萨拉·西弗曼在内的一众作者,和美国作家协会一起,陆续提起了多桩诉讼,他们的主要诉求是:OpenAI和Meta公司在未经许可或未支付报酬的情况下批量复制他们的作品,并将受版权保护的材料输入大型语言模型。对这些作者而言,ChatGPT等大模型的每一次输出都是一个侵权衍生作品。

美国作家协会声称,OpenAI公司在未经许可或未支付报酬的情况下批量复制他们的作品,并将受版权保护的材料输入大型语言模型。“这些算法是被告企业的核心,而算法的核心则来源于大规模、系统性的窃取。”

起诉书称,OpenAI的大型语言模型允许任何人总结或改写书籍的衍生作品,这可能会损害作家的利益。

这不是生成式人工智能第一次遇到此类诉讼。今年7月,有两位美国作家对OpenAI提起了类似的诉讼,同样声称他们的书籍在未经同意的情况下,被用来训练该公司的聊天机器人。

此外,2月Getty Images起诉Stability AI,指控这家文本转图像生成器公司复制了其1200万张图像作为训练数据。1月,Stability AI、Midjourney和DeviantArt因其人工智能图像生成器的版权问题,同样遭受集体诉讼。

对此,OpenAI辩称,作者们“误解了版权的范围,没有考虑到限制和例外(包括合理使用),而这些限制和例外为创新留下了空间,例如目前处于人工智能前沿的大型语言模型”。此外,作者的书籍只是ChatGPT庞大数据集的“一小部分”,“创新者以变革性方式使用受版权保护的材料并不侵犯版权”。因此,OpenAI认为,任何与作者作品相关的ChatGPT输出都类似于“图书报告或评论”。

此类诉讼的最新进展是,当地时间11月21日,一名联邦法官驳回了西弗曼提起的大部分诉讼:“没有指控或证据表明LLaMA模型已经根据现有的受版权保护的作品进行了重铸、改造或改编”。

但这并非最终的结论。

大模型是否真正进行了创作?

有人认为,生成式AI系统只是一种“21世纪的拼贴工具”,将其算法吸收的内容片段拼接在一起,而非产生独特的输出。

持有这一观点的人对生成式AI的工作原理理解不够充分。事实上,生成式AI是一类能够生成新的、原创性内容的技术,其主要特点是具备学习和创造的能力,生成式AI系统使用大量的训练数据来创建复杂的预测模型,并应用这些预测模型来生成新颖的、此前未见过的内容。因此,其在许多领域都具有创造性和创新性,例如艺术创作、自然语言生成、图像合成等。

那么,一个值得深刻探讨的问题是:生成式AI输出的内容,是精妙的模仿,是高科技的抄袭,还是真正的创作?

让ChatGPT自己回答下吧,看来也没有定论:

文生图模型如Midjourney和Stable Diffusion所使用的技术,被称为扩散模型,从初始的随机噪音分布开始,然后一层一层地“随机”地逼近对原作品的相似度——这是创作,是模仿,还是高科技的抄袭,或者如原告所说“是原作的衍生作品”?

目前,这是一个涉及法律、伦理和创作权的复杂问题,需要在法律和社会层面进行深入探讨。随着技术的不断发展,这些法律和伦理问题可能会变得更为复杂,未来必然需要更多的相关讨论和立法。

至少,在法律明确前,要保持足够的透明:大模型在训练中用到了哪些数据,需要清晰标注;大模型参与生成的内容,需要添加水印。

但在这一大变革的趋势下,那些拥有自己的作品和数据的公司,正在迅速学会使用生成式AI捍卫自己的权益,或者创新自己的业务模式。拥有大量金融数据的彭博,训练出了BloombergGPT。Adobe也用其获授权的作品,训练出了Firefly模型。

拥有最大图片库的Getty,用自己的图片数据,训练出了一个专有的图片生成模型,从中产生的图片,都会受到Getty的保护。它以后将鼓励其图片生成AI的用户,用自己的作品去训练出自己风格。

本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年12月4日
下一篇 2023年12月4日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日