《纽约时报》将OpenAI、微软告上法庭，发生了啥？

2023年12月28日 16:31 • 未来科技

据《纽约时报》的起诉书称，这些技术公司使用了数百万篇未经授权的版权文章用于训练ChatGPT。

《纽约时报》没有说明索赔的具体金额，但指出被告应该对“非法复制和使用《纽约时报》独一无二的宝贵作品”造成的“数十亿美元的法定和实际损害”负责，并要求这两家公司销毁所有使用《纽约时报》版权材料的聊天机器人模型和训练数据。//www.bloomberg.com/news/articles/2023-12-27/new-york-times-sues-microsoft-and-openai-for-copyright-infringement。

当人工智能不断兴起，随之而来的除了惊艳四座的强大技术，还有对技术的质疑以及各种规范的难题。

用什么作为训练数据？是否得到许可？生成内容是否会造成侵权？这些问题都成为了人工智能发展路上必问的问题。涉及的相关案例，在未来也会指导司法实践。

据彭博社报道，《纽约时报》已起诉微软和 OpenAI，指控其侵犯版权，违规使用了《纽约时报》的内容用于人工智能开发。这场官司让人们不得不正视媒体与颠覆性技术之间的关系。

据《纽约时报》的起诉书称，这些技术公司使用了数百万篇未经授权的版权文章用于训练ChatGPT 这样的聊天机器人，而这种自动聊天机器人正在成为人们获取可靠信息的来源，反过来抢新闻媒体的“饭碗”。

《纽约时报》没有说明索赔的具体金额，但指出被告应该对“非法复制和使用《纽约时报》独一无二的宝贵作品”造成的“数十亿美元的法定和实际损害”负责，并要求这两家公司销毁所有使用《纽约时报》版权材料的聊天机器人模型和训练数据。

在多数报纸和杂志都因为读者纷纷转战互联网而步履维艰时，《纽约时报》是少数在线上新闻业务中成功构建商业模式的媒体之一。而在生成式 AI 涌现的时代，传统媒体更面临着全新的挑战。

ChatGPT 登场这一年来，关于其从网上抓取文本作为训练数据的批评声和质疑声一直不绝于耳。今年九月，OpenAI 被美国作家协会指控，ChatGPT 参与了一场“大规模系统性盗窃”。《纽约时报》的起诉是 OpenAI 首次受到一家主流媒体的挑战。OpenAI 曾寻求得到版权方的授权，就像 Google 和 Meta 与 Facebook 的和解一样。据称，《纽约时报》曾于 4 月份联系了微软和 OpenAI，但未能达成一致。

“如果微软和 OpenAI 想要将我们的作品用于商业目的，法律要求他们首先要获得我们的许可，”《纽约时报》发言人在一份电子邮件声明中说，“但他们没有这样做。”

OpenAI 发言人在一份声明中表示：“我们尊重内容创作者和所有者的权利，致力于与他们合作，以确保他们受益于人工智能技术和新的收入模式。我们与《纽约时报》的持续对话富有成效，并且一直在积极推进，因此，我们对被起诉感到惊讶和失望。”微软则拒绝置评。

7 月，OpenAI 与美联社签署了一项协议，获取了该新闻机构的部分档案的版权。12 月份，OpenAI 与 Axel Springer SE 签署了一项为期三年的协议，以使用这家德国媒体公司的工作成果。

本周三，OpenAI 的发言人表示：“我们希望找到一种互惠互利的方式，像我们与许多其他出版机构一样，携手合作。”

即便如此，OpenAI 也已成为多起诉讼的目标，内容制作者不满自己的作品被不当用于人工智能训练。该公司面临着喜剧演员 Sarah Silverman、《权力的游戏》作者 George R.R. Martin 和普利策获奖作家 Michael Chabon 等文化名人的集体诉讼。

一、《纽约时报》的胜算

多家科技公司的首席法律顾问 Cecilia Ziniti 总结了《纽约时报》的制胜点。她称这场官司是迄今为止指控生成式人工智能侵犯版权的最佳样本。

首先，申诉书明确指出了被告方的侵权行为。被告有机会接触到原作，并且原告和被告之间的作品存在“实质性相似”。这两点是判定是否存在侵权行为的关键。而《纽约时报》是用于训练 GPT 的 Common Crawl 中最大的专有数据集，证明 ChatGPT 的输出和《纽约时报》的内容既存在接触途径，也存在“实质相似”。

其次，申诉书中提供了一看就懂的抄袭证据。下图中，红色是完全重合的文本，黑色是 GPT 新生成的文本，大量重复将一目了然。Ziniti 认为，除非 OpenAI 对 GPT 训练方式作出大调整，或者通过大量的法律手段说明技术原理，否则 OpenAI 根本无力辩护。选择和解比继续对抗更加明智。

《纽约时报》的聪明之处还在于他们突出了一篇新闻报道的原创过程。一篇调查出租车贷款的深度报道的背后是记者四处走访，采访 600 余次的不懈努力。版权法守护的虽然不是劳动者“额头上的汗水”，但它守护原创者的智慧和创造力。对比 GitHub Copilot 被超过一千万名程序员告上法庭时，他们只引用了几行开源代码，这个保护创新的说服力就没那么强。（注：额头汗水是一个著作权保护法的著名案子，美国联邦最高法院在“费斯特案”中认为只保护人类“额头上的汗水”—— 劳动，这种思路将损害著作权法的基本原理）

此外，4 月份，OpenAI 和《纽约时报》谈判破裂后，获得了《政客报》等其他媒体的授权，这对《纽约时报》的利益造成了损害。随着 OpenAI 的市值增长和越来越多的抄袭案例出现，拒绝与《纽约时报》和解，OpenAI 可能会付出高昂的代价。Ziniti 对 4 月份的谈判作出了大胆推测：OpenAI 方认为他们可以用几百万或几千万美元来摆脱困境，而《纽约时报》想要的更多，以及持续的版税。

据分析，“CloseAI”的不利形象也将对 OpenAI 产生影响。《纽约时报》将 OpenAI 描述成一个以盈利为目的的闭源组织，这与为公共利益服务的新闻业形成了巨大的对比。审判需要权衡版权保护与技术创新两者带来的社会效益。在版权案件中，“正义与邪恶”的斗争一直都是争议的焦点。而代表正义一方的叙事在法庭上往往更容易奏效。申诉书中还提到了 OpenAI 董事会和 Sam Altman 的“宫斗戏”，不知道“连续剧”是否为 OpenAI 的形象蒙尘。

最后，人们对大模型幻觉问题的恐惧会让案情更加跌宕起伏。《纽约时报》指控 Bing 称《纽约时报》发表了一篇名为“橙汁导致淋巴瘤”的文章，但实际上《纽约时报》从来没写过这篇报道。这无疑将 OpenAI 置于更加不利的地位。

这场官司可能是人工智能和版权领域的一个转折点。

二、后续影响

据彭博社上周报道，OpenAI 目前正在与投资者洽谈新一轮融资，估值将达到 1000 亿美元，这将使其成为美国估值第二高的初创企业。

微软是 OpenAI 最大的支持者，并在其多个产品中部署了这家初创公司的 AI 工具。在诉讼中，《纽约时报》称微软在其必应搜索引擎中逐字抄袭了该报的文章，并利用 OpenAI 的技术将其价值提升了一万亿美元。

自 2022 年 11 月 ChatGPT 首次亮相以来，微软股价已上涨 55%，市值增至 2.8 万亿美元。周三，微软股价变化不大，在纽约以 374.07 美元收盘。接下来，微软的股价是否会有大的变动，还未可知。

Abacus.AI CEO Bindu Reddy 发文表示，或许最后获益最大的是像 Gork 这样的产品。毕竟，通过允许用户在其平台上发布内容，他们就能获得用这些内容训练人工智能模型的权利。

其实，在文生图领域这样的难题也照样存在。甚至有用户表示，不想再看到 AI 生成图像的推荐了，并以“尸块”拼接定义 AI 作画。

事实上，文生图工具 Dall・E 3 在发布时就格外注意安全与版权问题。OpenAI 为避免像 Stability AI 和 Midjourney 一样被诉讼，允许艺术家将其艺术作品从文本到图像 AI 模型中删除，不用于训练。创作者可以提交一张他们拥有版权的图片，并在网站上填写表格要求将其移除。但这样的措施是否能够完全保护创作者的权利不被侵犯，依旧是个问题。

参考链接：

https://www.bloomberg.com/news/articles/2023-12-27/new-york-times-sues-microsoft-and-openai-for-copyright-infringement?srnd=technology-vp

https://www.nytimes.com/2023/12/27/business/media/new-york-times-open-ai-microsoft-lawsuit.html

https://twitter.com/CeciliaZin/status/1740109462319644905

https://twitter.com/emollick/status/1740061455607791987

https://twitter.com/bindureddy/status/1740085770180866141

本文来自微信公众号：机器之能（ID：almosthuman2017），编辑：佳琪、大盘鸡

声明：该内容为作者独立观点，不代表新零售资讯观点或立场，文章为网友投稿上传，版权归原作者所有，未经允许不得转载。新零售资讯站仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。如对本稿件有异议或投诉，请联系：wuchangxu@youzan.com

Like (0)

年底港股再迎估值巨头，看“斜杠青年”晶泰科技如何“厚积薄发”

Previous 2023年12月28日 16:23

迈向2024，AI创业有哪些新机会？

Next 2023年12月28日

水温80度：AI行业真假繁荣的临界点

我们从来没拥有过这么成功的AI主导的产品。

（这种分析统计并不那么准，但大致数量级是差不多的）

这两个产品碰巧可以用来比较有两个原因：

一个是它们在本质上是一种东西，只不过一个更通用，一个更垂直。

蓝海的海峡

未来成功的AI产品是什么样，大致形态已经比较清楚了，从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时“罢工”，全网打工人都慌了

美西时间午夜12点开始，陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载，忽然无法正常工作了。

因为发现AI用久了，导致现在“离了ChatGPT，大脑根本无法运转”。”

等等，又不是只有一个聊天机器人，难道地球离了ChatGPT就不转了。

大模型连崩原因猜想，谷歌躺赢流量激增6成

GPT归位，人们的工作终于又恢复了秩序。

未来科技 2024年6月5日
ChatGPT宕机8小时，谷歌Gemini搜索量激增60%

ChatGPT一天宕机两次

谷歌Gemini搜索量激增近60%

ChatGPT在全球拥有约1.8亿活跃用户，已成为部分人群工作流程的关键部分。

过去24小时内提交的关于OpenAI宕机的问题报告

图片来源：Downdetector

ChatGPT系统崩溃后，有网友在社交媒体X上发帖警告道：“ChatGPT最近发生的2.5小时全球中断，为我们所有依赖AI工具来支持业务的人敲响了警钟。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时大崩溃，AI集体罢工让全网都慌了

接着OpenAI也在官网更新了恢复服务公告，表示“我们经历了一次重大故障，影响了所有ChatGPT用户的所有计划。Generator调查显示，在ChatGPT首次故障后的四小时内，谷歌AI聊天机器人Gemini搜索量激增60%，达到327058次。

而且研究团队表示，“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关，显示出用户把Gemini视为ChatGPT的直接替代选项。

未来科技 2024年6月5日
深度对话苹果iPad团队：玻璃的传承与演变

iPad最为原始的外观专利

没错，这就是iPad最初被设想的样子：全面屏，圆角矩形，纤薄，就像一片掌心里的玻璃。

2010年发布的初代iPad

好在乔布斯的遗志，并未被iPad团队遗忘。

初代iPad宣传片画面

乔布斯赞同这一想法，于是快速将资源投入平板电脑项目，意欲打造一款与众不同的「上网本」，这就是iPad早年的产品定义。

iPad进化的底色

苹果发布会留下过很多「名场面」，初代iPad发布会的末尾就是一例。

未来科技 2024年6月5日
底层逻辑未通，影视业的AI革命正在褪色…

GPT、Sora均为革命性产品，引发了舆论风暴，但它在上个月发布的“多模态语音对谈”Sky语音，却由于声音太像电影明星斯嘉丽·约翰逊，被正主强烈警告，被迫下架。

华尔街日报也在唱衰，认为“AI工具创新步伐正在放缓，实用性有限，运行成本过高”：

首先，互联网上已经没有更多额外的数据供人工智能模型收集、训练。

03、

如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向，那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

但分歧点正在于此，电影公司希望通过使用AI技术来降低成本，但又不希望自己的内容被AI公司所窃取。

未来科技 2024年6月5日
KAN会引起大模型的范式转变吗？

“先变后加”代替“先加后变”的设计，使得KAN的每一个连接都相当于一个“小型网络”，能实现更强的表达能力。

KAN的主要贡献在于，在当前深度学习的背景下重新审视K氏表示定理，将上述创新网络泛化到任意宽度和深度，并以科学发现为目标进行了一系列实验，展示了其作为“AI+科学”基础模型的潜在作用。

KAN与MLP的对照表：

KAN使神经元之间的非线性转变更加细粒度和多样化。

未来科技 2024年6月5日
这个国家，也开始发芯片补贴了

//mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
[4]中国安防协会：欧盟批准430亿欧元芯片补贴计划：2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
[6]潮电穿戴：印度半导体投资大跃进，一锤砸下1090亿，政府补贴一半.2024.3.5https。

未来科技 2024年6月5日
大模型的电力经济学：中国AI需要多少电力？

这些报告研究对象（数字中心、智能数据中心、加密货币等）、研究市场（全球、中国与美国等）、研究周期（多数截至2030年）各不相同，但基本逻辑大同小异：先根据芯片等硬件的算力与功率，计算出数据中心的用电量，再根据算力增长的预期、芯片能效提升的预期，以及数据中心能效（PUE）提升的预期，来推测未来一段时间内智能数据中心的用电量增长情况。

未来科技 2024年6月5日
你正和20万人一起接受AI面试

原本客户还担心候选人能否接受AI面试这件事，但在2020年以后，候选人进行AI面试的过程已经是完全自动化的，包括面试过程中AI面试官回答候选人的问题，AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

以近屿智能与客户合作的校验周期至少3年来看，方小雷认为AI应用不太可能一下子爆发，包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

未来科技 2024年6月4日

《纽约时报》将OpenAI、微软告上法庭，发生了啥？

相关推荐