ChatGPT之后,维基百科还会存在吗?

Vincent)认为,没有维基百科就不可能有强人工智能,但他也认为,ChatGPT一类大语言模型的流行可能会导致维基百科的消亡。

如今,维基百科的编辑们就AI与维基百科关系的热烈讨论,有点儿类似10年之前,他们就谷歌和维基百科之间关系的探讨,那时候的结论是,谷歌和维基百科互惠互利,和谐共生:维基百科使得谷歌成为了更好的搜索引擎,而维基百科也从谷歌那里获得了大量的流量。

2021年初,当一位维基百科(Wikipedia)的编辑首次试用ChatGPT 3时,他发现这个语言模型错误百出——它会随意编造事实,胡乱引用文章。但同时,他也意识到了这个工具的巨大潜能,并深信在不久的将来,它将取代他深爱的维基百科。这位编辑为此写下了一篇名为《维基百科之死》Death of Wikipedia的文章。

© Mashable

如今两年的时间过去了,ChatGPT已经更新到了版本4;维基百科也在今年1月度过了自己22周岁的生日,那么,二者目前究竟存在一种怎样的关系呢?

新闻记者、作家乔恩·格特纳(Jon Gernter)深入探讨了这个问题,并在《纽约时报》上发表文章:《真相时刻:维基百科会不会在协助智能聊天机器人不断完善的过程中自取灭亡?》Moment of Truth:Can Wikipedia help tech A.I. chatbots to get their facts right—without destroying itself in the process?

回顾维基百科的历史,我们仿佛回到了网络的黄金年代:那时候,每个人,只要能联网,就能免费学习和分享所有人类的知识。

现如今,维基百科上的文章总数已经超过了6100万篇,由334种不同的语言书写。它长期在访问量最大的网站排行中榜上有名,并且,与同样上榜的Google、Youtube与Facebook不同,维基百科始终拒绝任何广告,只通过接受捐赠获取资金。

此外,它所有的贡献者都不收任何报酬——而这个群体保证了每分钟345次的编辑量。

如今的维基百科早已不仅仅是电子版的百科全书,而成为了将整个数字世界粘合在一起的知识网,为人们提供了一个可靠的信息来源。我们从Google/Bing/Alexa/Siri上搜索、了解到的知识大部分都来自维基百科,油管也使用维基百科来打击谣言。

而智能聊天机器人当然也不例外,在其接受训练的过程中,维基百科起到了至关重要、甚至可能是最关键的作用。

西门菲莎大学(Simon Fraser University)的研究员尼古拉斯·文森特(Nicholas Vincent)认为,没有维基百科就不可能有强人工智能,但他也认为,ChatGPT一类大语言模型的流行可能会导致维基百科的消亡。

在今年3月召开的一次大会上,人们探讨了人工智能对维基百科带来的威胁。编辑们的心情是喜忧参半的:他们既认为人工智能可以协助维基百科快速发展,又担心人们会越来越倾向于选择ChatGPT而不是维基百科来回答问题——比起维基有点儿古板生硬的词条,ChatGPT的回答显然更通俗易懂、自然流畅。

基于大会探讨的结果,一个共识性的呼吁是:“我们希望身处于一个全部知识是由人类生产和建构的世界。”但现在,是不是已经有点太迟了呢?

其实,早在2017年,维基媒体基金会的社群及其志愿者就在探讨如何进一步发展,在2030年实现永久性保存、分享世界知识。彼时,他们就注意到了人工智能的出现是如何改变知识的收集、组合和整合方式的。

维基百科在发展过程中遇到的挑战

除开维基百科,如今的大语言模型还广泛吸收来自Google patent database(谷歌专利数据库)、政府文件、Reddit上的问答、线上图书馆以及海量的线上新闻作为信息来源;不过,西雅图艾伦人工智能研究所(Allen Istitute for AI)的计算机科学家杰西·道奇(Jesse Dodge)认为,维基百科的贡献是无与伦比的,这不仅是因为它在用于培训大语言模型的数据总量中占到了3%~5%,更因为它是最大的、最经过精心筛选的数据库之一。

如今,维基百科的编辑们就AI与维基百科关系的热烈讨论,有点儿类似10年之前,他们就谷歌和维基百科之间关系的探讨,那时候的结论是,谷歌和维基百科互惠互利,和谐共生:维基百科使得谷歌成为了更好的搜索引擎,而维基百科也从谷歌那里获得了大量的流量。

当然,与谷歌及其他搜索引擎保持紧密关系,也给维基百科带来了一些存在危机:要是问谷歌,俄乌冲突是怎么一回事?它会引用并简要总结来自维基百科的文章内容,而读者往往更喜欢谷歌的答案,而不会去顺藤摸瓜阅读背后超过一万字并带有400个脚注的维基文章。

进一步,这会导致普通人过于简化理解我们的世界,也会影响维基百科招募到年轻一代的内容贡献者。

2017年的一项研究表明[1],人们对维基百科的访问量确实在下降。而且,智能聊天机器人的出现更是加速了这一进程。

维基媒体基金会机器学习研究小组的带头人阿隆·哈尔法克(Aaron Halfaker)表示,搜索引擎在提供简要答案的同时至少还会贴出来源链接,帮助人们回到维基百科的页面;而大语言模型只会把信息整合成流畅的语言,没有引用、没有依据,人们无从知晓答案的来源。这使得人工智能成为维基百科更难缠的对手——它可能更有害,而且很难与之竞争。

维基百科自身的缺陷及解决措施

当然,维基百科远不是尽善尽美的:首先,在4万名活跃的英语编辑中,有80%是男性,75%是美国白人男性,这导致维基百科在性别和种族方面的内容存在一些偏差。

其次,维基百科的文章可信度也不是稳定不变的:佐治亚理工学院(Georgia Institute of Technology)的教授艾米·布鲁克曼(Amy Bruckman)认为,在维基百科上,一篇经过上千人编辑的长文质量相当有保证,而一些短文却很可能出错甚至完全是垃圾。

© Wikipedia

这使得编辑需要旷日持久地与谬误作战:其中有经验的会出手编辑包含一些缺乏事实依据或无法验证真假的文章;此外,在编辑守则中,内容编辑也被要求保持“N.P.V.O”——即“Neutral Point of View”(观点中立)

人工智能工具的问题及解决方案

与之相对,对于智能聊天机器人来说,追寻真理之路甚至更为艰险[2]:就像ChatGPT会随意编造事实,胡乱引用不存在的文献(术语叫“hallucination”虚假信息);会过度简化一个复杂事实,例如分析俄乌冲突;也会乱给医学建议……

今年4月,斯坦福的科学家检验了4种内置AI工具的搜索引擎:Bing Chat,NeevaAI,perplexity AI和YouAI,发现它们生成的答案只有差不多一半能经得起事实的检验[3]

© MobileSyrup

这是为什么呢?原因很简单:聊天机器人的目标不是追求绝对的真理或准确性,而是尽量根据给定的上下文和概率来产生合理的回答[4]。这种选择可能基于统计数据和语言模型,因此不是百分之百准确的。

难道答案的准确性不应该是研发、培训智能聊天机器人的公司首要追求的目标吗?对于公众来说,这几乎是个毋庸置疑的问题。然而,据计算机科学家、前谷歌研究员玛格丽特·米切尔(Margaret Mitchell)爆料,在目前商业竞争白热化的阶段,比起真实可靠,公司更在意尽快向公众推出旗下的AI产品。(顺带说一句,米切尔正是因为批评谷歌在这个领域研发方向的问题而被解雇的。)

不过,米切尔也相信前景是光明的,她已经看到使用优质信息接受训练的模型在提高准确性方面显著的提升。只是,目前AI产品的数据训练方法是“放任自流”式,即不管好的坏的就把尽可能多的信息喂给模型,设想是输入的信息越多,输出的信息质量就越高;而不是反过来——全部输入优质信息,得出优质信息。

此外,市场竞争也有助于智能聊天机器人的自我完善,例如,OpenAI与许多商业公司都有合作关系,这些公司非常注重答案的准确性。另外,谷歌公司研发的人工智能系统与医学界的专家保持了紧密合作,进行疾病诊疗方面的探索。

相较以前的版本,ChatGPT4在提供涉及“事实内容”的回答时已经有了显著进步,不过,离它能准确地回答复杂的、多层面的历史问题,还有很长的路要走。对这样的智能聊天机器人来说,准确性与创造性、流畅性之间永远存在着张力。而开发的目标,绝不仅仅是让它们能“反刍”接收知识,而是需要看穿知识的模式,并用通俗易懂的语言告诉使用者。

目前二者的合作现状

6月底,记者试用了维基媒体基金会为ChatGPT开发的插件。

ChatGPT4目前拥有的全部知识截止于它受训结束的时间:2021年9月;而这个插件可以让它接触到迄今为止的所有信息:这使得用户可以同时享受到这两种工具的带来的便利:来自维基百科的知识具有准确性和时效性,而智能聊天机器人能用流畅、自然的语言将其输出。同时,ChatGPT也会列出信息来源——维基百科的页面。

维基百科也在内化一些人工智能模型,以更好地帮助新用户,或协助编辑工作。但目前,维基的社群还是比较抵触完全由人工智能编辑的文章;而编辑们也非常担心,面对强大的无休无眠的对手,面对能瞬时生成海量内容的人工智能,人类编辑在内容审核方面付出的努力是否只是螳臂挡车,终会一败涂地。

按照目前的情况来看——任何站到人工智能对立面的举动都是不理智的,一个很可能出现的场景是:像维基百科一类的组织必须努力适应由人工智能创造的未来才可能得以存续,而不是妄想对其施加影响甚至出手阻拦。

当然,许多接受采访的学者和维基编辑也认为,人工智能制霸之路不会是摧枯拉朽的,它将面临重重阻碍:

首先是社会性的:欧盟议会目前正着手制定一系列法律条文和规章制度,来规范对人工智能产品的使用:例如强制科技公司标明由人工智能生成的内容;公开人工智能受训的数据;以及标明信息来源,不可未经授权盗用其他网站、数据库资源等。

其次是技术上的。事实上,文章一开篇已经强调,如果没有维基百科、Reddit社区提供的海量数据,大语言模型根本无从接受训练,而人工智能的研发公司完全清楚这些数据库的重要性,这就给了维基百科等网站一些谈判的筹码。

此外,今年5月底,一些人工智能研究员还合作发表了一篇论文[5],探讨新的人工智能系统是否能只靠人工智能模型生成的知识来发展自身,而完全不使用人类生成的数据库接受训练。结果,研究者发现这会导致一种系统性崩溃——称为“模型崩塌”(Model collapse):使用人工智能合成的数据可能会导致混乱,因为它们可能不准确或不真实,进而会对下一代模型的训练数据集造成负面影响,使其对现实世界的认知产生偏差。

而维基百科的插件可以避免这一情况发生,但如果在未来,维基百科上充斥着由人工智能生成的文章,那么问题同样会产生:新一代的语言模型会陷入自说自话循环论证的状态。

最终,这项研究证明了,真人交互产生的数据的价值对未来大语言模型的发展不可估量,这对维基百科的编辑们来说是个振奋人心的消息。至少一段时间之内,人工智能还需要我们,需要我们人类让它变得可信而有用。

不过,这又涉及到一个叫做“结盟”(alignment)的理论概念,即假设人工智能符合人类最大的利益。保证人工智能与人类站在同一边,既是巨大的挑战,也是研发人工智能的首要任务。

而真人的好处是,人性使得人类天生就具备一些形成同盟的条件:例如一些人乐于分享高质量的教育资源的动机,恰好符合另一些人的需求。作者最后采访了一位维基百科的英文编辑杰德(Jade),她提到知识分享是自己的人生信条:她每周会固定花10~20个小时编辑维基百科。

目前,她致力于编辑一条关于美国内战的条目,其一年的阅读量已经超过了484万次,她的目标是继续完善这篇文章,直到获得维基百科“精选”的认证——这是一种极为珍惜的认证,在维基百科的英文版中,仅仅有0.1%的内容有资格得到这项认可。

最后,记者问及杰德是否认为人工智能会完全取代她的工作,杰德回答,她是个乐观主义者,相信至少在本世纪内,机器人不会完全替代人类来编辑维基百科。

然而记者本人就没有这么确定了,毕竟,根据他自己与ChatGPT聊天的经验,尽管在信息交换的准确性和细节方面人工智能做得还不够完善,但人机交互的体验已经足够吸引他了,一切都是如此轻松。

(原文有删改)

参考文献

[1]ojs.aaai.org/index.php/ICWSM/article/view/14883/14733

[2]www.nytimes.com/2023/05/01/business/ai-chatbots-hallucination.html

[3]arxiv.org/pdf/2304.09848.pdf

[4]www.nytimes.com/2022/04/15/magazine/ai-language.html

[5]arxiv.org/pdf/2305.17493.pdf

原文/www.nytimes.com/2023/07/18/magazine/wikipedia-ai-chatgpt.html

本文来自微信公众号:利维坦 (ID:liweitan2014),基于创作共享协议(BY-NC),由作者Jon Gertner发布,编译:南瓜大王,校对:tim

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2023年11月13日
Next 2023年11月13日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日