OpenAI终究还是违背了“祖训”

第一次分裂

2019年2月,OpenAI对外宣告了GPT-2,却没有第一时间对外开源。

突然的180度大转向,使得OpenAI内部开始分裂成两个对立的派别:

以达里奥·阿莫迪、伊利亚为代表的安全主义,认为必须先确保AI不会威胁人类,再公开发布产品。

尾声

GPT-4o发布之后,奥特曼重申了修改后的公司愿景:

OpenAI使命的一部分,是将非常强大的AI工具免费(或以优惠的价格)提供给人们。

6个月前,OpenAI爆发了一场举世瞩目的内部斗争:CEO奥特曼(Sam Altman)突然被开除,106个小时后,又在员工的簇拥下复职。

自那之后,“刺杀国王”的始作俑者之一、首席科学家伊利亚(Ilya Sutskever),再也没有现身。伊利亚是“深度学习教父”辛顿的大弟子,OpenAI的灵魂人物。消失前,他最后的工作,是带领名为“超级对齐”的安全团队。

GPT-4o发布会之后,伊利亚突然更新推文,宣布从OpenAI离职。首席科学家的退出,加速了OpenAI的分裂。

伊利亚(左三)与奥特曼(左四)

3天后,另一位“超级对齐”的科学家简·雷克(Jan Leike),也宣布提桶跑路。简·雷克公开爆料称,两人与奥特曼等高层存在严重分歧,安全团队举步维艰。

OpenAI的文化正在“变质”,忽视安全主义而转向“闪亮的产品”。

陆续有技术大牛选择离开。

一位OpenAI员工对着媒体说道,“注重安全的员工已经对他失去了信心。信任正一点点崩溃,就像多米诺骨牌一张一张倒下一样[1]。

众所周知,OpenAI是一家由理想主义情结捏合起来的机构。然而,对于如何实现这一理想,OpenAI内部却渐渐衍生出了两条不同的路线。伊利亚的离开,意味着他所代表的理想主义,已经彻底败给了另一种理想主义。


科学家与狂想家

2005年的一个周日,多伦多大学教授辛顿的办公室门外,来了个不速之客。

来者是一位数学系的学生,操着一口东欧口音,表情似乎总是愁眉苦脸。彼时,辛顿是极少数仍在研究深度学习的学者,并在多伦多大学组建了一个实验室。

这个学生说,他整个夏天都在快餐店兼职炸薯条,现在他更想来这个实验室工作。

辛顿打算考考这位急于展现自己的年轻人,给了他一份反向传播的论文。这篇论文写于上世纪80年代,是辛顿最知名的研究成果之一。几天后,这个学生回来了,问他:“你为什么不求导并采用一个合理的函数优化器?”

辛顿倒吸了一口气:“我花了5年时间才想到这一点。”[2]这个学生,就是伊利亚。

辛顿发现,伊利亚有种非常强大的原始直觉,能靠“第六感”找到正确的技术路线[2]因此,辛顿将伊利亚视作唯一一个比自己更“天才”的学生[3]

并且,辛顿很快发现,“技术天才”只是伊利亚身上的一个特质。

与伊利亚长期共事过的研究员谢尔盖·莱文(Sergey Levine)曾说道,他喜欢大的想法,并且从不惧怕相信。“不怕的人有很多,但他尤其不怕。”[2]

2010年,伊利亚在阅读了一篇论文之后,便大胆宣称,深度学习将改变计算机视觉——只需要有人来推动这项研究。在那个深度学习等同于民科的时代,伊利亚这番发言,显然是有些倒反天罡的。

然而,他只花了2年,就打了所有人的脸。

2012年,辛顿、伊利亚以及克里哲夫斯基三人打造的AlexNet,以高达84%的图像识别正确率,让世界看到了深度学习的潜力,并引发了产业界的狂热追逐。

那一年,谷歌花了4400万美元的天价,只为了将AlexNet的3位作者收入麾下。

在谷歌工作期间,伊利亚又开始相信一件更宏大的事情:超越人类的超级智能,已经近在眼前。

一方面,是因为他发现深度学习的游戏规则变了。

此前,研究深度学习的只有一小撮人,资源捉襟见肘。2009年时,辛顿曾短暂地在微软做过一个深度学习项目,连一张价值1万美金的显卡都申请不下来,气得他一顿阴阳怪气,“微软显然是家资金短缺的软件销售商。[2]

然而,自AlexNet之后,无数聪明头脑与热钱涌入,未来被加速了。

另一方面,早在学生时期,伊利亚就坚信Scaling laws。“第六感”告诉他,超级智能并没那么复杂,只需要更多的数据与算力。

并且,伊利亚又一次证明了自己是对的。

2014年的NIPS学术会议上,伊利亚公布了他最新的研究成果:Seq2Seq(序列到序列)模型。Transformer诞生之前,它曾是谷歌机器翻译的灵魂。只需要足够的数据,Seq2Seq模型就能表现得很好。

伊利亚在路演中提到,一个弱模型永远不可能有好的表现。“真正的结论是,如果你有一个非常大的数据集和非常大的神经网络,那么成功是有保证的。[4]

科学家与狂想家这两张面孔,在伊利亚身上迸发了神奇的化学反应。

随着伊利亚对超级智能愈发笃信,他对安全问题的重视也与日俱增。没过多久,伊利亚便遇见了知己。

理想主义的天花板

2015年,伊利亚收到投资机构Y Combinator掌门人萨姆·奥特曼的邀请,前往硅谷的瑰丽酒店参与一场秘密聚会。然而,奥特曼并非这场秘密聚会的主角。

马斯克突然现身,告诉现场所有人,他打算成立一间AI实验室。

促使马斯克这么做的导火索,是数周前的44岁生日派对。

当时,马斯克邀请了时任谷歌CEO拉里·佩奇等一众好友,去度假村玩了3天。晚饭过后,马斯克与佩奇围绕AI展开了激烈争吵。马斯克认为AI会毁灭人类,而佩奇则不以为然,嘲讽他是个“物种主义者”,对硅基生命有偏见[5]

从那之后,马斯克就不怎么和佩奇说话了。

在秘密聚会的现场,马斯克等人提到,很少有科学家会考虑自己研究的长期后果。如果任由谷歌这样的大型企业垄断AI技术,很可能会在无意间造成巨大伤害。

因此,他们提出了一种全新的形式:成立一间不受任何人控制、非盈利的实验室。

他们同样会去追逐AGI(通用人工智能)的圣杯,但不以盈利为导向,且放弃大多数研究成果,转而面向社会公开(open source)。马斯克与奥特曼认为,如果所有人都能获得强大的AI,那么“恶意AI”的威胁将大大降低。

“我能想到最好的事情,就是让人类以更安全的方式构建真正的AI。”另一位组织者布罗克曼(Greg Brockman)说道[6]

伊利亚被这个浪漫的想法打动了。他为此放弃了年薪200万美元的诱惑,毅然加入OpenAI。

成立的头15个月,OpenAI并没有设立具体的战略方向。谷歌科学家达里奥·阿莫迪(Dario Amodei),当时曾拜访过OpenAI,询问在研究什么,OpenAI的管理层竟一时答不上来,“我们现在的目标……是做点好事。[7]

几个月后,阿莫迪跳槽去了OpenAI,一起做点好事。

2017年3月,奥特曼等领导层意识到该更专注了。然而,在规划AGI路线图的时候,他们却发现了一个严重的问题:算力跟不上了。大模型所需要的算力,每隔3-4个月就会翻一倍。非盈利机构的形式,显然不足以支撑。

当时,马斯克提出了一个提案:OpenAI并入特斯拉,由他完全掌管[8]

然而,马斯克低估了奥特曼的野心。

奥特曼一直在寻找重大的科学突破,希望凭此打造出一家价值万亿美金的企业。过去,YC最为人熟知的投资案例,是Airbnb。随着奥特曼掌权之后,YC开始挤破脑袋寻找各种研究核聚变、人工智能、量子计算的公司。

a16z创始人、风险投资家马克·安德森曾表示:“在奥特曼的领导下,YC的野心水平提高了10倍。[9]

2018年2月,奥特曼将OpenAI管理层都拉拢到了自己的阵营。马斯克从此离开了团队,不再和奥特曼说话,并取消了对OpenAI的后续资助。

两个月后,奥特曼发布了OpenAI的公司章程。在不起眼的角落,他对公司愿景的表述,做了些小小的修改,“我们预计需要调动大量资源来完成使命。”

至此,曾经那个高度理想主义的OpenAI,渐渐踏入了另一条河流。


第一次分裂

2019年2月,OpenAI对外宣告了GPT-2,却没有第一时间对外开源。而后来的GPT-3,更彻底走向了闭源,OpenAI变成了CloseAI。

一个月后,OpenAI又改变了“非盈利”的性质,成立了一个营利部门,并接受了微软10亿美金的投资。

突然的180度大转向,使得OpenAI内部开始分裂成两个对立的派别:

  • 以达里奥·阿莫迪、伊利亚为代表的安全主义,认为必须先确保AI不会威胁人类,再公开发布产品;

  • 而以奥特曼、布罗克曼为代表的加速主义,则希望加速AI的普及,从而让更多人使用AI造福世界。

从中可以看出,两个派别的行事方式完全相反:

  • 安全主义主张先验证安全,再发布;

  • 而加速主义主张先扩大市场,再根据测试结果与反馈进行调整。

前些日子发布的GPT-4o,就是典型的加速主义做派。发布会之前,OpenAI匿名发布了性能强大的模型“im-also-a-good-gpt2-chatbot”,引起了开发者社区的广泛猜测与讨论。

事后证明,这模型就是GPT-4o的前身;而奥特曼故弄玄虚的目的,正是想让吃瓜群众帮他做测试。

随着分歧加剧,2021年,安全主义者、曾想一起做点好事的达里奥·阿莫迪,引发了OpenAI的第一次分裂。他认为,OpenAI正从“勇者”变成“恶龙”,越来越商业化,忽视了安全主义。

于是,他带领着一批核心员工出走,成立了另一家AI公司Anthropic。

阿莫迪将Anthropic定位成一家公益公司,这将使他们能够同时追求商业利润和社会责任。如今,Anthropic已成为OpenAI最大的竞争对手。

达里奥·阿莫迪的离职,在OpenAI内部造成了巨大动荡,但奥特曼仍试着努力维持两个派别的平衡。

直到ChatGPT的发布。

一种理想主义的失败

ChatGPT本是个临时项目。

当时,OpenAI正全力开发GPT-4。然而,有传闻称,阿莫迪的Anthropic正在开发聊天机器人。于是,奥特曼临时指派员工,给现有的GPT-3.5也打造一个聊天界面。奥特曼将ChatGPT称为“低调的研究预览”,可以帮助OpenAI收集人类与AI交互的数据。

当时,OpenAI内部员工搞了个赌注池,猜1周内能获得多少用户,最大胆的赌注是10万人[11]

最终成绩是100万。

2个月后,这个“低调的研究预览”,成为了历史上最快突破1亿用户的应用程序。

两个派别的平衡被彻底打破了。

一位内部员工对媒体说道:“ChatGPT诞生后,OpenAI有了获取收入的明确途径。你不能再用‘理想主义的实验室’标榜自己了,现在就有顾客希望得到服务。[12]

从学生时代开始,伊利亚就相信超级智能并不遥远。随着ChatGPT引发行业追逐,他对安全的焦虑变重了,与其他加速主义管理层的矛盾也日趋严重。

有人觉得他越来越神神叨叨,也有人觉得他开始更像一位精神领袖了。

2022年OpenAI的节日派对上,伊利亚开始带着所有员工高喊,“feel the AGI(感受AGI)”。在其他许多不同场合,他也反复说过这句话——仿佛超级智能已经近在咫尺。

去年宫斗之前,伊利亚曾告诉一位记者,ChatGPT可能是有意识的,世界需要认识到这项技术真正的力量。

这位媒体同志不止见过伊利亚一次,对他的印象并不算好:每次见面,他都会说很多极其疯狂的话[13]

2023年7月,伊利亚启动了“超级对齐”项目,发起了对加速主义的最后反抗。

在AI语境中,对齐(Alignment)并非某种黑话,而是一个专业术语,指让前沿的AI系统与人类的意图、价值观对齐。然而,伊利亚认为,超级智能的智慧程度将远超人类,人类智慧已经不足以拿来当衡量的标准。

他提到,当年的AlphaGo是个典型的例子。

它与李世石第二盘棋的第37手,下在了一个所有人都没想到的位置。当时,连中国围棋国手芈昱廷都在解说台上惊呼:“这是什么鬼,没摆错吗?”事后看来,这手棋恰恰是奠定AlphaGo胜局的关键。

连AlphaGo都如此捉摸不透,更遑论即将到来的超级智能。

因此,伊利亚拉上同事简·雷克,成立了“超级对齐”团队。工作内容很简单:在4年之内打造一个强大的AI系统,让它代替人类智慧负责对齐工作,而OpenAI将为这个项目提供20%的算力。

只可惜,奥特曼并没有给安全主义反抗的机会,没有兑现20%算力的承诺。

去年年底,伊利亚射出的最后一颗子弹,也未能击中要害。当伊利亚未能成功“刺杀国王”,他与OpenAI的结局就已经注定了。


尾声

GPT-4o发布之后,奥特曼重申了修改后的公司愿景:

OpenAI使命的一部分,是将非常强大的AI工具免费(或以优惠的价格)提供给人们。他在博客中写道:“我们是一家企业,很多东西需要收费,这将有助于我们向数十亿人(希望如此)提供免费、出色的AI服务。[15]

2016年时,《纽约客》曾发布了一篇关于奥特曼的特稿。

当时,奥特曼最主要的身份,还是YC的掌门人。实际采访时,《纽约客》记者在奥特曼身上感受到了一种侵略性。

“他正在硅谷内迅速建立起一种新的经济,这种经济似乎旨在取代原本的硅谷。[9]

如今,随着OpenAI彻底告别伊利亚时代,奥特曼将继续完成当年未竟的野心。

参考资料:

[1]“I lost trust”:Why the OpenAI team in charge of safeguarding humanity imploded,Vox

[2]Geoffrey Hinton|On working with Ilya,choosing problems,and the power of intuition,Sana

[3]深度学习革命,凯德·梅茨

[4]NIPS:Oral Session 4-Ilya Sutskever,Microsoft Research

[5]Ego,Fear and Money:How the A.I.Fuse Was Lit,New York Times

[6]Inside OpenAI,Elon Musk’s Wild Plan to Set Artificial Intelligence Free,Wired

[7]The messy,secretive reality behind OpenAI’s bid to save the world,MIT Technology Review

[8]The secret history of Elon Musk,Sam Altman,and OpenAI,Semafor

[9]Sam Altman’s Manifest Destiny,The New Yorker

[10]AI researchers debate the ethics of sharing potentially harmful programs,The Verge

[11]Inside the White-Hot Center of A.I.Doomerism,New York Times

[12]Inside the Chaos at OpenAI,The Atlantic

[13]Rogue superintelligence and merging with machines:Inside the mind of OpenAI’s chief scientist,MIT Technology Review

[14]OpenAI Wants to Harness AI.It Should Pause Instead,The Information

[15]GPT-4o,Sam Altman

本文来自微信公众号:远川科技评论 (ID:kechuangych),作者:陈彬,编辑:李墨天,视觉设计:疏睿

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年5月27日
下一篇 2024年5月28日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日