奥特曼回忆OpenAI宫斗第一季：一生中最奇特的时刻

2024年5月19日 11:04 • 未来科技

“我们最初只是玩机器人和游戏等一些小项目，有人开始研究大语言模型，Ilya坚定地相信它，并且确定了我们的大方向，我们从GPT-1一口气做到GPT-4。

语音模型是我们推出的一个很酷的东西，但也许最重要的是，我们能够使它如此高效地为免费用户提供服务，简直可以说得上是世界上最好的模型。Bartlett：你认为在GPT飞速发展的当下，能够活下来的人工智能企业的特点是什么。

在GPT-4o发布的当天，奥特曼接受了科技博客主Logan Bartlett的专访。这次专访原本约在去年复活节前，但因为OpenAI董事会发生“政变”，奥特曼被解除职务，专访被取消。

现在，奥特曼似乎又在面临宫斗的第二季。公司的联合创始人、首席科学家苏茨克沃（Ilya Sutskever）宣布辞职，与他共同领导公司超级对齐部门的Jan Leike很快也宣布辞职，并且在社交媒体平台X上发文，揭露公司对对齐工作不重视。公司的其他骨干，如负责部署ChatGPT的应用工程部负责人Evan Marikawa等人也宣布辞职。

在人们以为GPT-5即将发布，甚至期待有可能出现“超级智能”之时，AI的安全和对齐技术至关重要。此时，对齐团队出现危机，团队员工要么跟着辞职，要么被吸收到其他团队，这令人担心GPT-5是否安全，或者是否为了安全需要推迟发布。

奥特曼回忆了去年11月董事会“政变”期间，他收到世界各地一二十个国家的总统和总理的问候，以及在那5天期间所承受的极度的压力，他称之为一生中最奇特（surreal）的时刻。

自从宫斗大戏反转，奥特曼复职，并重组董事会后，发起董事会政变的苏茨克沃就再也没有亲自回到公司，他在6个月的时间内远程领导着超级对齐团队。

在专访中，奥特曼还谈起了苏茨克沃。当主持人在问他在OpenAI中所做的最重要的决定时，他承认是苏茨克沃确定了公司最重要的大方向：遵循扩展法则（scaling law）做大语言模型。

“我们最初只是玩机器人和游戏等一些小项目，有人开始研究大语言模型，Ilya坚定地相信它，并且确定了我们的大方向，我们从GPT-1一口气做到GPT-4。”

下面是专访的完整视频。我们节选了其中的一些重要问题，对文字进行了精简和编辑。

Logan Bartlett：OpenAI推出了ChatGPT-4o，你能解释一下为什么这很重要吗？

奥特曼：我认为这种使用电脑的方式不可思议。用声音控制电脑，我们有这样的想法很长一段时间了。你知道，我们有Siri，以前还有其他一些产品。对我来说，之前这些产品在使用上从来没有自然过。但是这个新产品，它的流动性和柔韧性简直太棒了，我简直不敢相信我这么喜欢用它。

Logan Bartlett：有什么实际使用的实例吗？

奥特曼：我刚试用了一周左右的时间。当我在工作的时候，把手机放在桌子上，然后根本不用换界面。我在做某件事的时候，通常会停下手头的工作，切换到另一个标签，比如谷歌，再四处点击。但现在，我只需要提问，它就能给出一个即时的回应，一点也不影响我在电脑上看东西，这是一件非常酷的事情。

Logan Bartlett：大胆猜测一下，也许下次大型发布会时，ChatGPT不会出现，不是GPT-5而是其他一些什么产品？因为我感觉你们已经采用了一种迭代的方法来开发模型。

奥特曼：说真的我们还不知道，我想我学到的一件事是：AI并不总是带来惊喜。

你知道科技公司发布产品的传统方式，但我们可能应该做一些不同的事情。我们仍然可以叫它GPT-5，并以不同的方式发布它，或者我们也可以给它一个别的名字。

不过，如何为这些东西命名对我来说并没有什么特别的意义，比方说发布从GPT-1到GPT-4。显然GTP-4会继续变得更好。

我们也有这样的想法，可能会有一个潜在的、类似于虚拟大脑的东西，它可以在某些情况下更加努力地思考。或者可能是不同的模型。所以目前我们还不知道如何去在市场上推广我们的产品。

Logan Bartlett：这是否意味着，在模型上取得增量进展的计算需求可能比历史上的要少？

奥特曼：我认为我们会尽可能多地使用计算。我们发现了令人难以置信的效率提升，这一点非常重要。

语音模型是我们推出的一个很酷的东西，但也许最重要的是，我们能够使它如此高效地为免费用户提供服务，简直可以说得上是世界上最好的模型。GPT-4o和GPT-4 Turbo的效率得到了很大的提升。

Logan Bartlett：你认为在未来12个月，有哪些应用或领域是最有前途的？

奥特曼：我认为编码是一个非常重要的问题。深度专门化模型是针对特定目的、特定数据进行训练的，而通用模型是能够进行真正推理的。我敢打赌通用模型才是最重要的。

如果模型可以进行通用推理，如果它可以计算出新的东西，那么如果它需要计算出一种新的数据，你可以输入提示，它就能做到——但反过来就不行。

我认为一堆专门化的模型放在一起并不能得出通用推理，因此我认为最重要的是弄清楚真正的推理能力，然后我们可以将它用于各种各样的事情。

Logan Bartlett：你认为人类和人工智能之间的主要交流方式是什么？

奥特曼：自然语言就很好了。我们应该设计一个人类和OpenAI可以共同使用，并且以同样的方式使用的未来。比起其他形式的机器人，我对人形机器人更感兴趣。因为我认为这个世界是为人类设计的，我不希望它被重新配置成更高效的东西。

Logan Bartlett：在需求方面，你是否觉得世界需要更多的人工智能基础设施？

奥特曼：首先，我很有信心我们会设法降低现有系统的成本；我也相信，随着我们这样做，需求将大幅增加；第三，我相信通过建立更大更好的系统，也将会有更多的需求。

我们都应该希望有一个非常智能、非常便宜的世界，人们用它做各种各样的事情：我想要阅读我所有的邮件，然后帮我回复；我想要治疗癌症。你当然会选择治疗癌症，但答案是，你喜欢让它同时做这两件事，我只是想确保我们有足够的钱来做这些。

Logan Bartlett：你认为在GPT飞速发展的当下，能够活下来的人工智能企业的特点是什么？

奥特曼：我发现唯一适用于此的框架是，你创办企业的理念，可以是下注下一个模型不会很好，也可以是下注下一个模型会令你获益。

我的建议是，在大多数情况下，你不是在建立一家人工智能企业，而是在建立一家企业，人工智能只是一种你可以使用的技术。

在应用商店的早期，有很多应用填补了一些非常明显的不足，但最终苹果修复了这个问题：你不需要一直从应用商店里下载手电筒应用，现在这已经是操作系统的一部分。像Uber这样的产品是用智能手机来实现的，但确实建立了一个非常可靠的长期业务。然后你只需要选择后一种。

Logan Bartlett：请给那些想要主动为这些颠覆做好准备的CEO们一些建议。

奥特曼：我敢说，信息作为一种服务，每年都在变得更好更便宜，这是必要的，但不足以让你胜出。

所以那些花了几年时间来实施这些的大公司，你可以打败他们的，其他所有的创业公司也会这样做。因此你仍然需要弄清楚，你的企业的长期防御能力是什么。

Logan Bartlett：你认为达到AGI（通用人工智能）的最大障碍是什么？

奥特曼：我认为最大的障碍是新的研究。从互联网软件到人工智能，我必须学会的一件事是，研究工作的时间表与工程不同。这通常意味着它需要更长的时间，但有时意味着它的工作速度比任何人预测的都要快得多。在科学和工程上有许多这样的例子，从建立理论，到在实验中发现并且证实，再到实际的应用，是一个漫长的过程。有些停留在理论的层面上百年了，但有些在突破之后，以惊人的速度变化。

Logan Bartlett：模型变得越来越聪明，你认为什么是人类独有的？

奥特曼：大模型开始具备越来越多的能力，我认为很多很多年以后，人类仍然会关心其他人类。我认为我们是如此倾向于长期关注，以各种各样的、大大小小的方式——都是对其他人的痴迷。你可能不会在意人工智能歌剧，即使你听到了，你也不会在意，我们也不会去看机器人踢足球。

Logan Bartlett：你是如何看待AI的未来的？

奥特曼：如果五年后你要给我发短信，我想你得弄清楚你是不是在给“我”还是我的人工智能助手发短信。如果是我的人工智能助手，它会把信息整合在一起，然后你会得到回复。如果它可以很容易地做一些人类助手做的事情，那么我认为把这些东西分开是有价值的。

并不是说，人工智能真的只是我的延伸，我不知道我是在和Sam还是Sam的人工智能鬼魂说话，但没关系，因为它们是一样的，这是一个合并的实体。我不想觉得这个东西就像我的怪异延伸，它是一个独立的实体，我可以跨越障碍与之交流。

Logan Bartlett：你认为大学教育系统应该做出哪些具体的改变，来为未来做好准备？

奥特曼：最大的问题是，我认为人们不仅应该被允许，而且应该被要求使用这些工具。在某些情况下，我们希望人们用传统的方法做一些事情，因为这有助于理解。比方说，考试中没有计算器，但在现实生活中，你会使用计算器，所以你需要理解它，需要熟练使用它。如果你在数学课上从来没有使用过计算器，你就会不太擅长你以后需要做的工作。所以我认为应该训练人们使用人工智能，这将是未来做有价值工作的重要组成部分。

声明：该内容为作者独立观点，不代表新零售资讯观点或立场，文章为网友投稿上传，版权归原作者所有，未经允许不得转载。新零售资讯站仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。如对本稿件有异议或投诉，请联系：wuchangxu@youzan.com

Like (0)

五月全球“AI大爆炸”：卷技术、拼落地、比价格

Previous 2024年5月19日

李想“吹牛”，理想被告！

Next 2024年5月19日

水温80度：AI行业真假繁荣的临界点

我们从来没拥有过这么成功的AI主导的产品。

（这种分析统计并不那么准，但大致数量级是差不多的）

这两个产品碰巧可以用来比较有两个原因：

一个是它们在本质上是一种东西，只不过一个更通用，一个更垂直。

蓝海的海峡

未来成功的AI产品是什么样，大致形态已经比较清楚了，从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时“罢工”，全网打工人都慌了

美西时间午夜12点开始，陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载，忽然无法正常工作了。

因为发现AI用久了，导致现在“离了ChatGPT，大脑根本无法运转”。”

等等，又不是只有一个聊天机器人，难道地球离了ChatGPT就不转了。

大模型连崩原因猜想，谷歌躺赢流量激增6成

GPT归位，人们的工作终于又恢复了秩序。

未来科技 2024年6月5日
ChatGPT宕机8小时，谷歌Gemini搜索量激增60%

ChatGPT一天宕机两次

谷歌Gemini搜索量激增近60%

ChatGPT在全球拥有约1.8亿活跃用户，已成为部分人群工作流程的关键部分。

过去24小时内提交的关于OpenAI宕机的问题报告

图片来源：Downdetector

ChatGPT系统崩溃后，有网友在社交媒体X上发帖警告道：“ChatGPT最近发生的2.5小时全球中断，为我们所有依赖AI工具来支持业务的人敲响了警钟。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时大崩溃，AI集体罢工让全网都慌了

接着OpenAI也在官网更新了恢复服务公告，表示“我们经历了一次重大故障，影响了所有ChatGPT用户的所有计划。Generator调查显示，在ChatGPT首次故障后的四小时内，谷歌AI聊天机器人Gemini搜索量激增60%，达到327058次。

而且研究团队表示，“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关，显示出用户把Gemini视为ChatGPT的直接替代选项。

未来科技 2024年6月5日
深度对话苹果iPad团队：玻璃的传承与演变

iPad最为原始的外观专利

没错，这就是iPad最初被设想的样子：全面屏，圆角矩形，纤薄，就像一片掌心里的玻璃。

2010年发布的初代iPad

好在乔布斯的遗志，并未被iPad团队遗忘。

初代iPad宣传片画面

乔布斯赞同这一想法，于是快速将资源投入平板电脑项目，意欲打造一款与众不同的「上网本」，这就是iPad早年的产品定义。

iPad进化的底色

苹果发布会留下过很多「名场面」，初代iPad发布会的末尾就是一例。

未来科技 2024年6月5日
底层逻辑未通，影视业的AI革命正在褪色…

GPT、Sora均为革命性产品，引发了舆论风暴，但它在上个月发布的“多模态语音对谈”Sky语音，却由于声音太像电影明星斯嘉丽·约翰逊，被正主强烈警告，被迫下架。

华尔街日报也在唱衰，认为“AI工具创新步伐正在放缓，实用性有限，运行成本过高”：

首先，互联网上已经没有更多额外的数据供人工智能模型收集、训练。

03、

如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向，那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

但分歧点正在于此，电影公司希望通过使用AI技术来降低成本，但又不希望自己的内容被AI公司所窃取。

未来科技 2024年6月5日
KAN会引起大模型的范式转变吗？

“先变后加”代替“先加后变”的设计，使得KAN的每一个连接都相当于一个“小型网络”，能实现更强的表达能力。

KAN的主要贡献在于，在当前深度学习的背景下重新审视K氏表示定理，将上述创新网络泛化到任意宽度和深度，并以科学发现为目标进行了一系列实验，展示了其作为“AI+科学”基础模型的潜在作用。

KAN与MLP的对照表：

KAN使神经元之间的非线性转变更加细粒度和多样化。

未来科技 2024年6月5日
这个国家，也开始发芯片补贴了

//mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
[4]中国安防协会：欧盟批准430亿欧元芯片补贴计划：2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
[6]潮电穿戴：印度半导体投资大跃进，一锤砸下1090亿，政府补贴一半.2024.3.5https。

未来科技 2024年6月5日
大模型的电力经济学：中国AI需要多少电力？

这些报告研究对象（数字中心、智能数据中心、加密货币等）、研究市场（全球、中国与美国等）、研究周期（多数截至2030年）各不相同，但基本逻辑大同小异：先根据芯片等硬件的算力与功率，计算出数据中心的用电量，再根据算力增长的预期、芯片能效提升的预期，以及数据中心能效（PUE）提升的预期，来推测未来一段时间内智能数据中心的用电量增长情况。

未来科技 2024年6月5日
你正和20万人一起接受AI面试

原本客户还担心候选人能否接受AI面试这件事，但在2020年以后，候选人进行AI面试的过程已经是完全自动化的，包括面试过程中AI面试官回答候选人的问题，AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

以近屿智能与客户合作的校验周期至少3年来看，方小雷认为AI应用不太可能一下子爆发，包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

未来科技 2024年6月4日

奥特曼回忆OpenAI宫斗第一季：一生中最奇特的时刻

相关推荐