在GPT-4o发布的当天,奥特曼接受了科技博客主Logan Bartlett的专访。这次专访原本约在去年复活节前,但因为OpenAI董事会发生“政变”,奥特曼被解除职务,专访被取消。
现在,奥特曼似乎又在面临宫斗的第二季。公司的联合创始人、首席科学家苏茨克沃(Ilya Sutskever)宣布辞职,与他共同领导公司超级对齐部门的Jan Leike很快也宣布辞职,并且在社交媒体平台X上发文,揭露公司对对齐工作不重视。公司的其他骨干,如负责部署ChatGPT的应用工程部负责人Evan Marikawa等人也宣布辞职。
在人们以为GPT-5即将发布,甚至期待有可能出现“超级智能”之时,AI的安全和对齐技术至关重要。此时,对齐团队出现危机,团队员工要么跟着辞职,要么被吸收到其他团队,这令人担心GPT-5是否安全,或者是否为了安全需要推迟发布。
奥特曼回忆了去年11月董事会“政变”期间,他收到世界各地一二十个国家的总统和总理的问候,以及在那5天期间所承受的极度的压力,他称之为一生中最奇特(surreal)的时刻。
自从宫斗大戏反转,奥特曼复职,并重组董事会后,发起董事会政变的苏茨克沃就再也没有亲自回到公司,他在6个月的时间内远程领导着超级对齐团队。
在专访中,奥特曼还谈起了苏茨克沃。当主持人在问他在OpenAI中所做的最重要的决定时,他承认是苏茨克沃确定了公司最重要的大方向:遵循扩展法则(scaling law)做大语言模型。
“我们最初只是玩机器人和游戏等一些小项目,有人开始研究大语言模型,Ilya坚定地相信它,并且确定了我们的大方向,我们从GPT-1一口气做到GPT-4。”
下面是专访的完整视频。我们节选了其中的一些重要问题,对文字进行了精简和编辑。
Logan Bartlett:OpenAI推出了ChatGPT-4o,你能解释一下为什么这很重要吗?
奥特曼:我认为这种使用电脑的方式不可思议。用声音控制电脑,我们有这样的想法很长一段时间了。你知道,我们有Siri,以前还有其他一些产品。对我来说,之前这些产品在使用上从来没有自然过。但是这个新产品,它的流动性和柔韧性简直太棒了,我简直不敢相信我这么喜欢用它。
Logan Bartlett:有什么实际使用的实例吗?
奥特曼:我刚试用了一周左右的时间。当我在工作的时候,把手机放在桌子上,然后根本不用换界面。我在做某件事的时候,通常会停下手头的工作,切换到另一个标签,比如谷歌,再四处点击。但现在,我只需要提问,它就能给出一个即时的回应,一点也不影响我在电脑上看东西,这是一件非常酷的事情。
Logan Bartlett:大胆猜测一下,也许下次大型发布会时,ChatGPT不会出现,不是GPT-5而是其他一些什么产品?因为我感觉你们已经采用了一种迭代的方法来开发模型。
奥特曼:说真的我们还不知道,我想我学到的一件事是:AI并不总是带来惊喜。
你知道科技公司发布产品的传统方式,但我们可能应该做一些不同的事情。我们仍然可以叫它GPT-5,并以不同的方式发布它,或者我们也可以给它一个别的名字。
不过,如何为这些东西命名对我来说并没有什么特别的意义,比方说发布从GPT-1到GPT-4。显然GTP-4会继续变得更好。
我们也有这样的想法,可能会有一个潜在的、类似于虚拟大脑的东西,它可以在某些情况下更加努力地思考。或者可能是不同的模型。所以目前我们还不知道如何去在市场上推广我们的产品。
Logan Bartlett:这是否意味着,在模型上取得增量进展的计算需求可能比历史上的要少?
奥特曼:我认为我们会尽可能多地使用计算。我们发现了令人难以置信的效率提升,这一点非常重要。
语音模型是我们推出的一个很酷的东西,但也许最重要的是,我们能够使它如此高效地为免费用户提供服务,简直可以说得上是世界上最好的模型。GPT-4o和GPT-4 Turbo的效率得到了很大的提升。
Logan Bartlett:你认为在未来12个月,有哪些应用或领域是最有前途的?
奥特曼:我认为编码是一个非常重要的问题。深度专门化模型是针对特定目的、特定数据进行训练的,而通用模型是能够进行真正推理的。我敢打赌通用模型才是最重要的。
如果模型可以进行通用推理,如果它可以计算出新的东西,那么如果它需要计算出一种新的数据,你可以输入提示,它就能做到——但反过来就不行。
我认为一堆专门化的模型放在一起并不能得出通用推理,因此我认为最重要的是弄清楚真正的推理能力,然后我们可以将它用于各种各样的事情。
Logan Bartlett:你认为人类和人工智能之间的主要交流方式是什么?
奥特曼:自然语言就很好了。我们应该设计一个人类和OpenAI可以共同使用,并且以同样的方式使用的未来。比起其他形式的机器人,我对人形机器人更感兴趣。因为我认为这个世界是为人类设计的,我不希望它被重新配置成更高效的东西。
Logan Bartlett:在需求方面,你是否觉得世界需要更多的人工智能基础设施?
奥特曼:首先,我很有信心我们会设法降低现有系统的成本;我也相信,随着我们这样做,需求将大幅增加;第三,我相信通过建立更大更好的系统,也将会有更多的需求。
我们都应该希望有一个非常智能、非常便宜的世界,人们用它做各种各样的事情:我想要阅读我所有的邮件,然后帮我回复;我想要治疗癌症。你当然会选择治疗癌症,但答案是,你喜欢让它同时做这两件事,我只是想确保我们有足够的钱来做这些。
Logan Bartlett:你认为在GPT飞速发展的当下,能够活下来的人工智能企业的特点是什么?
奥特曼:我发现唯一适用于此的框架是,你创办企业的理念,可以是下注下一个模型不会很好,也可以是下注下一个模型会令你获益。
我的建议是,在大多数情况下,你不是在建立一家人工智能企业,而是在建立一家企业,人工智能只是一种你可以使用的技术。
在应用商店的早期,有很多应用填补了一些非常明显的不足,但最终苹果修复了这个问题:你不需要一直从应用商店里下载手电筒应用,现在这已经是操作系统的一部分。像Uber这样的产品是用智能手机来实现的,但确实建立了一个非常可靠的长期业务。然后你只需要选择后一种。
Logan Bartlett:请给那些想要主动为这些颠覆做好准备的CEO们一些建议。
奥特曼:我敢说,信息作为一种服务,每年都在变得更好更便宜,这是必要的,但不足以让你胜出。
所以那些花了几年时间来实施这些的大公司,你可以打败他们的,其他所有的创业公司也会这样做。因此你仍然需要弄清楚,你的企业的长期防御能力是什么。
Logan Bartlett:你认为达到AGI(通用人工智能)的最大障碍是什么?
奥特曼:我认为最大的障碍是新的研究。从互联网软件到人工智能,我必须学会的一件事是,研究工作的时间表与工程不同。这通常意味着它需要更长的时间,但有时意味着它的工作速度比任何人预测的都要快得多。在科学和工程上有许多这样的例子,从建立理论,到在实验中发现并且证实,再到实际的应用,是一个漫长的过程。有些停留在理论的层面上百年了,但有些在突破之后,以惊人的速度变化。
Logan Bartlett:模型变得越来越聪明,你认为什么是人类独有的?
奥特曼:大模型开始具备越来越多的能力,我认为很多很多年以后,人类仍然会关心其他人类。我认为我们是如此倾向于长期关注,以各种各样的、大大小小的方式——都是对其他人的痴迷。你可能不会在意人工智能歌剧,即使你听到了,你也不会在意,我们也不会去看机器人踢足球。
Logan Bartlett:你是如何看待AI的未来的?
奥特曼:如果五年后你要给我发短信,我想你得弄清楚你是不是在给“我”还是我的人工智能助手发短信。如果是我的人工智能助手,它会把信息整合在一起,然后你会得到回复。如果它可以很容易地做一些人类助手做的事情,那么我认为把这些东西分开是有价值的。
并不是说,人工智能真的只是我的延伸,我不知道我是在和Sam还是Sam的人工智能鬼魂说话,但没关系,因为它们是一样的,这是一个合并的实体。我不想觉得这个东西就像我的怪异延伸,它是一个独立的实体,我可以跨越障碍与之交流。
Logan Bartlett:你认为大学教育系统应该做出哪些具体的改变,来为未来做好准备?
奥特曼:最大的问题是,我认为人们不仅应该被允许,而且应该被要求使用这些工具。在某些情况下,我们希望人们用传统的方法做一些事情,因为这有助于理解。比方说,考试中没有计算器,但在现实生活中,你会使用计算器,所以你需要理解它,需要熟练使用它。如果你在数学课上从来没有使用过计算器,你就会不太擅长你以后需要做的工作。所以我认为应该训练人们使用人工智能,这将是未来做有价值工作的重要组成部分。