GPT-4o团队引热议：狠狠重任新人，经验职级都是浮云

2024年5月19日 14:18 • 未来科技

具体情况，咱们来扒一扒就清楚了：

做出伟大产品的年轻团队们

本次吃瓜活动，就从最近万众瞩目的GPT-4o背后团队（以下简称Omni团队）下手吧。

想当初，PD哥是以本科毕业生的身份加入OpenAI的，虽然这个本科是MIT（手动狗头）。

此前在OpenAI工作了一年多时间，今年7月份从OpenAI又跳回到谷歌，他可能是唯一一位对GPT-4和Gemini都有贡献的人类了。

GPT-4o亮相没两天，背后Omni团队就被扒了个底朝天：领衔者是DALL·E 2/3研究团队成员、Scaling Law的共同提出者。

更深层次的，团队组成和Sora有着类似的规律：不怕启用新人，并且狠狠重任新人。

这里的“新人”，可能是本科or硕博刚毕业的应届生，也可能是刚加入OpenAI的新成员。

恰如其时地，思维链作者、从谷歌跳槽OpenAI的Jason Wei跳出来，分享了公司内部派活儿的原则：

派给你的活，绝不与你的职级挂钩。

换句话说，即使是初级工程师，只要有想法，就可能被OpenAI委任承担大项目。

而且任命前的评判纯粹根据员工执行表现来，而不是考虑过去这人有过啥优秀业绩。

Jason Wei说，他在OpenAI见过几位毕业不久的工程师，在内部揽了一个重要的大活，他那时候心想，“哇，要是谷歌，这不得让L8/L9的员工来搞？”

好一个任人唯贤！

网友看后感慨万千，感慨OpenAI这样独角兽中的超级独角兽，就是需要这股子劲。

给这样的团队2～3年，你会看到他们带来的惊艳表现。

具体情况，咱们来扒一扒就清楚了：

做出伟大产品的年轻团队们

本次吃瓜活动，就从最近万众瞩目的GPT-4o背后团队（以下简称Omni团队）下手吧。

Omni团队负责人，印度小哥Prafulla Dhariwal（下面我们叫他PD哥）。

你可能不咋熟悉他的名字，但一说他的前作你大概率都认识：DALL·E 2、DALL·E 3、一致性模型，还共同提出了Scaling Law。

谷歌学术显示，这哥的论文引用次数超过了72500次，而且还在不断上升中。

想当初，PD哥是以本科毕业生的身份加入OpenAI的，虽然这个本科是MIT（手动狗头）。

他在MIT主攻计算机科学、数学、物理学，并在MIT大脑、思维和机器中心担任本科生研究员。

据PD哥自我介绍，本科毕业前，他就已经在成立不到1年的OpenAI实习了，然后2017年毕业后正式转正。

我们整理发现，入职前半年，他就参与了Openai baselines的团队项目。

然后次年成为了Glow的共同作者，接下来更是共同提出Scaling Law，参与研究DALL-E 2、DALL-E 3、一致性模型等等。

过去的18个月里，他领衔了GPT-4o的工作。

项目面世后，奥特曼狂赞他，说如果没有PD哥的远见，以及长期以来的才智、信念和决心，就没有GPT-4o。

OpenAI总裁Greg Brockman也说，多亏PD哥“建立全能大模型”的信念，团队才最终搞定了GPT-4o。

夸得太卖力，一下就把PD哥推到了聚光灯下。

PD哥自己在推特表示，GPT-4o是他们团队推出的第一个模型，也是OpenAI首个原生多模态大模型。

经由PD哥在推特对团队成员的在线点名致谢，我们发现，Omni团队里有6位（疑似）华人面孔。

Yu Zhang：加入OpenAI 8个月；此前在Google DeepMind工作6年。他本科毕业于上海交通大学计算机专业。

Huiwen Chang：加入OpenAI 1年；此前在Google待过5年。她的学士学位是在清华大学姚班取得的。

Li Jing：加入OpenAI 2年，曾是Dall-E 3、Sora团队成员。本次负责保障GPT-4o的图像生成、3D生成的能力。本科时，Jing在北大获得物理学学士学位。

Jiahui Yu：加入OpenAI 3年8个月，现带领OpenAI感知团队；入职前参与过Google的Gemini、PaLM 2项目。Yu本科时就读于中国科技大学少年班，学习计算机。

Casey Chu：加入OpenAI已有4年，参与过GPT-4、DALL・E 2的研究。

Mark Chen：加入OpenAI 5年8个月，现任前沿研究主管，曾参与过DALL・E、GPT-4等项目。

当然，Omni团队背后还有大批共同参与者的努力。但就从上述几个人的资料来看，里面既有老手，也有OpenAI新来的员工，并不会因为司龄低，就不给派重要的活。

为了佐证这一点，我们又往前再扒了扒，看看之前的项目是否如此。

比如今年春节发布的Sora。

Sora由两位博士应届生带队研究，这可称为佐证Jason Wei分享的OpenAI用人秘籍的典范材料。

两位负责人，Tim Brooks和William（Bill）Peebles都是2023年刚刚博士毕业，团队里甚至还有00后成员。

其中，Tim是DALL-E 3的作者之一，而William（Bill）Peebles则和谢赛宁合作，搞出了Sora的技术基础之一DiT。

带队Sora的Tim（左）和Bill（右）

看看2020年发布的Jukebox。

这是一个在原始音频域中通过唱歌产生音乐的模型，参与人员就有我们刚入职没两年的PD哥。

当初没掀起什么水花，但着实为现在的GPT-4o培养了音频人才，成为了OpenAI奔赴“Her愿景”的基石之一。

再看看2018年发布的GPT-1。

一切故事都始于万神之源，论文《Attention is All You Need》的出现。论文发表当天，OpenAI刚刚离职的前首席科学家Ilya Sutskever，就意识到“它给了我们想要的一切”。

然后建议同事Alec Radford开始动手研究——彼时距离Alec加入OpenAI才不到2年，也是个本科生。

结果就是，Radford开发了GPT的原型，然后OpenAI调动更多人从机器人、DOTA游戏等项目转型，参与进来开发了GPT-1、GPT-2……

OpenAI沿着这位本科生主导的佳作，开创了今日盛世。

GPT-1论文主力Alec Radford

OpenAI原来是这样

不只是成员履历，其实从OpenAI的组织架构上，就能感知到他们这种任人唯贤的扁平化管理方法。

最明显的是，OpenAI的研究员，大家都叫Member of Technical Staff，没有啥称呼上的差异。

怪不得有网友调侃，OpenAI说初级工程师也能扛大活，但可能你们就没有初级工程师啊……

Greg曾透露，他们曾认真考虑用哪种职位名称，因为不想简单将他们归为研究人员和工程师。

“Member of Technical Staff”这一说法继承自施乐帕克研究中心Alan Kay的建议。

而且整个OpenAI的部门划分也没有很精细，只有数据科学、研究、安全等几个大部门。

但其实不管GPT-4、DALL·E、Sora还是最新的GPT-4o，全部都是项目制的。

整个团队从各个部门抽人组建起来，搭伙干活。

讲道理，在OpenAI，项目归属感可能比部门归属感更强。

除了OpenAI，现在很多科技公司和领导人，包括像马斯克的xAI在内也都按这套方法在搞。

现在，随着Omni团队的揭秘，关于OpenAI组织架构和评判标准再次被讨论。

有网友对这种方式表示赞赏，“这也是为什么我确信创始团队是应届毕业生的新出路”。

当前的市场环境下，这是满足这种雄心壮志的最佳途径，在传统稳定领域想要获得指导和成长变得十分艰难。

像Jason Wei所说，据他观察，一般大公司会对项目有一个隐隐的期望，所以会按职级划分工作内容，项目一般都是自上而下分配的。

重要项目通常派给此前工作表现突出的“值得信赖的”L7或L8，这能保证团队有组织、高可靠性地完成工作。

但是对于一个等待大展拳脚的初级工程师来说，想要他遵守一些无关痛痒的条条框框？

不可能，绝对不可能。指望我把活干好不就完事儿了！

虽然这也是许多公司在初创期的通用做法，但事情因OpenAI这次发布Gpt-4o再次得到曝光后，更多网友开始触景生情，破防了！

顺便再“蛐蛐”一下自家公司的成长体系：别说了，羡慕。

网友自曝其他大厂不这样

一位曾在微软工作的“独立黑客”自述了此前一段伤心经历。

他本来负责一个十分具有挑战性的功能，已经做了所有前期工作，也得到了设计部门的认可。但随后就被要求将项目交给一个高级工程师。因为这个工作不符合“职级要求”。

微软的管理者都精于算计（象棋高手），他们晋升的人选都是事先决定好的，合适的项目会分配给那个人，以证明晋升的合理性。

来自谷歌的现员工和前员工们也表示，谷歌在这方面确实做得很糟糕，就算是在Gemini时代也没有改善。

初级企业的层级结构扁平化，可以有更大的创新空间。

因此也有人警示，OpenAI“在这方面需要加强很多工作”，有前车之鉴在此。

这样的警示并非没有依据。

事实上，如今OpenAI飞速发展，人才规模迅速扩展，已经开始出现一丝丝不好的“苗头”。

ChatGPT发布会之后，OpenAI一度成为全球AI人才向往的圣地，像斯坦福、MIT等顶尖学术机构，微软、谷歌等顶级大厂的人才都在涌入这里。

但这当中，有不少研究类人才来了没过多久又走了，留不住。

典型如OpenAI创始成员、前特斯拉AI总监Andrej Karpathy，2023年ChatGPT发布后二进宫；又在一年之后再次离开，如今正在秘密开发一个项目。

还有又回到谷歌担任DeepMind研究科学家的Shane Gu，仅在OpenAI待了7个月，带领团队进入了日本市场。在此之前，他曾在谷歌待了四年。

2022年5月Shane Gu参与的研究发现，只要加上一句“让我们一步一步地思考”就能让GPT-3做数学题的准确率暴涨61%，引发学术界轰动。

还有其中DeepMind老员工Jack Rae，曾就压缩即智能在Stanford MLSys Seminar发表演讲。

此前在OpenAI工作了一年多时间，今年7月份从OpenAI又跳回到谷歌，他可能是唯一一位对GPT-4和Gemini都有贡献的人类了。

现在，OpenAI正掀起新一波离职潮，且大部分都是技术团队的人才，甚至随着灵魂人物、首席科学家Ilya官宣离职而加剧，超级对齐团队负责人也紧随其后辞职。

而另一边，关于产品、营销方面的人员正在加入。最新消息称，他们还挖来了谷歌搜索广告业务的21年老将。

再加上如今频繁的产品级更新、搜索引擎的布局以及同苹果Siri的合作……更多商业化操作不一而足，OpenAI和奥特曼的野心由此可见。

在这样的情况之下，OpenAI是否还能持续保持领先？

参考链接：

[1]https://x.com/_jasonwei/status/1791192069022810444

声明：该内容为作者独立观点，不代表新零售资讯观点或立场，文章为网友投稿上传，版权归原作者所有，未经允许不得转载。新零售资讯站仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。如对本稿件有异议或投诉，请联系：wuchangxu@youzan.com

Like (1)

苹果提前公布的这个iOS18新功能，可能比AI Siri更有趣

Previous 2024年5月19日

Meta发布“变色龙”混合模态模型，要挑战GPT-4o？

Next 2024年5月19日

水温80度：AI行业真假繁荣的临界点

我们从来没拥有过这么成功的AI主导的产品。

（这种分析统计并不那么准，但大致数量级是差不多的）

这两个产品碰巧可以用来比较有两个原因：

一个是它们在本质上是一种东西，只不过一个更通用，一个更垂直。

蓝海的海峡

未来成功的AI产品是什么样，大致形态已经比较清楚了，从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时“罢工”，全网打工人都慌了

美西时间午夜12点开始，陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载，忽然无法正常工作了。

因为发现AI用久了，导致现在“离了ChatGPT，大脑根本无法运转”。”

等等，又不是只有一个聊天机器人，难道地球离了ChatGPT就不转了。

大模型连崩原因猜想，谷歌躺赢流量激增6成

GPT归位，人们的工作终于又恢复了秩序。

未来科技 2024年6月5日
ChatGPT宕机8小时，谷歌Gemini搜索量激增60%

ChatGPT一天宕机两次

谷歌Gemini搜索量激增近60%

ChatGPT在全球拥有约1.8亿活跃用户，已成为部分人群工作流程的关键部分。

过去24小时内提交的关于OpenAI宕机的问题报告

图片来源：Downdetector

ChatGPT系统崩溃后，有网友在社交媒体X上发帖警告道：“ChatGPT最近发生的2.5小时全球中断，为我们所有依赖AI工具来支持业务的人敲响了警钟。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时大崩溃，AI集体罢工让全网都慌了

接着OpenAI也在官网更新了恢复服务公告，表示“我们经历了一次重大故障，影响了所有ChatGPT用户的所有计划。Generator调查显示，在ChatGPT首次故障后的四小时内，谷歌AI聊天机器人Gemini搜索量激增60%，达到327058次。

而且研究团队表示，“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关，显示出用户把Gemini视为ChatGPT的直接替代选项。

未来科技 2024年6月5日
深度对话苹果iPad团队：玻璃的传承与演变

iPad最为原始的外观专利

没错，这就是iPad最初被设想的样子：全面屏，圆角矩形，纤薄，就像一片掌心里的玻璃。

2010年发布的初代iPad

好在乔布斯的遗志，并未被iPad团队遗忘。

初代iPad宣传片画面

乔布斯赞同这一想法，于是快速将资源投入平板电脑项目，意欲打造一款与众不同的「上网本」，这就是iPad早年的产品定义。

iPad进化的底色

苹果发布会留下过很多「名场面」，初代iPad发布会的末尾就是一例。

未来科技 2024年6月5日
底层逻辑未通，影视业的AI革命正在褪色…

GPT、Sora均为革命性产品，引发了舆论风暴，但它在上个月发布的“多模态语音对谈”Sky语音，却由于声音太像电影明星斯嘉丽·约翰逊，被正主强烈警告，被迫下架。

华尔街日报也在唱衰，认为“AI工具创新步伐正在放缓，实用性有限，运行成本过高”：

首先，互联网上已经没有更多额外的数据供人工智能模型收集、训练。

03、

如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向，那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

但分歧点正在于此，电影公司希望通过使用AI技术来降低成本，但又不希望自己的内容被AI公司所窃取。

未来科技 2024年6月5日
KAN会引起大模型的范式转变吗？

“先变后加”代替“先加后变”的设计，使得KAN的每一个连接都相当于一个“小型网络”，能实现更强的表达能力。

KAN的主要贡献在于，在当前深度学习的背景下重新审视K氏表示定理，将上述创新网络泛化到任意宽度和深度，并以科学发现为目标进行了一系列实验，展示了其作为“AI+科学”基础模型的潜在作用。

KAN与MLP的对照表：

KAN使神经元之间的非线性转变更加细粒度和多样化。

未来科技 2024年6月5日
这个国家，也开始发芯片补贴了

//mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
[4]中国安防协会：欧盟批准430亿欧元芯片补贴计划：2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
[6]潮电穿戴：印度半导体投资大跃进，一锤砸下1090亿，政府补贴一半.2024.3.5https。

未来科技 2024年6月5日
大模型的电力经济学：中国AI需要多少电力？

这些报告研究对象（数字中心、智能数据中心、加密货币等）、研究市场（全球、中国与美国等）、研究周期（多数截至2030年）各不相同，但基本逻辑大同小异：先根据芯片等硬件的算力与功率，计算出数据中心的用电量，再根据算力增长的预期、芯片能效提升的预期，以及数据中心能效（PUE）提升的预期，来推测未来一段时间内智能数据中心的用电量增长情况。

未来科技 2024年6月5日
你正和20万人一起接受AI面试

原本客户还担心候选人能否接受AI面试这件事，但在2020年以后，候选人进行AI面试的过程已经是完全自动化的，包括面试过程中AI面试官回答候选人的问题，AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

以近屿智能与客户合作的校验周期至少3年来看，方小雷认为AI应用不太可能一下子爆发，包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

未来科技 2024年6月4日

GPT-4o团队引热议：狠狠重任新人，经验职级都是浮云

相关推荐