微软、OpenAI自研AI芯片,想站着把钱赚了?

图源:OpenAI官网

最近自研AI芯片的大厂非常多,比如英伟达的六大客户,微软、特斯拉、谷歌、亚马逊、Meta加上OpenAI都传出自研AI芯片的消息。

抢卡早已是共识,即便H100成本大约3000美金,而售价则是35000刀,即便英伟达毛利率近70%,也挡不住大厂们势要打造“人无我有”的超强算力,以及不管怎样,相比于老款芯片更高的“单美元效率”。

天下苦英伟达久矣。

10月6日,路透社报道称,有消息表示OpenAI正在探索打造自研AI芯片,并在评估潜在的收购目标。

在OpenAI的官网上,也能发现几个可能与自研芯片相关的岗位,比如这个图形编译工程师,年薪24.5万~38.5万美元。

插个题外话,OpenAI几乎所有岗位都享受微软今年新公布的一个政策“Unlimited time off”,就是字面意思,无限制假期,想怎么休就怎么休。

图源:OpenAI官网

最近自研AI芯片的大厂非常多,比如英伟达的六大客户,微软、特斯拉、谷歌、亚马逊、Meta加上OpenAI都传出自研AI芯片的消息。

不过有意思的是,作为大股东的微软,其自研芯片项目“雅典娜”(Athena)和OpenAI此次传出的消息并不是一回事,二者大有各过各的感觉。

自研归自研,大家心里其实千言万语就一句话:咱都是有头有脸的人,凭啥天天跪在黄老爷门前求卡?

自ChatGPT掀起大模型浪潮以来,英伟达的GPU便持续供不应求,这种状况在H100问世,相较于前任A100,在原本一个星期的工作量,现在只需要20个小时的性能加持下,争抢H100这事更是愈演愈烈形成军备竞赛。

Nvidia vs. AMD vs. Intel: 历年AI芯片销量对比. 图片来源: Visual capitalist

要知道,AI不赚钱早已是产业共识,红杉就有分析师算了一笔账,称当前全球AI产业的收入和支出之间,存在一笔每年1250亿美元的巨大缺口。

这一缺口,一方面是数据中心的庞大能源消耗所导致的,另一方面则是买芯片搞基建带来的资本开支。

抢卡早已是共识,即便H100成本大约3000美金,而售价则是35000刀,即便英伟达毛利率近70%,也挡不住大厂们势要打造“人无我有”的超强算力,以及不管怎样,相比于老款芯片更高的“单美元效率”。

这也难怪马斯克会抱怨“现在连狗都在买GPU”,也有公司拿着一纸英伟达的H100“供货承诺”,就能拿到23亿美元的债务融资。

也不知道如果拿着贵州茅台承诺卖我10万箱飞天的承诺书,能不能去银行贷款。

给黄老爷纳贡是一回事,耽误不了回家自己打小算盘。这不马斯克刚骂完,就在7月推出了由定制AI芯片D1所打造的Dojo超级计算机,用以训练其自动驾驶系统。

摩根士丹利也很配合,赶紧发了篇研报表示:我们算了算,特斯拉这套系统比过去用英伟达的A100足足省下了65亿美元。

这套系统比用英伟达更强,并不是说在芯片设计方面特斯拉就超越英伟达了,只是由于相较于英伟达GPU讲究一个“卖给谁都能用”的通用性,Dojo专注于特斯拉的自动驾驶训练,针对性更强,从而实现更高的效率。

归根结底,就是更便宜。

实际上这也是所有大厂要去自研AI芯片的主要原因:意图提高与自身训练目标的匹配度,以降低算力和功耗的“浪费”。

大厂们抱怨太贵,还只是短时间影响一下财报的美观程度,那“买不到”这事,可是实打实的影响企业的长期发展。

有预测称,2023年英伟达H100的出货量大概在50万张,但随着AIGC应用以及AGI的迭代升级,算力需求将会持续水涨船高,金融时报预测称2024年H100的出货量将高达150万张-200万张。

芯片供不应求是铁打的现实,今年5月底, ChatGPT之父阿尔特曼就公开表示目前OpenAI的GPU极其有限,这推迟了他们的许多短期计划,并且“大部分问题都是GPU短缺造成的”。

当然,随着产能爬坡,这种缺口肯定会有所缓解,可这核心技术掌握在外人手里,多少有种随时会上来卡一下脖子的错觉。

Analytics India Magazine又算了一笔账,“如果OpenAI继续以目前的速度烧钱,极有可能会在2024年底破产”。

这种话扔谁头上能不着急?

自研一方面是“节流”,同时还有“开源”的可能性,虽说自研芯片是根据企业自身情况所开发的“定制款”,但魔改一下谁说就不能卖给同行?

高通很多车机芯片不就是原来手机芯片改改,再拿去卖的嘛。

同时,OpenAI还有出售专有定制化模型的业务,而这块业务受限于算力紧缺和英伟达GPU过于标准化的原因,现在的销售模式是要求客户在啥玩意都没有的情况下先支付10万美元的定金。

好家伙,贾会计的车都还有宣传片呢,到它这直接打白条了,这能有几个大冤种愿意买?

自研芯片好处确实多,但摆在眼前的困难就有两个:CUDA和带宽。

CUDA这种英伟达研发的编程语言,其实才是它能够把GPU卖到如此高价而客户又不得不接受的主要原因,一位业界人士在比较GPU和ASIC(定制芯片)时,用了这样一个比较:“平时开车,你可以用普锐斯,但如果你必须在山上用四轮驱动,用吉普牧马人就会更合适。”

关于CUDA的来龙去脉这里就不过多解释,有兴趣的读者可以移步我们之前发过的一篇文章《疯狂的H100》。

那么当这些大厂纷纷自研芯片的时候,早已熟悉了CUDA编程语言的开发者们还得重新学一门新的编程语言,这谁愿意?

要么就会遇到过去曾经发生过的问题,有位私有云公司的CEO在接受采访时说过,他们也不是没想过转去买AMD的卡,但要把这些卡调试到正常运转至少需要两个月的时间。

等于造出来大概率还是得自己用。

另一个问题是带宽,简单理解,如果说强大算力是一台豪华跑车,那么带宽就是马路,路修得不好,车再高级也得憋着。

如果各位有自己组装过机箱的,应该都看到过PCIe插槽,这玩意学名叫外围组件快速互连,其实就是一种高带宽线,用于显卡、固态硬盘、无线网卡等等外设之间的高速数据传输。

而AI服务器通常都是多个CPU和GPU堆叠在一起组成一个“算力包”构成的,那么在CPU和GPU之间,GPU和GPU之间同样需要数据传输。

这个时候,PCIe协议就派上用场了,而AI服务器为保证传输效率,至少要PCle 4.0、5.0及以上版本,这技术专利只掌握在少数几家公司手里。

英伟达自己用的是NVLink,也是一种高带宽线,保证了GPU和GPU之间的高速传输。

那么自研芯片的各位怎么办?这里又有一位大佬,名叫Broadcom(博通)

简单来说,这家公司拥有这种适用于AI服务器的高速数据传输技术专利,想要用,还得向它买。

谷歌当年在研发自家芯片(TPU)的时候,就是和博通合作开发,最近谷歌还想和博通分家,最后还是没能实现,Meta自研芯片同样也是和博通合作,苹果至今仍是博通的最大客户。

据悉,受益于定制芯片市场的火热,博通CEO Hock Tan在今年6月财报后电话会议上表示:“AI热潮下,大量公司对AI芯片的需求将使该公司AI相关营收翻番,预计下一财年AI相关营收将增至约75亿美元,AI芯片收入很快就会超过公司总营收的25%。”

在过去一年里,博通的股价已然翻倍。

合着就算大家能想尽办法避开了英伟达,还是得给博通交税呗?

就算真自研了,那至少也是以年为单位的万里长征,很长一段时间里OpenAI还是高度依赖英伟达。

黄老爷着实是又高又硬。

亦感谢实习生马文琦对本文的贡献

参考材料:

[1]这颗博通芯片,涨到14万,芯世相

[2]To Reduce AI Costs, Google Wants to Ditch Broadcom as Its TPU Server Chip Supplier,The information

[3]Unlocking Tesla’s AI Mojo… Enter the Dojo: Upgrade to OW, PT$400, Top Pick,摩根士丹利

本文来自微信公众号:新硅NewGeek(ID:gh_b2beba60958f),作者:张泽一,编辑:戴老板,视觉设计:疏睿

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2023年10月13日 16:15
Next 2023年10月13日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日