生成式AI:三块短板、两道难题、一个悖论

2019-2023年全球GenAI的融资笔数和融资额

当下的GenAI热潮起源于美国产业界,实际上美国政府也高度重视,提出了“确保继续保持领导地位”的战略目标。

自ChatGPT发布以来我国十大互联网公司的市值涨跌情况
来源:根据雪球财经数据整理,数据截至2024年4月11日

大模型训练需要耗费大量算力,根据A16Z(2023)的数据,GenAI总收入的10-20%将流向云服务提供商。

炼大模型,大炼模型

近年是全球风险投资的低潮,生成式AI(GenAI)却逆市而起,去年的融资笔数和融资额分别增长66%和400%(来源:CB Insight,如下图所示),融资额高居所有细分领域第一位(来源:Dealroom.co)

去年美国前5大风险投资中,OpenAI、Anthropic(2笔)和Inflection AI三家GenAI公司占据了4个,融资额分别高达100亿美元、40亿美元、20亿美元和13亿美元,主要投资者是微软、亚马逊、谷歌和英伟达等巨头(来源:Crunchbase)

2019-2023年全球GenAI的融资笔数和融资额

当下的GenAI热潮起源于美国产业界,实际上美国政府也高度重视,提出了“确保继续保持领导地位”的战略目标。在奥巴马时期,美国白宫发布《国家人工智能研发战略计划》(2016),特朗普时期(2019)和拜登时期(2023)分别对其进行了更新,从而形成了9大战略——长期投资、人和AI协作、伦理、安全、数据集、评估标准、人才、公私合作、国际合作。为推进战略执行和落地,美国白宫科技政策办公室(OSTP)相继设置了人工智能特别委员会(2018)和国家人工智能倡议办公室(2021)

国内也炼大模型、大炼模型。今年一季度,全球前三大GenAI风险投资中,我国占其二——月之暗面10亿美元A轮融资和MiniMax 6亿美元融资。电信运营商、手机厂商、家电厂商、汽车公司、软件公司、AI公司、互联网公司、电商等各类型的企业纷纷涉足,已有117个大模型通过国家生成式人工智能服务备案。大模型成为大厂标配。不过并没有短兵相接的“百模大战”,反而颇有井水不犯河水之意。

三块短板

我国人工智能位居世界前列。但也存在尚待补齐的短板,集中体现在算力、数据集和人才三个方面。

一是算力。GenAI以算力堆积实现智能涌现,其成功依赖暴力美学。

根据Jaime Sevilla等人的研究(2022),在前深度学习时代(1952-2009),算力需求每21.3个月翻一番,符合摩尔定律;在深度学习时代(2010-2022),算力需求加快到每5.6个月翻一番。如下图所示。根据THE DECODER披露(2023),GPT-4的每秒浮点运算次数(FLOPs)达到2.15×10^25,一次训练成本6300万美元。

里程碑机器学习系统的训练算力需求

来源:Sevilla J, Heim L, Ho A, et al. Compute trends across three eras of machine learning. 2022.

在机器学习图形处理器领域,英伟达占有95%的市场份额(来源:New Street Research,2023)。英伟达的A100和H100芯片是训练大模型的“金刚钻”,具有不可替代性。由于美国对华GPU限令,我国面临卡脖子现实。

二是数据集。我国数据规模大。根据国家互联网信息办公室《数字中国发展报告(2022年)》,2022年我国数据产量8.1ZB,全球占比10.5%,位居世界第二。这被看作发展相关产业的优势。

然而,规模优势不足以弥补质量欠缺。不管把多大数量的马车连续相加,也决不能得到一条铁路(熊彼特,1934)。数据质量至少同等重要。在Hugging Face的高质量数据集中,英语以37.7%的比重位居第一位,中文仅占3.2%,和波兰语并列第九(来源:OECD,2023)。如下图所示。我国数据集的质量仍有待进一步提升。当然,这非一日之功,需要历经岁月的积累。

三是人才。自1966年以来,全世界共有77人获得图灵奖。其中只有一名华人——姚期智(2000)。我国计算机科学的历史积淀尚有不足,所幸近年进步很大,成为美国最大的竞争对手。

根据MacroPolo数据(2024),全球最顶级(前2%)AI研究人员的原籍国中,我国以26%的比例逼近美国(28%),位居第二位。在顶级(前20%)AI研究人员的原籍国中,我国有47%,远超美国(18%)

但仍有隐忧,在最顶级(前2%)AI研究人员的就业国家中,我国仍位居第二,但仅有12%,远落后于美国(57%)。如下表所示。GenAI高度依赖人们的创新能力。如何吸引全球顶尖人才来华创业、就业,是需要努力的方向。

全球AI人才的分布比例 

来源:根据MacroPolo(2024)数据整理

两道难题

每次创新都不是轻而易举的,都需要破除很多困难,遭受人们的质疑。当前的GenAI面临以下两个比较突出的问题。当然,只有发展才能解决问题。

一是缺乏杀手级应用,面临商业化困难。伟大的时代,必有杀手级应用。例如PC时代的Office,桌面互联网时代的搜索,移动互联网时代的手机支付。GenAI是世界潮流,然而还处于应用推广的早期,美国企业的AI采用率仅有5.4%(来源:人口普查局,2024)

大模型燃烧的是美元,产出是更少的美元。作为全球最性感的GenAI公司, OpenAI有会员订阅付费、开发者付费和微软分成三种盈利模式,自成立以来的收入累计不足20亿美元(来源:Finbold),却耗费了113亿美元融资。微软的GitHub Copilot也采用会员订阅模式,用户需支付10美元月费或100美元年费。但因计算成本高,微软平均每月在每个用户上的亏损超过20美元,重度用户高达 80 美元(来源:华尔街日报,2023.10)

GenAI尚不具备传统软件的规模经济,需要通过给用户巨额补贴来培育市场。国内用户则更喜欢免费,为优质内容和知识付费的习惯尚未形成,会员订阅不成主流。GenAI的商业模式仍处于探索的初期。

二是未能显著提振平台企业业绩,云和芯片是最大受益者。GenAI的兴起为我国平台经济注入了一线生机,各大平台纷纷下场推出大模型。然而,GenAI的火爆未能显著提振平台企业的业绩,我国互联网平台仍处于萎靡期。自ChatGPT发布以来,尽管叠加了疫情结束、国家支持等利好因素,我国互联网公司的市值仍有涨有跌,相当大比例的企业跌幅较大,如下图所示。

自ChatGPT发布以来我国十大互联网公司的市值涨跌情况

来源:根据雪球财经数据整理,数据截至2024年4月11日

大模型训练需要耗费大量算力,根据A16Z(2023)的数据,GenAI总收入的10-20%将流向云服务提供商。其中,创业公司 80%-90%的早期融资都用于向云计算平台购买算力。微软、亚马逊和谷歌是全球三大云基础设施服务商,也是最活跃的GenAI投资者,就不足为奇了。自ChatGPT发布以来,英伟达市值增长457%,成为全球市值第三高的公司,是最大获益者。

第四次工业革命的悖论

自1956年达特茅斯会议提出“人工智能”术语以来,人工智能的发展起起伏伏,经历了多次炒作周期。这次似乎不一样,即使对怀疑论者来说,ChatGPT的发布也意味着人工智能技术的重大突破。人们兴奋大呼:人工智能驱动的第四次工业革命正在到来。

工业革命的影响是全面的、深刻的、长远的,“综观世界经济史,工业革命是唯一一件大事”(Irad Kimhi,2006)。第四次工业革命如果到来,人们必会踌躇满志,经济必会生机蓬勃,生活必会欣欣向荣。然而,好像并不是。这是一个悖论。对此,时间可以给出答案,我们不必争论。有四个事实予以说明:

第一,人们对“智能”怀有与生俱来的痴迷,人工智能的发展充斥着乐观思潮。谢耘(2023)对其评价是:“志存高远,盲目乐观。”达特茅斯会议的主要参与者就曾作出大胆预言:

1958年,艾伦·纽厄尔和赫伯特·西蒙(两人共同获得1975图灵奖):“十年之内,数字计算机将成为国际象棋世界冠军”,“十年之内,数字计算机将发现并证明一个重要的数学定理”。

1965年,赫伯特·西蒙(1978年诺贝尔经济学奖获得者):“二十年内,机器将能完成人能做到的一切工作。”

1970年,马文·闵斯基(1969图灵奖获得者):“在三到八年的时间里,我们将得到一台具有人类平均智能的机器。”

第二,自2009年以来我们时刻在“经历”第四次工业革命(也有人说是第三次工业革命)。在中国知网上,以“第四次工业革命”和“第四次产业革命”为题名的文章分别有386篇和48篇(不计入2024年),如下图所示。

微电子(1984)、云计算(2012)、物联网(2016)、大数据(2016)、区块链(2017)、工业互联网(2017)、新基建(2020)等,都曾被赋以“第四次工业革命”的使命。现在轮到GenAI了。这意味着,GenAI需要达到与蒸汽机、发电机、内燃机、计算机和互联网一样的高度。

中国知网以“第四次工业(产业)革命”为题名的文章分布

第三,国外一般把GenAI(或AI)比作智能手机、云计算、互联网等特定技术,且通常使用“可能”“之一”等词汇。例如:

黄仁勋(2023.2):ChatGPT是“the iPhone moment of AI”, OpenAI所做工作是“one of the greatest things that have ever been done for computing”。

比尔·盖茨在《The Age of AI has begun》(2023.3)中表示,图形用户界面和GPT是他一生中见证过的两次革命性技术展示,并指出:“人工智能的发展与微处理器、个人电脑、互联网和移动电话的诞生一样重要。”

亚马逊CEO贾西致股东信(2024.4):“Generative AI may be the largest technology transformation since the cloud (which itself, is still in the early stages), and perhaps since the Internet.”

第四,历次工业革命都不是预测的结果,而是后人的总结。第一次工业革命(1760-1840)结束40年后,术语“Industrial Revolution”才在阿诺德·汤因比的推动下为大众所知;第二次工业革命(1870-1914)结束40年后,经济学家才开始使用“Second Industrial Revolution”,到1969年戴维·兰德斯《不受束缚的普罗米修斯》才标准化了其学术定义;第三次工业革命尚无统一认知,暂且不表。这颇有“伟大不能被计划”的味道,让我们期待第四次工业革命的不同之处。

本文写作中,得到马骏、马源、石光、王明辉、李勇坚、白惠天等人的支持和帮助,在此一并感谢。

本文来自微信公众号:腾讯研究院 (ID:cyberlawrc),作者:闫德利

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年4月24日 18:00
下一篇 2024年4月24日 18:11

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日