Gary Marcus曾开过一个玩笑:“几年前,如果你的初创公司域名中有.ai,那么你可以在你的估值后面加一个零。现在呢,可能会是两个零,尤其当你说自己正在用生成式AI。”
这句话道出了行业的最大疑虑:就目前来看,生成式人工智能是被过度炒作了吗?
今年10月,全球科技研究和咨询公司CCS Insight发布预测报告称:2023年大热的生成式人工智能领域将在2024年接受现实的检验。具体表现为:技术炒作逐渐消退,运行成本不断上升,监管呼声越来越多,投资人不再像之前那样兴奋和乐观。
近期,比尔.盖茨在接受德国《商报》(Handelsblatt)采访时也表示:“OpenAI内部包括Atlman在内的很多人,都相信GPT-5将明显优于GPT-4。但我有很多理由相信当前生成式人工智能已经达到极限。”
人们倾向于在短期内高估一项技术的效果,并在长期低估其效果。现在谁都知道生成式AI尚处在“尴尬的青春期”,但对这个青春期要持续多久,什么时候转变,还不是非常清晰。
而对于早期投资者而言,能够准确判断转机至关重要。
前几日,“华尔街TMT之王”美国对冲基金Coatue发布了一份115页的报告(The AI Revolution),360度无死角分析了当前AI所处的阶段、AI能否跨越炒作周期、开源和闭源、以AI为中心的生态系统等等。
其中,Coatue明确指出:AI不是炒作,关于AI的黄金时代还没有到来。
一直以来,Coatue对AI都寄予厚望。在今年6月发布的Investor Deck中,Coatue进一步指出衰退时代已经来了,但同时指出下一个科技超级周期的“突破”时刻:AI可能成为经济新的生命线。
而多年来,这家头部基金在应对不同周期的实际策略和对宏观的理解也超过大多数同行,稳稳地把控着科技行业的脉络。
例如2020年,全球疫情最糟糕的情况下,Coatue Management的创立者Philippe Laffont凭借精准的投资眼光,成为全球十大对冲基金经理第七名。
2022年,在美国大通胀、未盈利科技股大幅下跌的时刻,Coatue提前谋划回撤,腾出了近80%的现金。
这份115页的报告更是信息量满满,适道将从中截取的关键信息,进行整合。
2024年,AI炒作会结束?
首先,Coatue对AI的发展现状给出了一个清晰的定位。
新技术在美国达到50%用户渗透率的时间对比,PC用了20年,互联网用了12年,智能手机用了6年,而生成式AI大概只用3年。
另一个对比:1986年,S&P 500公司创造$1m收入要雇佣约7.8人,现在是5.1人,而未来在AI时代,这个数字会少于3人。
在此背景下,Coatue于2022-2023年迅速扩大了AI投资组合。其中就包括最近陷入风波的Stability AI。据悉,Coatue Management写信要求其创始人Mostaque下台,并要求公司提供Mostaque和其他高管的薪酬细节。
接着,报告进入了第一个主题:AI是炒作吗?
炒作有三大特征:1. 入账价值与投资不符,1990年代的光纤;2. 高估技术发展的时间和能力,自动驾驶;3. 技术尚未成熟导致缺乏普遍的实用性,量子计算。
Coatue针对以上三点分别进行回击,明确指出AI不是炒作。
1. 大多数 AI 投资都聚焦在模型层面(占比60%),入账价值已经显现;
不过,对于谁才是大模型的赢家,Coatue特意在报告中用了一页PPT表示:我也不知道。
虽然今年年中ChatGPT访问量有所下降,但在推出新功能后,其使用量比8月份增长了27%。至于未来情况如何,我们拭目以待。
2. 比起从“L1-L4”花费15年的“烧钱黑洞”自动驾驶,在过去的5年间,AI已经表现出了自己的有效性,例如现在AI autopilots已经能够自主完成复杂任务,大概达到了自动驾驶L3的水平。即便处于早期阶段,但有60%的企业都计划采用AI。
而且,在基准测试中,未来模型达到与人类水平的时间正在缩短。这点大家从GPT-3.5“小学生”和GPT-4.0“博士生”呈现出的巨大差异就能发现。
3. 目前量子计算空有理论,甚至还没有被证实,但AI已在各个领域证明了其实用性,例如开发人员使用Copilot Github节省了55%时间;在Runway上编辑视频节约了90%的时间等等。
一家名为的Finicch公司,使用AI客服节省了95%的人工成本;将回复时间从45分钟降至1分钟;客户满意度从55%提高至69%。
另外,咨询等知识型工作也会被AI改变。研究显示,BCG的顾问在使用AI后所有任务都表现更佳,工作质量提高了40%。
总体来看,Coatue认为AI技术演进日新月异,企业和民众采用意愿积极,且AI已经在一些领域切实地提升了生产力。因此,AI不是一场炒作。
目前支持“AI炒作论”的声音主要分三种:1. 智能化程度不够,以至于2023年势头太猛,需要洗个“冷水澡”;2. 投资人不想花钱,运行成本太高,毕竟连微软的GitHub Copilot都在亏钱;3. 监管问题,悬在AI头上的“达摩克利斯之剑”。
适道认为:首先,与其说2024年AI会凉,不如说热钱退潮期,一些产品匹配不上市场预期,没有技术护城河的AI企业会凉,最多只算公司层面上的“炒作”(在此反复“鞭尸”Jasper),完全称不上整个行业的炒作。
其次,算力成本过高其实是一个短期问题,毕竟任何新事物刚出现时成本都会很高,包括互联网。就目前来看,可以通过优化算法底层降低成本。现在有许多开源的大型模型,发布了新的优化方法,大家都在通过各种各样的方法将训练微调模型的成本降到最低。
目前来看,不那么容易“降本”的是硬件。借用马斯克的一句话:“英伟达不会永远在大规模训练和推理芯片市场占据垄断地位。”
如今,六大门派正在围攻英伟达的光明顶。前有英特尔、AMD等半导体巨头公布新一轮的AI芯片研发计划,后有OpenAI、微软等下游客户推动自研芯片,自己做“铲”自己挖。从国内来看,也有4-5家企业卷在芯片的赛道里。甚至有业内人士乐观估计:“AI芯片赛道会在年底再度爆发,芯片危机最快会在明年解决。”
长期来看,根据莱特定律,AI相关计算单元(RCU)的生产成本和软件成本将分别以每年57%和47%的速度下降。到2030年,硬件和软件的融合可以使AI培训成本以每年70%的速度下降,生成式AI将创造数百万亿美元的经济价值。
降本的同时是增效。根据ARK的研究,2030年生成式AI将使知识工作者的生产力提高4倍以上。在100%采用AI的情况下,全球劳动生产率将提高约200万亿美元。诸如Copilot等AI编码助手在2030年可以使软件工程师的产出增加10倍左右。
无论是现在还是未来,AI都完全称不上一个“炒作”产物。
那么现在就只剩下监管问题。
对此,Coatue在报告中明确表达了担忧。在调查中,有83%的受访者不信任AI安全,甚至有57%的受访者支持此前的“暂停AI开发6个月”倡议。但根据斯坦福的研究,目前大部分AI模型不符合EU AI Act的要求。
今年11月初,首届全球人工智能(AI)安全峰会在英国召开,包括中国、美国、英国和欧盟在内的超过25个国家代表,以及马斯克、Sam Altman等科技巨头与会,最终参会所有成员国签署《布莱切利宣言》,同意通过国际合作,建立人工智能(AI)监管方法。
开源好还是闭源香?
对此,Coatue认为开源是AI的心脏,且开放社区生态对AI的下一步发展至关重要。同时AI社区的开发者正在迅猛增长,软件开发人员变成AI工程师,业余爱好者也参与其中。
但尽管如此,目前不同的AI模型开放程度不同。
Coatue认为,在此背景下,数据就变成了一种货币,Reddit和X都已经为训练数据读取收费。Reddit对5000万次API调用收取12000美元;X则是每月5000美元可以刷100万篇帖子。
尽管如此,Coatue发现开源模型的水平也在迅速追赶闭源模型,蓝色是开源,绿色是闭源。
其实对于开源和闭源之争,适道在这里引用中科院院士、CCF开源发展委员会主任王怀民教授的一段话:
“在一个确定性的时代,比如确定性PC时代,微软以它的企业组织模式封闭推进一个产品的开发,我们称为单性繁殖,每个新的产品都由微软定义,这种模式在应对确定性的发展态势的时候它是有竞争力的,个人计算机的发展是微软的成功。
但是在互联网时代到来时,在一个不确定性的互联网时代要适应可能性,开源竞争力就强了,开源Linux这个社区发布一个核心版本,更多人在这个核心版本上根据他对需求和领域的理解进行不断地修改,形成了双性繁殖,能够产生或者低成本产生更多的适应未来发展的新版本,就是有一个种子复制,大家都可以复制,根据自己对未来变化的理解产生一个新版本,开源出来来适应一个环境,由环境来评价,然后再迭代回来不断地开发。
而这个新版本并不是由一家企业完成的,是由全社会参与者,当然也包括一些新的创新企业在其中推动这个工作。因此它产生适应未来不确定性的新版本的参与的人数和对于参与者来讲的成本相对于过去微软的一家大公司的组织模式成为了一个模式。开源在不确定性的时代更加有竞争力。”
如今我们又站在了一个不那么确定的人工智能时代,开源更多是一个创新方向。而开源与闭源的竞争,并不是在某一个领域,而是各自走出一条差异化的道路,迎来自己的天地。
但就初创企业的角度来讲,闭源大模型显然更具商业价值。有观点认为:大模型的商业化尽头是产业,而大模型走向产业,落地还是要靠闭源。
不过,如果已经有了例如Llama 2这样强大的开源大模型,还有人愿意用闭源吗?
有,但大家想用的一定是“卷王之王”。
例如ChatGPT,在Llama 2(水平类似ChatGPT 3.5)已经发布的背景下,如上文所述,即便今年年中访问量有所下降,但在推出新功能后,其使用量比8月份增长了27%。
也就是说,一些本就占据优势的企业才能成为“闭源之王”,它们在实现大型模型的全面商业化和产业化方面也更具有优势。
对此,其他企业还是不必“死磕”闭源大模型,毕竟数据都变成货币了,多刷点帖子又要给马斯克添钱了。
以AI为中心的生态系统
在这部分,Coatue提出了一个新范式:CPU+Software=计算机——GPU+AI=人类大脑。
Coatue认为,AI将开创“智能即服务IQaas”时代。
在提升模型性能方面,Coatue着重提出了数据的重要性,包括数据质量、数据数量、数据稀缺性、优化微调方法都会成为关键因素。
具体来看:
1. 训练数据集中的token数量呈上升趋势,训练模型的前提是增加数据集;
2. 到2026年,高质量文本数据可能很快耗尽,而图像和视频数据可以维持到2024年,数据稀缺性可能成为训练模型时的一项潜在障碍;
3. 数据质量和数量同样重要,有证据表明,在精简过的数据集上进行训练,会达到与在完整数据集上训练相似甚至更好的效果;
4. 合成生成的数据有助于清洗、提炼数据集,以便进行微调,尽管目前仍然无法与真实数据相媲美。
另外,通过用户反馈数据改进模型也是一条有效的优化之路,以Midjourney为例。
在后面一部分,Coatue认为对GPU的需求才刚刚开始。
同时,Coatue预测到2026年将会带来超过50%的新增能源需求,并会给云市场的增长和半导体行业带来大量机会。
不过,在边缘设备上运行AI模型可能有助于缓解GPU短缺的问题。比如Apple芯片本地模型运行的速度与GPU上运行居然一样快。
最后,Coatue提出了一个问题:AI到底是现有巨头的游戏,还是AI原生挑战者的游戏?并得出结论:先发制人的现有企业 > AI 原生企业 > 落后的现有企业。
与此同时,Coatue用Character AI举例指出AI初创企业的突破之路:像互联网前辈那样开创新模式。带着各领域还没解决的问题,在未来AI有望解锁更多杀手级应用。
最好的AI还没到来
收尾部分,Coatue做了一些总结:
1. 英语会成为未来的编程语言。
2. 边缘AI设备会被广泛应用,口袋大模型指日可待。
3. 扩展AI模型会是一项工程挑战,自GPT-3发布以来,OpenAI的工程师数量增加了3倍多。
4. 私有数据会解锁更多的使用场景。生物技术领域出现个性化医疗;Netflix会按需定制节目;电商平台成为AI购物管家;人人都能成为工程师等等。
5. 多模态大模型是前沿创新方向,基础架构会有新的发展。例如,今年10月,斯坦福大学提出新架构:Monarch Mixer,无需Attention,有望成为Transformer的替代者等等。一旦实现,就如Coatue在第一部分所提出的:OpenAI还会是大模型的最终赢家吗?