马斯克曾经很喜欢玩《魔兽争霸:人类与兽人》,游戏策略的一个关键就是保障可持续的资源供给。马斯克会复盘游戏中他预感到自己要赢的那一刻。他对别人说:“我就是为战争而生的。”
马斯克最近一次“赢”在九月的第二周:9月10日,摩根士丹利发布看多报告,理由是看好特斯拉的Dojo的宏大前景,将特斯拉评级从“持有”改为“买入”,将未来12个月内的目标股价调整为400美元。11日,特斯拉股价上涨10%,市值一夜飙升800亿美元至8683亿美元,万亿特斯拉似乎又将再现。
但真实市场却不容乐观。9月1日,特斯拉发布了model 3焕新版——六年之后的改款车型。但中国市场并未给出六年前的热情。《电动汽车观察家》了解到,新Model 3在上海、深圳的订单表现都比较一般。
《马斯克传》中透露,5月,特斯拉已将Model 2的产地从之前计划的墨西哥工厂改至得州工厂。
问题是,Dojo支撑万亿特斯拉前提,是Model 2、新Model 3等车型销售提供现金和数据“燃料”。从车企到AI公司的极限作战中,马斯克这次能“保障可持续的资源供给”吗?
Dojo支撑万亿估值?
这不是特斯拉第一次接近/抵达万亿市值。
2021年10月26日,特斯拉达到万亿美元市值
2021年10月26日,特斯拉市值达到1.03万亿美元,超越丰田、大众、通用等11家车企之和,成为苹果、亚马逊、谷歌和微软之后万亿美元俱乐部新成员。连马斯克都发推直呼“疯狂”。
但这次却会非常不同。上一次,特斯拉的股价高达1024美元/股。但这次,看多机构给出的价格是400美元/股,与苹果(175美元/股)和英伟达(439美元/股)的股价相近。
背后是资本市场对特斯拉的看法开始发生根本性的改变。
在这篇题为《特斯拉打开AI魔盒——走进Dojo魔算》的看多报告(下称《报告》)中,摩根士丹利认为特斯拉将在业务形态上完成从汽车公司到科技公司的转型。
“随着特斯拉在2028~2033年的五年间开始释放Dojo协同效应,预计EBITDA(税息折旧及摊销前利润)利润率将显著扩张,至2040年达到34%,高于23财年的15%和30财年的24%。(22财年为16.8%)”
《报告》:特斯拉估值从250美元到400美元增加过程
《报告》认为250到400美元(一年后)的特斯拉估值增加将来自汽车业务、自动驾驶出租车、SaaS(软件即服务,例如销售FSD自动驾驶软件)和第三方电池业务,分别为7、70、58和13美元。
此外,报告预测,至2040年,SaaS将为特斯拉提供62%的营业利润,达到3350亿美元。如同AWS(亚马逊网络服务公司)为亚马逊贡献70%经营利润,是零售业务2.5倍之多一样。“为特斯拉打开新的潜在市场,远远超出以固定价格销售汽车。”
Dojo,是最优解吗?
新增估值表面给到Dojo,实际给到FSD V12。
“老信息,新说法。”一位长期跟踪特斯拉的投资人对《报告》给出了这样的评价:“乐观假设:V12继续得到验证,(自动驾驶支持汽车从出行工具转变为智能机器人)逻辑走通,(股价)能跑到400美元。”
9月初,马斯克在社交平台X上直播了一次试驾,展示了完全由神经网络组成,端到端进行自动驾驶的FSD V12版本。其旨在通过观察、学习和复制人类最佳驾驶行为,像人类一样驾驶,从而实现极高的通用性。
马斯克在视频中再次提到,特斯拉希望FSD最终能够仅靠一个GPS目的地位置信息,将车辆最终开到目的地。
如何推动V12从无法应对复杂红绿灯路口的“初学者”,成长为只靠一个GSP定位就能开车的“类人司机”?
在《报告》看来,Dojo是特斯拉“硬件(车辆)和软件(FSD系统等)之间的交叉点”,是撬动特斯拉作为科技企业业务模式转型落地的核心要素,并为其给出了5000亿美元的估值。
“我们将重点放在Dojo的潜力上,通过实质性的加快神经网络训练效果,和数据采集/分析/学习,以更快的落地应用速度和更高的客单价提供自动驾驶和网络服务收入,从而大幅提高估值。”
《报告》预计:到2027年,全球使用特斯拉FSD的车辆(特斯拉+第三方)每天行驶的里程将达到10亿英里。截至今年一季度末,特斯拉官方表示FSD Beta版在40万搭载量的基础上,累计行驶里程已超过3亿英里。
目前,特斯拉每天能够获得从人类真实驾驶场景中回传的“1600亿帧视频”数据作为V12系统迭代的“燃料”。
而Dojo作为特斯拉从芯片开始涉及的自有超算中心,是人工智能产业“算法、算力、数据”的轮动规则中不可或缺的“基础设施”,也是用数据驱动算法进步的“动力系统”。
特斯拉希望其“便宜”又好用。
Dojo通过软硬协同,不断提升运行效率
在特斯拉的展示中,1个Dojo的等效算力约为6个英伟达GXC A100。以此为基础,《报告》计算认为,Dojo建设等效算力比英伟达(A100)要便宜约65亿美元。
效率上,特斯拉表示:一个Dojo Tile(集成25个D1)的速度是24个GPU的30倍,在25个D1芯片上进行特定操作需要5微秒,而24个GPU上需要150微秒。由此,Dojo将把典型工作量的训练时间从1个月减少到不到一周。
Dojo VS A100
但问题是,这些优势都是与两年前的英伟达A100对比而来。《报告》并未给出与英伟达最新的H100的对比计算。
8月,特斯拉激活了一个由1万个英伟达H100 GPU组成的计算集群,峰值算力高达39.5 exaFLOPS(FP8),用于训练视频数据。特斯拉官方介绍,该系统支持超过200 PB的热层缓存容量(1PB= 1048576 GB)。
英伟达表示,相比A100,DGX H100人工智能训练效率提升了9倍,推理效率提升了30倍。
价格上,DGX A100成本约为20万美元。H100的官方指导价为2.5万美元,但由于大模型导致算力抢购,其市场价格已飙升至4万美元。这意味着一台H100 DGX的市场价格将在88万美元左右。
马斯克表示,在特斯拉的测试中,H100的速度约是A100的三倍。但他也同时表示,“如果英伟达能够为我们提供足够的GPU,我们可能不需要Dojo。但他们不能,因为他们已经有足够多的客户了。”
Dojo会是又一个量产地狱吗?
显然,这次特斯拉万亿美元估值成立的前提,是V12持续进步,而其有赖于Dojo的大规模建成。
Dojo基于特斯拉自行设计、台积电7nm工艺代工的D1芯片组成。其没有采用通常的集中式服务器中心架构,而是高度可扩展性、具备 1.1 exaflops峰值算力的计算集群“ExaPOD”。
Dojo集成过程
按照计划,特斯拉将在其帕洛阿尔托数据中心建造7 ExaPOD,并在2024年实现100 exaFLOPs的算力规模,大大超过目前世界上任何一个超算中心。
《报告》显示,特斯拉今年已经订购了4万~5万之间的D1芯片。每个完整的Dojo ExaPOD大约需要3000个D1芯片,其订购额约等于13~16个Dojo ExaPOD,即14.3~17.6exaFLOPs的算力。
问题是,能够按时落地吗?
不同于英伟达的A100 GPU、IBM的 Summit或HPE的Cray Exascale等,为解决广泛任务而涉及的超算系统单元,D1和其组成的Dojo完全针对特斯拉的需求:基于图像和视频源的神经网络深度学习,从芯片到封装都高度注重大型神经网络模型部署所需的高带宽和低延迟。
由此,D1芯片另类到有些“传统”。
“当您将现代超标量乱序CPU内核与更传统的微控制器(例如没有虚拟内存、没有内存缓存、没有DDR或PCIe控制器)结合起来时会得到什么?Tesla Dojo。”业内评论家如此评论D1芯片。
特斯拉的V1 Dojo布局
D1雄心勃勃。在台积电的7nm工艺上,Dojo内核和SRAM(静态随机存储器)的面积为 1.1 平方毫米,占比芯片面积的71.1%的芯片用于内核和SRAM(相比之下,AMD齐柏林架构的这一比例为 56%)。
特斯拉的V1 Dojo内核拓扑
单个Dojo D1芯片有354个Dojo核心,共计500亿个晶体管,算力为362Tflops(BF16/CFP8精度),或22.6 Tflops(FP32精度)。25个D1芯片网格化封装在5×5 网格中,形成Dojo训练块。
封装是挑战之一。
2021年8月,台积电更新封装路线图,亮相了面向超高带宽chiplet(芯粒)集成InFO-L/LSI(整合型扇出封装技术中的一个分支)多个die下方有个“本地硅互联”层,并附上了一个特斯拉AI芯片的参考链接。
2022年4月,台积电在一个学术会议上提到,苹果M1 Ultra组合两颗M1 Max的方法就是InFO-LSI。
InFO-LSI封装技术图示,来源:台积电
显然,InFO-LSI是一项很新的先进封装技术,而目前已被量产应用仍在端侧芯片。对于极力追求高带宽的Dojo来说,新技术叠加工程化难题是否可能会阻碍其大规模量产部署的雄心?
因为,从第一性原理出发,对产品进行底层重构是特斯拉特色,但也屡屡使其陷入量产地狱。目前唯一成功爬上来的例子是Model 3项目,被寄予厚望的4680电池仍深陷地狱当中。
按照2020年9月提出的计划,至2022年4680产能达到100GWh,2030年达到3TWh。如果按计划落地,2022年特斯拉131万辆交付产品都可使用自产电池。
但截至今年6月底,特斯拉宣布,Giga Texas已生产了1000万块4680 电池。然而据科技博主Troy Teslike计算,1000万块4680只能满足1.2万辆低续航Model Y,或8000辆低续航Cyber truck所需。
这与特斯拉今年月销15万辆的计划相比,可谓九牛一毛。而供应商松下的4680大规模量产计划已从今年4月跳票至明年9月。与4680电池高度绑定的Cyber truck能否在今年年底交付,也仍是未知数。
一位电池专家表示,4680目前来看全极耳的实现和装备仍是问题。“我感觉有可能会是中国企业先做出来。”
Dojo是否会像4680一样,成为特斯拉的又一个量产噩梦?
Dojo需要钱,钱从哪里来?
在建起100 exaFLOPs 的Dojo计算集群,彻底跑通FSD,变身为营业利润率高达34%的科技型企业之前,特斯拉需要钱。
7月的Q2财报电话会议上,马斯克表示,特斯拉不会公布Dojo的支出,但 “到明年年底超过10亿美元”。
2022财年,特斯拉研发费用为30.75亿美元。而且要花钱的不只是Dojo,还包括Cybertruck的量产验证,廉价车Model 2和自动驾驶出租车车型的开发。
问题是特斯拉当下的赚钱能力开始下降。
特斯拉Q2经营利润率为9.6%,同比下降了5个百分点,为2年来最低值;但单车成本环比不降未增,为2018年来首次。
这意味着,在降价的推动下,特斯拉的规模边际效应正在收窄,利和量对特斯拉来说也变成了二选一的选择题。
今年1~7月,特斯拉销售32.7万辆,同比增58.0%,初步达成了年度增长40%+的预期目标。但在销售结构中,25万以下销量占比提升到28.2%;30万以下的销量占比为86.1%,去年同期则是75.6%。
9月,改款Model 3上市,未如市场所愿降价,被认为是为了推动老款Model 3清库。
上险数显示,截至7月Model 3销售17.5万辆,距离全年40%的增长目标,完成了55.9%,但Model Y只完成了52.8%,新3的压力显然不小。
从结果来看,我们了解到,上海和深圳的老款Model 3已经基本清库完成,但新3的订单却不容乐观。
对此,特斯拉销售解释为,消费者还需要店内有展车后,亲身试驾体验。而上述投资人则认为,新款Model 3整体产品力不足,降价是大概率事件,导致消费市场等降价。
但新款Model 3的降价空间在哪里?
新款Model 3搭载了HW4.0,感知摄像头从此前的120万像素提升到500万像素,内部FSD芯片算力和存储成本都大幅提升。仅16颗GDDR6显存成本就高达200~250美元。
而此前被认为是重要降价的宁德时代M3P电池,此次却没有出现在新款Model 3的工信部公告当中。
有电池行业人士粗略估计,M3P电池有望较同电量的三元锂电池降本6%左右。但如果预期新款Model 3降到老款价格,则意味着11%的降幅。
另一款押宝车型Model 2也是喜忧参半。
9月15日,外媒报道特斯拉已在车身一体化压铸上取得技术突破,这是特斯拉廉价车实现降本50%,降价(相比Model3)30%的关键所在。
但《马斯克传》中也首次披露,特斯拉已经决定将Model 2的率先投产从墨西哥工厂转移到美国得州工厂,以保证特斯拉设计工程师能够靠近制造中心。
但这也打破了特斯拉之前全球生产中心的任务分配。按照计划,得州工厂是Model Y 美国制造中心和未来的Cybertruck 基地;墨西哥工厂则是第一期200万辆/年Model 2的产地。
6月的消息称,墨西哥工厂的投产时间从2024年下半年推迟到了2025年一季度。
种种“阴影”叠加在一起,是否会是特斯拉成为成熟车企之后,又要面临的至暗时刻?
但这或许就是马斯克喜欢的。
2000年1月,去往投资人会议的时候,PayPal创始人之一蒂尔坐上了马斯克的迈凯伦。
“那么,这辆车厉害在哪儿呢?”蒂尔问道。
“瞧这个。”马斯克一边回答一边开上快车道,将加速踏板踩到底。后轴突然断裂,车子打了个旋,撞到了路堤。所幸两人都毫发无损。
后来马斯克笑着说:“至少它向蒂尔展示了我的冒险精神。”蒂尔说:“是的,我意识到这家伙有点儿不要命的劲头。”
本文来自微信公众号:电动汽车观察家 (ID:evobserver),作者:朱世耘,编辑:邱锴俊