自动驾驶的中美“赛跑”，正被大模型重置

2023年11月28日 10:44 • 未来科技

在无驾驶员的自动驾驶领域，中国看起来试图领先美国。特斯拉自研的第二代FSD芯片，今年年初开始上车，单卡算力性能略有提升，但不及当前市场主流自动驾驶芯片英伟达Orin。California
北京市自动驾驶车辆道路测试报告（2022年）
关于开展智能网联汽车准入和上路通行试点工作的通知

本文来自微信公众号：未尽研究。

今年，大型语言模型改变了自动驾驶技术路线的竞争格局。它正在教会规模量产的电动汽车，像个五星司机一样开车。特斯拉正处于有利位置，开始探索自动驾驶的世界模型。明年，如果它最新的FSD（完全自动驾驶）进入中国，将激发中国企业奋力阻击，保持当前似乎想领先美国的竞争格局。

美国的L4路线，过得不太好。今年，通用汽车旗下自动驾驶公司Cruise，在无人驾驶状态下撞上了行人，拖拽数米后才停下。这家明星公司摧毁了对自动驾驶的信任，它想隐瞒自己的算法有问题。它的无人驾驶车辆拥有庞大的远程操控团队。通用汽车每个季度为这一切烧掉6亿美元。自动驾驶的怀疑者马库斯，担心这是整个行业“黑暗真相”。

谷歌Waymo尝试用保险数据，挽回人们对自动驾驶汽车的信心。它的合作方是瑞士再保险公司，掌握着1250亿英里行驶里程的人类数据；Waymo提供了约0.4亿英里的无人驾驶数据。Waymo将人身伤害索赔频率降低了95%，将财产损失索赔频率降低了76%。质疑者认为Waymo的数据仍然太小。人类司机每行驶1亿英里就会发生一起致命交通事故，自动驾驶的明星企业们需要跑得更久更远。

Waymo的方式是继续在多个城市运营自动驾驶车队。它向凤凰城、旧金山、洛杉矶和奥斯汀的公众开放。中国加速更快，自动驾驶领域的融资总额，连续第二年超越美国。年初，北京与加州——中国与美国各自对自动驾驶最热情的地方——各自披露年度路测报告，百度近五年来的累计路测里程，也实现了对Waymo在加州的超越；小马智行也在飞驰。

北京速度仍在延伸。很多大中城市都将成为北京。截至今年三季度，百度的萝卜快跑累计服务订单超过了400万单，去年同期累计140万，按这个速度，明年将超越千万订单。百度的全无人自动驾驶车队，也已驶入北京、武汉、重庆、深圳、上海五城，还将进一步扩容。

在无驾驶员的自动驾驶领域，中国看起来试图领先美国。但变局在于大型语言模型以及生成式人工智能，尤其是今年以来，它迭代了包含机器视觉在内的多模态能力。很多学术机构认为GPT-4V对自动驾驶影响深远。特斯拉与英国初创企业Wayve，各自展示了探索阶段的世界模型（World Model），它们很有可能成为自动驾驶的基础模型（Foundation Model）。

这个时代更有利于特斯拉这样的规模量产玩家。特斯拉的Autopilot（自动辅助驾驶功能）系统，此前依赖基于规则的方法。车辆的摄像头识别路况，然后，特斯拉的工程师们，手动编写并更新了数十万行代码，设定了诸如“红灯停、绿灯行”等繁杂的规则。很多人不相信这种方式能真正通往真正的自动驾驶。

今年，马斯克的全自动驾驶技术新版本FSD V12，开始用数十亿帧人类驾驶的视频，来教会自己如何驾驶，就像大型语言模型通过处理数十亿的文本词汇，来训练自己生成答案一样。在某些情况下，这种基于神经网络的方法，要比传统的基于规则的更好。

这是一种端到端（end-to-end）的训练，即“视频进，动作出”，不需要人类明确编写代码或脚本，来告诉它要怎么做。它的瓶颈，很大程度上不再是代码量，而是视频输入量。神经网络在训练了至少一百万个视频后才能见效。马斯克在财报会议上，将通往自动驾驶之路的四大要素，总结为“超大型真实世界数据集、神经网络训练、车辆硬件和车辆软件。”

特斯拉是全球电动汽车销售冠军，今年称考虑将FSD授权给同行；还传出将在中国继续扩建产能，从目前的每年125万辆，提高至175万辆。特斯拉拥有万卡H100集群的庞大算力，超算Dojo也已经投入生产，相当于明年再新增30万片全球稀缺的A100芯片，来对付随之而来的海量数据。

特斯拉预估2024年内部算力储备

但Dojo架构早在几年前就定下，非常适合特斯拉当时独特的算法。如果拿它来跑大型语言模型，内存带宽恐怕不够友好。换道大模型的特斯拉，需要调整它的算力基础设施，或者突破模型底层技术的束缚。马斯克的应急方案是，赶紧抢购了万卡H100集群的庞大算力。

推理芯片同样如此。特斯拉自研的第二代FSD芯片，今年年初开始上车，单卡算力性能略有提升，但不及当前市场主流自动驾驶芯片英伟达Orin。英伟达会在2025年量产Thor，算力高达2000 TOPS，是Orin的近8倍，第二代FSD的近16倍。也许特斯拉需要在下一个AI Day给予回击。

马斯克渴望让完全体的FSD进入中国，承认“目前确实正在推进中。”特斯拉早已在上海建成用户数据中心，满足国内数据监管要求；今年，特斯拉中国车主的手册新增了FSD介绍。国内媒体爆料，特斯拉正在组建中国的FSD运营团队。

还剩下安全监管，但这道障碍也在有序撤去。11月，工信部等四部门发布了《关于开展智能网联汽车准入和上路通行试点工作的通知》，首次明确了不同情况下的交通事故责任归属，并鼓励汽车生产企业和使用主体组成联合体，在年底前完成试点的集体申报，并在此基础上遴选具备量产条件的智能网联汽车产品，在限定区域内开展上路通行试点。上海经信委“推动特斯拉自动驾驶在沪布局”或在明年成为现实。

中国汽车行业正在从电动化转向智能化，来自外来者的竞争，将加速中国量产车型拥抱大模型。工信部称，当前乘用车市场L2及以上智能驾驶渗透率已经超过了42%，预计2025年达到70%，并普及至10至20万的主流车型上。

很多车企没有错过大模型。除了自动驾驶技术企业外，大模型核心玩家的华为、以及“蔚小理”等一众造车新势力，也在尝试融入Transformer架构。毫末智行还发布了DriveGPT。但它们的规模量产与特斯拉相比，尚处于爬坡阶段。在技术的垂直整合能力方面还有距离。

比亚迪的电动汽车销量，最早将在年底实现对特斯拉的超越。它与特斯拉一样，正在垂直整合整条汽车产业链，但尚欠缺一点软实力。比亚迪也在走基于Transformer的决策规划大模型，今年大概会有6亿公里的数据，标注自动化率超过95%，并在未来保持指数级的数据储备。比亚迪内部架构也发生了调整，近期招聘了超过4000名软件工程师，“采用人海战术，保持颠覆性迭代能力”。

国内的算力也跟得上。英伟达的智能驾驶芯片，占国内前装NOA（自动辅助导航驾驶）市场超50%，并未被“高墙”所限。今年，比亚迪进一步扩大了与英伟达的合作，两家企业的共识是未来的汽车是可编程的。地平线占超30%，年底，它推出了征程6，专为大参数量Transformer设计，算力高达560 TOPS，明年正式交付。比亚迪是首批量产意向合作车企。

华为也拆分旗下智能汽车解决方案业务单元，引入长安汽车合伙。华为已经突破了高算力芯片的封锁。在“躯壳”与“灵魂”的争论中，“造车国家队”进入智能驾驶市场。

大模型将重置中国与美国这场从电动化转向智能化的竞争格局。2024年，在中国500多万公里的道路上，将上演国内智能驾驶车企守住领先身位，比拼大模型应用落地的一幕。但无论如何，安全第一。

主要参考报告

A Survey of Large Language Models for Autonomous Driving

GAIA-1: A Generative World Model for Autonomous Driving

Comparative Safety Performance of Autonomous- and Human Drivers

2022 Disengagement Report from California

北京市自动驾驶车辆道路测试报告（2022年）

关于开展智能网联汽车准入和上路通行试点工作的通知

本文来自微信公众号：未尽研究（ID：Weijin_Research），作者：未尽研究

声明：该内容为作者独立观点，不代表新零售资讯观点或立场，文章为网友投稿上传，版权归原作者所有，未经允许不得转载。新零售资讯站仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。如对本稿件有异议或投诉，请联系：wuchangxu@youzan.com

Like (0)

净利下滑、市值缩水，“特卖电商第一股”唯品会夹缝求生

Previous 2023年11月28日

“果链”大转向：苹果Vision Pro即将量产，中国内地供应链比例大幅提高至60%

Next 2023年11月28日

水温80度：AI行业真假繁荣的临界点

我们从来没拥有过这么成功的AI主导的产品。

（这种分析统计并不那么准，但大致数量级是差不多的）

这两个产品碰巧可以用来比较有两个原因：

一个是它们在本质上是一种东西，只不过一个更通用，一个更垂直。

蓝海的海峡

未来成功的AI产品是什么样，大致形态已经比较清楚了，从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时“罢工”，全网打工人都慌了

美西时间午夜12点开始，陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载，忽然无法正常工作了。

因为发现AI用久了，导致现在“离了ChatGPT，大脑根本无法运转”。”

等等，又不是只有一个聊天机器人，难道地球离了ChatGPT就不转了。

大模型连崩原因猜想，谷歌躺赢流量激增6成

GPT归位，人们的工作终于又恢复了秩序。

未来科技 2024年6月5日
ChatGPT宕机8小时，谷歌Gemini搜索量激增60%

ChatGPT一天宕机两次

谷歌Gemini搜索量激增近60%

ChatGPT在全球拥有约1.8亿活跃用户，已成为部分人群工作流程的关键部分。

过去24小时内提交的关于OpenAI宕机的问题报告

图片来源：Downdetector

ChatGPT系统崩溃后，有网友在社交媒体X上发帖警告道：“ChatGPT最近发生的2.5小时全球中断，为我们所有依赖AI工具来支持业务的人敲响了警钟。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时大崩溃，AI集体罢工让全网都慌了

接着OpenAI也在官网更新了恢复服务公告，表示“我们经历了一次重大故障，影响了所有ChatGPT用户的所有计划。Generator调查显示，在ChatGPT首次故障后的四小时内，谷歌AI聊天机器人Gemini搜索量激增60%，达到327058次。

而且研究团队表示，“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关，显示出用户把Gemini视为ChatGPT的直接替代选项。

未来科技 2024年6月5日
深度对话苹果iPad团队：玻璃的传承与演变

iPad最为原始的外观专利

没错，这就是iPad最初被设想的样子：全面屏，圆角矩形，纤薄，就像一片掌心里的玻璃。

2010年发布的初代iPad

好在乔布斯的遗志，并未被iPad团队遗忘。

初代iPad宣传片画面

乔布斯赞同这一想法，于是快速将资源投入平板电脑项目，意欲打造一款与众不同的「上网本」，这就是iPad早年的产品定义。

iPad进化的底色

苹果发布会留下过很多「名场面」，初代iPad发布会的末尾就是一例。

未来科技 2024年6月5日
底层逻辑未通，影视业的AI革命正在褪色…

GPT、Sora均为革命性产品，引发了舆论风暴，但它在上个月发布的“多模态语音对谈”Sky语音，却由于声音太像电影明星斯嘉丽·约翰逊，被正主强烈警告，被迫下架。

华尔街日报也在唱衰，认为“AI工具创新步伐正在放缓，实用性有限，运行成本过高”：

首先，互联网上已经没有更多额外的数据供人工智能模型收集、训练。

03、

如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向，那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

但分歧点正在于此，电影公司希望通过使用AI技术来降低成本，但又不希望自己的内容被AI公司所窃取。

未来科技 2024年6月5日
KAN会引起大模型的范式转变吗？

“先变后加”代替“先加后变”的设计，使得KAN的每一个连接都相当于一个“小型网络”，能实现更强的表达能力。

KAN的主要贡献在于，在当前深度学习的背景下重新审视K氏表示定理，将上述创新网络泛化到任意宽度和深度，并以科学发现为目标进行了一系列实验，展示了其作为“AI+科学”基础模型的潜在作用。

KAN与MLP的对照表：

KAN使神经元之间的非线性转变更加细粒度和多样化。

未来科技 2024年6月5日
这个国家，也开始发芯片补贴了

//mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
[4]中国安防协会：欧盟批准430亿欧元芯片补贴计划：2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
[6]潮电穿戴：印度半导体投资大跃进，一锤砸下1090亿，政府补贴一半.2024.3.5https。

未来科技 2024年6月5日
大模型的电力经济学：中国AI需要多少电力？

这些报告研究对象（数字中心、智能数据中心、加密货币等）、研究市场（全球、中国与美国等）、研究周期（多数截至2030年）各不相同，但基本逻辑大同小异：先根据芯片等硬件的算力与功率，计算出数据中心的用电量，再根据算力增长的预期、芯片能效提升的预期，以及数据中心能效（PUE）提升的预期，来推测未来一段时间内智能数据中心的用电量增长情况。

未来科技 2024年6月5日
你正和20万人一起接受AI面试

原本客户还担心候选人能否接受AI面试这件事，但在2020年以后，候选人进行AI面试的过程已经是完全自动化的，包括面试过程中AI面试官回答候选人的问题，AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

以近屿智能与客户合作的校验周期至少3年来看，方小雷认为AI应用不太可能一下子爆发，包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

未来科技 2024年6月4日

自动驾驶的中美“赛跑”，正被大模型重置

相关推荐