日本AI,失去的不止三十年

本土无人可用,使得日本在生成式AI浪潮里,始终处于失语状态。

直到1986年,辛顿提出了“反向传播算法”,这个问题才有了标准答案。

余凯曾在媒体专访中如此形容NEC。

五月花号迷航

2002年,杨立昆刚在普林斯顿进行了一年的研究工作,NEC就开始施压。

孤胆英雄

日本AI高歌猛进的步调,随着NEC美国实验室的落寞戛然而止。

唯一意识到问题的,正是软银集团的孙正义。

2019年,有两件事一直困扰着孙正义:软银的投资失败,以及日本科技的落后。

面对媒体,孙正义痛心地说,“科技产业几乎从日本消失了,我们正在成为一个被遗忘的国家。即将到来的AI革命,是日本重回牌桌最后的机会。”[1]

随着ChatGPT问世,孙正义的呼吁终于成为了共识。然而,正当日本举国动员,准备一脚油门闯入赛道时,却发现了一个尴尬的事实:日本目前的AI研究,非常依赖隔壁邻居为首的老外。

对此,RIKEN革新智慧综合研究中心负责人杉山将,曾做过一笔统计。

RIKEN(理化学研究所)是日本唯一的国家级科研机构,顶级头脑聚集地。汤川秀树等日本诺奖得主,都曾在这儿搞过研究。然而,那些被AI顶会收录的RIKEN论文,近一半的作者都隶属于外国大学,其中约一半的人来自中国[2]

本土无人可用,使得日本在生成式AI浪潮里,始终处于失语状态。

然而,如若回溯历史,会发现日本也曾是个“AI超级大国”。

上世纪八九十年代,日本一度是深度学习的中心。杨立昆、余凯、林元庆、贾扬清等载入科技史册的泰斗级人物,都曾在日本的AI实验室度过一段青葱岁月。

曾经攥着一手王炸的日本,为何会迈向老无所依的结局?

站在日本人的肩膀上

上世纪80年代,正在读大学的杨立昆,被一群“疯子”吸引了。

彼时,深度学习是个“已被证伪”的技术路线。然而,仍有一小撮人在死磕,这其中就包括了一批日本科学家。杨立昆发现,当时大部分的深度学习论文,都是日本研究人员用英文写的。

这其中,对他影响最大的,是一位名叫福岛邦彦的日本人。

1980年,福岛邦彦参照猫的视觉结构,设计了一个叫做“神经认知机(Neocognitron)”的多层网络模型。

在生物的初级视觉皮层中,存在多个神经元,每个神经元只“掌管”一小部分视野。随后,神经元收集到的信息会统一传输到视觉皮层,组合成完整的视觉图像。

受此启发,福岛邦彦给神经认知机设计了“感知光照“和“运动信息”两个神经元,分别用来“提取图形信息”和“组成图形信息”。然而,福岛邦彦的神经认知机,存在一个致命问题:太超前了。

当时,主流的神经网络只有1层,但神经认知机有足足5层。

面对多层设计带来的种种问题,福岛邦彦一时找不到解决办法,导致神经认知机只能处理一些极其简单的工作。

直到1986年,辛顿提出了“反向传播算法”,这个问题才有了标准答案。

但若向前追溯反向传播算法,会发现其源头仍是日本人。上世纪60年代,日本数学家甘利俊一提出的“随机梯度下降方法”,为其提供了技术灵感[6]。只不过囿于特定时代的局限,甘利俊一没有条件在计算机上进行模拟验证。

1988年,杨立昆将神经认知机与反向传播结合在一起,打造出了大名鼎鼎的卷积神经网络。直到今天,卷积神经网络仍是图像识别领域最重要的算法之一。

由此可见,这些定义一个时代的AI研究成果,都是站在日本科学家肩膀上实现的。

实验室里的中国人

同一时期,日本的产业界,拉开了更为激进的历史篇章。

彼时,日本步入极度繁荣的泡沫经济时代。大型企业纷纷为爱发电,自掏腰包搭建中央实验室,发力基础科学。这其中,要数NEC(日本电器股份有限公司)最为激进:它直接切入美国科技产业腹地,将实验室开到了普林斯顿和硅谷。

财大气粗的NEC Lab,很快聚集了一大批日后响当当的名字。

西安交大软件学院院长、国家特聘教授龚怡宏,是第一个加入硅谷NEC Lab的国人科学家。在他担任实验室主任时期,招募了一众青年才俊。

其中既有触发科技巨头竞拍辛顿的余凯,也有林元庆、徐伟等活跃在中国AI产业一线的技术大牛。

彼时,中国的计算机产业刚刚起步,吸纳不了那么多人才。硅谷NEC Lab无缝承接了这个需求,并招揽了大批立志从事AI研究的国人科学家。

余凯接棒硅谷NEC Lab主任一职后,又招募来了黄畅。当时,黄畅底下有一个名叫贾扬清的实习生。在NEC Lab期间,贾扬清展露出了高超的数学和工程代码能力,曾让实验室众人坚信其日后必有所造诣。

这种薪火相传的孵化线,在林元庆接手硅谷NEC Lab后仍在继续。

他引进的实习生谢赛宁,后来与麻省理工教授何恺明共同提出了著名的ResNeXt模型。2022年,谢赛宁还和OpenAI研究员Bill Peebles合著了论文Scalable diffusion models with transformers

以这篇论文为基础,OpenAI打造出了视频生成模型Sora。

另一间位于普林斯顿的NEC Lab,同样招揽了杨立昆,以及支持向量机发明者Vladimir Vapnik等泰斗级人物。

可以说,历史上没有任何一家机构,能如NEC Lab这般,拥有此等高手如林的班底。

余凯曾在媒体专访中如此形容NEC Lab巅峰时期的影响力:如果你在谷歌上搜索美国NEC Lab,页面会立刻弹出一句话:你要不要来谷歌工作?[7]

然而鼎盛时期风光无两的NEC Lab,却早已埋下了衰败的草蛇灰线。

五月花号迷航

2002年,杨立昆刚在普林斯顿进行了一年的研究工作,NEC就开始施压。

管理层毫不客气地告诉杨立昆,NEC对深度学习没有一丁点兴趣,并顺手解雇了当时的实验室主任。这段经历让杨立昆对产业界彻底失望,跑回纽约大学当起了老师。

NEC突然自毁长城,有两个不容忽视的现实原因:

一是人们对AI失去了信心。彼时,无论是芯片的算力,还是数据的丰富程度,都远不足以让深度学习发挥其潜力。与此同时,“第五代计算机”项目的失败,更是雪上加霜。

“第五代计算机”项目始于上世纪80年代,目标是打造AI驱动的超级计算机。

在日本的设想中,第五代计算机将具备回答问题、知识库管理、图像识别、代码生成等功能[8]。这个“领先时代40年”的科研项目,一度将美国吓得不轻,立马掏出补贴与日本竞争。

如此一拍脑袋的项目,结局可想而知。

1992年,五代机项目正式宣告破产。日本不仅白白浪费了数亿美金,还把其他跟风的国家给忽悠瘸了。一怒之下,人们将责任归咎于AI。日后很长时间里,AI研究如同过街老鼠,人人喊打。

其次,日本的中央实验室模式,此时也出了问题。

日本企业对于NEC Lab等中央实验室的定位,是纯粹的基础科研机构。这种模式没有与市场和产业接轨,只是盲目追求多拿几个诺贝尔奖。这让科学家们非常苦闷,内部时常调侃称“反正做的东西也用不到产品上”。

因此,当经济泡沫消失,日本进入“失去的时代”,毫无实际用处的中央实验室,理所当然地成了第一批“挨刀”的对象。

2009年-2020年间,NEC多次进行万人规模裁员,并大幅缩减研发经费。

在此阶段,中美科学家们纷纷选择自主创业,或另择良木而栖。

2012年,余凯受李彦宏邀请,领导百度的AI业务。在他的号召下,徐伟、黄畅等NEC Lab的同僚,也先后加入百度。后来,他们又跟着余凯一同创办了地平线。

日本花大力气点燃的AI火种,最终造就了今天中国AI的冲天火光。2018年NEC第四次大裁员后,其美国实验室的技术中坚力量,几乎流失殆尽。

孤胆英雄

日本AI高歌猛进的步调,随着NEC美国实验室的落寞戛然而止。

全球人工智能的历史仍在继续,就好像五代机项目从未存在过一样;而曾经组建了全明星阵容的NEC Lab,也渐渐被淡忘。在失去的三十年里,日本几乎没有在深度学习领域,留下任何一笔痕迹。

不仅如此,深度学习还在日本留下了根深蒂固的偏见。

2016年谷歌的AlphaGo击败了李世石,登上了全球科技新闻的头版。这一年,中国诞生了528家AI企业,催生371起AI投融资。从科学家到VC,都热情地谈论着深度学习的潜力。然而,隔壁的日本,却是另一番风景。

同年,日本产经省也举办了一场全国人工智能大会。有学者准备就深度学习提出两个企划案,却被同席的学术圈研究者提醒,“如果名字里加上深度学习的话,估计就没有人来听了吧”。

这种裹足不前的态度,是日本如今无人可用的重要诱因。

唯一意识到问题的,正是软银集团的孙正义。

2017年,孙正义在推出全球最大私募股权科技投资基金(愿景基金)时,笃定地表示,该基金只会根据一项策略进行投资,就是AI。

接下来的几年时间里,软银在AI领域的投资不可谓不激进。

光是在季度和年度报告中,孙正义提到“AI”的频数就超过500次,并大手笔地为超过400家AI创业公司,注入1400多亿美元资金。他甚至还在2020年胸有成竹地表示,史无前例的投资狂潮,将使软银成为主导AI革命的投资公司。

然而,孤掌难鸣。更尴尬的是,软银还押错了宝。

据风投数据库PItchBook于2023年公开的数据,在26家估值超过10亿美元的AI创业公司里,软银只投中了一家。

此外,孙正义虽然斥40亿美元投资英伟达,却在其股价暴涨前悉数抛掉,与近10倍的涨幅收益失之交臂。如果不是押中了ARM,孙正义的AI投资或将颗粒无收。

在ChatGPT引爆生成式AI热潮的2023年,孙正义在股东大会上痛心疾首地表示,自2022年末以来他就一直在反省,“为自己犯了很多错误感到羞愧”,“哭了好几天都停不下来”[13]

失去的时代

孙正义的眼泪,既是对软银频频押注失误的悔恨,更是对日本AI产业的恨铁不成钢。

2019年时,孙正义曾不加掩饰地公开批判:在当前最重要的科技革命上,日本已变成了一个“后进国”,而使其不断丧失竞争力的本质原因,是对进步的不贪婪[15]

这番言论,掺杂了不少情绪因素。实际上,这些都不是日本AI老无所依的根本原因。

深度学习从来都不是一场孤立的革命。

2012年,深度学习能够爆发,其实有两个先决条件:一是算力进化,当时英伟达所开发的GPU,已经初步能支撑起深度学习所需的算力。二是互联网的全面铺开,弥补了数据不足的问题。

集成电路、互联网、云计算,随着这些前置产业陆续成熟,深度学习才得以登上历史舞台。然而,这些产业,日本几乎一个都没有。

当年,在斯坦福教书的吴恩达想要进行大型图像识别实验,尚且有谷歌倾尽整个数据中心的算力,来成就他的The Cat Neurons项目(即“谷歌猫”)

然而,福岛邦彦和甘利俊一却没有这么幸运。即便是如今的日本,也没有任何一家民间公司,拥有训练AI大模型所需的庞大算力。仅有政府主导的理化学研究所中,才能找到“富岳”这样的超级计算机。

日本AI的后继无人,从最开始就埋下了伏笔。

如今,以AI为横切面的日本科技产业,似乎正在印证孙正义五年前的预言:日本已经失去了过去,还可能正在失去未来。

参考资料:

[1] 孫正義氏、日本を憂う「このままでは忘れられた国に」,日経ビジネス

[2] 日本国产AI开发依赖外国人,日经中文网

[3] Why Japan is lagging behind in generative AI, CNBC

[4] 科学之路,杨立昆

[5] 智能时代的算法发展,张江科技评论

[6] 甘利俊一 | 信息几何法:理解深度神经网络学习机制的重要工具,AI科技评论

[7] 对话地平线创始人、CEO余凯:德国诗意一般的六年深深地滋养了我,车云

[8] 第五代:人工智能与日本计算机对世界的挑战,爱德华费吉鲍姆,帕梅拉麦考黛克

[9] 野心勃勃的日本第五代计算机,是如何一步步走向失败的,CSDN

[10] 中国人工智能简史,林军,岑峰

[11] 日本人工智能的现状与“深层学习”的课题, Nippon

[12] 日本人工智能的发展及现状,鼎联知识产权

[13] 孙正义投AI,投了个寂寞,华尔街见闻

[14] 孙正义:一场巨大革命即将到来,软银终将统治世界,华尔街见闻

[15] 孙正义批日本竞争力反思人工智能落后,亚洲周刊

[16] 硅谷NEC Lab往事:将中国企业拽进AI时代的人,雷锋网

[17] 日本电子产业兴衰录,西村吉雄

本文来自微信公众号:远川科技评论 (ID:kechuangych),作者:沈丹阳,编辑:陈彬,视觉设计:疏睿,制图:疏睿

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年5月10日
下一篇 2024年5月10日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日