汤晓鸥的花样年华

汤老师最后一次演讲在世界人工智能大会上,介绍了他三个学生,推荐了于谦老师出演的电影《老师·好》,其中的旁白,也正是汤老师心声的写照:人生就是一次次幸福的相聚,夹杂着一次次伤感的别离。我不是在最好的时光遇见了你们,而是遇见了你们,我才有了这段最好的时光。

学术、学生

汤老师最骄傲的代表作一直是他的学生们,Guide2Research发布的2023全球TOP。

电影人生

其实着笔写的时候思绪太多,汤晓鸥教授的各种形象都涌了上来,一直没办法静下心来,许是内心一直不太能接受。最后想来,汤老师的一生还是精彩绝伦,应了他常所作的演讲的题目《人工智能的花样年华》。 

从中科大到麻省理工,从培养学生到孵化最佳论文,从创业上市到创立人工智能实验室。创业前,汤老师的演讲题目还是《生活中的人工智能》,而之后,“生活”就渐渐变成了“花样年华”。相同点是演讲总是从介绍儿子铭铭开始的。

铭铭在幼儿园时期应该就很出名了,汤老师还专门为此写了一篇文章,铭铭的名字是南师(注:南怀瑾先生)从《大学》里挑的,汤之盘铭,曰“苟日新,日日新,又日新”。后来我们大模型起名字,汤老师问我起了个啥,我回答:“日日新”,汤老师问为啥?我说:“总不见得叫苟日新吧”,然后就都笑场了。铭铭和商汤都是汤老师的孩子。

《花样年华》的片段汤老师给大家放了很多遍,演示我们视觉算法对电影片段做的分析,另一方面我总觉得汤老师有各种暗示表示自己长得像梁朝伟,我不知道是不是只有我听出了弦外音,暗示多了就觉得确有其实。

汤老师演讲喜欢引经据典,引的“经典”要加上一个后缀,经典的电影和音乐。从年会推荐《波西米亚狂想曲》的创意和执着,再到中国原创动画《哪吒》,以及用一生故事做一个原创电影的专注——《你好,李焕英》,背后都有一个同样的精神内核:原创

每年演讲都像是预测热点,《波西米亚狂想曲》斩获奥斯卡,推荐的电影最后都成为票房冠军,年会演讲主题《让世界充满爱》表达同理心,几天后歌曲上了当年的春晚。所以每年的新的演讲的开场都必须是,“我们先来复习一下去年的演讲”,这形成了特有的汤氏套娃演讲风格。读书时候觉得“学而时习之”,不停复习,到底“悦”在了哪里,汤老师倒是充分体会到了复习之乐。

疫情期间,线上会议,汤老师将蓄了许久胡子的自拍发在群里,突然来了一句,你看像谁?于是年会隆重推出了他失散多年的“兄弟”——宫崎骏。创业数年,年龄从梁朝伟跨越到了宫崎骏。

汤老师最后一次演讲在世界人工智能大会上,介绍了他三个学生,推荐了于谦老师出演的电影《老师·好》,其中的旁白,也正是汤老师心声的写照:人生就是一次次幸福的相聚,夹杂着一次次伤感的别离。我不是在最好的时光遇见了你们,而是遇见了你们,我才有了这段最好的时光。

学术、学生

汤老师最骄傲的代表作一直是他的学生们,Guide2Research发布的2023全球TOP 1000计算机科学家排名(D-index),大陆排名前十的计算机科学家中,汤老师创立的多媒体实验室(MMLab) 就出了三位,加上不在大陆地区的学生的话,可能要十占四五。

世界人工智能大会开幕式上,汤老师分享了三个学生王晓刚、何恺明和林达华的深度学习逐梦之旅。这三位都是本科刚毕业就来到了MMLab,而现在都是知名学者教授了。MMLab的发展史是原创科研的一个缩影,从最早只能把学生送到国外去才能做出最好的研究,到逐步可以合作搞最好的研究,再到有机会从国内开始搞出最好的研究。

晓刚带着团队按下了深度学习的门铃,恺明拿过2次顶级会议CVPR的最佳论文,是深度学习领域的大神;达华早在学生时代就拿了机器学习顶会NeurIPS最佳论文; 2023年,汤老师在上海人工智能实验室的团队又拿下CVPR的最佳论文,这是会议第一次全部由中国大陆科研机构署名的最佳论文。这背后的故事是,实验室有三篇工作入选了最佳论文的候选。

汤老师在2009年4月的文章中提到,“我常讲,做研究就像比武论剑一样,要论剑就要到华山论剑,华山以外,很难论出好剑。”做科研就是要发顶级会议的论文,要去华山一论。不过那时候,预期还没有到论剑第一,只是用文章名字期望能成为《天下第一铭》。巧的是,短短2个月过后,何恺明便以一年级博士生身份拿下了中国大陆第一篇计算机视觉顶会的最佳论文。

我不是汤老师的直接学生,在微软实习的时候是在汤老师负责的视觉计算组,从微软视觉组那时候起,汤老师的科研项目就和照片、电影连上了。如果说汤老师的科研特别得意的地方的话,我想一定是他的研究品味。多年后有一次聊到研究实力,汤老师提到有人告诉他,他上了一个科学家榜单,“研究品味”在视觉领域全球前五,这次,他对评委的眼光给予了充分的肯定。

汤老师的多媒体实验室(MMLab)创立于香港中文大学,港中大创校校长是国学大家钱穆,当时的办学理念是“沟通世界中西之文化,为人类和平社会幸福谋前途”,在当下全球环境之下亦显可贵。汤老师对于学生的研究选题向来宽松,鼓励学生的创意,有原话为证:“你们不要相信权威,权威不一定是这个领域的专家,但是我的话还是可以信的,因为我不是权威。” 

不过,在2010年深度学习浪潮之前,汤老师却异常坚定地让MMLab所有的研究力量都转到深度学习之上。之后三年,全球视觉顶会共有29篇文章关于深度学习,其中有14篇出自MMLab。

“我们有18项工作在全世界第一次将深度学习用到视觉问题上,包括人脸识别、人脸检测、人脸重建、物体检测、人体姿态、图像超分、三维形状识别等计算机视觉最核心的问题。在深度学习的大门上,Hinton和他的同僚一起摁下了深度学习大门的第一声门铃,而我们摁了18次门铃”,汤老师这么说道。在招生的时候,汤老师很喜欢这样介绍实验室在深度学习早期的工作,在中国最高学府的阶梯教室里,中国最顶尖的本科生们听完热血沸腾,纷纷寄出了申请的简历。

回去的路上我就问道,摁一次门铃不开门可能是没听到,但是摁18次门铃还没开门是不是说明主人不在家?这次又笑场。而之后我自己找到了答案,18次的共同点就是都是“第一次应用在某个领域”,就是那个汤老师一直执着的“原创”,门后面应该就是商汤了

创业

汤老师是一个科技理想主义者,他坚信自己所憧憬的。创业的起点就是对于原创的执着,当他把所有的技术突破呈现在好友IDG资本周全面前时候,周全指出了商业模式上问题,你们花100分力气原创,跟随者花1分力气复制,投入产出比没法计算。汤老师直接回答了,如果原创速度快过复制的速度,就没人愿意复制了。这就是“逃逸速度”。

汤老师是有现实扭曲力场的,他的坚信感染了一群人,在没有路径的起点,逐步走出了自己的道路。他把公司的使命定为:“坚持原创,让人工智能引领人类进步。”“原创这个词,英语里面都没有对应的,因为在他们看来,创新就是原创。如果哪天我们可以把这句话去掉,就说明我们走出了自己的创新道路。”

他对于商汤的定位,更像是实现提升中国的原创技术的载体。早期和投资人的沟通都是如何形成对于原创的共识,推动我们社会“我不愿模仿”的认知,这句座右铭来自上海美术电影制片厂首任厂长特伟。汤老师知道他的宫崎骏兄弟也对上美影的作品赞叹不已。关于长期发展,他经常会提到“我们不上市”。这确实又需要花不少时间再和投资人解释,毕竟,再远的目标也需要一步一步走到,商业化是一条必须走的道路。

商汤也还在路上。公司有很多汤老师的底层思维的烙印。想象一下一家创业企业的顶会论文数进入全球前三,这些资源的投入往往带不来商业价值。研究员都是自我培养体系,有从本科进入公司培养成研发负责人的。

原创科技的商业化往往要经历三个过程,第一是找场景,科技公司拿着技术找场景被形容为拿着锤子找钉子,那一流的科技公司无外乎是拿了个雷神之锤在找场景。能不能在现实世界中找到应用还依赖于大众的科技认知水平。一个类比是三百年前找到牛顿买下了他的三大定律的专利,那要等上两百年才能变现。

第二个过程是在场景中解决“行不行”的问题,就是技术有没有突破工业使用的“红线”。这点在视觉智能时代,商汤做了多个第一,商汤是全球第一家将刷脸支付集成到超过1000万人口的大城市地铁系统中的公司,10多个地铁城市每日使用;商汤是第一家将人脸特效优化到全平台手机终端,实现交互式增强现实及混合现实的效果;商汤是第一家用视觉识别完成千万公里高铁巡检;商汤也是第一家推出家用级别的机械臂用来和老人小孩下棋博弈……

这就是汤老师那摁18次门铃的延续,虽然未必每次尝试都能规模化,但我们用我们的方式去改变这个世界的固有习惯,哪怕就是那么一点点。 当然,最后的商业化过程必须解决场景中“廉不廉”的问题,只有大规模降低人工智能生产和部署成本,才能真正的做到AI普惠。商汤也还在路上。

也许科技创新带来生产力变革必须走完这三个步骤,Palantir, DeepMind, OpenAI都是这么走来的。但是在这地缘政治下的大模型重投入时代,路显然更加难走了。疫情期间,我和员工分享了电影里的那句歌词:“人间路,快乐少年郎,路里崎岖,崎岖不见阳光。”快乐的心态才能走完崎岖的路。

汤老师在年会上分享了他收藏的喜剧电影,希望大家能笑着往前走,也继续复习了疫情前给大家推荐的《让世界充满爱》和《明天会更好》,不过他略加修改。“也许昨天很难忘,今天很难受,明天很难说,但是我相信只要坚持笑下去,那最后后天会更好。”

一群被汤老师的执着感染的人,将继续一步一步带着AI的原创梦想往前走。回头看时,留下的都是美好的回忆。就像汤老师说的,事物总有他的两面性,好的一面,和更好的一面。

写在最后

追思会前连夜给汤老师写了一幅挽联,用了自己最喜欢的金庸武侠小说的描述,天龙八部的青衫磊落,射雕英雄的丹心耿介。

青衫磊落,格究智理,学贯中西,胸怀报国宏图志,悲憾科海巨星陨,阴阳割昏晓

丹心耿介,矢志原创,千古文章,情倾桃李满天下,惟愿此去山水寄,天地一沙鸥

上下联最后句都用了杜甫的诗,连起来是“晓鸥”两字。汤老师家国情怀也似杜甫。杜甫字子美,汤老师的爱好可不就是赞美“子美”。

在商汤的楼下,有一列绿皮火车,是我们从破废的火车中找出来的。汤老师当年一路南下,从鞍山到合肥求学,需要坐长时间的绿皮火车。我们找回这列火车的时候,那个年代的车厢内饰已经无法找到网络图片了,最后是在一个火车博物馆里找到参考描述,再加上汤老师的个人回忆,才还原出当年绿皮火车内的旧貌。有些东西,倘若没被人记着,很快就会在遗忘的终点消失。

钱穆说过,一个朋友的死亡,不是他的死亡,而是活着的人的逐渐消亡。因为他的意趣形象仍活在我们的心里,也就是他并未死亡;而我在他心中的意趣形象却消失了。

从这点来说,汤老师如此幽默睿智和善良,在大家的心里,会一直活着的,活出一个花样年华。

徐立

写于2024年1月24日

本文来自:问道商汤,作者:徐立

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年1月24日
下一篇 2024年1月24日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日