李飞飞:Sora可以生成电影,但无法替代宫崎骏创造的感动

作为一个物种,人类应该认识到,我们发明的一切,不仅是AI,还包括我们正在改变地球的方式,改变我们与环境的关系的方式,都需要我们审慎对待。但如果工作是人性的一部分,是定义我们创造力的一部分,定义我们的独特性,定义我们的意图、我们的同情心、我们与他人独特的情感联系,以及我们每个人对他人或对社会可能产生的独特贡献,那么我认为这些永远不会被完全取代。

在昨晚备受瞩目的GTC炉边谈话中,李飞飞与英伟达首席科学家Bill Dally围绕AI的发展、人类在AI时代的角色定义、李飞飞的新书等话题展开了令人触动的对话。

Bill Dally(左)李飞飞(右)

如果说去年的GTC炉边谈话,黄仁勋与OpenAI首席科学家Illya进行的是一场对技术未来的漫谈,那今年这场炉边谈话就是李飞飞对人类未来的呼吁。

在对话中,李飞飞讲了个故事:在她完成自传《我看到的世界》的初稿后,她的好朋友,哲学家、斯坦福以人为本AI研究院联合主任John Etchemendy看了后建议她去重写。

他说很多人都在写关于AI的书,但李飞飞有一段独特的历程,能代表很多觉得自己在AI领域没有发言权或找不到认同感的人——包括移民、年轻女性、各行各业的人,他们不一定是典型的硅谷AI人士,如果李飞飞可以给他们传达一个声音,这将带来更多力量。

确实,李飞飞广为人知的一面是斯坦福大学终身教授,美国工程学院院士,AI视觉领域的顶尖专家,被业内称为AI教母。

而她个人的另一面则是出生在北京,长于四川,直到12岁才随双亲前往美国,还因生活拮据不得不去餐馆打工赚取生活费。这就是John Etchemendy提到的关于李飞飞的“独特的经历”。

在整场对谈中,李飞飞都在用一种很独特的视角来思考AI的影响和发展,给在AI时代失语的普通人发声。在李飞飞看来,所有AI的发展都是关于人,关于具体的人。

这是一种更有人文情怀的,更具社会责任,也更女性细腻的视角。正如她在自传《我看见的世界:李飞飞自传》中所展现出的力量一样。

以下文章整理自2024GTC炉边访谈:

一、相信AI会带来好的未来

Bill Dally:欢迎大家,感谢来到GTC。我相信大家和我一样,都对李飞飞教授要说的话充满期待。你是斯坦福以人为本AI研究院(HAI Stanford)的联合创始人。到目前为止,你认为AI对人类影响最大的领域是什么?你认为未来AI将在哪些领域产生最大影响?

李飞飞:这是一个非常宏大的问题。首先,非常荣幸受邀来到GTC。AI目前对人类的影响是什么?我认为AI可能是21世纪最深刻的技术,它正在改变我们的生活、工作和未来。

AI是一种智能技术。在这之前,人类的技术发明大多停留在不涉及智能的层面,无论是发明工具让我们走得更快、飞得更高,还是发明工具让我们能看到人眼看不到的东西,这些都还是机械性的。但AI的发明,如理解语言、翻译语言、做决策、发现模式等,这些都是人类的基本能力,而现在都受到了这项深刻技术的挑战。所以在我看来,AI的影响是对人类的本质、能力和定义的深刻影响。

在我担任谷歌云首席科学家时,我就看到商业分析是AI的一大应用领域。在医疗、交通、教育、软件工程等领域,AI的影响将是无边无际的。

Bill Dally:一些业界名人如埃隆·马斯克和山姆·奥特曼认为AI可能对人类构成生存威胁。你怎么看?你认为AI可能带来的最大风险是什么?

李飞飞:我认为这是一个合理的问题。作为大学里的人,尤其是在大学校园工作,我们应该被允许提出各种问题,包括AI是否对人类构成生存威胁。从智力角度来说,这是一个重要的关于未来的问题。

作为一个物种,人类应该认识到,我们发明的一切,不仅是AI,还包括我们正在改变地球的方式,改变我们与环境的关系的方式,都需要我们审慎对待。但就AI而言,我更关注更直接和紧迫的灾难性风险。你提到的一些风险是深层次的社会问题。例如,AI可能因为错误信息而影响民主,可能取代工作或改变劳动力市场格局,可能影响我们与数据的关系、隐私和公平性。如果我们不能很好地管理这项技术的应用,所有这些都可能带来灾难性的社会风险。

Bill Dally:你最近写了一本关于AI的科学回忆录《我看见的世界:李飞飞自传》,我这里有一本。大家现在应该都从亚马逊上订购这本书。你能告诉我们一些关于这本书的情况吗?你为什么要写这本书?

李飞飞:《我看见的世界:李飞飞自传》,这本书是一本科学回忆录。就像你说的,我把“科学”这个词放在第一位。这本书有一个双螺旋结构,通过我作为一名计算机视觉科学家的视角讲述了AI的发展历程。我看到智能在自然界的进化始于对世界的感知。在过去十几年里,AI的进化,特别是深度学习的历史,与计算机视觉这个领域的进化紧密交织在一起。所以这本书讲了AI在过去十年左右的发展历程,溶蚀也与一个年轻科学家的个人成长历程交织在一起。

我之所以觉得有必要写这本书,是因为我被要求写一本关于AI的科普书,我确实花了一年时间写了一本只关于AI的书。但我们的好朋友,哲学家、斯坦福以人为本AI研究院联合主任任John Etchemendy看了我的初稿,基本上说我应该重写。我当时非常沮丧。

他说,很多人都在写关于AI的书,但你有一段独特的历程。你代表了很多觉得自己在AI领域没有发言权或找不到认同感的人。这些人包括移民、年轻女性、各行各业的人,他们不一定是典型的硅谷AI人士。如果你能给他们一个声音,这将更有力量。因此,我把这本书的结构改成了双螺旋结构。

Bill Dally:非常有趣。AI的发展历程与你作为一名科学家的成长历程交织在一起。假设AI在十年后变得成熟的话,如果你要为这本书写一个续集,你认为它会是什么样的?

李飞飞:首先,我不认为我想写续集。如果我要为这本书写续集,我想写一个人类胜利的故事。我要讲述我们如何利用这项技术让生活和工作变得更好。我这么说并不是出于盲目的乐观,因为我知道世界非常复杂。对年轻人来说,这个世界有时甚至感觉会有点反乌托邦。但如果你看人类文明的发展历程,它是很长的。正如马丁·路德·金所说,如果我们能以正确的方式使用技术,人类文明的弧线是朝着正义、希望、仁爱的方向发展的。

就像在这次GTC大会上,我们只是看到了(技术改变生活的)冰山一角。我们看到了如何利用这项技术改变医疗,从药物发现到个性化治疗再到医疗服务。我们才刚刚开始思考教育如何从根本上被改变,因为突然之间我们有了一个教学助手,可以进行深度个性化学习和教学。

我们看到,科学发现可以在强大的机器和认知助手的帮助下加速,这些助手可以真正加速人类已经进行了数百年的科学发现过程。所有这些都给了我们希望之光,希望我们在五到十年内能利用AI寻找气候解决方案,普及医疗服务,照顾好地球和我们自己。

如果我要写续集,我想写的就是这些。

二、AI永远无法替代人性感知

Bill Dally:非常令人兴奋的未来似乎已经到来。我们已经看到模型从早期ImageNet时代的ContralNets,到用于语言的RNN,再到Transformer,发展得非常快。接下来会是什么?或者你认为未来我们的主导网络模型会是什么?

你认为基础模型是会出现在世界层面上?也就是说我们可以问它任何关于世界的问题,而它会以多模态四维格式回答我们吗?

李飞飞:目前最新的是扩散模型。但我认为,首先,我继续相信数据的缩放定律。我认为我们还没有看到这方面的终点。关于我们是否已经看到了语言数据的极限有很多猜测,但我不知道答案,因为我不从事语言领域的工作。

从根本上说,语言是一个一维结构。而我从事视觉工作。它从根本上是三维的。如果加上时间,就是四维的。三维结构要丰富得多,但也复杂得多。

当我们用大数据进行扩展时,如果是完全盲目的扩展,那么我想英伟达会很高兴,你们会卖出更多芯片。但我想看到的是结构化建模,或着说偏向于三维感知和结构的模型与大数据相结合。我认为,要真正创造出空间智能,创造出我们今天仍然缺乏的世界模型。

我确实认为基础模型会出现在世界层面。我认为你不需要只是问它问题。这是一种以语言为中心的交互方式。我认为实际上你应该可以与它互动。

看看人类,或者生物体,作为一个计算机视觉人,我想提醒大家一件事,自然花了5.4亿年的时间来创造感知大脑。而创造语言,大脑只花了几十万年。所以感知是非常非常深刻的。

Bill Dally:这是一个很好的观点——感知领先语言几百万年。或者说感知更难,所以需要更长时间。人们对AI的一个担忧是它会扰乱就业市场。你可以说它会创造就业机会,也可能使其他工作变得不那么重要。你认为什么样的人类工作是AI或机器人永远无法取代的?

李飞飞:这是一个很棒的问题,也是一个危险的问题。自人类文明伊始,我们的祖先想象过的每一种工作基本上都是由机器协作完成的,像移动、飞行、计算等等。

工作的定义是什么?如果工作是一项任务,比如抓起某样东西或做一个煎蛋,我想它会被机器完成。但如果工作是人性的一部分,是定义我们创造力的一部分,定义我们的独特性,定义我们的意图、我们的同情心、我们与他人独特的情感联系,以及我们每个人对他人或对社会可能产生的独特贡献,那么我认为这些永远不会被完全取代。我们只会利用机器来帮助我们更好地完成这类工作。我没有看到一个根本性的取代。

让我们再次回到医疗保健领域,我花了几十年时间在医院里照顾我年迈的父母。每次我带着父母走进病房,我都会看着人类照顾人类,或者人类需要人类来照顾人类。在这种关系和互动中有一些非常深刻的东西,是任何机器人、AI、电脑、AR/VR,或者你认为的任何下一代技术都无法完全取代的。

在人性方面,在人与人的互动方面,有太多超越了计算、计算、机械的东西,我认为这些将是会保留下来并不断演变的工作。我们将越来越多地被机器赋予超能力,但作为人类的核心不会被取代。

Bill Dally:刚才你讲到了人类的同理心、情感联系、关怀还有创造力。创造力是人类的核心特质,但如果我们选择训练AI模型让它们具有这些特征,我们能做到吗?我们可以建立有同情心的AI模型,让它能够在情感上与人联系吗?

李飞飞:在某种程度上可以。我再次强调一下,我从事计算机视觉工作。现在已经有了深度创造性的文本到图像以及文本到视频的生成(模型)。但我也认为,就像这里没有人能预测下一个爱因斯坦会是谁一样,这种创造力以及创造力的不确定性,将永远存在于我们人类社会中。所以无论你如何训练机器,你都无法训练出人类的智能或人类创造力。

不仅仅是爱因斯坦,还有贝多芬、莎士比亚、梵高。还有太多太多了。而且不一定非要是那么聪明的人。我自己的孩子,我不认为任何机器都能创造出那样一个甜美、聪明、幽默的小家伙。

Bill Dally:这是独一无二的人性,机器永远无法取代。说到创造力,生成式AI正在做一些了不起的事情。OpenAI最近推出了Sora,你可以输入一个提示,就能得到一个看起来很棒的视频。也许当你在十年后写自传的续集时,是否会发展到如果你想看一部电影,只需写几行提示,它就会为你生成一部两小时的电影?

李飞飞:我不认为这需要十年,多生产一些B200,它很快就会出现。就技术而言,我认为这即将到来——创建更长时间的生成性世界、生成性故事情节、生成性角色互动的能力指日可待。

Bill Dally:在这样一个世界里,我们有AI程序生成大部分内容,那些在好莱坞或游戏工作室等地方的人类内容创作者的角色是什么?

李飞飞:这又回到了人类的独特性。我不知道你们中有多少人是宫崎骏、吉卜力工作室的粉丝。他们是最棒的,我就是喜欢一遍又一遍地看他们的电影。从计算机图形学的角度来看,它相当初级,他们不做皮克斯和梦工厂那样的(复杂)图形。

然而那些独特的故事,比如《龙猫》的故事多简单,那部电影中有关人性的表达那么单纯,除了宫崎骏,没有人能创造出那样的东西。我认为这仍然是人性。AI会创作电影,会创作娱乐人们的内容,但只有人,能利用AI创作那些能触动他人、启发他人或服务他人的内容,AI做不到。我确实看到了这种共生的可能性。

三、“我”在AI时代的角色是什么?

Bill Dally:你的意思是AI基本上会接管这些创意事物的制作部分,制作真正引人注目的视频,让图像看起来很棒。但最终在情感层面上与人联系,去讲述一个能让人流泪的故事,这将是人类应该努力的部分。

李飞飞:没错。这也是我一直强调的一点,就是在这个机器时代,不要忘记我们的人性,不要忘记我们的尊严,不要忘记彼此的尊严和人性。这就是我们的核心,这就是我们的独特之处。这也是我们构建机器应用、使用机器的开端。

Bill Dally:你还有什么想传达给观众的吗?

李飞飞:我想说的一点是,GTC是一个特别的会议。你们来到这里,是因为你们都以某种方式参与了AI。

当我写出《我看到的世界》这本书并与全球各地的观众,特别是年轻观众交谈时,我经常被问到的一个问题。而每次有人问这个问题,我仍然会被触动——那就“我”在这个AI时代的角色是什么?

比如我,我不是计算机科学家,我不来自斯坦福大学的理科专业;我不做软件工程,我不是在有电脑的家庭长大的;我热爱跳舞……但所有这些来自各行各业的人都在问我,他们会在AI时代扮演什么角色。

因为AI看起来是如此复杂,它有7000亿个参数,你怎么用自己的大脑来理解这么庞大的东西呢?然后是所有这些花哨的词,transformer、生成式、扩散式,它们似乎离每个人都很遥远。

但我真的想把它归结为:它是一个工具。它是一个需要一些数学和计算来实现的工具。但归根结底,人类不仅是工具的创造者,我们也是如何使用工具的决策者;我们是工具应用的创造者,我们也是工具的用户;我们是决定如何管理工具以及管理想要使用工具的人的选民。所以在公民参与AI方面有很多的可能性。

我特别希望年轻人,那些热爱艺术、热爱社区、热爱法律、热爱医学、热爱化学的人,无论你的兴趣是什么,都能以负责任的态度拥抱这项技术,你们实际上可以为让它变得更好、更好地使用它而有所作为。

这真的是我对每个人的恳求——你们在AI发展中是占有一席之地的,请加入我们,让AI变得更好。谢谢!

本文来自微信公众号:seesayso(ID:gh_7504995ab922),作者:Bill Dally、李飞飞

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年3月20日
下一篇 2024年3月20日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日