李飞飞的历险

她的自传同时讲了两个故事:一个故事讲的是成长,是李飞飞15岁从成都移民到美国,从语言不通到今天成为一位世界级人工智能科学家的故事。

我理解让李飞飞在人工智能领域成名的一个主要原因,是她的实验室最早建立起了一个拥有超大图片数据的数据集ImageNet。

李飞飞在大学实验室工作,同时因为她的研究领域,她跟大科技公司和风险投资人都有很多的接触,她自己还曾经做过谷歌云的首席科学家。

李飞飞自传《我看见的世界》真诚且好看,而且还很讲究叙事技巧。

她的自传同时讲了两个故事:一个故事讲的是成长,是李飞飞15岁从成都移民到美国,从语言不通到今天成为一位世界级人工智能科学家的故事;另一个故事讲的是今天全世界最让人关注的科技革命,人工智能技术的发展,以及她在里面扮演的角色。

这两个故事,都是历险,但也都有好的结果。

李飞飞的父母很了不起。

按照李飞飞的描述,她的父亲在化工厂的计算机部门工作,母亲先是高中老师后来是办公室职员。她的父母应该都是很有聪明才智的人,比如她的父亲会自己动手组装带挎斗的自行车,她的母亲会带着她读鲁迅的书及《道德经》《第二性》《老人与海》《双城记》这样的文学名著。在那个年代,这绝对是典型的中国精英家庭。

同样典型的是,她的父母会为了自己的价值观和下一代,牺牲自己这一代可能的职业成就,移居到美国,让下一代有了可能去获得更好的教育、更好的成长。牺牲是巨大的:到了美国之后,她的父亲找了一份修理相机的工作,她的母亲则做了一名收银员,最后的巅峰是他们家开了一家干洗店。

这可能也是第一代移民很典型的经历——第一代人都要做好牺牲掉自己职业生涯的准备。

对于李飞飞而言,青少年的生活艰辛,尽管她并没有刻意渲染,但是叙述的不经意间,贫穷的寒意就从文字中间流露出来。

她会说,衣服的问题在大学时期得到解决,是因为“普林斯顿大学的学生很有钱,所以在这里上学的一个好处是,宿舍的洗衣房里堆满了被丢弃的衣服”。到大学时第一印象基本都跟吃的有关,“校园好像梦境一样,我这辈子见过的饭菜种类都没有食堂里那么多”。她的一位老师喜欢上午先喝一杯卡布奇诺,她会一起去,但是“我个人的经济状况并不支持我养成喝咖啡的奢侈习惯”。

与此同时,她很幸运地拿到了普林斯顿大学的奖学金,然后在大学时期,她的兴趣从物理学迁移到了计算机科学和人工智能。接下来,从参与加州大学伯克利分校的一个实验项目开始,她一步一步地进入到了计算机视觉领域的最前沿,直到成为人工智能领域的顶级科学家,被世界看到。

李飞飞是最早意识到数据在人工智能研究中重要性的科学家之一。

我理解让李飞飞在人工智能领域成名的一个主要原因,是她的实验室最早建立起了一个拥有超大图片数据的数据集ImageNet。而当时数据在人工智能或者说计算机视觉的研究中并不被重视,这是一个冒险的选择。

用李飞飞在自传中的话说:“在2006年,算法是计算机视觉的中心,而数据这个话题并不十分吸引人……数据生活在算法的阴影之下,仅仅被视为训练工具,就像成长中的孩子玩的玩具一样。”

到了今天,所有人都已经认识到,人工智能革命由三股力量共同推动。

第一股力量是算法。具体而言,是当时少数科学家坚持的神经网络算法,比如杨立昆的LeNet、杰夫里·辛顿的AlexNet,是今天谷歌的Transform。

第二股力量是硬件。具体而言,是英伟达的图形处理器GPU。

GPU是为网络游戏开发的硬件,但是从功能上,“神经网络倾向的数字运算方式类似于视频游戏的图形渲染方式”。于是,李飞飞写道:“在2012年初的某一周,当世界各地数以百万计的图形处理器忙于渲染抖动的机枪、成群结队的僵尸和弹片飞溅的爆炸时,有两台图形处理器正在多伦多的某个地方将一种新型神经网络从理论变成现实。”杰夫里·辛顿用英伟达的GPU,在大学实验室训练他的AlexNet。

第三股力量是大数据。李飞飞实验室的ImageNet就提供了一个大规模的图片数据集。“神经网络与ImageNet对世界的呈现是天然的契合…ImageNet的数据广泛而全面,覆盖了世界上绝大多数物体。”ImageNet的数据量,让辛顿坚持的卷积神经网络算法有了用武之地。

李飞飞说:图形处理器推动之。ImageNet挑战值。AlexNet适应之。

这里面有科学家的坚持,“赌性坚强”:“我的实验室将所有赌注,都押在了长达数年、规模空前的数据追寻上,辛顿的实验室将他们的声誉都压在了卷积神经网络,这套几乎已经被专业领域抛弃的算法上。”也有市场“看不见的手”的拨动,游戏产业的繁荣让英伟达可以开发出低成本的GPU,从而让大学的科学家们可以低成本的训练自己的算法。

说到坚持,李飞飞应该是一个很坚持自己想法的人。比如在这本自传里,从头到尾,没有出现一张她的照片。出版商肯定会要求,如果不是她极其坚持,书里肯定会出现各种照片,比如她从中国到美国时的照片、她父母的照片、他们家干洗店的照片,她大学时的照片、她到谷歌时的照片、她去国会发言时的照片……

硬件、算法和数据,共同发动了新一代的人工智能革命,从深度学习到生成式人工智能——以算法而言,从辛顿的AlexNet到谷歌的Transform。

从李飞飞的叙述里来看,人工智能的风险至少包括三点:缺乏透明度、容易受到偏见和对抗性影响、赢家通吃。

缺乏透明度是因为算法。AlexNet和Transform这样的神经网络算法是黑盒子,科学家们对算法的内部运作机制几乎一无所知。用李飞飞的话说:“我们可以从理论的、抽象的意义上谈论神经网络,它们能做什么,它们达到目标需要什么样的数据,它们训练后的性能特征大致在哪个范围;但从一次调用到下一次调用,它们在内部到底做了什么,却是全完不透明的。”

因此,李飞飞才说,人类与人工智能的关系正在发生转变。人工智能不再像是“根据第一性原理设计产生的技术”,而更像是自己出现的一样,“需要先识别、后理解”。

容易受到偏见和对抗型攻击影响是因为数据。已有的人工智能如果表现出了偏见,那是因为算法赖以学习的数据库本身就表现出了偏见,所以才会出现人工智能把黑人图片标注为大猩猩的恶劣案例。

对抗型攻击是指人类可以有意输入迷惑机器学习算法的内容,以达到“反直觉甚至破坏性目的”。比如可以通过单个像素颜色的细微变动愚弄算法,让算法把长颈鹿辨识为书架,把人行道上的行人辨识为其他物品——这就很危险了。

赢家通吃是因为规模。李飞飞说,从ImageNet时代开始,规模的重要性就已显而易见,但是近年来“越大越好”的观点几乎有了宗教般的意义。

数据规模要大、算力要大,直接结果就是:人工智能的主导权,在从像她和辛顿这样的大学实验室的科学家,转移到市值万亿美元的科技大公司手里。

这本书的名字叫《我看见的世界》。李飞飞的经历让她有机会看到更多样的世界。除了她在这本书里讲述的两个故事之外,我觉得在她看过的世界里,至少还有两个方面是非常有趣也非常有价值的:

第一个方面是中国教育和美国教育的世界。

我自己觉得,如果李飞飞仍然留在中国接受高等教育,她可能仍然会是一个不错的大学教授,但是一定不会站到人工智能领域的最前沿。这跟中国和美国的教育方法和学术环境是否有关系?关系是什么?中国的教育有可能改变这一点吗?

关于教育问题如果没有得到很好的回答,意味着对于中国乃至整个世界而言,都存在着巨大的人力资源的浪费。可能有很多天才的头脑都被自己所在的环境淹没了。

第二个方面是学术世界和科技大公司的世界。

李飞飞在大学实验室工作,同时因为她的研究领域,她跟大科技公司和风险投资人都有很多的接触,她自己还曾经做过谷歌云的首席科学家。她同时看过大学和大公司的科研世界,也都有自己的观察和看法。比如她写过:“首席执行官们在世界各地的舞台上发表主题演讲,有些内容高瞻远瞩,有些拙劣不堪,还有一些是彻头彻尾的侮辱。”比如她说自己在见OpenAI的创始人时,对方直接向她表示出在学术界进行人工智能研究并不可行。

那么,对于推动科技的发展而言,这两个世界各自的优劣到底是什么?全世界最聪明的头脑必须要去为大科技公司工作吗?大科技公司天然会更愿意考虑科技的收益而忽视风险,这会带来什么?或者说这种状况有可能改变吗?

都是有趣的问题,也期待看到她的回答。‍

本文来自微信公众号:李翔李翔(ID:gh_b19aab226944),作者:李翔

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年5月24日 15:30
下一篇 2024年5月24日 16:31

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日