人们对大模型的预期太高了

时间已经到了年底,这一年最大的热点莫过于大模型。从二月底开始,几乎每隔一段时间,圈子里就会有一波 AI 新闻汹涌而来,多少让人兴奋。整体来看,一年时间,大模型已经从炒作阶段过渡到了价值沉淀阶段。你看,日常我们的讨论至少不用局限在 AI 生成诗词、小作文之类的场景,它们乍一听有趣,但没啥用。当新鲜感过去之后,我们终究会发现“有用”才是产品的最终立脚点

今天的文章又是一次聊天内容的整理。上周五下午时分,拖着丝丝困意,我和大模型创业者、前开课吧首席产品官、前得到 App 副总裁、前网易教育事业部首席产品架构师孙志岗老师聊起大模型,没想到,越聊越兴奋,特别是最后谈到教育时,他眉梢一动,激动得像个孩子。

我被孙老师感染了。

年初时,我就和孙老师交流过大模型。现在想想,差不多一年过去了,他的判断虽不中亦不远矣。以下内容,希望对你有帮助。

老池:这一年,互联网圈最大的变量当属 AI 大模型了。它在 2023 年大放异彩,并且也在不断变化之中。要不咱们最开始,先聊聊你感受到的大模型这一年的变化,我目之所及,它在逐步成熟,大众对它的认知也在祛魅。

孙志岗:我认同你说的“祛魅”,我也用过这个词。这一年,大众对 AI 大模型的预期过高了,从二三月份开始,在 OpenAI 以及微软的一些重要产品发布之后,我朋友圈里都刷屏了。并且刷屏的文章标题时常带有“颠覆”之类的词。

老池:甚至我记得那会,还有新闻说,有个公司因为用了 Midjourney 之类的产品,然后开始裁员。我心想,你要裁员就直接说么,还非道貌岸然地归因到使用某个先进的工具上。奇奇怪怪的归因,但有人信,很多人慌张了。

孙志岗:嗯,你看现在,类似的新闻少了。大家都理智了,知道这技术适合做什么,不适合做什么,局限性是什么。这不挺好。

老池:前两天我参加飞书的发布会,他们 CEO 谢欣说了一句话:我们必须得承认 AI 现在还没那么强,但同时又得相信,它未来会非常强。这话挺深刻的。有点像我们常讲的:对于新技术,人们总是短期高估,长期低估。

孙志岗:从炒作阶段过渡到了价值沉淀阶段。一开始,写个诗啥的,这种场景只能说有趣,很难谈得上有用。但从商业上看,只有有用、有价值,逻辑才能成立。

老池:有个问题我一直没想明白。阿里巴巴的逍遥子曾经说过一个观点:“面向 AI 时代,所有产品都值得用大模型重做一次。”这观点其实我到现在都有点迷糊。我理解的重做是像移动互联网那样,在移动端基于新的载体和端的能力,重新架构产品。但现在,我怎么看到的基本都是融合呢,钉钉融合大模型,淘宝广告投放端融合大模型。

孙志岗:“重做”这个词,有很大的解释空间。我一直认为,AI 只是个功能,不是个产品。你想想,PC 时代创造了电脑这个场景,Web 时代创造了上网这个场景,移动互联网创造了随时随地上网这个场景,而大模型没有创造任何新场景。所以,我对做大模型应用创业造富,是不抱多少希望的。

老池:也就是说大老板们所谓的重做,并不是我们理解的移动互联网时代那种层面的重做。

孙志岗:对。旧有的东西不会被完全推翻,它们不会变得一文不值, Photoshop 还是需要的, Word 也还是需要的, PowerPoint 也还是需要的,Google 也还是需要的。他们只是借助 AI 让里面以前一些繁琐性的工作可以变得更容易、更简单,它只是增加了 AI 的能力。

老池:有意思。移动互联网时代的重做,完全是因为终端变了,交互方式变了。而大模型,并没有这个层面的变化。

孙志岗:是啊。所以从这个角度讲,根本没必要重做么。但话说回来,我肯定认同所有的产品都应该认真思考下怎么借助大模型优化用户体验,创造新的可能性。大模型毕竟是跨时代的技术,它蕴藏着很多变化。

老池:怎么讲?

孙志岗:微软今年提出来一个概念,叫 Collaborative UX,协作式用户体验。它其实是讲在产品中,人和 AI 的关系是什么,它们应该如何协作。

老池:微软今年发布了 Copilot 全家桶,在一系列的产品中都集成了大模型。这 Copilot 就是他们理解的 Collaborative UX 吧。

孙志岗:对,但微软的方式也不一定对,都还在探索。微软一直强调用户是主驾驶,AI 是副驾驶。有点像什么呢?像老池你正在做 PPT,然后 AI 就在你旁边。你让 AI 帮忙找个图片,它可以帮你。你让它改下布局,它也可以搞定。

老池:哈哈哈哈,我理解了,你没把话说死。你的意思是未来软件界面还是有可能变化。

孙志岗:有点像你刚才说的谢欣的观点。AI 还在早期么,所以我的意思是我们至少要思考,思考某种可能性,并为此做好准备。重视而不是忽略,并且,一开始也别高估。

老池:所以,至于是不是重做,很难说。重做又不是目的。拿搜索引擎举例子,New Bing 倒是全部重做了,但有什么意义呢?用户并不喜欢。Google 和百度都没重做,都在做重合。比如百度,你现在去搜索试试,比如搜“冬天 散文”,它会在最前面给你写一篇冬天相关的散文出来,这个场景挺好。

孙志岗:并且交互的话,我也不觉得像 ChatGPT 那样 LUI 的方式会成为主流。你想想,咱们工作中肯定经历过这样的场景:你本想让同事帮忙做个事,但一两句话又说不清楚,你感觉好费劲啊,于是说让开,我自己来吧。对话的方式绝对不是效率最高的。

我家里有个小米的加湿器,想关闭加湿器,我可以喊一声:小爱同学,关闭加湿器。但如果我在加湿器旁边,直接伸手按一下是不是更省事?

老池:但我觉得是不是在 ToB 的产品中,LUI 的方式会更自然?第一,大多 ToB 产品都很复杂,对话式的交互可以降低使用门槛。第二,LUI 和 GUI 也不是非此即彼的关系,他们可以互相融合。

比如,我们公司用飞书,我想了解某个客户当前的进展。之前的操作方式是在飞书里打开 CRM,然后再输入客户名称,搜索,好多步。而如果能直接在飞书里用对话的方式完成,那会高效很多。就在对话框里,我不需要跳出,直接描述需求就好,如果说不清楚,那可以弹出来个 GUI 么,这不就能解决问题了。

孙志岗:我不觉得在交互层面 ToB 和 ToC 有什么区别。拿微软来说,虽然 Office 是企业买单,但终端还是个人用户在用。

老池:但我们还是把它定义为企业软件、办公软件。

孙志岗:我的意思是它不会因为 ToC、ToB 产品属性来归类交互方式。最终还是会回到一个问题上:旧有的产品怎么更好地结合 AI 能力。现在真的还在早期,没有好的答案,微软只是跑得快一些,但快也不代表对。在没有定论之前,我也不敢瞎编。

老池:那你感觉到底什么样的场景里比较适合 AI 呢?

孙志岗:如果你是一个产品经理的话,你可以想想自家的产品中,有哪些部分是文本进文本出。因为大语言模型最擅长处理的就是文本,甚至说只会处理文本。它把所有的内容都当作文本处理。像客服系统就很典型,用户提问,进来一段文本,客服系统回答, 再返回去一段文本。

你可以想想哪些场景里是文本进文本出,然后看看能不能用 AI 优化,比如让它变得自动化一些,或者效果好一些、成本低一点。不一定产品的呈现上非得有 AI 味,你可以把 AI 融入到冰山之下。

然后在这个基础上,随着多模态能力的提升,你可以再看看能不能有图片进文本出,或者文本进图片出的场景,一步步朝多模态的方向延伸。这是我当下的一个思考框架。

老池:挺有趣,看起来这还是改造旧有的场景,难道 AI 大模型就没有创造出来新场景吗?

孙志岗:至少从现在的角度看,我只发现了一个场景是 AI 创造出来的——Character.ai 干的事儿。之前没人觉得和虚拟人物聊天有这么大的需求,现在,大家乐此不疲。并且,没有大模型之前,就算你知道有这种需求,也实现不了。

老池:那 GitHub Copilot 呢?目前和工程师们聊,大家对它的评价挺高的。它是完全基于大模型的创新,并且想象空间很大,你想想,这些年来,不管是框架,还是低代码之类的产品,其实都在解决代码生成的问题。现在,大模型技术的突破,更优雅又具效率地解决了这一问题。

孙志岗:是的是的。但它是更好的解法,不是全新的场景。我也经常和朋友说,现在 AI 大模型能完成的所有有价值任务里面,编程类的任务是效果最好的,并且交互也是最自然的。

说到这,我得吐槽下很多文档类的产品,它的生成就很鸡肋。很多产品在演示的时候,都说你看,我可以生成个大纲,生成个框架,但这种场景,正儿八经写作的时候,谁会用到?除非是八股文写作。

老池:反正我用了这么久了,没用过那功能。我不觉得有用。

孙志岗:对,老池,你是正儿八经写作的人,并且,你之前也写过代码。你知道,写代码的时候,编辑器提供补全的功能,比如 Java 吧,你敲个 Concu,然后咔,一按 Tab 键,会自动补全为 ConcurrentHashMap。写文章的时候,要是能有这样的交互,那才爽。整个大纲啥的,我是觉得那个场景太拙劣了。

老池:我之前用 Notion AI,体验了一段时间后,感觉操作来操作去,老打断我思路。于是,放弃了。我当时还说,我最想让 AI 给我查个错别字,咋就不提供这功能呢。神奇。

并且,我感觉写代码和写文章还有些不同。因为从用户角度看,文章是最终的产物,用户会直接看文章。但不会看代码。而用户直接看文章的话,机器生成的文章,也不是不能看,只能说,水平比较差,它没有人的灵性在里面,我的表达有我的风格啊。

孙志岗:你下次可以试试在 VSCode 里开着 Copilot 写,我觉得效果挺好的,并且它也融入了我的风格。你看看这个截图。

老池:好的,我再去体验体验。

孙志岗:反正对于我来说,效果挺好的。我写作挺慢,很多时候都要字斟句酌,有时候,找到合适的词会花费很多时间。这时候,AI 就成为我一个非常好的帮手了。也许你不存在这个问题,你积累的词汇量比我多。

我提出过 AI 提效定律,它是说 AI 提效这件事情,和使用者的判断力成正比,但和使用者本身的生产力成反比。怎么理解呢?

你眼光独到,你能一下子判断出来 AI 的生成是好还是不好,那这时候就能充分借力 AI。若他的生成不好,你马上说这不对,要怎么改,这样反复几次之后 AI 就能交付出好的结果。

但如果你没有判断力,AI 输出一堆之后,你也不知道好不好,你完全蒙圈了,不知道如何选择。那这种情况下,怎么可能提高效率呢?对吧。所以,我说 AI 提效和判断力成正比。

然后你个体的生产效率已经很高了,比如你是余华,词都在你脑子里,都在内存里,从内存里取、判断,肯定比依赖外部系统快么。这时候,AI 能给你带来的增强就很有限。当你文笔很差,总是词不达意的时候,AI 才能发挥威力。

老池:有点遇强则弱,遇弱则强的意思。然后审美也会越来越重要,AI 无法替代人的审美,决定还是由人来做。

孙志岗:老池,你知道我这些年一直在搞教育。从哈工大的老师,再到网易云课堂,再到得到 App、开课吧,这些年,我基本都在教育领域,什么样的公司都接触过。AI 大模型来了之后,我曾很多次和做少儿绘画的朋友交流,我说当 AI 已经能够画出很好的画的时候,小孩子还有必要学习用手画画吗?

我朋友是中央美院毕业的,中国美术的最高学府。他见到的人,不管是大师还是小师,那都是从小拿着笔,一笔一笔地画,画了十年,二十年,三十年这样。在日复一日的创作中,他们有了手感,有了审美,成了大家。

老池:我肯定觉得还需要,有些事,AI 替代不了。你先说,你聊起来这话题两眼放光。

孙志岗:这还只是个思想实验。我是觉得,当 AI 慢慢变强的时候,我们只要培养审美就够了,一个人只要能用文字把自己想要的东西表达出来,然后让 AI 去画,然后再逐步调整就够了。何必非得一笔一笔地画呢?

老池:那你觉得这还算是创作吗?

孙志岗:为什么不是呢?

老池:那我举个例子。我坐在我们公司设计师旁边,让他给我设计个图片,但我不会用对应的设计工具,比如 Photoshop,我同事会。我撸起袖子,发号施令,告诉同事,你给我画一个大概什么样的东西。他画完之后,我说给我整点壮丽的红,然后那个角再圆一些,他咔咔咔按照我的意图完成了设计。这是我在创作吗?

孙志岗:为什么不是呢?

老池:我觉得那像是那个设计师在创作。或者我们在共同创作吧。

孙志岗:你看,从最开始,要怎么干,以及要修改哪里,这都是你做的决策。只是某些细节的执行和决策是那位设计师做的。这个作品里包含了你的创意、你的判断、你的决策,为什么不是你的作品呢?

老池:这让我想起电影行当的事儿。我们国内经常喜欢说某某电影是谁的作品,比如张艺谋作品、陈凯歌作品。但编剧芦苇之前就很不爽,他说:“我特别反感一个现象,导演要把电影署名为自己的作品——某某某作品。这个风气太坏了。凭什么是你的作品?我觉得都是自大狂。你看外国电影,除了艺术片导演偶尔会这样,一般都不会这样。”

孙志岗:这是一个视角。

老池:他说,“电影本质上是一个集体创作,怎么成你一个人的作品了?还有编剧,还有摄影,还有美工美术,还有演员,还有音乐,这是大家的作品。”

孙志岗:但如果对方是 AI 的话,就不存在这问题了。

老池:我理解你的意思。你是觉得如果 AI 越来越强,教育体系都可能发生变化。我想起来今年年初,曾任哈佛大学教授,谷歌、苹果公司工程总监的大牛 Matt 曾经说过,编程将被淘汰,我相信“写程序”的传统观念正在走向消亡。

孙志岗:对。也许我们学编程的时候,不需要再从 Hello World 开始了。学这些,没必要了。类比回刚才讨论的画画,也是一个道理。你想想,当计算器出来了之后,我们还是会学算数。但是我们学算数不是为了算数。我们后面学画画,也不是为了画画。

你把算数当成谋生的手段,那最快速的就是操起计算器,你不用自己掰着手指头算那个加法进位,你用计算器是最快的。如果你把画画当成谋生的手段,最快的方法是拿起文生图的大模型,给他发指令。

老池:若谈效率,那 AI 肯定是高。但聊到这里,我也想到了另外的话题,就是人类追求效率这事,也会带来很多的新问题。算数吧,不算创作。但画画这事,本身还是创作。创作本身可能还有一些副产品,比如对人的身心的影响。你看现在这社会,效率挺高的,但新一辈的人,心理问题也挺多的。

孙志岗:是的,这话题容易扯远。仅仅是个思想实验。但如果有机会,我还挺想试试 AI 时代该怎么做编程教育的。你知道,我教编程曾经是非常厉害的,但让人指挥 AI 写出非常棒的软件,那需要怎么培养这个人?我非常感兴趣。这可能是以后所有教育都会面对的问题:如何培养“眼高手低”的优秀人才——眼高说的是有判断力,有审美;手低是说我们可以让 AI 帮忙干,不一定非得自己吭哧吭哧来。

本文来自微信公众号:MacTalk(ID:MacTalkPro),作者:池建强

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年11月29日
下一篇 2023年11月29日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日