OpenAI、谷歌都在“Perplexity化”,谁是Perplexity?

RAG:一种开卷考试

让Perplexity不同于Google的是答案引擎,而让Perplexity不同于ChatGPT的,是被称作RAG(Retrieval-Augmented。

公司档案:

Perplexity

创始人Aravind Srinivas:

2017年,在印度理工学院马德拉斯分校获得工程硕士学位。

Perplexity,这个翻译成中文叫作“困惑”的产品很受欢迎已经不是新闻了。

英伟达创始人黄仁勋不久前接受采访时声称,他“每天都会用Perplexity”。今年1月,这家公司声称自己的月活跃用户已超过1000万,仅印度就有超过100万用户。而今年迄今为止,Perplexity在美国市场收到的用户查询接近7500万单,比2023年全年都要多。4月23日的最新一轮融资中,它筹集了约6300万美元资金,估值超过10亿美元——仅仅3个月前,其估值还只有5亿美元。

Perplexity正在改变传统的搜索体验。自2022年8月推出以来,曾在Google人工智能部门任职的研究人员在短短的时间内就研发出了一个聊天机器人式的研究助理,用户可以向其提问,该助理将实时回应从互联网获取的信息,以及它使用的信息来源。

最新传闻称,OpenAI已开发类似产品,并且本周就会上线。除了OpenAI,阿里巴巴旗下的搜索引擎品牌夸克据说也准备在今年下半年推出有类似用户UI的搜索产品,中国初创公司中的智谱、豆包、月之暗面都已为自己的问答机器人加入了提供参考链接功能——智谱不仅给出了参考链接,还像Perplexity那样在回答完问题后列出了一些“相关问题”,此外,它也效仿Perplexity开始将当日新闻作为话题,展示在对话框的上方。

如同一年前几乎所有应用都试图像ChatGPT那样把交互界面(UI)变成一个问答窗口,如今,几乎所有的生成式AI应用又试图“Perplexity化”。Perplexity究竟是什么?

答案引擎

模型“聪明”并不是Perplexity的最大卖点,毕竟它使用的都是第三方模型,其中既有GPT也有Gemini和Claude,有人因此甚至把它归为“套壳”产品。不过它吸引用户的关键之一恰恰是产品设计。

乍一看,它也像一个聊天机器人,提供与ChatGPT类似的交互体验。你向它提出一个问题,比如问它马斯克的脑机接口是怎么回事,它就会回答你“马斯克是Neuralink公司的创始人,而这家公司不久前宣布了全世界第一起脑机接口的人体试验,该人体试验的初步结果显示,这个植入人脑的设备探测到了神经元的放电模式”。

不过,相较其他聊天机器人,Perplexity提供了一个新东西——确定性。比如,它会在所生成内容的某些关键信息后面添加数字小标,然后像论文格式那样列出信息来源。循着小标,你就能看到路透社、彭博社、CNN、雅虎、连线等知名媒体关于Neuralink公司的脑机接口人体试验的原版报道链接。

你可以在对话框中提出问题,Perplexity的AI会作出回答,并标注信源链接。

而在AI回答的下方,你还能看到一系列相关问题,比如“Neuralink开发脑机接口的目的是什么”“Neuralink的脑机接口如何工作”或者“Neuralink脑机接口的潜在风险是什么”。这些问题被称作“相关问题”(follow-up question),如果它们引发了你进一步了解的兴趣,你可能就会点进去继续阅读——这个设计听起来有点像AI版的知乎,只不过提供回答的不是人类,而是AI。

除此之外,它还提供一种非常有用的功能,即允许用户将搜索范围限制在特定数据库中,比如你可以要求它将检索范围限定为YouTube、Reddit,也可以是特定学术期刊。

像Perplexity这种产品在市面上被称为“AI搜索”,因为它在回答问题之前其实先去搜索引擎上搜索了一圈相关信息,然后才归纳总结并回复用户。不过,Perplexity创始人兼CEO Aravind Srinivas更愿意称之为“答案引擎(Answer Engine)。“用户可以直接提出任何问题,并得到一个实际的答案,而不仅仅是一个可能包含或不包含答案的网页列表。”Aravind Srinivas说。

回答完你的提问,它还会给出一系列“相关问题”,答案同样是AI生成的。

答案引擎、问答系统的历史其实比搜索引擎更古老。早在Google的网页列表式UI出现之前,1970年代,信息检索领域的研究者就开始制作一种通过自然语言处理(NLP)来访问文本的应用程序。1990年代中期出现的Ask Jeeves服务(现为Ask.com),就是以一个穿着考究的人类形象,在网页中提供问答服务。

1990年代,Ask公司就开始以一个Jeeves的形象提供问答服务(现为Ask.com)。

2020年左右,Google也曾探索过通过简单的文本提取方式实现问答服务,如今你在Google搜索某一新闻或其他事物后出现的几百字摘要,就是这种文本提取技术的成果。不过没有大模型技术,这种文本提取式问答无法综合多个页面的内容,也因此无法回答更为复杂的问题。

RAG:一种开卷考试

让Perplexity不同于Google的是答案引擎,而让Perplexity不同于ChatGPT的,是被称作RAG(Retrieval-Augmented Generation)检索增强生成技术。顾名思义,这种技术使大型语言模型(LLMs)可以连接到外部知识库,利用从外部来源获取的事实提高生成式AI模型的准确性和可靠性,减少模型本身的“幻觉”。

创造RAG这个词和技术的人是帕特里克·刘易斯(Patrick Lewis),他在2020年一篇名为《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》的文章中首次提出了这种方法。现在,他是Cohere RAG团队的负责人。

RAG技术可以与任何外部数据源连接,通过它,用户基本上可以与任何数据存储库对话。比如,医疗领域的聊天机器人可以通过查询医院数据成为医生的得力助手,金融分析师的机器人也可以通过查询市场相关数据库变得更为可靠。

几乎每家企业都有属于自己的知识资产、数据库,过去,以OpenAI为代表的大模型公司提出以“微调”的方式为各垂直领域客户提供服务,即它倡导用各企业的内部数据继续训练大模型公司们提供的基础模型,从而推出一个更懂某家公司的专有模型。举个例子,GPT-4在学习了更多法律、财务知识后,就比在这些领域学得不够多的GPT-3.5更容易通过司法考试、分析师考试。

而RAG的路径与此不同,采用这种技术的公司,比如Perplexity,没有让GPT-3.5或GPT-4继续学习特定领域的垂直知识,而是将这部分数据作为可随时查询的对象给模型参考。打个比方,OpenAI不断用更多数据训练学识更渊博的大模型、然后由其直接为用户解答的做法相当于一种闭卷考试,Perplexity之类的RAG公司则是开卷考试

“用户永远不犯错”

产品形态上,Perplexity位于搜索引擎Google和聊天机器人ChatGPT之间,除了问答窗口、“相关问题”,它还有一个叫“发现”(Discover)的选项卡,里面有大量人为选择的当日新闻摘要供用户浏览和继续追问。与ChatGPT或Gemini相比,“发现”选项卡使得用户了解全球正在发生的新闻变得更加容易。

“发现”选项卡展示了人工编辑选出来的当天热门新闻。

整体看起来,Perplexity更像一个AI版的知乎,用户哪怕不提出问题,也能看到足够多且有趣的问答。

Perplexity身上有知乎的影子似乎并不令人意外,因为其创始团队中的多位成员都曾在Quora工作,后者是一个问答社区,知乎曾经模仿的正是Quora。比如Denis Yarats,他曾在Quora担任机器学习工程师,如今,他是Perplexity的CTO;创始设计师Henry Modisett也曾在Quora工作超过8年,曾参与设计Quora的feed流、问答等产品设计。

Quora创立于2009年,是一个基于知识分享的社交网络。

不过,Perplexity创始人Aravind Srinivas并没有在Quora工作过,促使他采纳“AI问答社区”这一设计方案的哲学有两个:其一,用户不会有犯错;其二,无论如何都不要单纯做搜索。

第一个产品哲学来自他的竞争对手Google。Aravind Srinivas称,他看过Google联合创始人拉里·佩奇(Larry Page)分享的一个故事:佩奇和Google另一位联合创始人谢尔盖·布林(Sergey Brin)曾经差点把Google卖给Excite,当时他们一起给Excite CEO做了演示,同时打开两个浏览器窗口,一个是Google,另一个是Excite,然后佩奇在两个搜索引擎中输入了同样的文字,Google成功返回了相关链接,而Excite没有。Excite的人当场表示Excite没有成功返回链接是因为佩奇的输入“不准确”。佩奇回答“我只是个用户,我没有犯错”。从这个故事中,Aravind Srinivas学习到了人机交互的一个基本原则——用户永远不犯错。

Google曾差点被出售给Excite,不过2000年左右,Excite自己先破产了。2004年3月,Excite.com门户网站被Ask收购。

“虽然每个人都有很强的好奇心,但能将好奇心转化为精确问题的人很少。”Aravind Srinivas说,Perplexity因此花了大量时间在处理、分析和重组用户查询的问题上,也就是说,当用户提出相对含糊的问题后,Perplexity会首先将问题处理成更有逻辑的提问方式,即优化用户的Prompt后,才将问题交给模型回答

“相关问题”和“发现”功能的设计也出于同一逻辑,Aravind Srinivas称,他会亲自参与“发现”选项卡背后的内容挑选,以便持续了解产品是否一直“足够简单,连普通新用户都能轻松理解”。Perplexity首席商务官Dmitry Shevelenko提供的数据称,由“相关的问题”产生的用户查询占据Perplexity总查询量的40%。

持续改进产品,让现有用户不断把产品推荐给更多朋友使用,同时保持产品容易上手的特性,对新用户友好。Aravind Srinivas称这两点也是Facebook早期的用户增长策略。

“无论如何都不要单纯做搜索”,这个哲学是投资人Marc Andresson给Aravind Srinivas的建议。Aravind Srinivas曾一度迷茫是不是应该专注做垂直搜索引擎,而不是把业务继续扩展到AI问答社区等有社交属性的领域。Marc Andresson的回答是“大多数宣称做垂直领域Google的公司都失败了,反而是在垂直领域建立端到端用户体验的公司成功了”,比如Booking,它不仅能搜索酒店,还能直接完成预订,而Airbnb已经不只是一个住宿预订平台,而是一家能提供综合旅行服务的公司了。只要做得足够深,竞争优势就不会只停留于技术、用户积累这样的单点上。

Aravind Srinivas被Marc Andresson说服。如果Perplexity的初衷是满足人们无穷的好奇心,那一个AI版问答社区就会比单纯的搜索引擎有用得多。“在Quora上,人们需要花一定时间等待别人来回答自己的提问,不仅很慢,也无法最大化加速知识的获取,Perplexity就是想要解决这样的问题。”Aravind Srinivas说。

Perplexity正在追求成为“服务更加全面”的公司。除了网页端产品,它最近还推出了适配苹果Vision Pro的头显端应用程序,并与Brilliant Labs建立了合作伙伴关系,用户能通过AR眼镜完成查询。

积累用户比训练模型重要

和曾经激励Aravind Srinivas创业的Jasper一样,Perplexity也一度被质疑为大模型的“套壳”产品,因为它在很长时间里都没有训练自有模型,而是利用GPT、Claude等第三方模型向用户提供基于AI的搜索服务。

不过Aravind Srinivas坚信他的做法才是对的,“如果你的目标是建立以产品为核心的公司,就不要在训练自有模型上浪费时间”,他认为“成为一个拥有10万用户的套壳产品显然比拥有自有模型却没有用户更有价值”。直到Meta发布第二代模型Llama 2并开源后,Perplexity才开始基于这一开源模型训练自有模型。

直到现在,Perplexity的团队规模都不大,只有45名员工,总部位于旧金山的一个共享办公空间。

4月初,Perplexity表示其活跃用户已经增长到1500万,比1月报告的1000万增长了50%。但Srinivas和他的投资者认为,颠覆Google搜索的时机已经成熟。

Perplexity被认为是Google的强有力潜在竞争者。咨询公司Gartner预测,到2026年,传统搜索引擎的市场将下降25%。因为搜索营销的份额会被ChatGPT那样的聊天机器人、Perplexity这样的答案引擎,或者其他AI智能体(agent)夺走。

Google已在测试自己的生成式搜索工具,不过态度似乎不够坚定——就连这项AI搜索的名字本身“Search Generative Experience”(搜索生成体验),听起来也毫不响亮。

Google正在测试的AI搜索功能,它有个不太响亮的名字“Search Generative Experience”(搜索生成体验)。

商业模式上的挑战是Google一直难以跳下来做“问答引擎”的原因。自2000年以来,Google的主要收入来源就是广告。根据Google 2023年财报,其广告业务营收2378.6亿美元,在总营收中占比77.4%。如果生成式AI能够对于用户提问给出快速且完整的回答,可能使得传统搜索引擎和夹杂在网页列表中的高利润广告变得多余。

Perplexity面临的商业化挑战与Google其实是一样的。其网站上目前还没有广告,因为它认为搜索应该“不受广告驱动模式的影响”,但它打算在“相关问题”中提供有品牌赞助的问题。这一广告产品可能在未来几个季度推出,能创造多少广告收入还是未知数。

目前,Perplexity的主要盈利方式是对高级功能收费。和OpenAI、Anthropic等公司一样,如果用户想要访问平台上的高级功能,比如上传自己的文件,让模型根据自己的职业、位置、好恶等信息来创建“个人资料”,以获得个性化的答案和建议,就要支付20美元/月的订阅费。为这些高级功能付费的用户并不多,自2022年12月推出以来,只有不到10万人为高级版付费。

公司档案:

Perplexity

创始人Aravind Srinivas:

  • 2017年,在印度理工学院马德拉斯分校获得工程硕士学位。

  • 2018年年中,在OpenAI实习,专注于使用策略梯度算法解决强化学习问题。

  • 2019年年中,在DeepMind实习了大约5个月,专攻大规模对比学习。

  • 2020年5月至2021年4月,在Google实习,参与研发基于自我注意力的模型HaloNet和SOTA视觉模型,如ResNet-RS。

  • 2021年,获得加州大学伯克利分校的计算机科学博士学位。除了强化学习,他还专注于计算机视觉、图像识别、视频生成和图像生成的Transformer的对比学习。

  • 2021年9月,回到OpenAI担任研究科学家,从事语言和扩散生成模型研究。

  • 2022年8月,离开OpenAI,并于当月创办Perplexity AI。

  • 2022年11月,ChatGPT上线。

  • 2022年12月,Perplexity上线。

Perplexity融资:

2022年9月,获310万美元融资(种子轮),Google首席科学家Jeff Dean、GitHub前CEO Nat Friedman、OpenAI联合创始人Andrej Karpathy和天使投资人Elad Gil参与投资。

2023年3月,获2560万美元融资(A轮),估值1.5亿美元。2024年1月,获7360亿美元融资(B轮),IVP领投,亚马逊创始人贝索斯参投。公司估值5.2亿美元。

2024年4月,约获6300万美元融资,估值超过10亿美元。

本文来自微信公众号:新皮层NewNewThing(ID:gh_38b8653e0e0b),作者:吴洋洋、杨秋秋,编辑:吴洋洋

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年5月8日
Next 2024年5月8日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日