OpenAI秘密研发AI搜索引擎，要攻入谷歌腹地？

2024年5月8日 18:47 • 未来科技

尽管用户体量依然差谷歌几个量级，但Perplexity仍然在一个Google长期霸占的市场，利用AI获得了阶段性颠覆的成果。

实时性方面，与ChatGPT等大模型依赖训练时的数据和语料获取信息不同，Perplexity基于底层传统搜索引擎开发而得，能够及时抓取最新的信息。在2023年4月的论文中，斯坦福的研究人员对YouChat、Perplexity.AI、NeevaAI及BingChat四个生成式搜索引擎进行了人工评估。

据多家外媒近日报道，知情人士透露称，OpenAI正秘密研发一款新的搜索引擎，可能叫SearchGPT或Sonic，目标是挑战Google的搜索霸权。

“OpenAI即将向谷歌搜索发起挑战，这是谷歌迄今为止面临的最严重威胁。”前 Mila 研究员、麻省理工讲师Lior S在X平台上爆料称。

据X用户名为Jimmy Apples的人工智能领域的知名爆料者预测，OpenAI将在5月9日发布新产品。而值得注意的是，谷歌I/O开发者大会将于5月14日召开。也就是说，OpenAI将抢在这场盛会之前发布搜索产品，大有“先发制人”之意。

有趣的是，当OpenAI搜索即将上线消息传出，谷歌的股价没有丝毫变化。这与一年前ChatGPT横空出世，众人大呼敲响搜索的丧钟形成了天壤之别。

为什么OpenAI会盯上谷歌这块“蛋糕”？我们又该如何看待谷歌搜索业务的前景呢？

一、盯上搜索“蛋糕”

从定义上看，搜索本质是联合整合信息的能力，AI搜索更进一步，不用用户挨个点开链接了，直接给你答案，相当于升级版的搜索。根据业内人士透露，有超过一半用户在AIGC产品里输入长句子，甚至最后还带问号。

这意味着，搜索几乎是AI应用最成熟的场景。Perplexity持续的流量增长就是最好的证明。在a16z 最新发布的月访问量前 50 的 GenAI 产品中，PerplexityAI 排名高居第七。根据Similarweb数据，Perplexity今年前三月的流量分别为4560万、4954万和6149万。

尽管用户体量依然差谷歌几个量级，但Perplexity仍然在一个Google长期霸占的市场，利用AI获得了阶段性颠覆的成果。

在这样的成绩面前，Perplexity也水涨船高。2024 年 1 月，Perplexity 筹集了近 7400 万美元，估值达到 5.4 亿美元，3 月初，Perplexity 以 10 亿美元的估值完成了 5600 万美元的融资。根据 TechCrunch 最新报道，Perplexity 正在筹集至少 2.5 亿美元融资，最新估值在 25亿～30 亿美元之间。

在国内也一样。AI搜索秘塔是仅次于文心一言和Kimi的第三大AI应用产品。今年3月，秘塔的月访问量为721万，增长了551%。

对于OpenAI来说，高昂的估值和庞大的研发开支，迫使其需要寻求更大的商业化突破。

一方面，ChatGPT的流量和商业化遭遇了阶段性瓶颈。SimilarWeb网站数据显示，在经历了2023年初的爆炸式增长之后，ChatGPT 自2023年6月全球流量下降了9.7%，流量逐月起伏。

2024年2月，随着GPT store和Sora的发布虽有所回升，但全球流量环比仅增长1%，访问量为 16 亿次，还没有完全恢复到2023年5月达到的峰值。受限于月活起伏，ChatGPT付费用户规模也不到1000万。

纵观与AI匹配的大规模商业化场景里，OpenAI 的选择其实并不多，其很难跟微软去抢 ToB 的市场，也很难跟英伟达去抢芯片的市场，更难跟 Apple 去抢终端市场。放眼望去，谷歌手上的搜索是OpenAI为数不多的可行选择。

既有Perplexity的珠玉在前，AI搜索的商业化想象力也足够大。2023年，谷歌的搜索广告机创造了超过1750亿美元的收入，广告总收入占谷歌2023 年总收入的近 78%。即使在国内，被认为“没落”的百度靠着搜索一年也能赚1000亿。

二、大模型与搜索有何不同？

在很多人看来，Perplexity和大模型好像没什么太大区别。ChatGPT本身就能直接解答用户的提问，NewBing 也是默认搜索加整合答案。这样看来，OpenAI下场做搜索自然轻而易举。

但其实并非如此。以AI搜索Perplexity为例，大模型和Perplexity的区别就是，一个能用、一个好用。大模型本身能搜索不假，但也会出现很多问题。

比方说，生成式AI无法做到实时更新，且受限于训练数据，可能无法覆盖相对小众、缺乏通用性的长尾知识。同时，生成式AI对生成内容的可控性较差，存在“幻觉”问题，用户也难以对答案进行直接验证。

Perplexity所做的事情就是，把这些大模型搜索过程中出现的“坑”一个个都填掉，其中最重要的事情就是信息的实时性和准确性。

实时性方面，与ChatGPT等大模型依赖训练时的数据和语料获取信息不同，Perplexity基于底层传统搜索引擎开发而得，能够及时抓取最新的信息。

准确性方面，Perplexity做了两件事情：减少幻觉和内容溯源。为了减少幻觉现象，Perplexity引入了RAG技术（检索增强生成），RAG的作用好比是给模型提供一本教科书，让它根据特定的问题去查找信息，通过关联外部知识来提高答案的准确性，有效减少了语言模型中出现的虚假信息，使得生成的回答更准确可信。

与此同时，Perplexity还对生成的每一句话都附有引用链接，在保证可靠性的同时便于用户溯源或深入研究。

不仅如此，Perplexity还对召回和排序环节的算法做了创新，保证内容的有用性及引用的精确程度。其中，“召回”指根据搜索指令从数据库中获取尽可能多的正确结果，“排序”指根据用户搜索内容的相关性对召回结果进行排序，决定了搜索引擎的精确程度和性能上限。

来源：中金研究部

这也让Perplexity成为当下综合性能最好的AI搜索引擎。在2023年4月的论文中，斯坦福的研究人员对YouChat、Perplexity.AI、NeevaAI及BingChat四个生成式搜索引擎进行了人工评估。结果显示，Perplexity.ai生成内容有用性的评分为4.56分，排名第二；引文召回率和精确度为68.7，排名第一；在泛搜索引擎类的体验中，综合能力位于最前列。

除了在信息准确、可靠上，Perplexity在响应速度上也花了很多功夫。比如，Perplexity通过自研推理堆栈，让其内容生成速度快于GPT类通用模型。在模型侧，公司对GPT-3.5进行微调，在降低成本的同时进一步提升响应速度。

Perplexity的成功，也证明了一件事情：比起模型能力，产品本身单点的价值创造和体验的优化，是一个更为重要的事情。这意味着，即使是拥有先进大模型的OpenAI，想要提供更好的用户搜索体验，上述产品层面的优化一样也少不了。

不过相比Perplexity等产品公司做模型，模型公司做产品的难度要小得多。

三、谷歌基本盘稳固，但隐忧不小

去年年初，ChatGPT的爆火，很多人断言，ChatGPT的出现几乎就等于敲响搜索的丧钟。按前谷歌第23位员工、Gmail的创建者之一Paul Buchheit的说法，像ChatGPT这样的人工智能聊天机器人将摧毁谷歌，就像当年搜索引擎彻底干掉黄页电话簿一样。

2023 年 2 月，微软宣布将推出由 OpenAI 的 GPT 技术提供支持的新版 Bing 搜索引擎，以追逐谷歌的搜索主导地位。当时，微软表示，仅1%的搜索广告市场份额就价值 20 亿美元的年收入。

但是，一年时间过去了，谷歌基本盘依然稳固。StatCounter 的数据显示，微软的搜索引擎在 2024 年 1 月的市场份额仅为 3.43%，比去年同期增长不到 1%。与此同时，谷歌的市场占有率为 91.46%，相比去年仅下降了不到 1%。

去年以来，谷歌的搜索广告收入逐季提升。到了今年一季度，搜索广告同比增长14%，甚至高于市场预期。

在产品层面，去年谷歌也推出了搜索生成体验（SGE），使用人工智能来生成复杂问题的上下文答案。看上去，谷歌似乎逐渐找到了用户体验到商业化之间的平衡。可以说，Bing的挑战失败了。

所以，当OpenAI的搜索即将上线，谷歌的股价也几乎没有变化。也就是说，市场并没有给这个事件的影响给予充分的定价。

但客观来说，不同于Perplexity，OpenAI的潜在威胁可要大得多。一方面，OpenAI天然拥有庞大的用户池，ChatGPT手上有十几亿的用户规模，日活在5000万左右。另一方面，OpenAI自身拥有模型，且性能更加先进。一旦agent最后成为AI时代大一统的终极产品，拥有更先进模型的OpenAI，将会给谷歌造成更大的麻烦。

换句话说，比起Perplexity，显然OpenA更有可能给谷歌搜索业务带来冲击。尤瓦尔·赫拉利在《人类简史》中写过这样的一句话：历史的铁律就是，事后看来无可避免的事，在当时看来总是毫不明显。

本文来自微信公众号：乌鸦智能说（ID：wuyazhinengshuo），作者：小黑

声明：该内容为作者独立观点，不代表新零售资讯观点或立场，文章为网友投稿上传，版权归原作者所有，未经允许不得转载。新零售资讯站仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。如对本稿件有异议或投诉，请联系：wuchangxu@youzan.com

Like (0)

胖东来能拯救永辉超市们吗？

Previous 2024年5月8日

《江湖菜发展报告2024》发布：江湖菜赛道进入稳步扩张期，赛道进一步挖掘潜力大

Next 2024年5月8日

水温80度：AI行业真假繁荣的临界点

我们从来没拥有过这么成功的AI主导的产品。

（这种分析统计并不那么准，但大致数量级是差不多的）

这两个产品碰巧可以用来比较有两个原因：

一个是它们在本质上是一种东西，只不过一个更通用，一个更垂直。

蓝海的海峡

未来成功的AI产品是什么样，大致形态已经比较清楚了，从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时“罢工”，全网打工人都慌了

美西时间午夜12点开始，陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载，忽然无法正常工作了。

因为发现AI用久了，导致现在“离了ChatGPT，大脑根本无法运转”。”

等等，又不是只有一个聊天机器人，难道地球离了ChatGPT就不转了。

大模型连崩原因猜想，谷歌躺赢流量激增6成

GPT归位，人们的工作终于又恢复了秩序。

未来科技 2024年6月5日
ChatGPT宕机8小时，谷歌Gemini搜索量激增60%

ChatGPT一天宕机两次

谷歌Gemini搜索量激增近60%

ChatGPT在全球拥有约1.8亿活跃用户，已成为部分人群工作流程的关键部分。

过去24小时内提交的关于OpenAI宕机的问题报告

图片来源：Downdetector

ChatGPT系统崩溃后，有网友在社交媒体X上发帖警告道：“ChatGPT最近发生的2.5小时全球中断，为我们所有依赖AI工具来支持业务的人敲响了警钟。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时大崩溃，AI集体罢工让全网都慌了

接着OpenAI也在官网更新了恢复服务公告，表示“我们经历了一次重大故障，影响了所有ChatGPT用户的所有计划。Generator调查显示，在ChatGPT首次故障后的四小时内，谷歌AI聊天机器人Gemini搜索量激增60%，达到327058次。

而且研究团队表示，“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关，显示出用户把Gemini视为ChatGPT的直接替代选项。

未来科技 2024年6月5日
深度对话苹果iPad团队：玻璃的传承与演变

iPad最为原始的外观专利

没错，这就是iPad最初被设想的样子：全面屏，圆角矩形，纤薄，就像一片掌心里的玻璃。

2010年发布的初代iPad

好在乔布斯的遗志，并未被iPad团队遗忘。

初代iPad宣传片画面

乔布斯赞同这一想法，于是快速将资源投入平板电脑项目，意欲打造一款与众不同的「上网本」，这就是iPad早年的产品定义。

iPad进化的底色

苹果发布会留下过很多「名场面」，初代iPad发布会的末尾就是一例。

未来科技 2024年6月5日
底层逻辑未通，影视业的AI革命正在褪色…

GPT、Sora均为革命性产品，引发了舆论风暴，但它在上个月发布的“多模态语音对谈”Sky语音，却由于声音太像电影明星斯嘉丽·约翰逊，被正主强烈警告，被迫下架。

华尔街日报也在唱衰，认为“AI工具创新步伐正在放缓，实用性有限，运行成本过高”：

首先，互联网上已经没有更多额外的数据供人工智能模型收集、训练。

03、

如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向，那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

但分歧点正在于此，电影公司希望通过使用AI技术来降低成本，但又不希望自己的内容被AI公司所窃取。

未来科技 2024年6月5日
KAN会引起大模型的范式转变吗？

“先变后加”代替“先加后变”的设计，使得KAN的每一个连接都相当于一个“小型网络”，能实现更强的表达能力。

KAN的主要贡献在于，在当前深度学习的背景下重新审视K氏表示定理，将上述创新网络泛化到任意宽度和深度，并以科学发现为目标进行了一系列实验，展示了其作为“AI+科学”基础模型的潜在作用。

KAN与MLP的对照表：

KAN使神经元之间的非线性转变更加细粒度和多样化。

未来科技 2024年6月5日
这个国家，也开始发芯片补贴了

//mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
[4]中国安防协会：欧盟批准430亿欧元芯片补贴计划：2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
[6]潮电穿戴：印度半导体投资大跃进，一锤砸下1090亿，政府补贴一半.2024.3.5https。

未来科技 2024年6月5日
大模型的电力经济学：中国AI需要多少电力？

这些报告研究对象（数字中心、智能数据中心、加密货币等）、研究市场（全球、中国与美国等）、研究周期（多数截至2030年）各不相同，但基本逻辑大同小异：先根据芯片等硬件的算力与功率，计算出数据中心的用电量，再根据算力增长的预期、芯片能效提升的预期，以及数据中心能效（PUE）提升的预期，来推测未来一段时间内智能数据中心的用电量增长情况。

未来科技 2024年6月5日
你正和20万人一起接受AI面试

原本客户还担心候选人能否接受AI面试这件事，但在2020年以后，候选人进行AI面试的过程已经是完全自动化的，包括面试过程中AI面试官回答候选人的问题，AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

以近屿智能与客户合作的校验周期至少3年来看，方小雷认为AI应用不太可能一下子爆发，包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

未来科技 2024年6月4日

OpenAI秘密研发AI搜索引擎，要攻入谷歌腹地？

相关推荐

Share To :