本周,OpenAI 搞了一个大花活。
整整一周,不断有外媒获得最新消息,报道 OpenAI 即将推出搜索产品,甚至前几天,已经有媒体拿到了 ChatGPT Search 的提前体验版本——界面仍然是对话交互,但 GPT 回答时会使用网络信息进行回答。
不过,在预热了一整周后,5 月 11 日最新消息称,OpenAI 在下周将举行发布会,但不会发布 GPT-5,也不会发布 AI 搜索引擎。
AI 搜索目前是海内外 AI 创业团队的重要方向之一。在海外,主打 AI 搜索的 Perplexity 目前估值已经超过 10 亿美元。
OpenAI 为什么会选择在这个时间点做一波这样的宣传?如果 OpenAI 真的入局搜索,会对搜索格局带来什么影响?对于创业者来说,AI 搜索是一个好的方向吗?
5 月 10 日,极客公园创始人&总裁张鹏、推出国内第一款融入大语言模型的搜索引擎-天工 AI 搜索的昆仑万维董事长兼 CEO 方汉,和投资了最近几个月数据飙升的秘塔搜索的猎豹移动董事长兼 CEO 傅盛,在极客公园“今夜科技谈”的直播中,共同聊了聊这个话题。
两位嘉宾都是经验丰富、身经百战的创业者,在外媒传出确切消息之前,就明确指出了 OpenAI 此次传出要推出 AI 搜索引擎的消息,大概率并不是要在此投入巨大的精力,做成一项惊人的产品,而更多是一场 PR 战术。
两人共同对 AI 搜索背后所需的技术储备、AI 搜索的成本结构和商业模式进行了分析,并对 AI 搜索的未来进行了展望。
极客公园对此次直播进行了整理,分享如下。
一、OpenAI 做搜索,能做出什么新的花样?
极客公园:OpenAI 为什么在这个时间点上传出要推出搜索引擎?
傅盛:前天我和朱啸虎一起参加了中投的论坛,他当时有一个观点就是觉得 OpenAI 的 CEO Sam Altman 是一个非常能吹牛的人。我觉得无论怎么说,我们要意识到,Sam Altman 的 PR 能力确实是非常强的。
从历史上来看,他每一次 PR 的时间点都拿捏地非常准确。当时发布 Sora 的时间点,就是 Anthropic 的 Claude3 和其他几个大模型上线的时刻。它们在文本能力上进展很快,那 Altman 立即给你升维一下,说你看你还在讲陆军的事,我都到空军了,然后立即舆论又都在关注 Sora,OpenAI 又成了业界唯一的明星。
其实你现在回头想想,Sora 从头到尾就是一场 PR,现在都五月了,还是没有开放给公众使用。
传闻中的 OpenAI Search 测试界面 | 图片来源:赛博禅心
我的观点是,GPT-5 的研发,肯定遇到了一些问题。如果不是这样,直接上 GPT-5 就好了。科技企业,永远都是能早一天就早一天,绝对不能晚的。GPT-5 要不就是性能没有提升地那么惊艳,要么就是成本特别高。
但以我对 OpenAI 的理解,即使成本再高,只要效果特别惊艳,它一定会往外放,先震你一下再说,哪怕 GPT-5 一天就能用 5 条,那也让你先用一下,让所有的人的目光都先看过来。所以我觉得 GPT-5 的研发可能还是遇到了一些问题,不管是成本,还是所谓安全性问题,或者幻觉问题,反正多少遇到了问题。
对于 OpenAI 来说,在现在这么烧钱的情况下,用户量增长就是它的核心命脉,一旦不增长,融资下一笔钱的时候,估值不能再上一个台阶,就会很麻烦。
所以我觉得这次说要做搜索引擎,就是围魏救赵,我最近经常唱衰 OpenAI,因为我觉得,从一个商业公司的角度看,其实 OpenAI 走到这里,现在有点骑虎难下。
方汉:我首先非常赞同傅盛老师一个观点,就是 Sam Altman 的确是一个 PR 高手,而且是绝顶高手。
我认为在 OpenAI 里面,权力最大的其实是 PR 团队,或者说负责去融资的团队,其次是技术团队,再其次是产品团队。我认为是这个排序导致 OpenAI 做出了现在的种种行为。
GPT-4.5 和 GPT-5 为什么迟迟不发?根据我得到的消息,OpenAI 已经训出来了,也不是能力不行,但是它现在没有把握在工程上把这个东西效益最大化。
意思是什么?刚才我们也聊到了,用户涨不上去是 OpenAI 现在最头疼的事情。如果发布了一个新的大模型,它没有把握一次性、瞬间获得足够多的用户,那它就不会上,这是它根本性的原因。
那么发搜索产品呢?从我们目前看到的产品形态来讲,OpenAI 的搜索产品,并没有对海内外所有的搜索引擎产品,形成碾压,形成 SOTA(state-of-the-art,最佳表现),发布这个产品,可能会让用户有一点增长,但不会让用户翻倍增长。所以我认为,这是在 Google I/O 前一周对谷歌的一次战略狙击,它的根本战术上,还是在等待和筹备 GPT-4.5。
极客公园:OpenAI 如果推出搜索引擎,会解决 OpenAI 的什么问题吗?会使搜索引擎的格局有变化吗?
方汉:我觉得它应该能提升用户使用上的体验,但是对大盘影响不大。
最早 Bing 推出 new Bing 的时候,把谷歌都吓死了,但最后对于 Bing 的大盘其实没有什么影响,谷歌过了半年一看,市场份额好像没什么变化。我觉得搜索引擎对于 OpenAI 的用户增长也不会有根本性的变化。
傅盛:我还没看到它的具体页面会怎么设计,但我觉得,如果它变成一个默认功能的话,还是多少会增加一些用户的感知点的。未必是能带来多少新用户,但是老用户的留存活跃这件事可能能够变得好一点。
OpenAI Search 测试界面 | 图片来源:赛博禅心
搜索这个功能,对于用户在日常将其从好玩,变成当作生产力工具在使用,是非常重要的。我其实之前一直不明白为什么 ChatGPT 在发布之初没有增加这个功能,我怀疑原因可能在于成本。
它本来成本已经很高了,也一直在努力降成本。不加搜索时,本来用户问一个问题,然后模型去预测下一个字,都需要这么多推理成本。如果加上搜索后,用户问一个问题,你先去啪啪啪搞出几十个网页,抓取下来几千个字,传给模型再让模型总结,那这个成本就高很多了。
极客公园:在部分灰度用户的测评中,我们看到此次 OpenAI 所说的搜索产品,其实产品形态和现有的搜索产品很接近。是不是 AI 搜索的产品形态,没有太多的创新空间了?
傅盛:现在这个形态的 AI 搜索,我觉得创新空间不大。
AI 搜索,是让用户省去了去点网页、选网页以及看网页的过程,而把这个过程交给大模型,用 AI 去替你做这件事情。
这里面涉及两个技术问题,一个是把网页收集回来,一个是把网页内容传递给大模型让大模型进行总结。
前者涉及要建立网页索引库,而不是简单地去百度搜几个网页,然后拿回来加工——百度肯定是不让你这么干的。秘塔搜索也是自建了索引库。而后者涉及 AI 算法和模型能力。
我觉得形态上大家都是比较类似的,而从模型能力角度讲,目前看来,整理网页内容把它输出出来,需要的 AI 能力,其实也不是那么高,百亿参数的模型已经够了,那后面就是谁能把工程化、产品化做得更好。
工程化是什么意思?技术,我们指的是算法啊等等的进步。比如原来是用牛、马来进行运输,那我现在在算法层面,做出一个超级算法,相当于我做了一个蒸汽机,把这些东西统统搞定,仍然能保证有很强的运载力。
而工程化指的是,有时候现在没有这么强的一个技术出来,我们怎么去多搞牛、马,协调这一千头牛、一万匹马来完成一件事,还保证它不出错。
AI 搜索现在虽然是大一统了,但在很多细微的地方,能看到不同的产品是不一样的。
PerplexityAI 的搜索界面 | 图片来源:截图
比如用户在问不同问题的时候,看似在做同一件事,其实不同的搜索产品背后,会用不同的分类策略,对问题先进行分类。哪些问题的深度要求高,哪些问题的实时性要求高,再做对应处理,不同的产品就会体现出区别。
再比如一个回答,是从知识库里调出来后只进行回答,还是纯网页的信息整合?那天我问秘塔搜索,第三次世界大战会不会打起来?你会发现它的回答不完全是基于网页内容做出来的报告,它给了我三种可能:打、不打、说不清楚。但是同时它搜了很多网页,为选项做了支撑。这个如何保持一定的客观性,分配权重,是很细的活。
再比如,AI 搜索引擎怎么去做排序?这也是一个点,而且可能未来和传统搜索引擎的点完全不一样。比如,传统搜索引擎一般是不会把一篇很专业的,非常长的论文,直接推到用户面前。但是在 AI 搜索下,为了提供更准确的回答,它在搜索引擎所依赖的背后内容的排序上,可能反而是很靠前的。
所以我觉得,未来的 AI 搜索产品,拼的应该不是谁的技术特别牛,拼的是如何让搜索结果能够更忠于网页内容,如何做出更体系化的整理的这种工程能力和产品设计能力。
方汉:我认为现在 AI 搜索的产品形态只是一个暂时的形式,为了让传统搜索引擎用户能够很顺畅地迁移到新形态的 AI 搜索上去。但是随着技术和产品的迭代,我相信新的交互形式、新的产品形式都会在 AI 搜索上展现。
比如我们可以看到这次 OpenAI 的搜索 GPT,里面包含了一个功能叫 wikis,我认为可能就是用 GPTs 这种 agent(智能体)来实现的。在搜索的时候,可以调用各种各样的模型解决用户的问题,这将是 AI 搜索的上限所在。
也就是说,根据用户的特定需求,我可以调用各种各样的模型,我可以调用翻译模型,我可以调用总结模型,我还可以调用 tts 模型,把它转成语音输送给你。如果用户想在论文方向搜索,我专门做一个论文的智能体,调用这个智能体来回答你的问题,这个上限我觉得是非常高的。
在我们的实践过程中,我们的天工 AI 搜索里已经集成了大量官方制作的智能体来提升 AI 搜索的效果,且推理成本其实还是可控的。
但是我这里要吐槽一下 OpenAI。因为我看了 OpenAI 的使用界面之后,我心里的想法是,他们的技术话语权远远超过产品的话语权。
search.chatgpt.com 的网页存档 目前该网站无法打开 | 图片来源:X 用户 Tibor Blaho
为什么这么说?
它们的产品里,要搜索,首先要选模型,有两到三个模型,还要选是否使用图像搜索等等,我觉得复杂度比谷歌还高。让我一个做技术的人看没有问题,但很多用户一定是用不明白的。他们的所有技术细节都没有藏起来,我开个玩笑,这样做产品的,在张小龙手下,一定活不到第二天。
所以总的来说,我认为 AI 搜索的形态仍然有非常大的进化空间,但具体怎么变,说实话我也很难预测。
OpenAI 也没有带来太多产品形态方面的惊喜,最多就是这个 GPTs,但我觉得在国内的人看来,比起我们熟悉的微信小程序什么的,看起来也还是挺落后的。
二、AI搜索好在哪?从设计原理上解决幻觉问题
极客公园:AI 搜索相较于传统搜索引擎有哪些区别,有哪些优势?
方汉:传统的搜索引擎是通过爬虫,把互联网上所有的网页都抓取回来,经过清洗跟排序,最后在用户打出查询词的时候,搜索引擎按照自己的逻辑对网页进行排序,给到用户。整个过程,用户需要自己选点那个网页,点开之后也要自主去看。
而 AI 搜索,让用户省去了去点网页、选网页以及看网页的过程,你直接看到的,就是它对现有网页的一个总结结果,相当于一个搜索小秘书。
它最大的作用是什么呢?是降低了用户的搜索时间,并提高准确性。
我们都使用过传统搜索引擎。要去打开网页看内容,看完了靠人脑去总结,耗时其实是蛮长的,基本上都要几分钟,但现在大模型替你做了这个事情,它可以在几秒钟之内就给你一个总结,基本上天工搜索的用户都会反映它极大地提高了大家的工作效率,甚至它的一些总结,包括脑图 PPT 等,你可以直接用。
天工 AI 搜索的增强模式(共有简洁、增强、研究三个模式)| 图片来源:截图
在传统搜索引擎中,最早的谷歌搜索引擎除了搜索按钮以外,还有另外一个按钮 I feel lucky,点一下就直接进入第一个搜索结果,实际上是传统搜索引擎降低交付的走成本的一个尝试。本质上我们现在所有的 AI 搜索就是 I feel lucky 那个按钮所起到的作用,只不过我们做得比他们要好得多。
另外就是准确性。AI 搜索解决了大模型的幻觉问题。大家一开始用 ChatGPT,其实很多人是把它当搜索引擎用的,但实际上它是会经常一本正经地胡说八道。AI 搜索通过 RAG 这些技术,先找到事实,限制大模型根据以上事实来回答问题,能极大地抑制甚至彻底消除大模型的幻觉。
傅盛:我们一定要意识到一点,就是搜索用户在搜索的时候,其实抱着非常多的目的。有的搜索,就是寻址,我懒得记一个网页的网址,我要去那个网页,我就去搜索引擎上搜索一下。不知道大家知不知道,以前百度搜索的第一名,是 Hao123,一个汇集其他网址的导航网站。
还有一些搜索,只需要一些即时的简单内容,这种也不太需要 AI 搜索。我觉得现在的 AI 搜索,更侧重于一些特定的搜索需求——在一个相对复杂的问题下,对网络上的结果进行综合分析,更偏向于形成某个东西的一份调查报告那种感觉。
秘塔搜索的研究模式(共有简洁、深入和研究三个模式)|图片来源:截图
当然,它从客观上克服了幻觉的问题,但要理解 AI 搜索,一个更好的理解是把它作为大模型的一个非常垂类的场景,大模型作为主力,去帮我研究一下比如新能源车最近价格是如何变化的,这个助理就帮你去在搜索引擎上找了一堆的文章,然后给你整理了一份报告。
极客公园:用户愿意信任 AI 搜索吗?AI 搜索是不是只是一小波用户的需求,而不是一个大众需求?
傅盛:用户愿不愿意信任 AI 搜索,AI 产品能做出怎样的体验非常非常关键。
比如秘塔搜索,在产品中,它生成的回答会列出参考资料,列给你看,增强你的信任感。我看到有些竞品,也列了 12345,但实际上,引用的不是列出来的最新内容。
秘塔搜索的深入模式(共有简洁、深入和研究三个模式)|图片来源:截图
所以我觉得,用户的信任,可能是需要通过不断地通过品牌的行为去强化和获得的。
不产生幻觉,我觉得技术上是完全可以做到的。这时候就要看是不是因为大家做产品做得比较快,细节上做得不够,另外任何搜索引擎,包括传统搜索引擎,也会出现一些误差,能不能把这个比率控制在不影响体验的范围内。
这也是我前面说,AI 搜索现在是比拼工程化、产品化的时候的原因。不是弄一堆文章过来,整理一下,就算做好了。
对 AI 搜索引擎来说,其实用户对于 AI 不信任的问题,反而是其次的。更多的是如何去用 AI 满足更多的搜索需求。
比如百分之八九十的搜索可能不需要用到深度分析,我在传统搜索引擎下,搜一下得到一个电话或者地址就好了。这可能是 AI 搜索需要解决的更大的问题。
不过长期来说,所有的搜索,肯定都是 AI 搜索。包括传统的搜索引擎,他们也在看,也在推出 AI 搜索的功能,大家最后肯定是殊途同归的。
方汉:我认为 AI 搜索首先是没有幻觉问题的,因为从技术原理上来说,它是先搜索再总结,然后再通过智能体去处理。在这个流程过程中,我们从源头杜绝了这个欺诈的问题。
同时传统搜索引擎要列出更多网页,需要保证这所有网页都不是欺诈网页。而我们只需要把这些网页里面我们认为最可靠的三个,互相交叉验证之后最可靠的三个内容进行总结,展现在网页上给用户去看,那么可靠性一定是增强了的。
我们都有能力鉴别一个网页是不是欺诈,但并不是所有用户都这样。我们的父母辈,他们真的是没有能力鉴别这一点的。天工搜索有合规小模型,反欺诈模型来筛选网页,也会从 prompt 端优化让模型输出多数网页认可的价值,那鉴别能力低的用户用 AI 搜索,效果一定是正向的。
我们这些很熟悉技术的人,自己很熟悉传统搜索,能够主动地去合适的网站找到合适的内容,所以有时候觉得一部分需求好像 AI 搜索满足不了。但我们不要忘记,AI 搜索从出现到现在也就一年多的时间,随着时间的推移,我认为 AI 搜索在体验、准确性等问题上都会远远超过搜索引擎,
我们的用户数据里看到,天工搜索的用户的粘度是非常高的,非常信任我们。为什么?因为他们会看我们给出的索引。
比如说体制内的人用我们的搜索帮助写公文,他会发现我们索引,引用的都是官方媒体的,他用了几次之后就会非常信任我们,所以我认为,信任会随着时间的推移而逐渐增强。
天工 AI 搜索的研究模式(共有简洁、深入和研究三个模式)|图片来源:截图
至于用户群体,我刚才也提一下,new Bing 出现后,Bing 搜索引擎的市场份额只有小幅增加。那是因为它当时的智能体技术不成熟。
用户上来就是搜一首歌、搜个电视剧、看个八卦什么的,我认为这部分需求用智能体一定是可以可以解决得非常好。
有了智能体的技术,用户更多的长尾需求可以得到满足,那么我认为用户量的增长是指日可待的。
我完整地经历了中国搜索引擎的发展过程。当初百度搜索在北大燕园资源楼办公的时候,我还去参观过。其实最早用搜索引擎的人,也全是像我们这样的一些技术极客,但慢慢它就会泛化到全人群。我认为 AI 搜索也是这样。
现在使用我们 AI 搜索的主要用户应该还是白领用户以及技术极客。随着时间推移,AI 搜索也一定会逐渐被更多样的人群使用。
三、AI搜索的商业前景:成本低于5美分就能盈利
极客公园:传统的搜索引擎是用户免费使用而 B 端投放广告,形成了成熟的商业模式。AI 搜索中,用户直接得到搜索结果,会不会改变商业模式?能够盈利吗?
方汉:上个时代的搜索成本,它首先有个固定开销,就是你的爬虫集群的开销,这个爬虫集群,如果索引全球的网页的话,那基本上在 3000 台服务器到 1 万台服务器之间,这是个固定开销。
另外一部分成本就是做 page rank(网页排名),这个服务器规模是更为庞大的,且是动态开销。你的用户越多,你就需要越大的集群。
在这两个开销之外,还有人员成本,还有保护费的成本——比如说谷歌每年要给苹果交钱,让苹果保留使用谷歌作为默认搜索。
所有这些都加起来之后,谷歌每年搜索引擎查询次数是 3.3 万亿次,单次搜索的成本是 0.2 美分。然后整个谷歌搜索广告的收入是 1500 亿美金左右,去年可能是 1600 亿美元差不多,可以算出来,差不多一次搜索产生的收入是 5 美分左右。
然后再跟大家说一个数字,OpenAI 早期的成本,注意不是现在的成本,早期的成本,一次对话的成本是 36 美分。你可以看到这里面有几个数字差,36 美分、 5 美分、 0.2 美分。可以看出来,推理成本是 AI 搜索商业模式中非常关键的因素。
我再跟大家分享另外一个数据,文生图有一个开源模型,叫 Stable Diffusion。我记得非常清楚,在 2022 年的时候我开始使用它,当时一张 4090 的卡平均跑 3 分钟出一张图。今天我还是用同一张卡,一秒钟能出 100 张图。可以看出,推理的优化速度非常快。我认为跟摩尔定律是有点像的,推理成本的下降速度跟摩尔定律是一样的,非常快。
甚至在未来,端侧推理变得足够成熟之后,在端侧去做这件事情,几乎不存在推理成本了。我认为 AI 搜索商业模式应该很快就可以打正,这只是一个时间问题。
从商业模式上来说,最基础的 AI 搜索的商业模式,一定是靠广告信息流,那么这个商业模式也是非常成熟的。实际上国内的单个搜索能够收到的钱比国外高很多,但基本上也是在 5 美分或者是几十美分这种量级,我们认为这个东西在短期内也不会有太大的变化,所以我们也在一直优化,一定要把我们的推理成本打到 5 美分以下,整个商业模式才会成立。
我认为这个在现在也不是特别难的事,这一天迟早会到来。
我们还会做智能体,智能体实际上属于 VIP 服务了,还可以收到更高的费用。
傅盛:在商业模式的问题上,首先,每次搜索成本的价格必须降下来。
Transformer 那种大架构,如果你有千亿参数,每一个网页你都送进去喂一把,来一下上下文,那最后它就是很贵,搜索成本不降下来,你找用户收钱,每月收你 100 块钱,我还得限制你用多少次,商业模式就是算不过来账。
秘塔搜索的创始人是猎豹移动以前专门负责 NLP 的首席科学家。特别值得一提的是,他们做产品的时候思路非常清晰,搜索成本一定不能高。
秘塔在搜索背后的这个模型,大概也就是百亿参数,是自己训的一个模型,所以这使得秘塔搜索每次的搜索成本是非常低的。现在有的大模型,几百万字上下文,可能一次搜索的成本要几十块钱。
秘塔搜索的深入模式(共有简洁、深入和研究三个模式)|图片来源:截图
我觉得由于需求的这个场景越来越明确,然后大家如果在这个网络框架或者算法上去发力,整个行业一起努力,我觉得成本会降得很快,可能最后降到一个和传统搜索成本差不多,或者稍微高一点点的水平,这是我个人的一个判断。
而真正未来的商业模式,也许是一个复合模式。比如在秘塔搜索里面有个功能叫深度分析,可能以后那种深度分析的功能就是会员享受的。具体的秘塔商业模式会怎么发展,我不能替创始人回答,只是一个想法。去年秘塔这个团队都是盈利的,它没有像 AI 公司一样去烧钱,是非常务实的团队。
极客公园:AI 搜索是创业者的好机会吗?
傅盛:AI 搜索,我们叫大搜索创业,肯定不适合大部分创业者。竞争对手都是巨头,压力很大。
其实 AI 的出现对搜索大厂本身是增强的。为什么大家现在开始用小红书搜索一些娱乐内容,讲难听点,就是因为今天百度不好意思公开地去抓人家不让抓的数据。但有了 AI,大厂可以偷偷抓,变成自己的内容吐出来,像是洗稿,那其实是增强了它的能力。
而且大厂其实不是没有 AI 的能力,AI 的能力是在传统搜索团队覆盖范围之内的。传统的搜索引擎公司,想做 AI 搜索,核心是成本问题,不是能力问题。创业者尽量不要去打人家火力范围内的事情。
对于大厂来说,它不着急。这波人工智能下,我认为即使英伟达的股价泡沫破灭了,谷歌可能都是比较稳的。它只要不断地做 Gemini,等到整个商业模式变好了,再开始大力推。
只要大厂不犯重大错误,大搜索的格局就很难有大的变化。
但是我觉得 AI 搜索的这个模式,对于很多垂类来说是可以做的。随着一些基础技术和 AI 的普及,比起以前,创业者做一个垂类搜索的速度快了非常多。
搜索可以无处不在,它不一定要以一个大搜索的形式存在,所以创业者可以考虑在你的各种产品当中去加一些 AI 搜索模块。因为 AI 搜索它整个的能力已经上来了,成本也降下来了。做模块可能比以前要简单得多、也会多得多。
方汉:首先我认为 AI 搜索不是创业者一个好的方向。很简单,AI 搜索,如果你要想做到成本最低,你一定要自建搜索引擎索引库,这个成本是非常高的,我不觉得一个小创业者能解决这个问题。
我们公司做这个事情是因为我们原来在海外做 Opera News 这个新闻推荐产品的时候,从 16 年开始就自建了一个比较小的一个搜索引擎,我们当时每天大概索引 5000 万个新闻网站,我们整个 AI 搜索的引擎团队是一脉相承的,也就是说我们做这个搜索引擎的集群已经做了有七八年了。
索引库实际上就是爬虫集群和存储集群。比如有做个人站的,你能看到的个人站上,有几个网站带着 bot 的标志来爬虫你的个人站了,你就知道有哪几个公司是有自己的爬虫集群的。
这一块其实是一个比较大的成本,因为如果你没有的话,你就得去买第三方的服务,比如调用 Google 或者是 Bing 的索引库,给他们钱。那基本上购买第三方服务就可以把你所有的利润都吃完了。谷歌自己的成本是 0.2 美分,那你觉得卖你多少钱是它觉得合适的?
这个成本远比你的推理成本要高,而且推理成本正在迅速地下降。
看未来,AI 搜索最后可能不会取代市场上的老大,但它有可能把市场上的老二老三给挤下来。
现在虽然有谷歌搜索,其实同时仍然还有很多的搜索引擎。垂类的搜索引擎活得很好,比如 DuckDuckGo。我认为这种引擎反而是未来受到威胁最大的。
另外我反复强调智能体,你的智能体如果能够满足一部分垂类用户的需要,那你这个 AI 搜索就能够长期存在,而这些特定领域,搜索巨头未必能覆盖到。举个例子,搜论文,谷歌做了一个学术搜索,但是在中国有知网,然后在海外还是有 Arxiv,垂类领域我们认为 AI 搜索通过智能体的赋能空间还是非常大的。
天工 AI 的智能体广场 | 图片来源:截图
极客公园:未来搜索这个形态本身,还有搜索的市场格局,会发生变化吗?
方汉:一个比较少被讨论的点是,在现在的搜索格局下,谷歌和百度这两个搜索巨头,都在自建内容闭环。谷歌给 Wikipedia 捐了很多钱,20% 的流量落在 Wikipedia 上。百度有百度百科、问答等等。
大模型可能会完全颠覆内容闭环这件事。Wikipedia、百科都需要人工编辑,只要需要人工编辑,维护成本就非常高,而目前看到,大模型是有机会自己去生成 Wikipedia 的。我觉得下一段时间 AI 搜索都会聚焦的一个方向是内容生成。
包括我们看到,微软的新模型是使用 GPT-4 生成的教科书来训练的。大模型现在已经可以生成教科书了,虽然这个教科书用来训练模型,我们实际看到其实效果不太好,但仍然可以从侧面说明,我们离生成合成数据越来越近了。
传统意义上的搜索,它只是一个很长一段时间最适合我们获取信息的一种方式。然后随着大模型的进步,随着 AI 的进步,我们认为我们有能力给用户提供更方便、更直接的这样一个体验。只要你能够让用户真正的省时间,真正的能提高准确性,变得方便,那么你的使用率自然会上升,你的留存自然会变好。
大家都现在都在卷模型的指标。以后当技术进步放缓的时候,我认为产品就会介入。现在这一波 AI 创业中,产品的话语权是远远低于技术的,我认为这个情况是不太正常的,长期来看一定是改变世界的是产品。
未来的搜索市场份额,我认为新产品一定是能拿到的。谷歌这样的大公司,沉没成本太高了,行动速度一定是比新产品慢的。但是能不能守住这个市场份额,以及能不能颠覆这个市场,是不一定的。
2023 年搜索引擎市场份额 |图片来源 YouTube Data Wrap
可能颠覆市场的是做操作系统的,或者是做别的产品的公司,一下子降维打击,把搜索引擎的市场搞没了。端侧推理和智能体,都可能带来颠覆创新。
傅盛:五年之内,搜索的形态可能会发生一些变化,可能真的会从一个纯服务端的变成本地化的。意思是,我真的不再去打开一个网站了,我就在手机上问我的 Siri 就行了,每个回答给我 20 字,直接满足我 90% 的需求。
我不知道这件事会不会真正发生。但是端上运行的大模型,将变成一个非常重要的变量。
像我刚才讲的,搜索市场本身,在原来的格局下,我看不到第一名被颠覆会有很大可能性发生。234 名可能会有些变化,谁在这个 AI 上怼的快,可能市场份额就上去了。
但是我觉得,明年我们可能会看到一个结果,就是端侧推理,会不会给整个搜索形态带来重大的变化。
苹果六月份就要发布他们涉及端上模型的方案。当时财报会上有人问苹果公司,你这么大一个公司,买 的GPU和卡还不够多。苹果的回答是,我们是混合模型,大模型我们用合作伙伴的,端侧本地模型我们自己研发。它对本地模型是极度重视的。
行业里现在已经分成两派了。OpenAI 那派推 7 万亿 GPU 小镇,扩云端模型。而另一派,就是关注本地。微软,到苹果,到高通,现在都在推 AIPC 了。
苹果 M4 芯片 强调 AI 功能 | 图片来源:发布会截图
我觉得其实第二派会更快地到来。有可能你的电脑以后就是一个搜索引擎了,那我觉得这个可能对搜索引擎的模式是完全的颠覆。
我本地一个 APP,到百度抓五六个网页,自己回来做分析。你说百度不让我抓?这个没办法不让抓,你也分辨不出来,我就是一个用户。那到时候,搜索引擎的整个商业模式就完全没法成立了。
本文来自微信公众号:极客公园 (ID:geekpark),作者:今夜科技谈