什么是AI原生应用,百度讲清楚了吗?

 
在AI大模型这波热潮中,百度几乎是走得最快的,从模型发布、迭代,到产业落地,再到如今发布的以“AI原生应用”为基础的多款C端产品。
 
在这方面,虽然百度一直在借AI大模型推动文心千帆平台和百度智能云在B端市场的影响力,但行业对百度的认知明显不够。
 
目前,文心千帆不支持叠加公有云部署,也就是说百度的AI大模型,只能用在百度的公有云上。

10月17日,百度召开了2023百度世界大会,并在会上宣布了文心一言4.0。

 

这一天,还有三家主流大模型创业公司发布了新消息:百川智能宣布完成A1轮3亿美元融资;智谱AI开源了与清华KEG合作的CogVLM-17B多模态大模型;面壁智能推出了与清华NLP合作的XAgent智能体。

 

ChatGPT转眼上线快一年了,国内经历了半年多的百模大战,AI战火越烧越旺。

 

百度的官方数据显示,文心大模型4.0在9月已开始小流量上线。8月31日文心一言面向全社会开放至今,用户规模已经达到4500万,开发者5.4万,场景4300个,应用825个,插件超过500个。

 

在AI大模型这波热潮中,百度几乎是走得最快的,从模型发布、迭代,到产业落地,再到如今发布的以“AI原生应用”为基础的多款C端产品。本次百度世界大会上,李彦宏喊出:“百度要做第一个把所有现有产品都进行重构、重做的公司。

 

如此快速地要把过去的产品用AI全部重做,对于任何一家成熟科技公司都相当困难,对于百度的用户来说,最大的兴趣点,聚焦在新的“AI原生应用”到底能给我带来什么?我又要为这些新功能,付出什么?

 

AI原生应用找到盈利点了吗?

 

李彦宏在本次百度世界大会上的演讲题目是“手把手教你做AI原生应用”,虽然不知道听完演讲之后,有多少人学会了如何做AI原生应用。但百度的确是把AI能力全面加入到了已有的产品中。其中搜索、地图、文库、网盘等ToC产品,更是AI原生应用的主力。

 

百度本次发布的AI原生应用,包括提升搜索的交互、推荐激发能力,地图的智能辅助决策,网盘的多模态搜索,以及文库的内容检索与生成等。产品提升的核心是用户体验和AI助理功能,从而增加用户黏度,拓展新用户。

 

对于AI原生应用来说,一直以来主要考虑的问题有两个其一是安全合规,其二是盈利。目前,在安全合规方面,相关部门已经在立法和监管方面做了很多工作,国内大模型普遍已经可以“持证上岗”。但盈利问题仍比较困难。

 

AI大模型在ToC领域的商业模式,一直是个争议话题。

 

从OpenAI被曝出的营收情况来看,ChatGPT的付费订阅模式在海外市场还是比较受认可的。外媒The Information报道称,OpenAI CEO Sam Altman在近期的内部讨论中表示,目前OpenAI的年收入约为每年13亿美元,其中很大一部分来自订阅收入。2022年,OpenAI的年收入仅为2800万美元。

 

不过,国内厂商对生成式AI的C端应用普遍比较看好与现有产品结合,也就是百度正在力推的AI原生应用。

 

百度2023第二季度财报中曾经提到过,当季资本支出增加主要是由于购买硬件以支持其人工智能模型和应用程序的训练和运营。一些百度内部流出的非官方公布信息显示,文心一言4.0的推理成本比3.5高8到10倍。

 

庞大的训练、推理成本,摆在面前,对于AI原生应用来说,AI能收回成本吗?能赚钱吗?

 

一种声音认为,国内的C端产品其实已经做得很好了,AI大模型很难对用户的体验带来跨越式的提升,甚至没法给用户创造特别具体的价值。因此,很难有人直接为C端产品中的AI大模型买单。

 

从AI原生应用中的大模型功能来看,更多的还是集中在传统互联网消费领域,提供索引和消费决策支持。因此,能给AI最终付费的人,大概率仍会是传统互联网商业模式的主要收入来源——广告。

 

一直以来,百度营收的重点都是广告,目前主推AI的大厂,微软、谷歌、Meta也都公开提到过生成式AI对广告业务的促进将会是未来的重点。

 

不过,从百度地图、如流更新的打车、机酒、餐饮等功能来看,与生成式AI相结合的推荐、预订业务,应该也会以渠道的形式创造新的盈利点。

 

AI打开B端局面

 

国内AI在大模型落地方面,“产业先行”的呼声很高。

 

百度本次也着重强调了两款B端的AI原生应用GBI(Generative Business Intelligence)和如流。虽说GBI这个词算是“首创”,但这两款产品在国内市场上均不鲜见。多数专注B端的AI供应商都早有类似GBI的产品或功能推出,如流的AI助手,则也早在钉钉和飞书上,看到过相似的功能。


百度的GBI

 

相对C端来说,B端的盈利模式更好找,但B端用户更看重产品本身的核心能力。

 

在这方面,虽然百度一直在借AI大模型推动文心千帆平台和百度智能云在B端市场的影响力,但行业对百度的认知明显不够。

 

“我们最近调研过的国内制造业的大模型,华为和腾讯相对比较适合,我认为百度更偏消费。”某知名自动化技术供应商向虎嗅表示,虽然百度在国内AI大模型中一直走在前排,但是在垂类大模型方面能力并没有特别突出。除此之外,由于百度智能云业务在国内的应用基础不够,很多产业用户并不会优先考虑使用文心千帆或是百度智能云。

 

目前,文心千帆不支持叠加公有云部署,也就是说百度的AI大模型,只能用在百度的公有云上。

 

“如果要达到最好的效果,我们建议还是全套都用百度端到端的技术,如果觉得迁移成本比较高,我们也努力在其它云上做很好的适配和效能。不过,我们目前是不支持在其它公有云上去做部署。”百度智能云AI与大数据平台总经理忻舟告诉虎嗅,虽然不能叠加公有云,但客户如果要部署在私有云平台的话,是可以支持其它云或是客户的自研云平台的。

 

AI大模型的MaaS模式,其实是SaaS模式的一个延伸。对于用户来说,选择云厂商的重点是软件、服务,选择AI大模型也一样。虽然公有云的排他性或许在一定程度上限制了AI大模型的产业推广,但这也使AI大模型成了百度智能云在AI新时代的云市场中,成了百度的一张王牌。

 

文心4.0,还有什么没说清?

 

百度认为文心一言4.0已是可以直接对标GPT-4的大模型。但在发布会上,或许是受限于篇幅,或许是不想讲太多难懂的技术细节,关于文心4.0模型的技术细节百度并没有讲太多。

 

其中有两个与大模型落地直接相关的具体问题,也都是一笔带过。

 

首先是大模型的幻觉问题。

 

AI大模型落地应用的一个关键因素就是准确和稳定。AI的幻觉问题,直接影响到生成内容的安全合规性,以及能否满足用户使用AI的需求。与其它厂商的发布会不同,百度并没有给出量化的幻觉、错误下降比率。

 

关于文心大模型4.0的能力提升,在百度CTO王海峰博士的演讲中,只是给了一个很抽象的概念:一个月的时间提升了30%。

 

不过王海峰在大模型技术方面,具体讲解了一下,文心大模型正在通过知识点增强和智能体机制,提高回答的准确度和模型的可解释性。在技术上,这两个问题对大模型的应用非常重要。


通过知识点增强提升准确度

 

另外,就是业内最关心的AI大模型的成本问题。

 

其实关于大模型每次推理和调用的成本问题,多数厂商都没有给出过具体的数据。不过,在文心千帆的介绍中,百度集团执行副总裁、百度智能云事业群总裁沈抖简单地讲了一下文心千帆的调用价格。

 

沈抖在演讲中提到,企业利用文心千帆平台基于RAG应用框架制作企业文档问答应用的功能,并介绍了百度与三一重工的探索性合作。

 

在这个案例中,利用AI大模型只需10来分钟,就可以把48页,20000余字的产品说明制作成问答助手,并生成代码,直接挂在三一重工的网站首页,解答关于三一重工机械产品的专业问题。

基于文心大模型的三一产品小助手

 

沈抖表示,制作这样一个问答助手的成本:只需要几百块钱,后续的每次问答只需要几分钱。

 

文心千帆平台的收费定价是公开可查的。

 

在文心千帆平台上,大模型的预置服务模块报价中,ERNIE-Bot大模型公有云在线调用服务的定价是0.012元/千tokens;Llama-2-70B-Chat的定价是0.044元/千tokens;最便宜的模型是Embedding-V1和bge-large模型,定价为0.002元/千tokens。

 

计费规则以ERNIE-Bot调优大模型调用服务为例:

 

输入:“请给我念一首诗”

输出:“春眠不觉晓,处处闻啼鸟。 夜来风雨声,花落知多少。”

共中文字数为27,总计tokens为27

调用价格为0.012(单价) x 0.027千tokens=0.000324元

 

这些只是文心千帆报价的一部分,具体定价可以参阅文心千帆网站。这个定价对于B端用户有限的业务来说确实不贵。结合沈抖的演讲,几乎可以算出三一重工在这个问答助手上每月的开销。

 

沈抖提到的每次问答几分钱,我们取低,算3分钱一次问答。根据网站访问统计工具SimilarWeb的数据显示,2023年7-9月,三一重工官网的访问量是36.8万次。如果对三一重工的问答每个访问是3次,那平均算下来这3个月的调用成本也就3万块钱左右,确实不多。

 

虽说这个价格是对B端客户的不太适用C端,不过,我们可以按这个价格大胆估计一下,如果把这个问答助手放在百度官网流量级别的网站首页,可能花费的调用成本是多少。

 

同样参照SimilarWeb的数据,百度官网在过去3个月中的访问量是156.6亿次。如果每个访问提问1次,那这3个月的调用成本,也有4.6亿元了。

 

这个估算只是猜测,百度官方对大模型的C端成本控制其实非常乐观。

 

百度集团副总裁、百度移动生态事业群组(MEG)搜索平台负责人肖阳告诉虎嗅,单看搜索一项,基于文心一言实现“极致满足、推荐激发、多轮交互”的搜索成本没有那么可怕。相对于普通搜索,融合了生成式AI的搜索在成本方面只是“略高”。

 

不过,在搜索的成本一直很高。有百度内部资料显示,百度搜索本来处理的数据量在七八年前就已经达到千亿级别,目前每年纯设备成本超过50亿元,算上研发、运营和维护的人工成本,总开销每年接近100亿,且有逐年递增的趋势。

 

肖阳透露,目前百度在搜索方面的AI大模型调用量每天已超3亿次,“这个规模是很大的,如果成本上吃不住的话,早就叫停了。”

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年10月18日
下一篇 2023年10月18日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日