Google成了“AI界汪峰”,全都怪OpenAI?

2016 年,Google CEO 桑达尔·皮查伊在 I/O 开发者大会上豪情满怀地向全世界宣布:

Google 已经成为了搜索的代名词,Alphabet 未来将成为一家 AI 优先的公司。

凭借在深度学习、自然语言处理等领域的深耕不辍,Google 也的确在这场 AI 竞赛的起跑线上抢得先机。然而,ChatGPT 的异军突起,让拉响“红色警报”的 Google 直接从和平时期转向了战时准备状态。

很多人乐观地预测,一夜消融的 AI 高山——Google,最晚到了来年冬天定能恢复昔日的巍峨,但迟来上演的却更多是少年屠龙的故事。

OpenAI “踩着” Google 过河

如果说 Google 在摸着 AI 的石头过河,那么 OpenAI 在“踩着” Google 过河。

在近期的 Google Cloud Next 活动中,Google 宣布最强大模型 Gemini 1.5 Pro 正式对外开放,其支持处理的最长音频约为 11 个小时,最长视频为 1 小时,让一众看客们都沸腾了起来。

有网友给 Gemini 1.5 Pro 上传了一个有史以来最具标志性的体育时刻合集,并让它识别视频中的运动,参与的团队/运动员、年份等,它都能给你安排得明明白白。

当人们还在沉浸在“把玩”Gemini 1.5 Pro 时,针尖对麦芒的 OpenAI 宣布推出 GPT-4 Turbo 的正式版本,不仅基础能力大更新,还自带读图功能,现在更是已经向所有 ChatGPT 付费用户开放。

一时间,本该是 Google 大杀器的 Gemini 1.5 Pro 又成了“明日黄花”,给人一种汪峰入职 Google 的感觉。

为什么说又呢?分不清有意还是无意,但这已经不是 OpenAI 第一次卡点狙击 Google 的新品了。

今年 2 月,Google 推出攒了许久的终极 AI 大招——Gemini 1.5 Pro,其支持高达 1M 上下文,相比之下,GPT-4 Turbo 也仅支持 128K 上下文。

这一炸裂性的头条新闻同样维持不到几个小时。因为牌桌上的 OpenAI 不需要考虑出牌节奏,随手一掏,便是 AI 视频生成领域中的王炸——Sora。

长达一分钟的视频生成、多镜头的实时转换、出色稳定的画面生成以及世界模型理解能力等特点吸引了全世界的目光,也将 Gemini 1.5 Pro 溅起的水花狠狠地压了下去。

纵观以往 OpenAI 产品的发布节奏,我们可以发现,强大的议程设置能力无疑是绕不开的关键词。每一次重大产品的推出,OpenAI 都恰如其分地抓住了市场的风向标。

此前有消息称,当 Anthropic 还在权衡 Claude 的安全性问题时,OpenAI 已经果断靠 ChatGPT 抢占市场先发优势。而在 Anthropic 拿到亚马逊高达 40 亿美元的融资后,OpenAI 再次发力语音和图像功能,用会看、听、说的 ChatGPT 反手给了 Anthropic 一巴掌。

这一切的背后,或许也与 OpenAI 创始人 Sam Altman 的影响密不可分。早在 YC 担任掌门人的时候,他就展现出对媒体影响力的深刻理解和运用。

根据 The Information 创始人 Jessica Lessin 的回忆,Altman 尤其擅长与媒体记者打交道,并用精湛的沟通技巧赢得记者的信任。即便是在 OpenAI 的宫斗大戏期间,他也能够通过几条推文掌控舆论的走向,其影响力堪比网红界的马斯克。

而成为这种带有 Altman 特色策略的牺牲品,Google 无疑是最不走运的那一个。为什么说这两次头条非常重要呢?这得从 Google 被 OpenAI 一直“压着打”的历史讲起。

回首这两年,在 OpenAI 的光环之下,Google 的 AI 征途显得有些命运多舛。

2022 年底,ChatGPT 一夜之间照亮了整个 AI 界,起了个大早的 Google 却一筹莫展,皮查伊看着自己 AI 领域的“满朝文武”,恨不得要天天上演一场康熙怒斥群臣的戏码。

让月活破亿的 ChatGPT“嚣张跋扈”许久之后,去年 2 月,Google 仓促发起反攻,但依旧出师不利。搞混太阳系外行星第一张照片作者的 Bard 让看完发布会的观众直呼退钱,也让 Google 瞬间蒸发约 2.75 个京东的市值。

倘若 GPT-3.5 还能让 Google 看到一丝追赶的希望,那么 GPT-4 则直接断崖式压制了同行整整一年。

胜在这些年积累的技术底蕴,大船调转,All In AI 的 Google 在合并 Google Brain 和 Google Deepmind 之后,还真捣鼓出 Bard“改头换脸”版的 Gemini 1.0 模型。

其中超大杯 Gemini Ultra 号称全面碾压 GPT-4 ,但发布仅仅一天后,就被扒出刷爆全球互联网的演示视频存在造假,以至于 Google 自家员工反手就来个内鬼自爆,“这是不切实际的画面”。

直到 Gemini 1.5 Pro 的出现,无论是 MoE 架构的技术思路,还是实际的亲身体验,在一众网友的好评声中,其仿佛用能与 GPT-4 “掰手腕”的实力宣告 AI 最高的山又要回来了。

此外,1M 上下文处理能力当时更是碾压同辈。Gemini 1.5 Pro 既能瞬间掌握一门只有 200 人使用的冷门语言,也能一口气看懂一部 44 分钟的巴斯特·基顿的默片。

两次“头条”的失利,也让 Google 仿佛化身大闹天宫的孙悟空,尽管蹦跶得再欢,终究也翻不出佛祖 OpenAI 的手掌心。

值得一提的是,在主流产品上,两家公司对标得也比较全面。甭管实际效用如何,主打的就是一个你有我也得有。

  • 你有 ChatGPT,我有 Bard(Gemini)

  • 你有 DALL·E 3,我们有 Imagen 2

  • 你有 Sora,我有 PPT 上的 Video poet,甚至 Imagen 2 也能文生视频

就连 Google 的老本行——搜索领域,OpenAI 不光想取而代之,而且野心也更宏大。

前不久,Altman 在接受 Lex fridman 的专访时指出,世界不需要多出一个翻版 Google。

他在采访中的言外之意是,OpenAI 要像 Perplexity 一样,用 LLM+搜索重新定义搜索引擎的概念,并且还要寻找到一种不依赖广告的盈利方式。

最了解你的往往是你的敌人

近一年来,手握 ChatGPT、Sora 等先进 AI 工具的 OpenAI 成了整个 AI 行业的最强参照物。

从全球“千模大战”的大模型厂商中,随便拎几个大模型出来,什么“逼近 GPT-4”,什么“全面对标 GPT-4”之类词汇,都能引得众人哄笑起来,让整个 AI 圈充满了快活的空气。

英伟达高级科学家 Jim Fan 近日在社交平台 X 上称:“软件 AI 代理的核心优势并非其薄薄的包装层(例如 Devin, SWE-Agent),而是底层的 LLM。”

上到基准测试榜单,下到网友好评,短时间内能站稳脚跟、引领风骚的,基本就四大巨头——OpenAI、Anthropic、Google 以及 Meta。

AI 的发展绕不开三大要素:算力、算法、数据。对比 Anthropic ,有钱有人有资源的 Meta、以及 Google 显然更值得盯防。同时相较于 Meta,Google 与 OpenAI 之间的渊源其实也比想象中更深。

最了解你的人往往不是朋友,而是你的对手。

古龙在武侠小说《七种武器》中如是说道,这句话同样适用于 OpenAI 与 Google 之间的关系。

2017 年春天,一篇名为“Attention Is All You Need”的学术论文,加速了生成式 AI 浪潮的到来。在 GTC 2024 期间,论文作者与黄仁勋的对谈也成为了整个 AI 界的话题焦点。

鲜少有人知道的是,八位作者实则都有一个身份——Google 的研究员。但 Transformer 架构的问世并未激起 Google的足够重视,正如 Altman 所说:

当 Transformer 论文发表时,我想 Google 的任何人都没有意识到这意味着什么。

论文发表后不久,在时任 OpenAI 首席研究员 Ilya Sutskever 的推进下,OpenAI 成功分到生成式 AI 的第一杯羹。

如今,论文的 8 位作者都相继离开了 Google,核心作者之一 Kaiser 也加入了 OpenAI,并且还是名为“Q*”的新技术的发明者之一。这样的情况也发生在 Sora 身上,其背后的时空 Patch 技术同样被曝出是站在 Google Deepmind 的肩膀之上。

2024 年,没有哪一家科技公司愿意在 AI 赛道掉队。火药味变重的 OpenAI 与 Google 之间的拉扯较量便是这股趋势的小小侧写。

据 The Information 爆料,Google 联合创始人谢尔盖·布林亲自下场,打电话挽留即将转投 OpenAI 的员工。而 OpenAI 从 Google 挖人时,给出的承诺年薪将在 500 万美元至 1000 万美元之间。

此外,消息人士还透露,Google Deepmind 的负责人 Hassabis 就曾抱怨 Google 的薪酬政策使他难以阻止研究人员跳槽到 OpenAI。

当然,Google 也并非被动挨打,前 OpenAI 前开发者关系负责人 Logan Kilpatrick 近期便成功入职 Google。在 Gemini 1.5 Pro 正式发布时,Kilpatrick 也没少转发推文为其站台造势。

从融资背景上说,OpenAI 与 Google 的较量其实更像是背后的微软在与 Google 在博弈。

放眼国外市面上的主流大模型,似乎都难逃被科技巨头收编的命运。

苹果这一年来,就没少买买买。亚马逊也不甘落后,选择大规模入资 Anthropic,而手握 OpenAI、Mistral AI、Inflection AI 等创企的微软则暂时在这些巨头较量中处于上风。

微软与 Google 这两位在搜索时代的恩怨情仇,也绵延至今日 AI 时代的较量。

在那个以搜索为王的年代,Google 以其卓越的算法和用户体验,稳坐搜索引擎的霸主宝座,而微软的必应,却始终难以撼动 Google 的统治地位。

根据 StatCounter 公布的数据,截至 2023 年 1 月,Google 在全球搜索引擎市场的份额高达 92.9%,而必应仅有 3.03%。这种巨大的市场份额差异,使得必应长期稳居“千年老二”。

只是这一次,当 AI 的曙光乍现,曾经在搜索引擎市场遭受过挫折的微软,似乎找到了扳回一局的希望。

本文来自微信公众号:APPSO (ID:appsolution),作者:莫崇宇

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年4月15日
下一篇 2024年4月15日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日