重组团队、重金投入，谷歌AI业务能否重回巅峰？

2024年4月27日 20:43 • 未来科技

Pichai，下称“皮查伊”）在财报发出后的业绩会上表示，在Gemini（谷歌旗下的多模态大模型）时代，谷歌的发展很顺利，“我们在AI（人工智能）研究和基础设施方面拥有领导地位，再加上遍布全球的产品，这为下一波AI创新奠定了良好的基础。Consulting副总裁陈沛认为，市场忽视了Gemini的模型进化，Gemini1.5Pro支持的文本长度可达1000万tokens（token为大模型文本中的一个最小单位），“能力已经与GPT-4（OpenAI旗下的大模型）不相上下”。

美国东部时间4月25日，谷歌母公司Alphabet发布财报。2024年第一季度，Alphabet的营收为805.39亿美元，同比增长15%，创下2022年初以来的最快单季增速；净利润为236.62亿美元，同比增长57%。

财报发布后，Alphabet股价在美股盘后时间大涨，截至发稿，股价涨幅超过11%。谷歌的总市值也达到了1.96万亿美元。

谷歌CEO（首席执行官）桑达尔·皮查伊（Sundar Pichai，下称“皮查伊”）在财报发出后的业绩会上表示，在Gemini（谷歌旗下的多模态大模型）时代，谷歌的发展很顺利，“我们在AI（人工智能）研究和基础设施方面拥有领导地位，再加上遍布全球的产品，这为下一波AI创新奠定了良好的基础。”

但在之前的一段时间，谷歌AI业务的进展一波三折。2023年2月，谷歌的AI聊天机器人Bard在官宣视频中出现照片识别错误，Alphabet股价在次日暴跌9%。此后，谷歌发布的Gemini 1.0模型陷入造假传闻，推出的Gemini 1.5 Pro模型又被Sora（美国AI研究公司OpenAI旗下的文生视频大模型）抢去了风头。

与此同时，谷歌也在不断调整AI团队架构。4月18日，皮查伊给全体员工发布了邮件，宣布全面整合谷歌的AI团队，表示此举将有助于更迅速高效地开发AI产品和服务。

从2012年第一次识别出猫，到2016年在人机大战中战胜顶尖人类棋手，谷歌旗下的AI项目曾经代表着人类最前沿的技术探索。但在OpenAI旗下AI聊天机器人ChatGPT引发的大模型技术浪潮中，谷歌在AI领域的优势不再。

而最新发布的财报显示，Alphabet在今年一季度的AI资本支出达到120亿美元。重组团队、重金投入，能否让谷歌的AI业务在未来重回巅峰？

重组团队攻向AI

谈及皮查伊近日发布的全员邮件，一位在谷歌工作十余年的人士说：“从来没看到过CEO（发送过）这么长的邮件。”

这是一篇标题为《建设我们的AI未来》的长文，皮查伊在文章开头表示谷歌正在进行一场波及全公司的变革，最先需要变化的是模型与研究。

皮查伊宣布将谷歌专注于大模型以及负责AI技术安全等研究的谷歌研究部门Google Research，全面整合到AI业务部门Google DeepMind之中。

上述谷歌人士称，谷歌在战略层面进行组织调整，是为了更聚焦且高效地推进大模型与应用端的融合，从而加速AI技术的开发与创新。本次调整不只是出于技术层面的考虑，也是因为谷歌内部的业务太复杂了。他出示了一张表格图，图中纵向展示的是谷歌的几十个产品线或业务部门，横向展示的是谷歌设立的4个主要技术栈方向——Mobile（移动端）、Web（全球广域网）、AI（人工智能）、Cloud（云计算）。

此前，皮查伊已经对谷歌的AI团队采取了一系列调整动作。2023年4月，他选择将谷歌旗下的Google Brain、DeepMind两个AI研究团队进行合并，创建了新部门Google DeepMind。Google DeepMind主要专注于通用AI模型研究与创新，由DeepMind原联合创始人兼CEO戴密斯·哈萨比斯（Demis Hassabis，下称“哈萨比斯”）担任负责人。

对于上述两个团队的合并，皮查伊认为，尽管谷歌拥有两个排名世界前三的AI团队，但在开始建立更强大模型的时候，谷歌不仅需要更庞大的计算资源，也要从纯粹的AI研究转向商业化，还需要投入大量资源开展测试和确保安全。

上述谷歌人士也表示，DeepMind此前一直是AI强化学习的早期探索者，“在谷歌内部是一个相对独立的存在”。他认为，在谷歌将所有专注于AI创新研究、开发的人才整合至哈萨比斯的团队后，可以在接下来更为激烈的模型进化中做到全力出击。

Gemini模型演进

ChatGPT中“T”代表大模型技术Transformer，由谷歌DeepMind团队最早发明的。然而，在OpenAI抢先用生成式AI产品打响市场后，谷歌不但姗姗来迟，甚至在Bard的首秀中“翻车”。

2023年11月，谷歌全新推出的大模型Gemini具备语言、听力与视觉等方面的多模态交互能力，还可以在数据中心、移动设备等多类型平台上运行。

Gemini模型家族共有三个量级的产品，分别是可用于特定任务和端侧的Nano版，可用于多任务的Pro版，以及模型能力最强的Ultra版。谷歌在今年2月16日宣布升级Gemini 1.5 Pro，风头却被同日推出的Sora抢尽。

IT投资人、新加坡Vibranium Consulting副总裁陈沛认为，市场忽视了Gemini的模型进化，Gemini1.5Pro支持的文本长度可达1000万tokens（token为大模型文本中的一个最小单位），“能力已经与GPT-4（OpenAI旗下的大模型）不相上下”。

陈沛称，尽管Gemini Ultra版至今没有接受公开排行榜的测试，但这一版本模型的参数规模远大于GPT-4。行业内的共识是，谷歌在模型创新能力上正在反超OpenAI。

斯坦福大学AI研究所在4月15日发布的《2024斯坦福AI指数报告》也重点提及了Gemini。过去一年，谷歌发布的基础模型最多。此外，Gemini Ultra版本的训练成本预计达到1.91亿美元，而GPT-4的训练成本仅为约7800万美元。

4月15日在加拿大举行的TED2024大会上，曾有参会者邀请哈萨比斯评价微软与OpenAI计划开发价值达1000亿美元超级AI计算机的动作。哈萨比斯表示，虽然谷歌内部并不谈论在提升AI计算能力方面具体的投入数字，但随着时间推移，谷歌的投资后续将超过1000亿美元。

在上述谷歌人士看来，谷歌并非近两年才将AI作为重点。早在2017年，谷歌就提出了“AI第一”战略。除了广为人知的Transformer技术和战胜顶尖人类棋手的AI机器人AlphaGo，谷歌还有很多AI创新武器“不急于亮出来”。他认为，谷歌在当前的AI模型竞赛中没有跟风去拼速度。

加速端侧落地

4月中旬，极客邦科技创始人兼CEO霍太稳在美国参加了Google Cloud Next 2024大会。在大会的主题演讲环节，谷歌宣布将与中国手机厂商OPPO、一加合作，为它们的2024款手机产品提供Gemini模型支持。

此前，华为、小米、vivo、OPPO、荣耀等国内手机厂商，都发布了具备大模型能力的手机。但谷歌推进AI模型落地端侧的动作，让霍太稳感受到了国内厂商与谷歌之间的差距。“尤其在硬件芯片方面，谷歌自研了TPU（张量处理器），还广泛应用了英伟达高端GPU（图形处理器），这是（国内厂商）能力所不及的。”霍太稳说。

从谷歌对外释放的信息看，旗下智能手机Pixel 8与Pixel 8 Pro都将在今年6月的季度更新中具备Gemini Nano模型的服务能力。在陈沛看来，用户若想在手机上流畅地使用最高性能的Gemini Ultra模型，谷歌还需专门优化大模型的性能、响应延迟和能耗。

易观分析高级分析师陈晨称，目前手机厂商主要与芯片、大模型等厂商进行战略合作，部分目的是解决大模型在端侧的适配以及模型能力应用边界等问题。“要想实现大模型在端侧的高效运行，厂商要平衡算力与能效、智能化与便携化之间的诸多问题。”陈晨说。

不过，与GPT-4相比，Gemini模型具备在端侧率先落地应用的优势。陈沛告诉经济观察报，谷歌拥有安卓移动应用生态，近来还在尝试将一些生成式AI功能更新到安卓APP中，这些都为Gemini模型在端侧的创新应用提供了土壤。

上述谷歌人士称，国内的安卓市场是割裂的，每家手机厂商都可以有自己的分发渠道，甚至可以自研操作系统，“一旦（它们的）手机应用出海，只有两个可以依靠的分发渠道，一个是Apple Store（苹果旗下移动应用市场），一个是Google Play（谷歌旗下移动应用市场）。”

一位手机行业人士证实，国内手机厂商选择与谷歌合作，看重的更多是Gemini模型与海外市场的适配性。他说，国内厂商虽然早早展开AI能力自研，在端侧模型方面进行了相关应用创新，但它们的AI能力和模型服务“在海外是不可用的，或者说不适用于海外用户”。

此外，手机厂商对于大模型端侧落地和应用创新的推动，也是Gemini模型加速迭代的催化剂。

2023年末，一加中国区总裁李杰表示，并不看好当时的“大模型手机”，直言“（它们）更像是一个噱头”。时隔两三个月，一加的母公司OPPO便发布了全新的AI战略，一加也在今年3月推出了支持大模型的Ace 3V智能手机。

上述谷歌人士透露，除了国内手机厂商，三星也在和谷歌方面接洽，寻求大模型的合作。

本文来自微信公众号：经济观察报（ID：eeo-com-cn），作者：钱玉娟

声明：该内容为作者独立观点，不代表新零售资讯观点或立场，文章为网友投稿上传，版权归原作者所有，未经允许不得转载。新零售资讯站仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。如对本稿件有异议或投诉，请联系：wuchangxu@youzan.com

Like (0)

Rabbit R1首批体验出炉：还没干翻app，被质疑造假

Previous 2024年4月27日

寻找引力波：了解科学运作的方式

Next 2024年4月28日

水温80度：AI行业真假繁荣的临界点

我们从来没拥有过这么成功的AI主导的产品。

（这种分析统计并不那么准，但大致数量级是差不多的）

这两个产品碰巧可以用来比较有两个原因：

一个是它们在本质上是一种东西，只不过一个更通用，一个更垂直。

蓝海的海峡

未来成功的AI产品是什么样，大致形态已经比较清楚了，从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时“罢工”，全网打工人都慌了

美西时间午夜12点开始，陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载，忽然无法正常工作了。

因为发现AI用久了，导致现在“离了ChatGPT，大脑根本无法运转”。”

等等，又不是只有一个聊天机器人，难道地球离了ChatGPT就不转了。

大模型连崩原因猜想，谷歌躺赢流量激增6成

GPT归位，人们的工作终于又恢复了秩序。

未来科技 2024年6月5日
ChatGPT宕机8小时，谷歌Gemini搜索量激增60%

ChatGPT一天宕机两次

谷歌Gemini搜索量激增近60%

ChatGPT在全球拥有约1.8亿活跃用户，已成为部分人群工作流程的关键部分。

过去24小时内提交的关于OpenAI宕机的问题报告

图片来源：Downdetector

ChatGPT系统崩溃后，有网友在社交媒体X上发帖警告道：“ChatGPT最近发生的2.5小时全球中断，为我们所有依赖AI工具来支持业务的人敲响了警钟。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时大崩溃，AI集体罢工让全网都慌了

接着OpenAI也在官网更新了恢复服务公告，表示“我们经历了一次重大故障，影响了所有ChatGPT用户的所有计划。Generator调查显示，在ChatGPT首次故障后的四小时内，谷歌AI聊天机器人Gemini搜索量激增60%，达到327058次。

而且研究团队表示，“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关，显示出用户把Gemini视为ChatGPT的直接替代选项。

未来科技 2024年6月5日
深度对话苹果iPad团队：玻璃的传承与演变

iPad最为原始的外观专利

没错，这就是iPad最初被设想的样子：全面屏，圆角矩形，纤薄，就像一片掌心里的玻璃。

2010年发布的初代iPad

好在乔布斯的遗志，并未被iPad团队遗忘。

初代iPad宣传片画面

乔布斯赞同这一想法，于是快速将资源投入平板电脑项目，意欲打造一款与众不同的「上网本」，这就是iPad早年的产品定义。

iPad进化的底色

苹果发布会留下过很多「名场面」，初代iPad发布会的末尾就是一例。

未来科技 2024年6月5日
底层逻辑未通，影视业的AI革命正在褪色…

GPT、Sora均为革命性产品，引发了舆论风暴，但它在上个月发布的“多模态语音对谈”Sky语音，却由于声音太像电影明星斯嘉丽·约翰逊，被正主强烈警告，被迫下架。

华尔街日报也在唱衰，认为“AI工具创新步伐正在放缓，实用性有限，运行成本过高”：

首先，互联网上已经没有更多额外的数据供人工智能模型收集、训练。

03、

如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向，那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

但分歧点正在于此，电影公司希望通过使用AI技术来降低成本，但又不希望自己的内容被AI公司所窃取。

未来科技 2024年6月5日
KAN会引起大模型的范式转变吗？

“先变后加”代替“先加后变”的设计，使得KAN的每一个连接都相当于一个“小型网络”，能实现更强的表达能力。

KAN的主要贡献在于，在当前深度学习的背景下重新审视K氏表示定理，将上述创新网络泛化到任意宽度和深度，并以科学发现为目标进行了一系列实验，展示了其作为“AI+科学”基础模型的潜在作用。

KAN与MLP的对照表：

KAN使神经元之间的非线性转变更加细粒度和多样化。

未来科技 2024年6月5日
这个国家，也开始发芯片补贴了

//mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
[4]中国安防协会：欧盟批准430亿欧元芯片补贴计划：2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
[6]潮电穿戴：印度半导体投资大跃进，一锤砸下1090亿，政府补贴一半.2024.3.5https。

未来科技 2024年6月5日
大模型的电力经济学：中国AI需要多少电力？

这些报告研究对象（数字中心、智能数据中心、加密货币等）、研究市场（全球、中国与美国等）、研究周期（多数截至2030年）各不相同，但基本逻辑大同小异：先根据芯片等硬件的算力与功率，计算出数据中心的用电量，再根据算力增长的预期、芯片能效提升的预期，以及数据中心能效（PUE）提升的预期，来推测未来一段时间内智能数据中心的用电量增长情况。

未来科技 2024年6月5日
你正和20万人一起接受AI面试

原本客户还担心候选人能否接受AI面试这件事，但在2020年以后，候选人进行AI面试的过程已经是完全自动化的，包括面试过程中AI面试官回答候选人的问题，AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

以近屿智能与客户合作的校验周期至少3年来看，方小雷认为AI应用不太可能一下子爆发，包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

未来科技 2024年6月4日

重组团队、重金投入，谷歌AI业务能否重回巅峰？

相关推荐