谷歌硬刚OpenAI，硅谷大战继续升级

2024年5月15日 12:28 • 未来科技

5月15日，谷歌举办了2024年I/O开发者大会，AI是全场的主题，谷歌CEO桑达尔·皮查伊和他的同事们发布了Gemini。

皮查伊以“重新定义搜索”的架势，连续上线多款基于Gemini的产品，比如总结谷歌搜索引擎结果的“AI概览”功能，支持用户存储图片的AI搜索Ask。

苹果公司计划和OpenAI合作，将OpenAI的技术引入iPhone之中，但微软是OpenAI的最大出资方。

一场科技竞赛正在美国硅谷上演。

5月15日，谷歌举办了2024年I/O开发者大会，AI是全场的主题，谷歌CEO桑达尔·皮查伊和他的同事们发布了Gemini 1.5 Pro的新版本，在100万Tokens的窗口能力上，进一步扩大至200万Tokens，它们的最终目标是无限上下文。

谷歌还展示了新的搜索产品，比如从本周开始，谷歌搜索引擎将在美国推出“AI概览”（AI Overviews）的功能，搜索引擎会直接归纳总结搜索结果。此外，谷歌还推出了新的TPU，第六代TPU芯片Trillium，较上一代芯片的算力表现翻4.7倍。

就在这场发布会前一天，OpenAI举行了春季发布会，发布最新GPT-4o多模态大模型，相较于GPT-4 Trubo速度更快、价格也更便宜。接下来的一个月里，硅谷还将迎来两家科技巨头的重磅大会——5月21日左右，微软将举行Build年度开发者大会；6月10日左右，苹果将举办全球开发者大会。一场有关AI的大比拼在大洋彼岸开赛。

伴随着OpenAI的崛起，以及谷歌在AR眼镜等失利，外界一度评价谷歌已经成为一家为“赚钱”打造的机器，失去了创新激情。

不过，谷歌仍然拥有谷歌搜索、YouTube、云服务、Gmail、Android以及自动驾驶Waymo等业务，仅YouTube就有20亿月活用户，Android也拥有20亿月活用户，可以说，谷歌掌握着全球最多的用户场景、数据以及设备接口。

谷歌发布更新产品后，谷歌-C股价微涨0.6%，收盘价为171.93美元，市值2.12万亿美元，股价较2024年开年上涨了23%。

在刚刚过去的财季，谷歌展现出强有力的竞争力。2024年第一季度，谷歌实现营收805.39亿美元，同比增长15%，非美国通用会计准则下净利润为236.62亿美元，同比增长57%。

一

大会一开场，皮查伊就介绍说，现在已经有超过150万开发者正在使用谷歌的原生多模态大模型Gemini。Gemini在2023年12月上线，它被认为超过了GPT-4。

皮查伊宣布，Gemini 1.5 Pro向全球所有开发者开放，并支持200万Tokens的Gemini 1.5 Pro模型的预览，他们的目标是“无限上下文”。

此次开发者大会，谷歌着墨最多的是搜索，这是谷歌的起家业务，现在谷歌要重新定义搜索，它要把搜索做成多轮对话的推理，用户只需要问就可以了。

皮查伊以“重新定义搜索”的架势，连续上线多款基于Gemini的产品，比如总结谷歌搜索引擎结果的“AI概览”功能，支持用户存储图片的AI搜索Ask Photos。

以练瑜伽为例，谷歌会帮用户找到排名更靠前的工作室，并介绍他们的服务，可以看到每个门店的距离。谷歌搜索会把更大的问题分解成各个部分的问题，比如排名、评论、营业时间以及其他更多的研究。

但“重新定义搜索”的最大主动权可能不在谷歌手里，而在OpenAI这边。今年年初有传言说，OpenAI计划上线AI搜索业务，不过在5月14日OpenAI的发布会上，并没有展现该业务，这可能与算力成本有关系。

成熟大公司对待创新公司的崛起仍然毫无办法。对标OpenAI，谷歌仍在努力显示自己的存在。

在此次发布会上，谷歌还展示了一个名为Astra的项目，这是谷歌开发的通用人工助理，在演示视频中，Astra通过手机摄像头能识别真实环境中的物体，实现了能看、能说、能听。这与前一天OpenAI上线的GPT-4o功能类似，都实现了人机交互的新形式。但谷歌似乎不满足于此，Astra更强调指向人、机器与现实世界的三重交互。

大模型最大的挑战是解决响应时间的问题。谷歌介绍说，它们在Gemini模型的基础上，开发了通过连续编码视频帧，更快地处理信息的代理，同时，将视频和语音输入组合到事件的时间线中，捕捉并有效记忆。这些代理可以更好地理解用户所处的环境，并在对话中快速响应，使交互的速度和质量更加自然。

Gemini也将支持语音实时交互，同时今年晚些时候还将上线实时视频交互功能。未来几个月内，谷歌也将推出类似于GPTs的自定义AI助手Gems。它将能与“谷歌全家桶”进行交互。

“Gems易于创建，它们可以充当你的瑜伽闺蜜、你的私人副主厨、聪明的微积分导师、代码的同行评审员。”谷歌的相关负责人说。

谷歌发布会上还宣布了安卓生态的AI新进展，今年晚些时候，能够在本地运行的多模态Gemini Nano模型将登陆Pixel手机，它更智能，更注重隐私保护，比如，如果用户接到诈骗电话，将会提醒用户。

如果没有OpenAI，上述谷歌的创新技术可以称得上可圈可点，但奈何“既生瑜，何生亮”。

二

在发布会上，谷歌只提到一家科技大公司，那就是英伟达。皮查伊发布了第六代TPU（张量处理器，谷歌为机器学习定制的专用芯片）芯片Trillium，较上一代芯片的算力表现翻4.7倍，TPU是谷歌自己研发的GPU芯片。

同时，皮查伊说，谷歌云将在2025年初，用上英伟达的最新Blackwell架构GPU。在过去数年，谷歌投资了200万英里的地面和海底光纤。

今年3月，英伟达发布了基于“Blackwell”架构的B100芯片与B200 GPU加速器，英伟达创始人黄仁勋说，这是迄今为止，英伟达最强大的GPU芯片，在生产出首批服务器之后，黄仁勋将一台服务器送给了OpenAI。

GPU在过去一年多时间成为堪比黄金的硬通货，各大科技公司不得不排队数月来等货，这让黄仁勋成为硅谷最受欢迎的CEO，人们争相排队和他见面，英伟达也是所有科技公司的合作伙伴。

而在GPU大热的背后，硅谷正在进入新一轮的科技竞赛。

2022年底，OpenAI发布ChatGPT开始，整个硅谷进入亢奋状态，这里甚至诞生了AI一条街，五六个人就可以组建一个公司，依靠一个想法获得融资，比如斯坦福博士生郭文景和同学创办的Pika，短短数月间就完成5500万美元融资，并推出了视频生成器Pika1.0。

科技巨头之间的关系变得异常紧张，主要是AI重构了边界，大公司重新变得野心勃勃：

微软重新盯上了搜索，扶持Bing发展；Meta向第三方硬件制造商开放VR头显操作系统Meta Horizon OS，进一步蚕食苹果生态；为应对OpenAI的崛起，苹果不得不放弃数十年的造车计划，集中资源搞AI。

进化以群体聚集的形式在硅谷上演，大公司你追我赶，它们之间的合纵连横也让AI竞赛变得复杂。

苹果公司计划和OpenAI合作，将OpenAI的技术引入iPhone之中，但微软是OpenAI的最大出资方；谷歌正和OpenAI酣战，支持其开源系统Android的AI进化，以展开和苹果iOS系统之间的竞争。

席卷全球的这次科技竞赛浪潮，颇有点20世纪七八十年代硅谷的意味。那时，原生技术层出不穷，1968年，英特尔成立；1969年，AMD成立；1976年，乔布斯创办苹果电脑；1977年，甲骨文成立；1984年，思科公司成立。

只不过，50年前，是芯片等硬件造就了创业潮，创造了财富；现在，AI以及产品化则是最新的动力。

在AI时代，中国互联网同样也迎来了新的发展机会，但正如大部分中国AI创业者所说，虽然一家又一家公司会在这次浪潮中转型甚至退场，但是千万不要低估中国创业者的生命力。

本文来自微信公众号：中国企业家杂志（ID：iceo-com-cn），作者：闫俊文，编辑：李薇

声明：该内容为作者独立观点，不代表新零售资讯观点或立场，文章为网友投稿上传，版权归原作者所有，未经允许不得转载。新零售资讯站仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。如对本稿件有异议或投诉，请联系：wuchangxu@youzan.com

Like (0)

一家勇立“新质生产力”潮头的中国品牌是如何炼成的？

Previous 2024年5月15日 11:58

苹果在iPad广告上失策的另一个原因

Next 2024年5月15日

水温80度：AI行业真假繁荣的临界点

我们从来没拥有过这么成功的AI主导的产品。

（这种分析统计并不那么准，但大致数量级是差不多的）

这两个产品碰巧可以用来比较有两个原因：

一个是它们在本质上是一种东西，只不过一个更通用，一个更垂直。

蓝海的海峡

未来成功的AI产品是什么样，大致形态已经比较清楚了，从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时“罢工”，全网打工人都慌了

美西时间午夜12点开始，陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载，忽然无法正常工作了。

因为发现AI用久了，导致现在“离了ChatGPT，大脑根本无法运转”。”

等等，又不是只有一个聊天机器人，难道地球离了ChatGPT就不转了。

大模型连崩原因猜想，谷歌躺赢流量激增6成

GPT归位，人们的工作终于又恢复了秩序。

未来科技 2024年6月5日
ChatGPT宕机8小时，谷歌Gemini搜索量激增60%

ChatGPT一天宕机两次

谷歌Gemini搜索量激增近60%

ChatGPT在全球拥有约1.8亿活跃用户，已成为部分人群工作流程的关键部分。

过去24小时内提交的关于OpenAI宕机的问题报告

图片来源：Downdetector

ChatGPT系统崩溃后，有网友在社交媒体X上发帖警告道：“ChatGPT最近发生的2.5小时全球中断，为我们所有依赖AI工具来支持业务的人敲响了警钟。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时大崩溃，AI集体罢工让全网都慌了

接着OpenAI也在官网更新了恢复服务公告，表示“我们经历了一次重大故障，影响了所有ChatGPT用户的所有计划。Generator调查显示，在ChatGPT首次故障后的四小时内，谷歌AI聊天机器人Gemini搜索量激增60%，达到327058次。

而且研究团队表示，“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关，显示出用户把Gemini视为ChatGPT的直接替代选项。

未来科技 2024年6月5日
深度对话苹果iPad团队：玻璃的传承与演变

iPad最为原始的外观专利

没错，这就是iPad最初被设想的样子：全面屏，圆角矩形，纤薄，就像一片掌心里的玻璃。

2010年发布的初代iPad

好在乔布斯的遗志，并未被iPad团队遗忘。

初代iPad宣传片画面

乔布斯赞同这一想法，于是快速将资源投入平板电脑项目，意欲打造一款与众不同的「上网本」，这就是iPad早年的产品定义。

iPad进化的底色

苹果发布会留下过很多「名场面」，初代iPad发布会的末尾就是一例。

未来科技 2024年6月5日
底层逻辑未通，影视业的AI革命正在褪色…

GPT、Sora均为革命性产品，引发了舆论风暴，但它在上个月发布的“多模态语音对谈”Sky语音，却由于声音太像电影明星斯嘉丽·约翰逊，被正主强烈警告，被迫下架。

华尔街日报也在唱衰，认为“AI工具创新步伐正在放缓，实用性有限，运行成本过高”：

首先，互联网上已经没有更多额外的数据供人工智能模型收集、训练。

03、

如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向，那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

但分歧点正在于此，电影公司希望通过使用AI技术来降低成本，但又不希望自己的内容被AI公司所窃取。

未来科技 2024年6月5日
KAN会引起大模型的范式转变吗？

“先变后加”代替“先加后变”的设计，使得KAN的每一个连接都相当于一个“小型网络”，能实现更强的表达能力。

KAN的主要贡献在于，在当前深度学习的背景下重新审视K氏表示定理，将上述创新网络泛化到任意宽度和深度，并以科学发现为目标进行了一系列实验，展示了其作为“AI+科学”基础模型的潜在作用。

KAN与MLP的对照表：

KAN使神经元之间的非线性转变更加细粒度和多样化。

未来科技 2024年6月5日
这个国家，也开始发芯片补贴了

//mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
[4]中国安防协会：欧盟批准430亿欧元芯片补贴计划：2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
[6]潮电穿戴：印度半导体投资大跃进，一锤砸下1090亿，政府补贴一半.2024.3.5https。

未来科技 2024年6月5日
大模型的电力经济学：中国AI需要多少电力？

这些报告研究对象（数字中心、智能数据中心、加密货币等）、研究市场（全球、中国与美国等）、研究周期（多数截至2030年）各不相同，但基本逻辑大同小异：先根据芯片等硬件的算力与功率，计算出数据中心的用电量，再根据算力增长的预期、芯片能效提升的预期，以及数据中心能效（PUE）提升的预期，来推测未来一段时间内智能数据中心的用电量增长情况。

未来科技 2024年6月5日
你正和20万人一起接受AI面试

原本客户还担心候选人能否接受AI面试这件事，但在2020年以后，候选人进行AI面试的过程已经是完全自动化的，包括面试过程中AI面试官回答候选人的问题，AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

以近屿智能与客户合作的校验周期至少3年来看，方小雷认为AI应用不太可能一下子爆发，包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

未来科技 2024年6月4日

谷歌硬刚OpenAI，硅谷大战继续升级

相关推荐