Gemini Ultra除夕发布了,不等于说谷歌可以过年了

Gemini的回答是:

我以同样的意思,让GPT-4设计了一幅。

我让Gemini写一段代码,帮助我搜集一些好的素材,用来设计一幅龙年新年的贺卡。

Gemini的发布,对于谷歌更重要的意义是,以往不同产品与服务的AI功能,都统称为Gemini。

Gemini(基于Pro模型)仍然免费,相当于ChatGPT(基于GPT-3.5)。

终于,谷歌与AI相关的无数产品,拥有了一个共同的名字:Gemini。它可能结束了谷歌许多部门都在搞AI,整个公司却不知如何与微软/OpenAI竞争的局面。

谷歌赶着中国龙年的除夕,发布了号称唯一胜过人类专家水平的大模型Gemini Ultra1。谷歌去年底曾发布了较低版本的Gemini Pro和用于终端设备的Nano1、Nano2。

“最大的模型Ultra 1.0是第一个在MMLU(大规模多任务语言理解)方面超越人类专家的模型,MMLU结合了57个科目——包括数学、物理、历史、法律、医学和伦理学——来测试知识和解决问题的能力。” 但究竟有多大,谁也不知道。

谷歌用来与ChatGPT竞争的Bard,也已经改名Gemini。一打开页面,它向我问好:

我先试了下它从英文翻译成中文的功能。它能提供三个翻译版本供选择。同时它披露,我的这个对话背后,有人在审核:

“为了更好地改进,经过培训的审核人员需要处理您的对话。

因此,在使用双子座时,请不要输入您不想让审核人员查看或谷歌用来改进服务的任何内容。

请注意,您的谷歌工作区内容,例如来自 Gmail 或 Drive 的内容,不会被用于改进双子座。”

然后我让它为我以“龙马精神,恭喜发财”为意,设计一幅恭贺新年的贺卡。它回答说还没有文生图功能。

于是我给它出了一道题,在英语里人们称之为Apple测试,即让它造出十个以Apple结尾的句子。我要求它给我造出十个以“龙”为结尾的句子,姑且命名为龙测试。来了:

审核得不错。我又让ChatGPT造出十个以“龙”字结尾的句子,如下:

接下来,我想试试它的文生图功能。我要求它设计一张图,以“龙马精神,恭喜发财”为意,贺中国新年。Gemini的回答是:

我以同样的意思,让GPT-4设计了一幅。能看懂上面的字吗?意思看懂了,就是不认得。

我让Gemini写一段代码,帮助我搜集一些好的素材,用来设计一幅龙年新年的贺卡。几行Python代码立刻出现,提供了三个方案。

我选择了其中的一个,这段代码使用 Unsplash API 来搜索素材。Unsplash 是一个提供高质量免费图片的网站。

最后,它会交付给我一个相关图片的链接列表。还能帮我找到10张龙的图片。

Gemini的发布,对于谷歌更重要的意义是,以往不同产品与服务的AI功能,都统称为Gemini。如Duet AI 将成为 Gemini for Workspace,很快拥有 Google One AI Premium  计划的消费者就可以在 Gmail、文档、表格、幻灯片和 Meet 中使用 Gemini。对于云客户来说,Duet AI 也将在未来几周内成为 Gemini。以往谷歌也做了一大堆大模型,今后谷歌的业务,都统一建立在Gemini的基础之上了。

Gemini(基于Pro模型)仍然免费,相当于ChatGPT(基于GPT-3.5);其高级版本Gemini Advanced(基于Ultra1模型),将每月收费19.9美元,与ChatGPT-Plus(基于GPT-4模型)相同。看来,使用高端人工智能的起始价格,就是每月20刀了。Gamini应用还推向安卓和iOS设备。

关于Gemini不明觉厉的地方,可以在谷歌的技术报告中找到一些答案。在这里你可以看到一大堆的测试报告,包括这次老老实实地标注出在最重要的MMLU综合测试中,Gemini Ultra的5样本测试并没有胜过GPT-4。

Gemini的完整推出,也完成了过去一年谷歌在AI战略上的抓狂。现在Gemini将会变得和Google一样重要,更重要的是,它们都可以用字母G作为开头。

谷歌所面对的挑战,是要同时与OpenAI和微软竞争。它需要研发出一个最起码匹敌GPT-4的大模型,同时,在应用其业务中,尤其是在生产力工具方面,要与微软竞争。但谷歌的优势在于,它拥有强大的消费群体,应用场景更丰富,创新新产品的空间更大。

都说大模型是大力出奇迹的结果,那么,谷歌既不缺算力,更不缺钱,为什么不出一个碾压GPT-4的大模型?这里面有几种可能:

首先,大模型的缩放法则,即更强的算力-更大的模型-更多的智能涌现,可能正在接近上限,而GPT-4 级别的模型,已经接近了大型语言技术所能达到的 AI 能力上限,这是否意味着 AI 能力的指数增长会暂告一段落。

其次,是谷歌的一个商业策略。它的确需要一个可以与 GPT-4 竞争的模型,因此训练了 Gemini 达到该水平,然后停止了研发。它要看下GPT-5会不会有重大突破,然后再考虑Ultra2。

最后,可能OpenAI 真的拥有其他公司无法复制的某种“独门秘籍”,只有OpenAI自己能超越自己,谷歌虽然尽了最大努力,却无法破解 OpenAI 的秘密。

过去的一年多来,GPT-4统治着大模型世界,今天终于有一家能与其竞争,这也许是一个新时代的开始。它也告诉人们,只有做到了GPT-4和Gemini的水平,才能进入真正的应用领域。这样看来,开源的模型面临更大的压力,拥有最大算力集群的Meta,今年不知何时能推出一个什么样的Llama3。

除夕谷歌发Gemini Ultra1,OpenAI的GPT-5还过得了十五吗?

本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:周健工

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年2月9日
下一篇 2024年2月9日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日