下一个苹果还是苹果

十月份,苹果机器学习研究团队曾推出一个“雪貂“模型(Ferret),这个多模态大模型比GPT-4v对空间的理解更准确。

还有上海交大团队推出的推理引擎PowerInfer,都为大模型在设备终端,尤其是手机和笔记本电脑的部署,扫清一个又一个障碍,也预示着2024年,消费类电子产品,将会迎来一波大模型加载的高潮。

苹果正在与美国各大媒体机构谈判,约以5000万美元的价格,获得这些媒体的档案语料库,用来训练自己的大模型,可能会用Siri的对话服务。

苹果冷静地观察了生成式AI亢奋的一年,一直在为自己的生态基础添砖加瓦,还在一步一个脚印地迈向明年发布AiPhone。

十月份,苹果机器学习研究团队曾推出一个“雪貂“模型(Ferret),这个多模态大模型比GPT-4v对空间的理解更准确。最近这个模型开源了。简单地说,在一幅图中的任何地方,你指出任何一个物体,哪怕它再微小,“雪貂”都能解释清楚。

这种对空间的敏感,对于苹果即将发布的Vision Pro具有重要作用,它让自然/虚拟的视觉感知与语言大模型结合。这篇不张扬的论文作者全部是华人,最近越来越引起业内的重视,它在空间计算上达到了SOTA水平。

“雪貂”模型架构 (来源:FERRET: REFER AND GROUND ANYTHING ANYWHERE AT ANY GRANULARITY )

苹果最近推出了能在其M3芯片上训练部署大模型的开源框架MLX。这意味着Mac笔记本电脑的开发者,可以开发出大模型支持的应用。

苹果还推出了“闪电大模型” (LLM in a Flash),用闪存解决了手机上部署大模型内存(DRAM)不足的问题。

这是个人很喜欢的一篇论文。是的,偷偷干活的苹果,也开始默默地发论文了。

这篇论文谈的是一个小而关键的问题,如何在手机这样一个内存非常有限的空间里,部署一个大模型,而且推理的速度要快,还不费电池。

它的最大优点,不是就算法谈算法,而是从对硬件的深刻理解,结合算法提出了自己的方法。它的出发点完全是消费者思维,大模型在遥远的云端,大得吓人,贵得惊人,只有揣在用户的口袋里,才能让消费者对生成式AI产生感觉。

DRAM太小,放不下一个几十亿级的模型。尽管可以放到闪存里,但闪存的带宽不够。为了最小化从闪存到DRAM带宽的负载,苹果创新了两个技术,窗口化 (windowing)和行列捆绑 (row-column bundling)(详见论文)

在OPT 6.7B和FALCON 7B两个模型上测试,结果相当“炸裂”,能够运行的模型尺寸达到可用DRAM能容纳的两倍,与CPU和GPU中的简单加载方法相比,推理速度分别提高了4~5倍和20~25倍。

对齐芯片、操作系统和系统设计,找到方法建立起一个推理成本模型,这事只有苹果做得出来。

最近一系列的几十亿参数级小模型表现当惊世界,如Mistral, Phi-2能挑战百亿参数级大模型;谷歌推出了18亿参数的Nano级Gemini模型,直接装到Pixel手机上。高通的骁龙芯片能跑得动百亿参数级的模型。三星可能将于2024年初推出生成式AI游戏功能的Galaxy S24手机。

还有上海交大团队推出的推理引擎PowerInfer,都为大模型在设备终端,尤其是手机和笔记本电脑的部署,扫清一个又一个障碍,也预示着2024年,消费类电子产品,将会迎来一波大模型加载的高潮。

这些“小”模型的推出,有一个共同的特征,就是采用了高质量的数据,“教科书级”的数据。无疑,主流新闻媒体的档案,所能提供的是好的语言训练材料。

苹果正在与美国各大媒体机构谈判,约以5000万美元的价格,获得这些媒体的档案语料库,用来训练自己的大模型,可能会用Siri的对话服务。

想想这些用来训练语料的品质吧,康迪纳斯特的Vogue、New Yorker、NBC News,以及IAC的People、The Daily Beast、Better Homes、 Gardens等。它包括大量的以时尚与生活方式为内容的精美文字和图片。也包括部分新闻文章、图片和视频。

但是其他的主流媒体对此没有表示出多少兴趣。以往纸媒与社交媒体的合作,并没有给他们带来多少利益。另外,媒体将其档案中的新闻交给苹果去训练大模型,在使用的过程中,可能产生的法律纠纷,也引起这些媒体的担忧。

苹果的做法,被认为更加地道。其他的AI公司或者科技巨头,是先用了人家的语料,被揪住了再去谈授权,已经引发了一些官司。

苹果出于对隐私的强调,它不愿意直接从网络上扒数据。苹果也不允许收集其客户的数据。

那么,2024年苹果会做什么?

大家首先想到的是,它会在明年推出生成式AI加持的语言助理Siri。它将是2024年秋季iPhone16和iOS18的最大亮点。有些果粉开玩笑说会推出SiriGPT。但这些都只是冰山一角。

巨头的做法,通常是寻找新的技术加强其固有的核心能力,在原有的产品上产生差异化。是从表面上看,吃老本的苹果,在生成式AI上行动迟缓,采取了保守的跟随战略?还是苹果能真正利用其在芯片、操作系统、大模型方面一体化整合的能力和产品设计能力,做出最好的AI产品体验?答案可能是后者。

苹果在过去的几年,已经收购了几十家AI初创企业,用于其产品、服务及生态中。只是这里面没有那些明星级的初创公司。

苹果只做不说,早有分析人士注意到,苹果在AI上的投资,一点都不比微软少:已经花了上百亿美元,建造生成式AI应用开发的基础设施。稍早人们传闻苹果在内部偷训自己的大模型Ajax,或者叫Apple GPT,据说当时能赶上GPT-3.5。

但最近苹果在机器学习方面一系列的研究成果表明,苹果在走自己的路。微软、谷歌、亚马逊、英伟达,以及OpenAI为代表的闭源大模型公司,围绕模型、云和算力去收割了第一茬。

而苹果看重的是其20亿设备及其用户所形成的巨大的生态。生成式AI所带来的iPhone的新的体验,以及用大模型去加持所有的应用,这些给苹果带来的消费市场机会,是其他巨头难以夺走的。苹果以隐私保护的名义,控制了第三方应用之间互相窜访,这也让苹果商店成为自己未来AI应用的金矿。

苹果动作慢了吗?生成式AI的幻觉问题,还有监管、隐私保护、版权纠纷等,这些问题都会令苹果想得更深一些,考虑得更周全一些。苹果有这样的底气,因为它在芯片、操作系统、应用、产品、制造等各个层面一体化的设计,最终所带来的产品体验创新性的深度,仍将可能是其竞争对手难以比拟的。

OpenAI引发的“iPhone时刻”,已经尖叫好几回了,但下一个苹果,还是苹果。

参考论文:

https://arxiv.org/pdf/2312.11514.pdf

https://arxiv.org/pdf/2310.07704.pdf

本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:周健工

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年12月24日
下一篇 2023年12月25日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日