解密PC的AI进化:AI大模型如何“压”进PC?

 

 
无论是AI技术发展,还是PC市场趋势,都预示着AI将会成为2024年的PC行业新的增长引擎。
 
技术大揭秘:把AI装进PC
 
大模型的通用性、泛化能力都是来自于模型的参数量,从AI大模型热潮爆发至今,模型的参数量不断扩大,对算力的需求也在直线上涨。
 
PC市场的拐点
 
IDC在2023年底发布的《全球季度个人计算设备跟踪报告》指出,鉴于当前的经济环境和市场状况,对全球PC市场的预测被下调。

当地时间2024年1月9日,2024年国际消费电子展(CES 2024)在美国拉斯维加斯举办。AI for All成为CES大会的关键议题之一。在众多展品当中,被视作个人大模型普惠第一终端的AI PC吸引众多目光。全球最大的PC厂商联想集团更是推出了包括Yoga Pro 9i,ThinkBook Plus Gen 5 Hybrid、全球首款商务AI PC ThinkPad X1 Carbon AI、ThinkCentre neo Ultra在内的AI PC产品。那么这些初次登场的AI PC产品身上到底有什么黑科技呢?虎嗅与您一起走进2024CES,为您揭开AI PC神秘的面纱。

奔驰、宝马、大众纷纷把大语言模型接入车机系统,给让人能跟汽车自然对话。

 

三星给冰箱装了个AI识别系统,可以识别食物品种和新鲜度。

 

LG推出了会问候早安、欢迎回家的家庭AI机器人。

 

在2024年的CES展上, AI热度仍在持续,各家厂商都在喊AI for All,All in AI之类的口号。

 

然而对于普通的消费电子用户来说,更关注的似乎还是停留在手边的设备,比如作为我们生产力工具的电脑。

 

AI PC是2024年CES展中最热的词之一,在数据中心业务上赚的盆满钵满的英伟达,也在本次展会上推出了多款聚焦个人、商用电脑的AI硬件产品和应用。包括RTX 4060 Super、RTX 4070 Ti Super 和 RTX 4080 Super三款GPU,将大语言模型(LLM)的处理速度提升了5倍,将AI视频生成速度提高了150%。

 

英伟达产品管理的高级总监Justin Walker在新闻发布会上强调:“我们已经销售了超过1亿块RTX GPU,这为运行AI应用的个人电脑提供了坚实的硬件基础。”

 

在PC终端方面,微软在CES大会之前,就宣布将在新款Windows 11电脑上配备Copilot按钮,这是一个专门用于调用现已融入其操作系统的人工智能聊天机器人的功能。配备Copilot按钮的首批设备预计将在本月完成上市。值得注意的是,Windows PC键盘布局上次的重大变革还是在30年前。

 

不过,在AI PC方面走的最靠前的当属联想。从2023年10月的全球TechWorld大会宣布了全线AI PC规划后,仅几个月时间,联想就带着多款AI Ready阶段的AI PC产品亮相CES展。包括赋能创作过程的Yoga Pro 9i,全球第一台可无缝切换笔记本电脑和平板电脑两种模式的ThinkBook Plus Gen 5 Hybrid、全球首款商务AI PC ThinkPad X1 Carbon AI、新一代超小型ThinkCentre neo Ultra等。

 

 

无论是AI技术发展,还是PC市场趋势,都预示着AI将会成为2024年的PC行业新的增长引擎。AI PC则成为了传统PC厂商的新增长机会,甚至有可能打破依靠供应链和渠道驱动的业务模式,创造出全新的PC市场趋势和发展模式。

 

技术大揭秘:把AI装进PC

 

大模型的通用性、泛化能力都是来自于模型的参数量,从AI大模型热潮爆发至今,模型的参数量不断扩大,对算力的需求也在直线上涨。由此AI需要云端算力,几乎成了业界共识,很多人认为脱离了云服务器的AI PC很难把模型的能力发挥好。

 

然而,对于个人和商业用户来说,纯粹的云端AI也并不是万能的。随着AI技术的发展和应用场景的多样化,依赖云端AI处理大量数据、提供服务的模式正逐步显现出局限性。

 

目前的AI云服务主要面临三个比较明显的挑战:成本、安全和响应速度。

 

而结合云端AI和AI PC类产品的优势,构建的云端+本地的AI模式,很可能会成为未来AI的发展趋势。通过这种模式,大型AI模型可以在云端进行复杂的数据分析和学习,而端侧AI则负责实时、低延迟的任务处理。这种协同工作模式不仅能够弥补单一模式的不足,还可以在保证处理效率的同时,确保用户数据的隐私和安全。

  

那么,要把云端那些需要英伟达A100、H100显卡才能跑起来的AI大模型,“拖到”小小的个人电脑中,应该怎么做呢?

 

联想的做法是对大模型进行“压缩”。

 

AI大模型通常涉及复杂的数据结构(如神经网络的权重矩阵)。这些结构需要频繁地在计算过程中修改和访问,所以在训练和推理过程中需要占用大量内存空间。

 

以GPT-3为例,它有1750亿个参数。通常情况下,这些参数以32位浮点数(即float32)的形式存储。在32位浮点数中,每个参数需要4字节的存储空间。换算成更常见的单位,这大概相当于700GB。

 

目前参数量较小的主流AI大模型多位70亿参数或130亿参数,这些“小”模型需要的存储空间,大约也要20GB以上。个人、办公电脑上要运行这些模型,相当困难。

 

“通过我们的技术,我们现在做的技术就是如何把这个存储的这些空间降低之后,还能保持原有的模型性能。”联想研究院研究员谢栋介绍说。

 

联想基于阿里通义千问的7B模型重新做了一个新的模型,在参数量不变的情况下对模型的“体积“进行了大幅度的压缩,谢栋告诉虎嗅:”可能原来一个参数用两个字节来存储,经过压缩,一个参数只有半个字节就可以存储。“

 

阿里通义千问7B模型的原始大小是14.4GB,在联想的Lenovo AI now中运行的模型则压缩到了4GB。由此,AI大模型+电脑本身的缓存,大概只要5-6G内存就能运行起来。而目前,联想的主流集成显卡笔记本电脑内存都在16G以上,独立显卡的游戏本、高性能本显存都在8G以上,可以轻松运行压缩后的通义千问7B模型。

 

现在的AI与传统的软件不一样,不是所有的芯片都能跑。AI与硬件之间还有一个中间层叫framework。目前,联想的AI PC正在做的事就是定制自己的framework。

 

“中间层是决定他能在这样的硬件基础上跑的,第一要能跑,第二还要跑得好。“联想全球中小企业产品与解决方案总经理郑爱国告诉虎嗅,目前我们的专家每天都在和AMD和Intel的专家沟通,对他们最新的平台和芯片一个一个地调优,是其能最大限度地适合AI PC的工作和任务。

 

目前联想研究院在这个“中间层”的研发工作中担任重要角色,除此之外,联想对AI PC的研发采用了多元化布局。目前最主要的研发任务主要集中在中国和美国。在日本、巴西,以及印度也都有研发分布。联想集团首席执行官杨元庆表示:“创新还有研发一直以来都是联想两个重要的核心能力之一。我们的研发经费在过去几年一直在提升,从不到3%到大概已经4%以上。”

 

如何用AI PC打出区隔

 

正在拉斯维加斯举办的2024 CES展上,联想展出了ThinkBook 16P、ThinkPad P1、ThinkPad P16、ThinkBook 13x等多款AI Ready的产品。这些产品的推出,不仅是技术进步的展示,也是联想在AI PC领域策略的体现。

 

联想集团执行副总裁兼中国区总裁刘军表示:“我们的AI PC目前处在AI Ready的阶段,在2024年4月的联想中国创新科技大会(TechWorld)上,我们将正式宣布我们的个人Agent。”这一声明表明,联想正将AI PC技术与个人助理功能结合,推动AI技术在个人电脑领域的深入应用。

 

在AI PC的硬件方面,联想计划推出CPU+GPU+NPU的混合AI模式,这种模式可以提高计算效率,优化AI应用的性能。NPU(神经网络计算单元)的引入是对传统CPU和GPU功能的补充,能够更加专注于处理AI相关的任务。这种混合硬件布局不仅适用于PC,也将应用于手机、平板等多种设备,甚至扩展到商业环境和AIOT(AI驱动的IoT)产品。

 

在软件生态方面,联想的战略是改变传统PC行业甚至是消费电子产品的交互逻辑,从应用交互转向意图交互。这一转变预示着未来的交互方式将更加直观和自然。用户不再需要通过复杂的菜单和步骤来执行任务,而是可以直接通过意图来与设备互动。这种基于意图的交互方式能够大大提高用户体验,使设备更加智能和易用。

 

在探索这些新领域的同时,对于其他厂商而言,如何在AI PC市场中寻找自己的定位和特色,是一个值得思考的问题。例如,其他厂商可能会在特定的垂直领域内进行深耕,如专注于创意工作的AI应用,或者在安全性、隐私保护方面进行创新。同时,不同厂商可能会选择不同的技术路径或合作伙伴,以寻找差异化的市场机会。

 

对于整个PC行业来说,AI PC的发展是一个多维度的过程,涉及硬件、软件、用户体验和生态系统等多个层面。联想作为先行者,在AI PC方向上自然会占据一定的先发优势,不过在创新产品的开发,以及AI技术的发展过程中,势必也会遇到各种不确定的问题。

 

 

从行业趋势来看,AI PC的未来可能不仅仅局限于个人电脑,而是会扩展到整个智能终端生态系统,包括智能家居、智能汽车等领域。这种趋势下,厂商之间的竞争将不仅仅是硬件和软件的竞争,更是对整个生态系统的理解和布局的竞争。

 

PC市场的拐点

 

IDC在2023年底发布的《全球季度个人计算设备跟踪报告》指出,鉴于当前的经济环境和市场状况,对全球PC市场的预测被下调。预计2023年的出货量将比2022年下降13.8%,而2022年的出货量则比上年下降了16.6%。这种连续两年的两位数同比下降在个人电脑市场是前所未有的。不过这种“衰退”趋势可能正在为市场的后续复苏铺平道路。

 

IDC认为,疫情期间售出的PC产品大多将在2024年面临Windows更新周期。此外,一些失去微软服务支持的旧版Windows系统,将面临2024年升级至Windows 11的压力。

 

这些因素在短期将会促进2024年PC市场的增长。而从长远来看,PC市场更大的增长动力则很可能源自AI PC带来的革命性升级。

 

联想智能设备集团执行副总裁兼总裁Luca Rossi在CES期间接受采访时表示:“2023年市场确实遭遇了一些压力。对于2024年全球市场的趋势我们保持谨慎乐观的态度,预见会有少量的增长。我们也乐观地认为,在2024年下半年和2025年,AI PC将在消费和商用市场掀起广泛的换机潮。人工智能电脑将成为转折点,加速更换周期。”

 

虽然目前全球PC市场中,仅有联想一家在大举落地AI PC,但其它PC行业巨头也都在对AI PC概念保持高度关注。HP和Dell的高管在近期的采访中都表示AI PC必将大幅提升PC的升级换代潜力表示肯定,HP Personal Systems部门总裁Alex Cho认为:AI PC或有望帮助PC行业增长率翻倍。

 

尽管面临短期挑战,IDC预计2024年及以后的市场将会出现反弹。预计2024年PC市场总量将比2023年增长3.4%,这得益于AI PC对市场升级起到的催化作用。初步针对企业PC市场的某些细分市场,随着用例的进一步发展和成本的降低,AI PC可能会推动更广泛的市场应用。

 

同时,IDC认为2024年将是PC市场的关键一年,为市场近期的挑战提供了喘息机会。预计2024年之后,出货量的增长将超过大流行前的水平,在2027年达到2.85亿台的峰值

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年1月12日
Next 2024年1月12日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日