有了它,断网也能“纵享丝滑”

 
以下为嘉宾的部分观点摘要:
 
应用驱动发展,端侧AI逐步刚需
 
● 目前来看,不论国内国外端侧AI都还没有形成一个固定的生态和框架,现在所看到的这些所谓开源和推理,都还没有统一的集大成者出现。
 
● 云端有云端的优势,它可以快速的去做模型迭代和收敛,而且它的算力强,数据收集和训练都很方便,但云端也有一些劣势,比如云端识别要依赖于网络,如果网络不稳定,信号覆盖不到或者信号质量差,服务器处理能力不行的情况下,它的识别会非常不稳定。其次就是云端无法保证用户的隐私安全,存在泄漏风险。再就是云端的运行成本非常高,因为它要搭建,涉及到搭建服务器、升级、维护,包括便利和传输数据的传输,这无形当中都会带来非常大的成本,虽然现在互联网厂商在承担这个成本,但长期来看,会转嫁到用户身上去。

荣耀、OPPO、VIVO、小米各大厂商都相继开始支持大模型在手机端的应用,联想也刚发布了全球首款AI PC。

 

相比云端,在终端运行AI究竟能带来哪些直观价值?作为消费者,我们又可以期待些什么?

 

12月28日,虎嗅智库举办了502线上同行主题研讨活动,来自上海人工智能技术协会首席咨询顾问尹智、亚马逊云科技资深解决方案架构师贺杨、中科创达物联网事业群副总裁杨新辉、亿智电子AI研究院院长孔文海、启英泰伦芯片技术总监王书娟,就端侧AI的产业生态进行了前沿观点分享。

 

以下为嘉宾的部分观点摘要:

 

应用驱动发展,端侧AI逐步刚需

 

● 目前来看,不论国内国外端侧AI都还没有形成一个固定的生态和框架,现在所看到的这些所谓开源和推理,都还没有统一的集大成者出现。

 

● 端侧AI的需求是由应用驱动的,选择云还是端侧AI,主要取决于用户的选择,比如交通领域,需要做一些人流分析,包括人脸识别,这种对延迟性要求高的场景就会有比较刚性的需求。另外,从成本和传输方面也是考量因素,毕竟全视频流在带宽和流量上都有一定压力,如果端侧AI能够分担一部分云端压力,价值是很真实的。

 

● 云端有云端的优势,它可以快速的去做模型迭代和收敛,而且它的算力强,数据收集和训练都很方便,但云端也有一些劣势,比如云端识别要依赖于网络,如果网络不稳定,信号覆盖不到或者信号质量差,服务器处理能力不行的情况下,它的识别会非常不稳定。其次就是云端无法保证用户的隐私安全,存在泄漏风险。再就是云端的运行成本非常高,因为它要搭建,涉及到搭建服务器、升级、维护,包括便利和传输数据的传输,这无形当中都会带来非常大的成本,虽然现在互联网厂商在承担这个成本,但长期来看,会转嫁到用户身上去。而这些问题,也会制约一些智能终端设备的发展和升级。

 

● 对应的,采用端侧AI的刚需性也是这几个方面,第一是延迟,像自动驾驶这种特殊场景如果通过云端反馈过来,直接就会出安全问题;第二成本也很重要,用手机端的算力跑AI可以极大节约成本;第三是隐私安全可以得到保障。

 

● 以家具家电这类功能性比较强的设备为例,我们经常用到的空调,烟机,微波炉,风扇,跑步机,这些不需要联网就能在终端做指令的唤醒和识别,这对用户来说是端侧AI带来的便利。

 

● 运行在汽车端时,端侧AI可以实现多任务下发,联动一系列指令,比如我说“请帮我打开车窗,并且导航到北京西站,然后播放一首刘德华的音乐”,这样的长指令在以前是很难实现的,虽然现在云端和端侧都可以实现,但从用户体验的一致性来说,他会期待无论车走到什么地方,即使进入隧道或不能联网时,也能有这样的丝滑感,所以基于这样的需求,就只能靠端侧AI,而且随着它的能力边界越来越清晰,也会越来越好用。

AI芯片在场景中做衍生,混合AI是趋势

 

● 从现在那些算法的演进来看,大部分都是在英伟达的CUDA生态上去做加速或者训练,所以算法的发展进程比端侧AI芯片要早得多。

 

● 端侧AI芯片具体要设计成什么样,跟不同公司和不同业务场景相关,正常一个周期在一年左右,快的半年。一般芯片出来之后,算法还会去做衍生,切入不同应用场景,可能是做车、做机器人、做物联网设备等等。未来需要平衡的是成本和性能,并最终由市场来定义性价比。目前从半导体的成熟度看,还需要比较长的时间周期来使端侧AI这个产品成熟和广泛利用。

 

● 混合AI,就是说除了云端,端测和边测上的AI也会发展起来,这个背景实际上是产业链分工的问题。AI大模型这么大的发展势头,做端侧芯片的厂商不可能不去参与,大家都做,就推动了半导体产业的进步。现在除了手机以外,AIPC也在成为热点,就是加载这种AI处理能力的笔记本形态的产品在不断出来。包括像一些语音识别的场景,比如会议系统的纪要DEMO自动生成、会议摘要的快速整理之类,虽然云端也可以完成这件事情,但本地端显然可以更敏捷高效的解决这些需求。

 

● 对于不同场景的不同需求,怎么精细定义AI能力边界的识别问题,这是一个很难的工作,比如到底3B,20B,70B还是130B的模型,每一个模型在不同的场景下,到底有多好用,这是目前业内都在寻找边界的工作。但实际上,我们看起来现在从3B到7B的模型,尽管它的模型能力在参数小的情况下很有限,但已经远比以前没有大模型时代的能力要大幅提升了。

 

● 现在行业整体还很早期,有很多创新的可能,而且我们看到半导体厂商和模型厂商提供了这些基础技术能力后,可能会有成千上万或者上百万的这样的AI原生应用爆发式出现,相应的也就会产生新的开发者生态,也就会有更多的人会去思考,基于边缘端AI或者端侧AI到底能做什么样的技术创新,到时候场景的想象空间会更大。

 

… …

 

本次活动中,线上参会观众汇集了来自深圳市人工智能与机器人研究院、阿里巴巴、美团、商汤科技、智谱AI、美的集团、比亚迪等知名公司的人工智能相关从业者,大家在互动区进行了热烈的提问,对于“目前端侧大模型的在 AI PC 上的能力,与参数较多的云端大模型有多大的差距?这些差距主要体现在用户体验的什么方面?”等问题,嘉宾给出了精彩回复,也圆满结束了本次502线上同行研讨活动。

关于虎嗅智库:

 

虎嗅智库致力于推动产业数字化以及以“双碳”转型为代表的可持续发展,为参与这个进程的中国企业高管、政府相关决策服务。我们主要的服务手段主要为:研究型内容(报告、分析文章、调研评选)、数据库、线上线下活动与社群、定制型项目等。

 

我们提供的核心价值:

 

及时与优质的洞察,了解技术、了解行业、了解同行与对手;

为决策者技术与产品战略决策、产业规划、解决方案选型提供重要参考;

帮助市场全面了解前沿科技及所影响产业的发展状况,还有未来趋势。

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年1月3日 18:49
Next 2024年1月3日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日