科技云报道原创。
推进工业新质生产力,机器人有望成为AI下一个“新引擎”?
“人工智能的下一波浪潮是机器人技术,这是一个‘0亿美元市场’,但未来将价值数十亿美元,就像Nvidia刚起步时的GPU加速计算一样……”这是英伟达CEO黄仁勋对加州理工2024届毕业生的劝勉。
这不免让人想起初创公司Figure的人形机器人,其外表和动作都与人类十分相似。它可以与人流畅对话,理解人的意图。当听到工程师“想吃点东西”的口令后,它迟疑了一下,准确地拿起了苹果。它甚至可以解释自己为什么要这样做。
这一人形机器人背后,是OpenAI公司为其配置的大语言模型。多模态技术加持下,它具备高级视觉和语言智能。
随着大模型、机器人制造等技术发展,赋予人工智能“形体”的具身智能(Embodied AI)正逐步走入人工智能舞台中央。
AI技术的集大成者
“具身智能”,字面意思是“具有身体的人工智能”。简言之,具身智能就是让机器人或智能系统像生物一样,通过自己的身体去感知世界、理解世界,并在世界中行动和完成任务的智能技术。一年多来,随着政策、资本、产业、学术界的共同推动,具身智能成为广为人知的热门词汇。
如今,具身智能是人工智能产业发展的重要方向之一。英伟达近期发布人形机器人通用基础模型Project GR00T,希望能让机器人拥有更聪明的“大脑”。由Project GR00T驱动的机器人能够理解自然语言,并通过观察人类行为来模仿人类动作。在特斯拉2023股东大会上,马斯克也向大众展示了人形机器人Optimus的全新型号。这些都是具身智能驶入发展快车道的缩影。
值得一提的是,在大众语境中,具身智能常常会被认知为人形机器人,以此作为其通俗意义的指代称呼。但具身智能不能完全等同于人形机器人,它代表的是一种智能技术,当具身智能走进物理世界、与不同硬件结合时,形成的硬件有可能是机械手臂、四足或六足机器人、轮式机器人,或者人形机器人,因此二者的范畴是不同的,人形机器人只是可能承载具身智能的一个本体。
具身智能强调的是机器能够像人类一样感知和交互的能力,不仅仅局限于思维和计算能力。它涉及多个学科和技术,包括机器人学、计算机视觉、计算机图形学、语音与自然语言处理技术等,这些技术共同作用,使机器能够理解、推理并与物理世界进行有效的互动。换句话说,具身智能的独特意义在于为实体机器人安上“大脑”,让“机器”真正变成“机器人”。
随着AI技术的不断突破,机器人产业或将成为下一个万亿市场。人形机器人是AI最有前景的落地方向之一,未来不仅能将人类从低级和高危行业中解放出来,提升人类生产力水平和工作效率,还可以在工业、商业、家庭、外太空探索等领域具有广阔应用场景。
根据Precedence Research数据,2022年全球人形机器人市场规模约为16.2亿美元,预计到2032年,全球人形机器人的市场规模将增至286.6亿美元,2022-2032年的CAGR高达33.28%市场空间广阔。
当前,阻碍人形机器人商业化量产的原因包括大规模应用场景不足以及存在诸多技术问题亟待解决。
一方面,应用场景直接影响机器人需求的刚性程度,目前人形机器人应用场景仍有待挖掘。
另一方面,人形机器人尚处于功能相对简单、初步智能的形态。其解决路径核心仍是机器人功能和智能化水平提升,支撑机器人从封闭场景走向开放场景,从单一场景进入复杂场景。提升通用化水平是未来人形机器人行业发展的必由之路,必须依靠AI技术的进步和发展,AI技术与机器人的结合,将弥补当前机器人在智能性、易用性、经济性上的短板,有效提升机器人在各个行业的渗透率。
传统的深度学习模型中,机器智能往往局限于特定场景,而在ChatGPT、PaLM为代表的AI多模态大模型的赋能下,机器人可以与真实世界进行多模态交互,从而实现具身智能,并拥有不断进化、跨场景应用的能力。
技术进步与挑战并存
依托大规模数据和强大算力的大模型,为机器理解世界提供了前所未有的能力。它与具身智能的结合,预示着机器人的未来将更加智能化、互动化。
在制造业领域,机器人集成了人工智能、高端制造、新材料等先进技术,被誉为“制造业皇冠顶端的明珠”。而结合大模型的人形机器人,更是新质生产力发展的重要代表。
去年11月,工业和信息化部印发《人形机器人创新发展指导意见》,提出人形机器人集成人工智能、高端制造、新材料等先进技术,发展潜力大、应用前景广,是未来产业的新赛道。
发展具身智能,主要可从三方面发力。
一是仿生机制。具身智能的一个关键目标是使机器能像生物体一样具备感知、决策和运动能力。因此,更深入地研究和模仿复杂的生物机制,如神经系统的运行方式、生物体的自我修复能力等,是实现这一目标的重要途径。
二是基于物理的智能决策能力。智能系统需要更紧密地与其所处的物理形态融合,以便在各种环境中自然、高效地执行任务。这意味着需要发展出更先进的机器人硬件和软件技术,支持智能系统在复杂环境中的运动和操作。
三是自主学习和适应环境。具身智能系统需要具备自主学习和适应环境能力,以便能在复杂多变的环境中执行任务和解决问题。这可以通过强化学习、迁移学习等机器学习技术实现。
然而,难题和挑战也如影随形。
首当其冲的是算力。具身智能需要进行大量计算来支持感知、决策和运动过程。随着任务和环境复杂性的升级,其对算力的需求会不断增加。目前,大模型的参数已经达到万亿级别。这类大模型存在过度消耗数据和算力的问题。没有深度学习时,算力对电力的依赖每20个月翻一番;大模型时代,算力对电力的依赖,每年都要翻10到100倍。可见,算力对电力的消耗呈几何指数增长。
数据安全也不可忽视。具身智能系统需要收集和处理大量数据进行学习优化,这些数据可能包含用户个人隐私信息。除了隐私泄露,具身智能在实践应用中,还可能带来模型中毒、数据窜改、内部威胁、蓄意攻击等数据安全威胁。
随着具身智能技术不断发展,也需要关注其可能带来的伦理和道德问题。例如,如何确保机器人在执行任务时不伤害人类或造成不必要的损失,如何保证机器人行为符合人类道德和价值观等。
具身智能的万里长征
在2024北京智源大会上,针对当下人形机器人赛道参与者众多、创业项目层出不穷的现象,零一万物CEO、创新工场董事长李开复“泼”了一盆冷水,他透露,目前创新工场投资了约6家无人驾驶公司,却并没有投资任何一家具身智能、人形机器人公司。李开复指出,具身智能是物理世界跟AI的结合,一旦大模型接入物理世界,就需要面临包括安全问题、机器问题、机械问题、故障问题在内的各种问题,难度会增加很多倍。
具身智能是重要的,它可以很好地结合大模型多模态能力,而且一旦实现之后就可以产生数据,形成数据飞轮闭环,有很大的想象空间。但具身智能要在短期做好,难度很大,必然要走漫长的道路。
张亚勤从AI安全方面发出了提醒,随着AI能力的不断扩大,AI的安全风险也在扩大,因此现在考虑未来的风险是很重要的。当AGI达到一定能力并被大规模部署,那么可能会有失控的风险。目前AI仍存在可解释性问题,未来机器人数量可能会比人要多,当大模型被用到基础物理设施、金融系统,包括国家安全、军事系统等方面,就可能会有失控的风险。
人工智能的未来就像“薛定谔的猫”,充满不确定性。但可以确定的是,人类不会在各种陷阱面前望而却步、畏首畏尾。面对人工智能带来的陷阱,坚持开放而审慎、包容而敬畏、大胆而自信的心态,我们就能与新技术的更迭保持同频,站在人工智能的肩膀之上抓住机遇,确保AI技术朝着有益于人类福祉的方向发展。