特斯拉的Optimus机器人,“进厂打工”了

升级后的Optimus在进行电池分类,来源:特斯拉

同时Optimus的稳健性足以应对频繁的物体交互,减少了常规维护的需要。

升级后Optimus在特斯拉办公室行走,来源:特斯拉

这种广泛的技术整合不仅展示了Optimus作为一个先进机器人平台的能力,也引出了关于人形机器人技术未来发展的重要问题:在面对有限的预算和资源,如何选择能够最大化技能迁移和泛化能力的任务。

5月5日,特斯拉在X账号上分享了Optimus(擎天柱)人形机器人的最新进展,Optimus的能力全面升级。

视频中,Optimus利用端到端神经网络执行基本工厂任务,包括对4680型电池单体精确地分类并插入托盘,并且走路速度大幅提升,较去年12月时速度提高30%以上,目前约为0.6 米/秒。此外,特斯拉还特别强调了机器人的自主性,Optimus甚至能在工作中纠正自己的错误。

特斯拉机器人团队工程师米兰·科瓦奇(Milan Kovac)对全新升级的Optimus进行了详细说明:

  1. 特斯拉开发并部署了一个神经网络,允许Optimus机器人执行更实用的任务,例如从传送带上捡起4680型电池,并准确地将它们放置在电池托盘中。

  2. 这个神经网络完全是端到端运行的,利用机器人自身的2D摄像头以及触觉和压力传感器的数据,直接产生控制关节的序列。网络完全在机器人的全自动驾驶(FSD)控制器上运行,由机器人的电池供电。

  3. Optimus的设计能通过单一神经网络执行多种任务。在训练过程中,特斯拉引入了大量不同的数据。

  4. Optimus目前还不够完善,反应速度较慢,但其成功率正逐渐提高。特斯拉还在训练Optimus如何从失败中恢复,目前已观察到Optimus能自行纠正错误。

  5. 特斯拉已在一家工厂部署了多个Optimus机器人,它们每日在真实的生产环境中接受测试并不断改进。目前Optimus也能在办公室中进行长时间的行走而不跌倒

  6. 特斯拉正在进一步研究如何提高机器人的移动速度,让它能适应更复杂的地形,所有这些进展都未影响其类人特性。同时特斯拉也致力于提高整个机器人队伍的可复制性,训练神经网络处理动态校准和机器人间的微小差异。 

自从2021年Optimus首次亮相后,三年来特斯拉每隔几个月就会分享Optimus的更新,主要是为了展示其步行速度和执行任务时精准度的进程。特斯拉之前还展示过机器人折叠衣服、自主分类物体以及执行瑜伽等体能动作的能力。特斯拉的CEO埃隆·马斯克(Elon Musk)在去年12月还表示,这些“钢铁大汉”一年内就能掌s握穿针引线。

4月23日,在特斯拉2024年第一季度财报电话会议中,马斯克强调Optimus已经在执行工厂任务,并预计在未来几年内将更广泛地使用。预计今年年底,Optimus将在工厂中执行一系列工作任务。而到2025年底,“机器人将对外销售”。

对于价格,马斯克在3月说过:“Optimus的价格最终将低于25000美元或30000美元,他预计其生产成本将比汽车一半的成本还低。”

更灵活的手部

英伟达高级研究科学家Jim Fan称赞这次Optimus升级是令人瞩目的更新。他表示:“从视频中我们得以一瞥他们收集人类数据的场景,这也是Optimus的一大优势。”

要建立起这样一个高效的数据收集流程,需要哪些关键要素?

首先是Optimus机器人的手部。它的手部是最先进的五指灵巧机器人手之一,具有触觉感应功能,能够感知和处理各种物体。

与许多手部仅有6到7个自由度(即可独立移动的关节数量)的竞品相比,Optimus拥有11个自由度,大大提高了灵活性和操作精度。手部的高自由度也让Optimus能够执行更复杂的任务。

升级后的Optimus在进行电池分类,来源:特斯拉

同时Optimus的稳健性足以应对频繁的物体交互,减少了常规维护的需要。特斯拉对机器人的前庭系统、脚部运动轨迹和地面接触逻辑进行了改进。同时升级了其运动规划器,增加了轻微的躯干和手臂摆动,以及缩短了机器人的循环延迟时间。通过这些技术提升,Optimus在运动时的稳定性和自信度都有了显著的整体提高。

其次是Optimus使用的远程操作软件。操作员通过佩戴VR眼镜和手套来控制机器人,实现了极低延迟的精确控制。这种设置的复杂性在于同时要处理大量的实时视频流和控制信号,确保操作者的动作能即时准确地反映在机器人上。即使是极小的延迟也会显著影响操作的直觉和效率,所以它对减少人机交互中的延迟至关重要。

需要强调的是,Optimus在其控制系统中使用了特斯拉的全自动驾驶(FSD)控制器。FSD提供了高级的视觉处理能力和实时决策制定功能,能让机器人在没有人类直接监督的情况下,自主完成复杂任务。

FSD的关键在于其先进的神经网络,这些网络能够从汽车的摄像头和传感器中收集数据,并将其转化为驾驶指令,如转向、加速和制动。

特斯拉在FSD系统中使用端到端神经网络,从数据输入到驾驶决策的整个过程都是自动完成的,不需要人工编写的代码介入。这种系统不仅能够减少对硬编码规则的依赖,而且能够通过不断学习和适应来改进其性能。

而在FSD系统中使用端到端AI的主要原因之一是其能够显著提高决策的速度和精确度。这种技术通过直接从实际驾驶数据中学习,可以更准确地模拟和预测人类驾驶行为,从而在各种驾驶环境中实现更安全和更有效的驾驶 。

由此可见,特斯拉在机器人上使用FSD技术,主要是为了借助其强大的数据处理和AI决策能力,使机器人在执行任务时更加独立和有效。利用FSD在处理高速、高精度数据流方面的能力,从而实现更流畅和精确的机器人动作控制。

而且FSD在汽车自动驾驶中已经得到了广泛的应用和验证,它的高性能计算能力,完全可以有效支持Optimus机器人的复杂数据处理和实时决策需求。

此外,Optimus的操作系统不仅包括先进的硬件,还涉及复杂的运营管理。一个规模庞大的机器人群体需要多个机器人同时运行以并行收集数据,还需要训练有素的人类承包商全天候轮班操作,以及随时待命的维修团队以确保系统的持续高效运行。Optimus机器人的多样化应用场景从视频中也可以看出,无论是在工厂环境中移动电池,还是在家庭环境中处理洗衣和整理日常物品,Optimus都显示出了极高的适应性和功能性。

升级后Optimus在特斯拉办公室行走,来源:特斯拉

这种广泛的技术整合不仅展示了Optimus作为一个先进机器人平台的能力,也引出了关于人形机器人技术未来发展的重要问题:在面对有限的预算和资源,如何选择能够最大化技能迁移和泛化能力的任务?

虽然远程操作为解决人形机器人问题提供了一种可能的路径,但这种方法的可扩展性受限。未来还需要探索如何在保持操作精度和低延迟的同时,进一步提升机器人的自主性和泛用性。机器学习算法、增强感知系统以及机器人的物理设计都还需要进一步优化。

备受争议的“擎天柱”

自2021年8月,首次在特斯拉AI DAY公开展示概念机Tesla Bot起,Optimus机器人项目可谓是毁誉参半,许多人只当他是马斯克拉投资的噱头。

首次亮相时便有机器人专家指出,Optimus机器人显示的移动能力有限,与波士顿动力等公司的现有人形机器人相比有较大差距。

NASA旗下灵巧机器人团队的负责人肖恩·阿兹米(Shaun Azimi)指出,汽车的自动驾驶并没有人们想象得那么简单,对于人形机器人而言,挑战更大。他强调,在出现意外情况时,机器人的灵活应对能力尤为关键。

同时,美国亚利桑那州立大学的人类系统工程学教授南希·库克(Nancy Cooke)提到,要证明机器人的成功,马斯克需要展示机器人能够执行多样化且非具体指令的行为。仅仅让机器人走动和跳舞,并不能充分展示其能力。

但在一系列的争议中,Optimus也在逐步前进着:

2022年2月,特斯拉推出了人形机器人原型机,标志着从概念走向现实的重要步骤。到了2022年4月,原型机完成了第一次步态行走。

同年9月的第二届AI DAY上,Optimus首次公开演示了直立行走、搬运和洒水等动作。

2023年2月,在Investor Day上通过视频展示了Optimus自由行走和拧螺丝等简单工作。

2023年5月的股东大会,马斯克展示了Optimus的行走、挥手和摇摆动作,并分享了其在汽车工厂中的应用视频。

同年9月,特斯拉在社交平台发布了展示Optimus自我校准、多任务处理、姿态控制及自平衡能力的视频。

2023年底的12月,发布了Optimus Gen-2视频,展示了更灵活的行走和更精细的动作,如二指拿鸡蛋和左右手转移动作,展示了先进的运动和质心控制能力。

Optimus Gen2机器人相比于其前一代,在多个方面有显著提升。Optimus Gen2采用了特斯拉自主设计的致动器和传感器。其中机器人的脖子增加到了2个自由度,使头部运动更加自然;行走速度提高了30%;机器人的重量相比上一代减轻了10千克。

Optimus Gen2还增加了脚力和扭矩感应功能,配备了铰接式的脚趾部分,更好地模仿了人类脚部的几何形状,这样的设计提升了机器人在各种地面上的稳定性和适应性。最引人注目的还是上文提到的,这一代机器人的双手拥有了11个自由度。

三年来,特斯拉Optimus人形机器人实现了从概念雏形到技术突破的蜕变。它在行走速度、自主性和稳定性上的提升,预示着人形机器人将更加灵活、高效,以便进入更多行业提升生产效率,改善人类的生活质量。

一个更加智能、更加人性化的机器人时代,或许很快就要到来。

本文来自微信公众号:甲子光年(ID:jazzyear),作者:苏霍伊,编辑:田思奇

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年5月6日 13:57
下一篇 2024年5月6日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日