他们给机器人造大脑，OpenAI红杉抢着投5亿

2024年4月12日 09:14 • 未来科技

Intelligence，简称Pi或π。目标是开发一套“为各种机械设备添加高级智能的软件”，最终构建可以控制任何机器人执行任何任务的通用AI模型。

我们是一群工程师、科学家、机器人学家和公司创建者，正在开发驱动当今机器人和未来物理设备的基础模型及学习算法。Chelsea得意门生、丰田研究所机器学习、机器人学和计算机视觉研究科学家Suraj。

还记得曾火遍全网的ALOHA家务机器人吗？最近该项目导师，斯坦福计算机科学与电气工程系教授Chelsea Finn在X宣布，正式与其他几位伯克利大牛学者、谷歌DeepMind科学家共同创业，全力为机器人打造智能大脑。

新公司的名字叫Physical Intelligence，简称Pi或π。目标是开发一套“为各种机械设备添加高级智能的软件”，最终构建可以控制任何机器人执行任何任务的通用AI模型。

Chelsea Finn解释说，这其实极具挑战性，需要整合机器人跨平台策略、从视觉和语言模型中迁移学习、并通过模仿学习实现对灵活技能的掌握。

联合创始人兼CEO Karol Hausman也兴奋表示，项目将收集前所未见规模的机器人数据，进行算法改进和训练超大模型，并攻坚一切将AI引入物理世界所需的技术。为此他们组建了一支“世界级团队”，迫不及待开始这趟新的冒险旅程。

根据公开消息，才创立不到一个月，Pi已经被包括OpenAI和其早期投资者Khosla Ventures、美国红杉资本、Lux Capital在内的多家风投机构提前锁定，拿下7000万美元的高额融资。这不仅因为公司在机器人赛道中的技术前景被无比看好，更多是对创始团队实力的信心押注。

十人团队，人均大神，一位华人成员

Pi的官网页面上是这样介绍自己的：

“Physical Intelligence是一家将通用人工智能带入物理世界的新公司。

我们是一群工程师、科学家、机器人学家和公司创建者，正在开发驱动当今机器人和未来物理设备的基础模型及学习算法。现在还处于初期阶段，欢迎有兴趣的伙伴加入！”

列出的成员目前只有十人：

虽然展示方式“过于朴素”，但团队阵容实际上相当豪华，几乎是人均大神。在加入Pi以前，他们各自都有不斐的研发成果，好几位都是业界响当当的名字。

首先必须介绍的是除Chelsea Finn和Karol Hausman的另一位联创Sergey Levine。

Sergey Levine现任UC Berkley电气工程与计算机科学系助理教授，专注于研究让自主智能体通过学习获得复杂行为的通用算法，集中在机器学习决策和控制领域。并开发端到端深度神经网络训练策略，曾带领团队与谷歌联合开发RT-X机器人项目，被认为是强化学习领域的领军人物之一。

然而更令这个男人扬名立万的是他“学术狂魔”的名号。Sergey Levine谷歌学术上被引用量超过13万，同时在顶级国际会议和期刊上发表过大量研究论文，接收量长期位居前列，并且经常霸榜。

例如NeurIPS 2019 和 2020 上他分别有 12 篇论文被接收，位列NeurIPS榜单第一。2019年ICML论文接收量并列第二。2022年更是向ICML投稿了30篇论文，并以16篇的接收量断崖式登顶作者Top1——简直是令人闻之丧胆的“论文收割机”！

此外Sergey Levine还是伯克利人气超高的“网红教授”，教育成就十分突出。他开设的深度学习课程（Deep Reinforcement Learning，代号CS285）在学生中反响极为热烈，很受欢迎。线上视频在油管和B站都可以观看，广为传播。

在这次对于新公司Pi的“创业声明”里他说，希望为机器人领域带来类似“大语言模型之于自然语言处理”那样的通用解决方案。

“过去我们已经多次看到，机器学习在大规模数据集与小数据集中面临的问题有巨大不同。我们的研究很有实用性价值，相信也会为基础研究突破打开大门。”

开篇提到的Chelsea Finn也是联合创始人之一。她从MIT大学毕业后在伯克利取得博士学位，其介绍元学习算法的毕业论文获得2018年ACM博士论文奖，当时的指导老师就有Sergey Levine。

目前Chelsea Finn担任斯坦福大学计算机科学和电气工程的助理教授，重点研究通过学习和交互来发展机器人等智能体的广泛智能行为。例如端到端视觉感知和机器人操控，从收集的经验中自主学习通用技能，以及快速学习新概念和行为的元学习算法，谷歌学术引用超4.9万次。她也曾在谷歌大脑担任过5年研究科学家，开发机器人深度预测模型。

Pi的首席执行官Karol Hausman是谷歌大脑的高级研究科学家，同时也是斯坦福大学的兼职教授。他的研究兴趣集中在使机器人能够在真实世界中以最小的监督自主获得通用技能，并因“对可扩展的机器人学习算法做出重大贡献”而获得2023年IEEE机器人与自动化学会行业职业奖。

Hausman在X的自我介绍十分有趣：“喜欢机器人、AI、NBA、哲学、足球和杏仁可颂。”

除了这三位，团队还聚集了擅长机器人运动规划和基础模型的前谷歌研究科学家Brian Ichter；巴基斯坦裔杰出工程师、前特斯拉自动驾驶和硬件专家（设计了Model X独特的上翘式猎鹰门）、现Anduril Industries高级副总裁兼电气工程负责人Anduril Industries；Chelsea得意门生、丰田研究所机器学习、机器人学和计算机视觉研究科学家Suraj Nair；以及支付公司Stripe前高管、著名科技投资人Lachy Groom等业界大牛。

另外吸引我们注意的是，这份名单列表里还有一位华人成员Lucy Shi。这位来自人大附中的姑娘在USC获得计算机科学学士学位，现在是一名斯坦福的学生研究员，由Chelsea Finn教授指导。曾与NVIDIA 高级研究科学家兼通用具身智能研究团队负责人Yoke Zhu、高级研发经理Jim Fan合作过。

最近她刚公布了斯坦福与伯克利合作的Yell At Your Robot（YAY Robot）项目，展示机器人从语音纠正中实时改进，根据人类口语反馈来学习和不断提升，执行灵巧操作任务的研究成果。

Lucy Shi在个人页面开心地分享了自己以“第一位实习生”身份加入Physical Intelligence 的消息。

自我介绍中她写道：“我对机器人学习有着广泛兴趣。研究目标是创造出通用型机器人，在我们日常生活中无缝执行复杂、长期的任务….我深信人类的创造力和人工智能的潜力。未来20年，我希望成为一名大学教授，建立起新一代的贝尔实验室 ——这个改变世界的创新思想工厂。这让我们欣喜地看到又一位智慧与理想兼具、前途无量的年轻学者。”

迎难而上的智能机器人大脑缔造者

在历久以来的科幻小说和电影里，人们总梦想有一个真正听懂自己需求的机器人。它会思考、有情绪，能跟在身边陪伴我们，帮助解决生活中的种种难题，像人类朋友一样全能。然而现实中的机器人虽说可以在工厂搬运重物、给家里打扫卫生，但与日益通用化的聊天机器人相比，能够执行的任务范围相对要局限很多。

Chatbot和LLM的崛起得益于互联网语料中的海量数据。OpenAI和Google可以通过向大语言模型输入数十亿个人类语言样本来训练它们。然而从真实世界收集类似规模的数据是极其困难的，这也限制了近几年人工智能在物理机器人领域的进步。

Physical Intelligence认为，现在正是采用新方法推进通用型机器人的时机。

Figure 01通过接入ChatGPT实现了人形机器人智能化的“看听说”交互，让人们看到大模型与机器人结合的巨大潜力。Pi也希望将构建语言模型的先进技术与自己的机器控制和指令技术相结合，创建一种任何硬件、任何平台都可用的，具备广泛任务执行能力的通用人工智能系统。

团队表示，Pi并不专注于特定类型的机械臂或工业机器人，而是计划开发可以应用于多种类型机器人的软件。他们也不会制造自己的硬件，创业后第一步是解决工程问题、搭建模型，以及购买各种不同的机器人并在上面开展训练，目的就是积累迄今为止最大规模的机器人数据。

Karol Hausman在接受公开采访时强调，团队要开发一个通用模型，将人工智能从计算机里带到物理世界，“它能为任何硬件设备提供动力，用于任何应用。”

而这显然不仅仅是Pi的愿景。除了面临来自Figure AI和特斯拉等制造人形机器人公司的竞争，几十年来，人们也一直在努力改进驱动机器人的软件。

就在Pi宣布成立的同一周，有着7年历史、由知名AI科学家Pieter Abbeel和他三位华人博士生创立的Covariant公司就推出了基础模型RFM-1，为机器人提供类似ChatGPT的语言理解和生成能力。经过一般互联网数据和丰富现实世界交互数据的联合训练，RFM-1可以让机器人理解自然语言指令并生成相应的动作，并能处理一些突发状况，收获大量好评。

如今强强联合，正式加入战场的Pi，到了将团队多年潜心累积的卓越成果集大成的时候了。再加上OpenAI的背后支持，能不能凑齐龙珠召唤神龙，推动通用机器人领域的新纪元？

“我们的目标是为机器带来人类那样的基本能力。” Lachy Groom说，“我认为构建人形机器人是非常酷的事情。但从根本上让人类变得有趣的是大脑，而不是我们的硬件——我们才是终极的通才。”

本文来自微信公众号：硅星人Pro（ID：Si-Planet），作者：张潇雪

声明：该内容为作者独立观点，不代表新零售资讯观点或立场，文章为网友投稿上传，版权归原作者所有，未经允许不得转载。新零售资讯站仅提供信息存储服务，如发现文章、图片等侵权行为，侵权责任由作者本人承担。如对本稿件有异议或投诉，请联系：wuchangxu@youzan.com

从1到10：AI产品和互联网产品有什么不同？

上一篇 2024年4月12日

迅销公布中期业绩母公司拥有人应占溢利1959.12亿日元

下一篇 2024年4月12日

水温80度：AI行业真假繁荣的临界点

我们从来没拥有过这么成功的AI主导的产品。

（这种分析统计并不那么准，但大致数量级是差不多的）

这两个产品碰巧可以用来比较有两个原因：

一个是它们在本质上是一种东西，只不过一个更通用，一个更垂直。

蓝海的海峡

未来成功的AI产品是什么样，大致形态已经比较清楚了，从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时“罢工”，全网打工人都慌了

美西时间午夜12点开始，陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载，忽然无法正常工作了。

因为发现AI用久了，导致现在“离了ChatGPT，大脑根本无法运转”。”

等等，又不是只有一个聊天机器人，难道地球离了ChatGPT就不转了。

大模型连崩原因猜想，谷歌躺赢流量激增6成

GPT归位，人们的工作终于又恢复了秩序。

未来科技 2024年6月5日
ChatGPT宕机8小时，谷歌Gemini搜索量激增60%

ChatGPT一天宕机两次

谷歌Gemini搜索量激增近60%

ChatGPT在全球拥有约1.8亿活跃用户，已成为部分人群工作流程的关键部分。

过去24小时内提交的关于OpenAI宕机的问题报告

图片来源：Downdetector

ChatGPT系统崩溃后，有网友在社交媒体X上发帖警告道：“ChatGPT最近发生的2.5小时全球中断，为我们所有依赖AI工具来支持业务的人敲响了警钟。

未来科技 2024年6月5日
ChatGPT、Perplexity、Claude同时大崩溃，AI集体罢工让全网都慌了

接着OpenAI也在官网更新了恢复服务公告，表示“我们经历了一次重大故障，影响了所有ChatGPT用户的所有计划。Generator调查显示，在ChatGPT首次故障后的四小时内，谷歌AI聊天机器人Gemini搜索量激增60%，达到327058次。

而且研究团队表示，“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关，显示出用户把Gemini视为ChatGPT的直接替代选项。

未来科技 2024年6月5日
深度对话苹果iPad团队：玻璃的传承与演变

iPad最为原始的外观专利

没错，这就是iPad最初被设想的样子：全面屏，圆角矩形，纤薄，就像一片掌心里的玻璃。

2010年发布的初代iPad

好在乔布斯的遗志，并未被iPad团队遗忘。

初代iPad宣传片画面

乔布斯赞同这一想法，于是快速将资源投入平板电脑项目，意欲打造一款与众不同的「上网本」，这就是iPad早年的产品定义。

iPad进化的底色

苹果发布会留下过很多「名场面」，初代iPad发布会的末尾就是一例。

未来科技 2024年6月5日
底层逻辑未通，影视业的AI革命正在褪色…

GPT、Sora均为革命性产品，引发了舆论风暴，但它在上个月发布的“多模态语音对谈”Sky语音，却由于声音太像电影明星斯嘉丽·约翰逊，被正主强烈警告，被迫下架。

华尔街日报也在唱衰，认为“AI工具创新步伐正在放缓，实用性有限，运行成本过高”：

首先，互联网上已经没有更多额外的数据供人工智能模型收集、训练。

03、

如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向，那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

但分歧点正在于此，电影公司希望通过使用AI技术来降低成本，但又不希望自己的内容被AI公司所窃取。

未来科技 2024年6月5日
KAN会引起大模型的范式转变吗？

“先变后加”代替“先加后变”的设计，使得KAN的每一个连接都相当于一个“小型网络”，能实现更强的表达能力。

KAN的主要贡献在于，在当前深度学习的背景下重新审视K氏表示定理，将上述创新网络泛化到任意宽度和深度，并以科学发现为目标进行了一系列实验，展示了其作为“AI+科学”基础模型的潜在作用。

KAN与MLP的对照表：

KAN使神经元之间的非线性转变更加细粒度和多样化。

未来科技 2024年6月5日
这个国家，也开始发芯片补贴了

//mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
[4]中国安防协会：欧盟批准430亿欧元芯片补贴计划：2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
[6]潮电穿戴：印度半导体投资大跃进，一锤砸下1090亿，政府补贴一半.2024.3.5https。

未来科技 2024年6月5日
大模型的电力经济学：中国AI需要多少电力？

这些报告研究对象（数字中心、智能数据中心、加密货币等）、研究市场（全球、中国与美国等）、研究周期（多数截至2030年）各不相同，但基本逻辑大同小异：先根据芯片等硬件的算力与功率，计算出数据中心的用电量，再根据算力增长的预期、芯片能效提升的预期，以及数据中心能效（PUE）提升的预期，来推测未来一段时间内智能数据中心的用电量增长情况。

未来科技 2024年6月5日
你正和20万人一起接受AI面试

原本客户还担心候选人能否接受AI面试这件事，但在2020年以后，候选人进行AI面试的过程已经是完全自动化的，包括面试过程中AI面试官回答候选人的问题，AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

以近屿智能与客户合作的校验周期至少3年来看，方小雷认为AI应用不太可能一下子爆发，包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

未来科技 2024年6月4日

他们给机器人造大脑，OpenAI红杉抢着投5亿

相关推荐