继AI Pin翻车后,又一款网红AI硬件rabbit r1迎来了用户首批体验。
然而,随着设备到手,动手能力强的网友们翻出了源代码之后发现:这个AI硬件,可能和AI一点关系都没有。
2024年CES展上什么最火?那一定是前百度高管吕骋做出来的,扬言“干翻所有APP”的兔子,rabbit r1。
距离产品发布不过一周的时间,rabbit r1就预售出了40000台。这台设备只有一个巴掌大小,但功能极其强大,最大的卖点就是用户可以通过语音的方式,用它调用手机上的一切APP。
rabbit r1操控手机app的能力源于其内置的“全新的基于AI的系统”——基于大型动作模型(Large Action Model,LAM)打造的rabbit os。
用人话说就是,理想情况下,咱们对着它说“我想点个兰州拉面外卖送到家”,它就会自己打开手机里的美团外卖支付下单一气呵成。
然而,前几天这款万众瞩目的AI硬件的源代码遭到泄露,有人分析了代码后认为,rabbit r1不但和AI没有任何关系,而且还很可能存在隐私泄露的风险。
首先,泄露的代码中似乎并不包含任何实际的AI或机器学习组件。而是依赖于Playwright自动化脚本与有限的应用程序进行交互,这也就意味着产品最大的卖点,操控APP,并不是用AI来做的。
这两者有什么区别呢,我们以用APP点外卖为例。经过训练的AI可以认识APP中每个按钮的作用,识别文字的意思,可以像人一样点击屏幕。
而Playwright更像是按键精灵,你需要提前设置,先点击屏幕右上角定位xx的位置,再上滑2厘米……最后点击屏幕右下角,带有“付款”文本的按钮。
只要设置得够细致,Playwright也能自动化操作,可是一旦APP的页面发生变化,比如支付按钮换到了左边,或者原来是“美食”的页面被美团换成了“百亿补贴”,那么Playwright就可能会失效。
其次,泄露的代码还显示,rabbit R1要求用户通过其Web门户登录,实际上是通过NoVNC连接的虚拟机。
用户被要求在这些虚拟机上输入私人密码,这无疑增加了用户的隐私泄露风险。更令人担忧的是,用户会话也被存储在rabbit的服务器上,且没有任何额外的安全层保护。
这就类似于,你把你的账号密码和聊天记录手写在一张纸上交给r1,这张纸使用后最终会到谁手里,谁能看见,用户也不得而知。
日前,rabbit r1创始人吕骋发帖进行回应,表示这只是谣言,也有人认为泄露的代码不完整,不能说明什么问题。
不过作为用户,我们更关注rabbit r1的实际体验,如果真的可以用自动化脚本把功能做得和AI一样好,那倒也不是不行。
rabbit r1用起来怎么样呢?用一句话形容:功能不完全的手机。
截图自Twitter@GregoryMcFadden
从外观上看,rabbit r1小巧趁手,橙色的外壳包裹着2.88英寸的屏幕和一个可以旋转的摄像头。交互则通过侧边的一个灰色按钮以及一个滚轮进行。设备背面有扬声器开口,底部和侧边还有麦克风、typec充电口和sim卡槽。
rabbit r1包装中还附送了一个兔子徽章、兔子魔术贴以及透明塑料保护壳。
操作起来比较顺滑,尤其是滚轮,受到了评测博主们的一致好评。
截图自Twitte@ijustine
此外,r1在UI设计上也挺用心的,比如充电画面是一只兔子在滚轮上奔跑。
截图自Twitte@ijustine
在视觉识别和语音问答这两个AI常见功能上,r1做得挺好,可以快速准确地识别出画面中的内容。
在静物识别方面,r1准确认出了食物、篮球、植物等,并准确描述出了画面中的细节。
比如博主@unboxtherapy用r1识别篮球,r1可以回答这个篮球的品牌wilso以及NBA标志,并推理出这是一个NBA官方篮球。
截图自Twitte@unboxtherapy
在识别场景时,r1不但可以说出画面中人物的特点,还能推理出二者的关系,比如r1就认出了博主@ijustine和她的女儿。
截图自Twitte@ijustine
这与另一个网红AI硬件AI Pin相比,不但速度快,而且更加智能。至于AI Pin有多糟糕,可以看一下硅基君之前的文章《一个AI Pin翻车,无数个AI Pin还在翻车的路上》。
在语音问答方面,r1发挥稳定,博主@Unbox Therapy询问“多伦多枫叶队是什么”,r1很轻松地回答了关于这支冰球队的一些信息。在博主进一步询问更详细的问题时,r1还能够联网进行搜索。
硅基君猜测,这个功能应该用到了perplexity.ai,一款类似Kimi的ai应用,可以实时联网搜索。
rabbit r1聚合了许多AI应用,比如perplexity.ai、midjourney,并且表示之后还会有更多的功能加入到rabbit r1中。说到这,不得不再次鞭尸一下AI Pin了,它的应用生态基本没有。
rabbit r1的办公功能也是厂商着重介绍的,简单来说就是用摄像头识别表格,这个表格可以是手绘的。随后r1会将表格整理成电子版发送到你的邮箱。twitter博主@rileybrown_ai测试了一下这个功能,效果又快又好。
截图自Twitte@rileybrown_ai
这功能是不是老罗十年前就做了?
最后,rabbit r1比较有特色的功能有操控手机APP,用手机打车等。但很奇怪,几个测评博主并没有着重测试这方面的功能。@ijustine简单测试了一下用r1放歌以及打车,而@Unbox Therapy什么都没做。
可能是这个功能还不完善,要尝试十几次才能成功一次?有用户在twiiter上表示,Uber在r1上根本无法运行。甚至有用户表示r1连时间都报不准。
再结合rabbit r1源代码泄露事件,很难不让人联想。
rabbit r1的功能大概就这些,其他更多玩法要等更多的人上手。人们对于rabbit r1的态度比AI Pin宽容不少,相比于后者,r1功能更加简单也更加完善,在交互和外观上也不像AI Pin那样激进,最重要的是,r1只要199美元,还有只兔子随时随地对你卖萌。
r1比AI Pin更有用,但在AI硬件的角度,两者都没做到“替代手机”“消灭APP”,更像是一个功能简化的智能手机。
ChatGPT火爆后,谁都想成为下一个乔布斯,定义什么是AI硬件,有把AI功能打包放在一个独立硬件里的;有疯狂堆算力,但没啥功能的;也有给键盘加个AI启动键的。
这时候就要引用一下朱啸虎前段时间在采访里说的话了:“美国大公司敢砸钱,中国不需要砸钱,咱们跟在后面就行了。我们跟在后面,花的钱少一个数量级,风险小很多,干嘛不跟在后面?”
咱们等华强北就是了。
本文来自微信公众号:新硅NewGeek(ID:XinguiNewgeek),作者:董道力,编辑:张泽一