体验Vision Pro两周,我们发现了空间计算的杀手级应用

在逐渐习惯只用手眼的交互中,我们也搞清楚了“空间计算”的真正含义:

空间交互
空间影像
空间音频

苹果用这三板斧,构建起了。

再者,多界面的空间布局呈球形,而并非像照片墙一般整齐排列在同一个平面,同时打开若干个应用,随意放在前方的任意位置,不管如何排列,所有界面的垂线交汇点,就是我们的眼睛。

用。

我们惊叹于。

拿到 Vision Pro 的这段时间,我们玩儿遍了几乎所有的热门应用。

实际体验和之前外媒博主的总结如出一辙,尽管上头前已经对这台设备有了一定的了解,但亲自使用后,还是会有一些小小的震撼。

在逐渐习惯只用手眼的交互中,我们也搞清楚了“空间计算”的真正含义:

  • 空间交互

  • 空间影像

  • 空间音频

苹果用这三板斧,构建起了 Vision Pro 的护城河,并在 UI 和应用间,创造了一个全新的生态。

苹果 CEO 库克将空间计算定义为“计算技术新时代的开端”:

如同 Mac 将我们带入个人计算时代,iPhone 将我们带入移动计算时代,Apple Vision Pro 将带我们进入空间计算时代。

上述的产品都对应着不同的交互习惯:Mac 有键鼠触控板,iPhone 有食指大拇指,而 Vision Pro 拥有整个身体。

Vision Pro 的空间交互,需要手眼口的相互配合:双眼充当光标定位(鼠标光标),手指负责确定(鼠标右键),语音作为输入方式(键盘)

一、为眼睛,定制一套新系统

我们在实际体验中,发现了“眼动”在 Vision Pro 中拥有很高的权重,以至于 UI 的每个细节设计都在围绕眼睛展开。

每次长时间佩戴 Vision Pro,苹果肌的压力属实有点大,但眼睛反而不会太累,最主要的原因是:界面被设计成眼睛喜欢的样子。

首先,Vision Pro 所有界面都会出现在屏幕的正中央,这里是看东西最舒服的区域,减少了颈部和身体的移动,也减少了眼球大范围的转动。

其次,所有界面在刚出现时的默认距离适中,不会太近看不全,也不会太远看不见;另外,观感不适往往还来源于眼球不断地调整焦距,和许多司机用不惯流媒体后视镜一个道理。

Vision Pro 还为此做了同一界面“近小远大”的动态尺寸调整,以此减少人眼对焦的次数,尽量将焦距调整区间调整在很小的范围里。

比如盯着 Safari 上方的网页栏时,会有突出的高亮效果,实际上后面的界面也在同步进行“虚化+后退”,这样的联动能尽量减少焦点的位移。

也正因为“突出高亮”的效果,我们很轻易能识别选中的目标,省去了许多“找光标”的过程。

而且长时间盯着主界面的菜单栏,还会出现详情信息,这个照搬 3D Touch 长按的“悬停”效果,能隐藏很多文字,使界面尽量简洁。

这几天的实测体验,我们还发现了 Vision Pro 对“中心”的重视。

一方面, Vision Pro 采用了大量的圆形(圆圈、药丸形、圆角矩形)和柔和的界面曲线。没有棱角不仅不刺眼,而且还有助于精准识别,因为圆形可以把目光下意识地集中在目标的正中央。

而且苹果还规定了 visionOS 每一个图标的大小和间距:用于眼部交互的图标总大小不能小于 60pt,并且图标之间的间隔需要在 16pt 以上。这样的要求可以帮助眼睛快速定位,同时也减少了“看错”的可能。

再者,多界面的空间布局呈球形,而并非像照片墙一般整齐排列在同一个平面,同时打开若干个应用,随意放在前方的任意位置,不管如何排列,所有界面的垂线交汇点,就是我们的眼睛。

每一位体验过的小伙伴都反馈到,感觉站在 Vision Pro 的球心。

二、手势操作,运筹帷幄

手势操作,有一定的学习门槛。

Vision Pro 在开发者大会中公布了六种常用手势,可覆盖大部分的操作场景。

用 iPhone 上的操作类比会更好理解这六种手势互动:

  • 拇指轻触一次食指:相当于轻触点击一下 iPhone 屏幕;

  • 拇指轻触两次食指:相当于双击 iPhone 屏幕;

  • 拇、食指捏合一段时间:类似于按住 iPhone 屏幕一段时间,放大指文本;

  • 拇指和食指捏合并拖动:用于滚动和移动窗口位置;

  • 左右手同时摆出食指拇指捏合,并同时向内/外移动:调整窗口大小;

  • 左右手同时摆出食指拇指捏合,并旋转:操纵目标的显示方向。

设备实际上对手的识别范围很广,放在腿上或桌上,用最自然的姿势就能触发相应指令,无需刻意高举在半空。

手势操作最大的难题是,在缺乏真实触觉的情况下,尽可能模仿出直接触控的效果。得益于细节上的优化,Vision Pro 在模拟真实这方面,做得很好。

以虚拟键盘为例,当我们伸手触摸键钮时,指定字母的亮度、位置、大小会随之一同变化,并且还会有苹果祖传的解压声效。

通过一系列的动效,Vision Pro 弥补了原本缺失的感官信息,极大程度地还原了真实物体该有的反馈,现实中不存在的物体,开始看得见也摸得着。

例如一款适合全年龄段的游戏 A Cozy Loóna,在把相应的物体放到合适的位置时,能很深刻地感受到“东西就在手里”:

两根手指捏合,为选中并改变目标物体位置,两只手一起就能随意旋转、摆放并放大缩小整个 3D 虚拟空间:

空间操作在当中最大的意义是,当游戏走进专业应用,就把遥不可及,变成了手到擒来。

比如在 JigSpace 中,我们可以零门槛、零成本地拆解发动机、航天器的 3D 模型,从开发者的视角一层层剖析产品细节。

之前的消费电子展也有过类似的裸眼 3D 屏幕或简单 3D 模型交互,但很少见到把显示效果、操作互动无缝融合的软硬件,而 Vision Pro 依靠众多的感知元件扫描空间信息,并把虚拟物体的位置信息、阴影处理、透视关系等,接近真实地表现。

这给工业设计和交互式的 3D 知识科普提供了全新思路,起码就亲身体验讲,JigSpace 绝对是一款讨喜机械迷的空间应用。

类似的专业应用在 Vision Pro 里不算少,医疗软件 Surgical AR 在当中能排上前三。

这是一款基于微软 HoloLens 2 的AR App,医生通过软件就能看到患者的 MRI 和 CT 影像全息图,观察病灶的内部结构。

以前的医疗影像图是把若干切面图片铺在一张相片上,将其组合在一起分析还需要医生一定程度的“脑补”,Surgical AR 打破了二维限制,不管是日常检查还是术中对比,医疗人员都会获得更直观的三维视角:

加上 Vision Pro 的空间能力,只用动动手,用最自然的动作,完成最专业的操作:若干个界面在眼前随意排布,3D 影像也能通过调整组件显示不同位置的扫描结果。

此前,SurgicalAR 已经得到了美国 FDA(食品药品管理局)的认证,并被评为 2023 年时代杂志最佳发明之一;如今在 Vision Pro 中,它的价值被进一步提升:在更轻便的设备落地,并拥有了更多自定义的可能。

在这些娱乐和专业的应用里,我们逐步理解了手眼操作对 Vision Pro 的意义:

尽管 Vision Pro 的技术原理基于 VR,但经过一周的体验,能明显感觉到苹果在尽力融合 VR 与 AR 技术,二者的统一,则是通过手眼协同的空间操作,我们的肢体成为了连接两大技术阵营的桥梁。

三、影音娱乐,杀手级应用

众多评测对 Vision Pro 的其他功能褒贬不一,但在观影效果上却保持了高度一致:惊艳。这也是我们最好奇的亮点之一。

在深度体验了观影软件后,我们发现了 Vision Pro 惊艳显示的原因。

高素质的屏幕,是一切优秀成像的地基,著名拆解团队 iFixit 将 Vision Pro 拆开后用显微镜观察发现,屏幕区域的像素值为 3660×3200px,相当于每平方英寸里装了 230 万个像素。

更具体的类比,苹果在 Vision Pro 上,将 54 个像素塞到了 iPhone 15 Pro Max 的一个像素里。

这也解释了为什么我们在“虚拟自然景观”里,能看到 1:1 成像效果的自然景观,仿佛云端、雪山、沙漠甚至月球表面,就在你的眼前。

好画质+好应用,是 Vision Pro 建立生态大厦的下一步,其中体育观赛感受的升级,是最明显的变化之一。

如果你经常观看体育赛事,有几个痛点你大概率遇到过:

  • 赛事信息显示不全,得分、助攻、犯规、暂停数、效率值等数据不可在同一屏幕兼得;

  • 同时进行的不同场次很难在一个设备里并行观看;

  • 比赛内容几乎完全由导播说了算,观众一般只能被动接受。

Vision Pro 用高度自定义的空间页面布局完美破局,所见之处皆为屏幕也突破了传统电子设备的单一屏幕,构建视频群组。

NBA App 提供了多个角度供你选择

NBA App 把比赛界面分成了四个区域,根据自己的需要把比赛直播、球队信息、球员数据、比赛场次等放在不同的位置,我们在 Vision Pro 里不再是被动接受的观众,而是纵观全局的导播。

再者,受益于空间音视频的加持,Vision Pro 也开启了云演出的下一个形态。

沉浸式演唱会软件 AmazeVR 把我们的视角带到了舞台上,不再局限于坐在台下的视角。当中的舞者和歌手,似乎专门为你开了专场,超 4k 的分辨率+空间音频,极大程度地还原了现场的音效和舞美,也是让云演出真假难辨的头号功臣。

我们惊叹于 Vision Pro 对艺人真人形象的还原,毫不夸张地说,她就站在你的面前,镜头拉近时,那种真实感甚至会让人产生些许害怕。

目前 T-Pain、UPSAHL、Megan Thee Stallion Megan Thee 和 AESPA 等艺人团体的作品,都已陆续入驻 AmazeVR。

在体验 Vision Pro 应用的这些天,感触颇多。

首先,我们强烈建议对苹果头显感兴趣的各位,要亲自佩戴体验,无论是官网的宣传视频还是我们的文字总结,都无法复现 Vision Pro 真实的显示效果。

另外,尽管 Vision Pro 的价格和适配生态依然无法走进大部分人的生活,也并没有成为下一个消费电子时代的终极形态,但它的未来,值得期待。

消费电子设备作为工具,在设计之初,就需要准确定位其使用场景,找到适合的人群和运用空间,才能让新技术走向大众市场。

许多人在讨论 Vision Pro 是否会成为下一个 iPhone,就像当年对 iPad 定位的担忧一样,起码从目前的使用场景看,它不会也不可能替代手机的地位,因为二者从来都不是一个赛道的竞品。

iPhone 的便携性,是最大的优势,可随身携带、随时拿出、站着坐着躺着都能用,不受时间和空间的束缚,但作为“全才并非专家”的 iPhone 或者说手机,也不能胜任所有工作,最简单的例子:我们几乎看不见办公室的伙伴用手机来做表格、写文章、剪视频。

Vision Pro 亦然,在找准它的适用场景的同时,其实也在回答一个更深入的问题:空间计算到底有什么用?

从苹果给出的几大定位,不难看出 Vision Pro 或者说空间计算最大的用武之地,就是“沉浸式”的场景:巨幕观影,一比一呈现的霸王龙,NBA 的场内观赛视角,可在任意位置摆放的网页与界面……这些都是一台手机,甚至是其他设备不能给予用户的独特体验。

更重要的是,这台苹果头显将人与空间、现实与虚拟完美地串联起来,我们用眼睛实现导航、用双手进行操控、用语音充当输入,再利用超 4K 的显示屏和三维渲染实现输出,一起构建了 Vision Pro “人本位”的交互生态。

本文来自微信公众号:APPSO (ID:appsolution),作者:肖凡博

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年2月10日
下一篇 2024年2月11日

相关推荐

  • 狂砸670亿美元,日本要重振芯片产业

    为了夺回昔日半导体50.3%市占率的领先地位,且不被海外竞争者“卡脖子”,日本“痛下决心”狂砸670亿美元吸引全球先进半导体公司来日本建厂,并试图量产2纳米高端芯片,以重新领跑全球。

    日本在自20世纪80年代以来在全球半导体领域的领先地位被超越后“痛定思痛”,决定将截至2030年的半导体产业的复兴分为三个阶段:(1)加快半导体生产的基础设施建设。

    未来科技 1小时前
  • 每秒500token的AI芯片让人惊叹,但它真的靠谱吗?

    根据Groq此前发布的论文,它的核心技术其实是一个名叫TSP的微架构设计,全称叫做张量流处理器,Tensor。

    对比可以看到,Groq的回答比较简单,无法挖掘书中所代表的更深的复杂的意味。

    快速来自上面提到的TSP的优化,除此之外,Groq上面的模型也是他们自己微调过的,它并没有公开微调过程,所以对于模型本身的看法来源于我的推测:它上面可以选用的所有的模型后面都有“小尾巴”,比如Llama。

    未来科技 1小时前
  • 聊一聊我眼里的科技颠覆感

    如果说从电脑到互联网到智能手机,一直是在这个世界提升粘度频次的话,ChatGPT则是创造另外一个世界的重要支柱,且没有之一。

    就当下这个时间点而言,我依然像90年代末看到互联网一样,隐隐觉得这可能是一个很剧烈的变革,但还是有些懵懵懂懂模模糊糊。

    这个例子的意思就是,人类并没有掌握所有的规律,人工智能作为我们的创造物,通过机器学习大量的也是我们的创造物,能发现新的规律以至于可以重现虚拟的真实世界。

    未来科技 1小时前
  • “已经有三个人跟我说要做中国版Sora”

    而针对OpenAI宣称sora是“世界模拟器”,图灵奖得主、Meta首席AI科学家杨立昆(YannLeCun)认为,根据提示词生成的大部分逼真视频,离“AI理解物理世界”还差得远,刷屏的视频仍有很多bug,生成视频的过程与基于世界模型的因果预测完全不同。

    去年此时,很多人问,为什么中国没有产生ChatGPT,到了今年问题又变成了,为什么中国没有产生sora,在天才科学家史蒂芬·沃尔弗拉姆那本《这就是ChatGPT》的导读序中,作者建议我们把问题换成,“为什么全世界只有OpenAI能做出ChatGPT”。

    未来科技 1小时前
  • 一年一万篇论文撤稿,期刊编辑守不住学术大门了?

    2023年最大比例的撤稿来自于出版商Wiley旗下的Hindawi系列期刊,在一年内撤稿超过了8000篇,该公司在声明中表示如此规模的撤稿是出于对“同行评审过程被系统性操纵的担忧”,尤其是大量负责特刊的客座编辑出现了不可控的风险,最终Wiley表示将彻底放弃Hindawi品牌。

    图源:Nature

    很多长期关注学术不端的专家对撤稿论文超过1万成为大新闻表示乐见其成,因为根据他们的观察,在全世界论文工厂的生意非常火爆,这1万篇仅仅是其中运气不太好的那一小部分。

    未来科技 2小时前
  • 存储,战火重燃

    一、冯·诺依曼的“陷阱”

    韩国人之所以能等来又一次机会,很大程度上得感谢“计算机之父”冯·诺依曼。

    1945年,全球第一台计算机ENIAC问世在即,冯·诺依曼联合同事发表论文,阐述了一种全新的计算机体系架构。其中最大的突破在于“存算分离”——这是逻辑运算单元第一次从存储单元中被剥离出来。

    如果把计算机内部想象成后厨,那么存储器就是仓库管理员,而逻辑芯片就是主厨。

    未来科技 3小时前
  • GPT-4劲敌,谷歌进入高能+高产模式

     

    图源:Gemini 1.5 Pro官方测试数据

    Gemini 1.5 Pro大大超过Gemini 1.0 Pro,在27项基准(共31项)上表现更好,特别是在数学、科学和推理(+28.9%),多语言(+22.3%),视频理解(+11.2%)和代码(+8.9%)等领域。
     

    图源:Gemini 1.5 Pro官方演示样本

     
    Gemini 1.5 Pro在处理长达超过100,000行的代码时,还具备极强的问题解决能力。

    未来科技 3小时前
  • Vision Pro的两个难题

    如果没有新的硬件变革,应该也没有什么纯内容服务平台的大机会了吧

    我的回复是这样的:

    这么多年的内容生态,内容本身变化很小的,基本还是图文音视频,这都是前互联网时代的东西。

    IMAX其实是一项1967年就问世的技术,但相当长一段时间里,也一直困在恶性循环中:院线不愿意花钱做IMAX影院,电影生产商因为IMAX影院少而不愿意费力气拍IMAX片子。

    由此我们可以看到,一个具有引爆点力量的内容非常重要,它能彰显出巨大的财富预期,以推动产业走出那个恶性循环。

    未来科技 4小时前
  • 299卖Sora内测账号?互联网的创造力全拿来骗钱了

    总而言之,虽然 Sora 的官方应用啥时候公测还没个准信儿,但这帮卖课、搞诈骗的,显然已经“遥遥领先”了。

    也难怪,最后整得。

    卖 GPT 课的时候,卖课哥还能给自己辩驳两下子,说这是知识付费,愿者买单。

    但 Sora 现在连产品都还不知道在哪儿,国内几乎也没有谁真正上手试用过,有些人还敢漫天要价,就真的是黑心的萝卜,坏透了。

    说实在的,这两年生成式。

    未来科技 5小时前
  • 赶超英伟达?都2024年了,居然还炒作SRAM

    SRAM的优点很明显,快,非常快,不仅远远超过NAND,更是超过DRAM的速度,所以SRAM的特点就是快。

    在PC,HPC上的CPU里面,SRAM面积还不小哦,普遍占到一半,但是在手机这种对功耗要求比较高的CPU里,SRAM就比较小了。

    实际情况就是大容量的SRAM要上,毕竟这个直接提升性能比较明显,但是HBM也绝对不是它的对立面啊。

    未来科技 7小时前