带摄像头的AirPods,苹果会怎么做?

虚拟声场,离不开耳机上的镜头

先说总结,在这份专利文件中,加上摄像头的并非。

AirPods。

搭配上。

另外,专利当中还对“显示器”做了特别说明,虚拟声场中的观影屏幕,不仅仅局限于传统的电视,而是拥有屏幕或投影的设备都可以实现此类功能,例如笔记本电脑、平板电脑、投影仪、台式电脑屏幕等(需要搭配带有摄像头的。

苹果对智能产品的设计,正在放飞自我。

根据彭博社记者 Mark Gurman 的爆料,苹果在“未来设备”的规划里,有两个大胆的想法:

一是带有屏幕的 HomePod 正在研发中,当中将集成 Apple TV、FaceTime 等众多功能;二是配备摄像头的 AirPods,低分辨率的镜头将用来收集周身信息,并通过 AI 处理数据,以此“协助人们的日常生活”。

两个概念产品目前还处于探索阶段,但我仍惊讶于这种“前卫”的组合,以及一反苹果“简约”的理念,特别是带镜头的耳机,实在有些费解。

在翻阅相关文献资料时,一份代号为 US11432095B1 的苹果专利文件,似乎能证明“镜头+耳机”这对奇葩组合的可行性。

虚拟声场,离不开耳机上的镜头

先说总结,在这份专利文件中,加上摄像头的并非 AirPods (Pro),而是 AirPods Max;另外,当中涉及的技术也不是新闻中爆料的“AI 功能”,而是已经在 Vision Pro 上初见雏形的空间音频。

首先,我们要理清一个原理:人是如何辨别声音发出的位置的?

两只耳朵在头两侧的布局,除了美观,更重要的作用是让我们拥有了听声辨位的能力。

在保持同一水平线且轴对称的前提下,尽可能远离彼此,为的就是在听到同一个声源时,每只耳朵接收到的声音信息与另一只都有所差异,主要包括双耳时间差、强度差以及频率差三种,一般的来说这些差异都非常微小。

图片来自:Medium

以时间差举例,生活中的大部分声音到达两只耳朵的时间都是不一样的,往往只有百微秒左右(眨 1/10 次眼的时间)的差别,我们感知不到,大脑则可以从这些几乎可以忽略不计的声源信息差异中,判断出孰先孰后,以此产生了“声音从那里发出”的感觉。

好比我们启用手表上“找手机”的功能时,耳朵就是通过各种声源差异,才能顺利发现手机掉进了沙发缝里。

许多电影院和家庭影音设备正是利用了人耳极为敏感的特性,在有限的空间内用多声道的组合,实现环绕立体声,让观影在声音层面身临其境。

以上的信息包含了两个核心要素:

  • 人能通过声源信息的差异实现听声辨位。

  • 声音从空间中不同位置发出造成了听觉上的差异。

这份 US11432095B1 专利文件,就是在解释,苹果如何只通过耳机让用户听到来自四面八方的声音,就像是拥有了一整套环绕立体声设备。

这项技术,被称为“虚拟声场”

拥有虚拟声场的设备能在当中构建若干个虚拟扬声器,通过听声辨位的生理特性,让每个扬声器都放在用户所处空间的固定位置,从而实现“一副耳机就是一套音响”的效果。

那,摄像头在当中发挥了什么作用?

科技博主何同学在 Vision Pro 评测的视频中做过一个实验:把 Vision Pro 的一个应用窗口放在固定的位置后,往远处走了 300 余米再回到原地,窗口的位置几乎没有发生变化。

如此精准的定位来源于 Vision Pro 前方的视觉定位系统,通过红外线、摄像头等扫描所在空间的物理信息,并记录窗口在重构空间中的物理位置,以此实现了令人惊叹的准确定位。

AirPods Max 上的摄像头,也是利用相同的原理录入图像信息,再由跟踪处理器实时分析用户的头部位置信息,并且能够使用显示器和周围环境的映射作为参考,来跟踪用户的头部,实现双重保障。

搭配上 Apple TV 盒子中的摄像头,虚拟扬声器在房间内的位置就能确定下来,若干个声源放在哪里、从哪发射,都有据可依。

简言之,镜头让 AirPods Max 拥有了视觉,虚拟声场也能接近真实地还原实体音响的效果。

比起听到,我更愿意说成可以“看到”声音。

虚拟音响摆在哪、摆几个,都可以由用户自己设置,5.1 或 7.1 环绕声不用再大费周折地添置,甚至还能根据电视尺寸、位置和收听区域(包括房间的几何形状)实时调整;同时用户的坐姿也会影响虚拟音响在声场中的位置。

专利文件中还说明,在虚拟声场中,可以生成单独的一组一个或多个虚拟扬声器,并将其分配给多个带着相同设备的用户。

即使两人交换了座位,或是在房间里来回走动,虚拟声场都会根据用户的所在位置,调整每个虚拟音响的音效,使每个音源都能相对使用者保持静止。

另外,专利当中还对“显示器”做了特别说明,虚拟声场中的观影屏幕,不仅仅局限于传统的电视,而是拥有屏幕或投影的设备都可以实现此类功能,例如笔记本电脑、平板电脑、投影仪、台式电脑屏幕等(需要搭配带有摄像头的 Apple TV 盒子使用)

也就是说,你的下一套环绕音响,为何不能是耳机?

先造梦,再铺路

如此看来,带镜头的 AirPods Max 所构建的虚拟声场,更像是 Vision Pro 的技术下放。

在先前的文章中,我们全面解析过 Vision Pro 通过空间视频、空间音频和空间交互构建起的“空间计算”,但高昂的价格和为数不多的生态适配,还是让其成了一款想要走进市场的概念产品。

Vision Pro 开启的空间计算时代,是一个遥远的构想,是尖端显示技术、新型交互、运算能力的汇总,它更像一个目标和未来。

而专利文件里的 AirPods Max,用真正的“消费级”产品,实现客厅里的空间音频,比起 Vision Pro,它佩戴更舒适、使用更方便,当然价格也更合理。

在走向未来的过程中,遥远的目标被拆分成一个个阶梯,Apple Watch 上的手势交互,iPhone 开始支持的空间视频录制,都是已经登上的台阶。耳机带镜头是其中的又一个分支,也让空间音频找到了更适合日常、更容易落地的方案。

当然,镜头+耳机的方案是否会真的来到我们的身边?即使苹果真的将二者融为一体,到底会走向文章开头的用 AI 协助人们的日常生活,还是回到专利文件中虚拟声场的技术路线?我们都难以得到确切的答案。不过在数种新型技术不断涌向市场的时候,终究会出现一个最适合时代的选项。

在这之前,比起得到结果,不断地大胆尝试,才是当下最有价值的事。

1972 年,时任美国马萨诸塞州一家箱包公司前副总裁的 Bernard D. Sadow,把一个大衣柜上的四个脚轮卸下,随后安装到一只自家品牌的行李箱底部,接着又在箱子上方绑了一根皮带。

图片来自:Facebook

世界上第一只滚轮行李箱就这样被发明了出来。

从今天回看拉杆箱发明的时间点,多少都会有点难以相信。

一是此时距离箱子的发明已经过去了 7000 多年,离轮子的发明也已经过去了 5000 多年,伴随了大半个人类文明史的两个发明竟然才被组合使用;

二来,阿波罗 11 号已于其两年之前成功登月,人类首次在其他星球上留下脚印。在同一个国家里,滚轮箱的发明甚至比登月还晚,在此之前,人们还保持着手提箱的习惯。

Sadow 马上在当年为其新发明申请了专利,并讲这种可滑动的行李箱命名为 Rolling Luggage。

创新这件事,有时真的需要灵感和运气,但故事到这还没完。

虽然 Rolling Luggage 在刚发明的那段时间广受欢迎,但由于设计的缺陷使得行李箱重心不稳,拉动时经常会翻倒,也会偶尔撞到拉箱人的脚踝。

事实证明这的确是一个好创意,但 Rolling Luggage 并不是一个好产品。

在之后的十多年里,虽然新秀丽等公司对初代 Rolling Luggage 进行过优化,但还是不便使用。

直到 1987 年,美国西北航空公司的退休机长 Robert Plath,在家捣鼓箱子时,把箱体竖立,并在同侧装上轮子和拉杆,现代拉杆箱的雏形才得以确定。

拉杆行李箱在今天是那么理所当然的一件事,但这并不意味着技术本身是显而易见的,因为创新和创新者的局限,与时代背景息息相关。

当时长途旅行不像今天这样普遍,且旅行时携带的物品不多,拉杆箱并不是刚需;箱子和轮子的确存在了很久,但既轻便又耐用的箱体材料和轴承技术,那时还没出现。

需求不高、技术不足,即使构成新发明的技术组件很早就存在,它也不会成为一项成功的发明,因为行为需求、技术条件和市场因素并没有汇聚在一起。

对于带轮子的箱子来说,这种结合直到 20 世纪后半叶才真正实现。

对于“镜头+耳机”亦或是别的奇怪组合,当下的质疑和嘲笑的眼光也恰好证明,对未来技术的探索才刚刚起步。

但不管最后选择了哪一条路,都是在向未来迈步。如果没有这些奇思妙想和大胆实践,可能到今天我们还在拎着那只笨重的箱子。

本文来自微信公众号:爱范儿 (ID:ifanr),作者:肖凡博

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年3月8日 14:02
Next 2024年3月8日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日