《时代》杂志公布了的“2023 最佳发明”榜单,评选了 200 个具有开创性的发明。
呼应技术和生活方式变迁,“最佳发明”榜单也增加了多个新单元。
从去年开始,AI 成为了一个独立单元。和去年相比,今年 AI 单元入选的项目不仅在数量上有所增加,从去年的 8 个增加到今年的 14 个,而且入选产品的应用领域也更加广泛。
接下来,我们也将完整展示 AI 单元中所有入选的发明。此外,绿色能源、可持续、无障碍等也获得的独立单元,也呼应了社会关注的改变。
事不宜迟,让我们一起看看今年有什么出色的发明吧。
一、进击的 AI
Adobe Photoshop 生成式扩展和填充:让照片跳出框框
《时代》:通过把技术搭建在原本就已经非常受欢迎的图片编辑软件 Photoshop 中,Adobe 将 AI 的力量传递到数百万人的手上。
在这套基于 Firefly 的生成式扩展和填充功能支持下,创作者可以利用前者让一张图片打破原有边界,扩展出一个“框外世界”;后者则让创作者可以通过输入简单的文本,在原有图片中增加或删除特定元素。
Adobe 高级副总裁 Ashley Still 称,这个选项让“顾客可以他们想象的速度来实现自己的愿景”。
OpenAI GPT-4:颠覆性的 AI
《时代》:自 3 月发布以来,过去八个月了,OpenAI 的 GPT-4 仍然是那个驱动着公众也能使用的聊天机器人里最强大的 AI 模型。
和那个让大众感受到 AI 潜力的 ChatGPT 相比,GPT-4 表现更惊艳。
在律师资格考试中,ChatGPT 的成绩只比 10% 的学生,而 GPT-4 却超过了 90% 的学生。而且 GPT-4 的语言推理能力也相当出色,即能把复杂概念用简单语言拆解,也可以为你解释笑话的笑点。
今年 9 月,GPT-4 更是迎来了语音和图像输入更新,展示出全新的应用交互可能性。
Runway Gen-2:开创性的影片编辑
《时代》:Runway Gen-2 让所有人都可以通过文字提示词、图像和其他视频来生成完整的视频。
《瞬息全宇宙》万花筒一般的世界背后,是一家名为 Runway 的 AI 创业公司。它所推出的新模型 Runway Gen-2 颠覆了视频的“拍摄”方式。
Runway 联合创始人兼 CEO Cristóbal Valenzuela 称:“AI 是一种新的摄像头,它将永远地重塑讲故事的方式,引领我们走向完全靠生成的电影长片。”
Alitheon FeaturePrint:AI“真探”
《时代》:解决价值数万亿美元的假冒商品问题的方法可以很简单,把手机摄像头对准(要检验的)手表或手袋,然后让智能软件判定其真伪。
FeaturePrint 是一个专注于光学技术的 AI,它的“眼尖”到能看到物件表面上非常微小的细节,然后将该信息转换成一个独特的数字身份,并用于判断其真伪。
值得指出的是,FeaturePrint 的其中一位客户是 Argor-Heraeus(贺利氏),也是为银行铸造金条的公司之一。
Dedrone City-Wide Drone Detection:针对无人机的虚拟防护罩
《时代》:无人机既可以是有益的,也可以是具有破坏性的。Dedrone 的城市无人机监测系统就像在一个地区建立了虚拟防护罩,当无人机进入特定区域,系统会在数秒内警告执法机构。
Dedrone 的 CMO 将其产品比作无人机的空中交通管制系统。该产品结合了多种无人机信号,包括无线电频率、 ADS-B 数据和 RemoteID 信标,更全面地去确定无人机的位置。
Meta SeamlessM4T:翻译大师
《时代》:Meta 把自己的 SeamlessM4T 模型比作“巴别鱼”,小说《银河系漫游指南》里一种能充当通用语言翻译器的生物。
Meta 的软件支持将近 100 种语言的实时翻译,形式也很多样:语音-语音、文字-文字、语音-文字、文字-语音。
此外,Meta 还声称新系统比之前的更高效和准确,甚至还可以翻译混有不同语言的句子。这是一个开源的模型,意味着所有人都可以去研究它的代码。
So-VITS-SVC:“AI 孙燕姿”背后的技术
《时代》:今年早些,一位自称为 Ghostwriter 的匿名创作者发布的歌曲“Heart on My Sleeve”引起轰动,因为其中融入了由 AI 生成但逼真的 Drake 和 Weeknd 歌声。
这些声音都是生成自开源软件 So-VITS-SVC。它让技术达人能以歌曲素材去训练出针对特定歌手的神经网络。接下来,这个神经网络就可以用这个歌手的声音唱出任何歌曲。
到了现在,基于这个技术,我们也迎来了众多使用更简单友好的网站。
AlertCalifornia 和 Cal Fire AI 的山火监测器:掐灭山火
《时代》:在山火扩散之前监测到它,成为了全球众多地区的挑战。
为了解决这个难题,加州大学圣地亚哥分校的公共安全项目 AlertCalifornia 和利用 AI 监测烟火的项目 Cal Fire 合作打造了一个山火监测器。
Cal Fire 的技术结合了分布于加州森林里超过 1050 个摄像头的信息,旨在监测烟雾和其他山火早期迹象。一旦有发现,系统就会用短信通知本地消防局。
在系统启用的前两个月里,它已经正确地识别了 77 起火灾。AlertCalifornia 的其中一位负责人 Falco Kuester 表示:
这个系统最成功的故事,是那些你未曾听说过的山火。
Stable Audio:创作音乐,可以更简单
《时代》:借助生成式 AI 的力量,Stability AI 打造的 Stable Audio 可以在一些简单的文本提示词基础上造出近乎任何你想要的声音或歌曲。
据介绍,这个模型的数据来自于一个声音库,来源是合法的。素材涵盖了 80 万个文件,合计长度达到 2 万小时。
专业人员还是业余爱好者也许都可从中找到亮点。
TrailGuard AI:守护濒危动物
《时代》:在印度和非洲的部分地区,偷猎仍然是大象和大型猫科动物灭绝的最大威胁,即便在保护区里也如此。
由美国环境组织 Resolve 打造的 TrailGuard AI,结合了小型摄像头和英特尔的技术,观察濒危物种和发现偷猎者。
该技术借助于手机或远程无线电信号,可以再 30 秒内把图像传回到当地部门的手机上。TrailGuard AI 不仅可以识别人类,也可以识别各种动物。
《时代》表示,该系统在测试阶段已经在东非促成了 30 名盗猎者被捕,目前正在印度中部有老虎聚居的地区测试中。
OpenAI Dall-E 3:让你的想象“现形”
《时代》:当 OpenAI 在 11 月推出 ChatGPT 时,它从根本上改变了 AI 界。这家公司也希望 DALL-E 3 能有同样的影响力。
据 Dall-E 的创造者 Aditya Ramesh,过去的影像生成要求用户学习一套新的技术语言才能生成出好成果。
但 Dall-E 3 却不用。
Dall-E 3 结合到 ChatGPT 其中,用户可以直接用对话式的命令就能得到和他们描述相符的图像。
古登堡计划的公开语音书系列
《时代》:始于 1971 年的古登堡计划是最古老的数字图书馆,它让电子书触达到更多人。然而,CEO Greg Newby 却说它“创造和分发都不擅长。”
微软和麻省理工学院合作,用“文字转语音”的生成技术,将古登堡项目中 5000 本书做成语音书免费开放。
与此同时,项目背后的软件和技术细节,也在公开论文中展示了。
AudioShake:分解节拍,帮助歌手赚钱
当全球其中一支最伟大的摇滚乐队谈下新合作,将乐队一首 70 年代的歌曲用在广告中,乐队成员都很开心。但有个问题:广告只需要演奏部分,但乐队只有最终混音版。
乐队找到了 AudioShake,后者的 AI 程序可以将音频中的不同元素分解开来。AudioShake 的联合创始人 Jessica Powell 表示:
我们让音频变得可互动和可编辑,让这些能帮助歌手赚钱的实用的操作变成可能。
Humane Ai Pin:重新想象智能手机
《时代》:联合创立了 Humane 的两位前苹果高管,创想了一个没有屏幕的世界,Ai Pin 就是第一步。
这款将于 11 月 9 日正式推出的设备,前段时间还登上了时装周。
只需要把 Ai Pin 固定在你衣服上,它就会变成你的个人助手。通过结合 GPT 等一系列专业软件,理论上你可以用语音让 Ai Pin 帮你完成各种任务。
Ai Pin 设有一个小摄像头,可获取辅助的视觉信息来完成任务,如评估一个食物的热量。
出于隐私保护,设备上的摄像头、麦克风或传感器启动后,Ai Pin 的“Trust Light(信任灯)”都会亮着,告知他人设备正在运行中。
想看信息?张开手掌就可以。
二、看到生活更多可能性
在 2023 年,AI 无疑是全球其中一个最耀眼的领域,但在这以外,还有全球范围内还有非常多聪明有趣的发明在为我们点亮生活的无限可能性。
Sphere:超越想象的娱乐空间
当耗资 23 亿美元打造的球型场馆在 7 月 4 日首次被点亮时,开发了这个空间的 MSG Ventures CEO David Dibble 惊呼:
它就像是科幻小说里出来的一样。
人们都从车里走出来,抬头看着它。
这个全球最大的球型建筑,占地面积约 8.1 万平米,外墙面积达 5.4 万平米,由 120 万个可编程的 LED 面板组成,也是全球最大的 LED 屏幕。
在室内,它配备了先进的曲面屏幕和音乐会级别的音箱系统。现在,这一切都被用于传奇乐队 U2 的驻场演唱会。
它不仅吸引了全球的目光,也占据了《时代》年度发明特刊的封面。
惠普企业“前沿”超级计算机:地表最强计算机
“前沿(Frontier)”是惠普为美国橡树岭实验室打造的超级计算机,也是世界上第一台百亿亿次级计算机,算力高达每秒 1.1 百亿亿次。
它目前被应用于黑洞研究和气候模拟等各个重要领域。惠普这个项目的负责人 Nic Dubé 称:“这不仅是一个奇迹。这在统计学上简直就是不可能。”
Music: Not Impossible:感受音乐的另一种方式
如果你在音乐节上看到这个“背包”,可别以为人们在做力量训练。
这个名为 Music: Not Impossible 的可穿戴设备,可将音乐和声音“翻译”成节拍,并帮助听障用户通过皮肤更精确地感受到音乐。该公司 CEO Daniel Belquer 解释:
对于聋人来说,为的不只是音乐,还有社交。
参与到比自身更大的活动中,融入人群中——这是健听者想当然的事情。
Zeen:让前行更丝滑
据统计,美国每年有数万人在使用拐杖时发生意外,我们需要一种更安全的拐杖。
曾在 70 年代发明了“斯坦尼康”摄影机稳定器的 Garrett Brown,将其中的气弹簧应用于现在 Zeen 中。
Exokinetics 公司制造的 Zeen 让用户可以顺滑地调整椅子高低,并由此轻松地从行走、站立或坐下模式间切换。
Exokinetics 的 CEO Garrett Brown 认为,“在拐杖和轮椅之间,我们还缺了些东西”,而 Zeen 就是填补这个空缺的产品。
苹果 Vision Pro:革命性的新“现实”
《时代》表示,虽然近乎所有科技公司都在尝试打造能够征服大众的虚拟头设,但苹果可能是首个成功的公司。
micro-OLED 显示屏、12 个摄像头、6 个麦克风、5 个传感器和专门设计的 R1 芯片,Vision Pro 除了硬件够“硬”外,还带来了众多创新交互 —— 用户可通过眼睛、手势和语音控制。
此外,头显还考虑了用户在是使用时和身边人的沟通,配置了外部屏幕作为沟通媒介。库克称 Vision Pro 的目标是“以一种全新的方式将数字内容和现实世界结合起来。”
兰蔻 Hapta:所有人都有追求美的权利
中风或关节炎可能会让人的手没法特别稳地拿东西,但这不意味着这个群体就要被剥夺追求美的权利。
兰蔻公司推出的 Hapta 是口红“支架”,借助基于 AI 的稳定技术帮助用户更准确地涂上口红。
HAPTA 配有智能运动控制功能,可追踪用户的动作;同时设有可旋转的磁吸功能,可根据人体工程学调整使用。
Cruz Cool:换一种方式“保冷”
得耗 500 年才能降解的泡沫塑料依旧是运输时最常用的绝缘材料,Cruz Foam 想用创新改变这个情况。
Cruz Cool 冷藏盒可以为冷藏食品提供 48 小时的保温。它的主要材料是几丁质,这种物质通常可以在菌类、昆虫和虾的身上找到。
更重要的时,找到这种替代材料后,Cruz Foam 还将几丁质和其他材料混合制成大颗粒,包装生产商可以直接把这些材料直接用在现有的生产线上。
三、最后的话
在过去 20 多年里,《时代》每年都在坚持发布“年度发明”榜单。
榜单上入选的数量也从 50 增加到 100,从去年开始,这个数字更是涨成了 200,因为“世界在快速改变,发明也迅速发展”。
这些发明以“原创性、能效性、野心和影响力”几个维度综合评选而出,它们都在“改变着我们生活、工作、玩耍和思考可能性的方式”。
我们总是忍不住想看这个榜单,因为发明是我们得以接触到新技术的媒介。
发明化作产品,技术也走进了生活。它能满足我们对当下的好奇心,也会成为我们想象未来的奠基石。
最后附上“2023 年度发明”完整榜单:
本文来自微信公众号:爱范儿 (ID:ifanr),作者:方嘉文