终于有正经AI硬件了,一台能写诗的“拍立得”

另一演示则是对着纽约公共图书馆的天花板拍张照,它会解读并创作出:

“天花板的影子之舞,

如同金镶木,

用春日天空欺骗了眼睛

石碑和木梁下

伫足”

两位开发者表示,由于诗歌相机的开源属性,用户其实可以根据个人喜好更改源代码,重新编程和选择不同的诗歌形式,不局限于现代自由诗,也可以是日本俳句或七言绝句,后续可能会给用户不同大模型去选择,比如从。

2016 年,由人工智能撰写《电脑写小说的那一天》小说成功通过了日本“星新一文学奖”的初选;Sony 开发的 DeepBach AI 在深度学习巴赫后,创作出的仿巴赫音乐,在 1600 位听众里,骗过了超过一半的人,让他们以为这就是巴赫本人的创作。

如今,人工智能已经能生成真假难辨的视频,极具艺术感的图像。

人工智能正在挑战着文学、音乐、绘画、影视等等这些原本属于艺术创作的领域。当艺术难以成为人类对抗 AI 的护城河后,许多人认为,诗歌或许是智能时代,人类最后被攻克的堡垒

诗歌被认为是人类文学最初的起源,在尚未有文字的人类社会,诗歌就以口语的形式流传在文明里。它在形式上考验节奏和韵律,在表达上考验想象和凝练,它需要表达者把经验、观察、意识结合,毕竟诗歌的创作依托于人类特有的通感,因此我们可以让 ChatGPT 写一首关于月亮的诗,它只会泛泛而谈,而无法和人类在当时当刻,设身处地看到独一无二的月亮。

但是,如果 ChatGPT 有了能“看到”月亮的能力,给思考赋予观察呢

基于这个想法,Kelin Carolyn Zhang 和 Ryan Mather 两位设计师和开发者鼓捣出了一台设备:让摄影机去“所见”,让人工智能去“所感”,用技术的手段去实现文学里最难以量化的表达。

这就是诗歌相机(Poetry Camera)

一、相机与诗

诗歌相机内核搭载了树莓派,一个只有信用卡大小的微型电脑,得以成像和调取 GPT-4 的 API,这就打通了设备的“眼睛”和“大脑”。

举起诗歌相机,随便拍下一张照片,计算机视觉算法会开始分析视觉数据,人工智能模型开始解释图像,识别图像里关键元素、颜色、环境、影调情绪等信息,生成诗,并且以类似超市收银条的方式打印出来,就好像拍立得“洗”出照片一样。

拍照出诗不出片,这可比拍立得更让人有期待和惊奇感。不看宣传看效果,它能生成怎样的诗歌呢?

有用户拍下了早上自己在家里喝咖啡时玩手机的样子,诗歌相机的创作是:

镜头后面,一人调整视线,

在正方范围里的像素空间。

……

日光透过褪色的薄纱,

他手上,温热的咖啡流转。

对话传出,跨过虚拟的边界,

他的倒影镜像,在屏幕上出现。

书架上,书本倾斜,无声的喋喋不休,

茂盛的植物,是唯一的生命。

戴着眼镜,家成了他平静的面糊,

在这堵墙里,他的世界四散开来。

在 2024 年 4 月的一个清晨,

一种新的常态,悄悄地磨损。

@poetry.camera

不难看出,哪怕经过简单翻译,它生成的文字依然有诗歌特有的“意象感”。诗歌相机的原文更显用词文法上“刻意地精妙”,比如每一段都在押韵脚,比如第一段的 lens,gaze,space,place,race,第二段的 sheers,steers,frontier,appears。在用词上也会采用诗歌用词,比如把 morning 写成 morn,就像中文里把“早上”写成“晨”一样。

另一演示则是对着纽约公共图书馆的天花板拍张照,它会解读并创作出:

“天花板的影子之舞,

如同金镶木,

用春日天空欺骗了眼睛

石碑和木梁下

伫足”

两位开发者表示,由于诗歌相机的开源属性,用户其实可以根据个人喜好更改源代码,重新编程和选择不同的诗歌形式,不局限于现代自由诗,也可以是日本俳句或七言绝句,后续可能会给用户不同大模型去选择,比如从 GPT-4 换到更擅长理解文字和语义的 Claude,或者更擅长写故事的 Dragonfly。

两位开发者表示“只想享受科技的乐趣”|图源:Poetry Camera

而且诗歌相机不会以任何数字方式保存,用户既看不到相机拍到了什么,也不能直接复制粘贴文本,如果想留存一份,只能拿起手机拍下来这一张诗条。因为两位开发者认为,除了技术问题(需要服务器和云平台)、隐私问题之外,诗歌的瞬时性给它增添了额外的意义,打印出来的“诗条”是瞬时捕捉,随机生成,独一无二的实体存在。

在屏幕主宰我们日常生活的当下,诗歌相机这种设计把视觉以诗意用物理的方式呈现,让它在数字之外,增添了一丝模拟化的浪漫气息。

二、你我都能做

“拍下所看到的景观,让相机生成诗歌”这一想法不仅富有创意,似乎看着还挺难实现的?但实际上,你我都可以做出一台诗歌相机。

诗歌相机到现在也还停留在一个“艺术项目”的阶段,两位开发者也暂未有大规模商业化的计划。他们只是产生诗歌相机的想法,鼓捣出了一台能实现想法的硬件,他们所用到的软硬件都是开源的,因此两位开发者选择在网站上把详细的制作过程公开,鼓励更多的用户 DIY 自己的诗歌相机。

诗歌相机的内核是微型卡片计算机树莓派,再附以一些常见配件,再加上树莓派的相机模块、一台迷你热敏打印机、六个电池、一个按钮就够了。

官方把详细的 DIY 教程发到了 GitHub|图源:Poetry Camera GitHub

而诗歌的生成则要对接到 ChatGPT-4 的 API 密钥,在按下快门时,会触发脚本,把采集到的图片发送到 GPT-4 上创建一首诗,最后在热敏收据打印机上打印出来。

两位开发者已经写好了全流程脚本,只要按照他们给的详细步骤逐步设置,不需要会编程和 3D 打印,纸壳里也能造出一台诗歌相机。

如果说乔布斯所信奉的“技术和人文的十字路口”让他造出了极具美感的数码产品,那诗歌相机则是用一种互动形式上的创新,给予我们另一种技术和现实交互的可能,突破界限,创造新的表达形式,甚至进一步反向激发人类的观察和想象。

这也是两位开发者秉持的理念:技术应该融入生活,让我们能更好地欣赏日常,而不是挤压人类的生存空间

联合创始人 Kelin Carolyn Zhan 坦言道诗歌相机的意义所在:“对我来说,这仍然是艺术,它是关于表达的。诗歌相机是一台塑造我们想要看到的世界的工具,这也是一个人们可以把玩新技术的世界:人工智能并不全是厄运和悲观,也不仅仅是用更深、更快、更糟糕的方式模仿人类,而是用新技术创造全新的工具,再让工具再次带出人类内心的孩子。对于这个项目来说,这不是为了赚钱——而是为了让那些天真的奇迹再次成为可能。”

但在创意之外,我们又不得不产生疑惑:GPT-4 生成的诗已经有模有样,那在诗的创作上,超越人类是否只是时间问题?

三、人工智能写的诗,能和人比吗?

当我们站在赏鉴的角度再看诗歌相机的成诗,可以感受到人工智能和诗人作诗上的差异所在,人工智能写的诗有更明显地“描述”和“顺序”,用词上更连贯,比如“日光透过褪色的薄纱”“天花板的影子之舞,”,更像是用文雅的词描述一个场景,其中缺少了诗歌难以描述的抽象感和意象美。

就像诗刊社在《GPT时代,诗歌的意义和价值所在?》里提到的,“GPT 的出现是对文本顺序的改变,它省略了世界与作者的概念,中间加入的是标准化、数字算法,却没法模仿诗歌的意象。

诗人夏宇所写的现代诗|图源:夏宇

诗人欧阳江河也曾在采访里说到“写作背后的广阔性是人的生命、人的世界观。这些包括了生命的感动、生命的升华、生命的伤痛、生命的恐惧、生命的黑暗、生命的爱、生命的愚蠢、生命的局限性。但人工智能不可能有生命,人工智能太聪明了,它没有疼痛,没有生命的脆弱感和恐惧,而诗歌正是这些的产物。如果没有这样的来源,只剩下漂亮的句子是没有意义的。”

诗不像围棋或公式,诗没有确定的答案,当我们质疑人工智能写诗的能力,我们更多是在质疑它诗的由来

就像在 1982 年的科幻电影《银翼杀手》里,人造人罗伊·巴蒂在死前留下了全片最富有诗歌气息的台词,这意味着人类,至少《银翼杀手》的创作团队相信,在共同经历了对生命的感受之后,人工智能体也能创作出优美且富有人性的诗歌。

回到诗歌相机上,在我们了解这个设备后,并没有感受到一种“被人工智能挑战”的紧迫感,反而是新奇更甚,毕竟当我们触手可及的设备能进行一种艺术的表达时,它也随之解锁了我们看待周遭的一种独特的方式。

就像诗人夏宇在 2023 年与 ChatGPT 合作完成了一册诗集《验证您是人类》,她和 ChatGPT 探讨诗、评论、语言、机器、笑话……最终她在采访里说道“人类至上的人类又在搞机器人,处处代入人的语法人的意图动机人的情感……与ChatGPT的沟通,透过它习得的人类语言,它也学得很快,我还是希望它保留它的机械性不要轻易进入人性。”

与其去较真人工智能和人类在写诗上还有多少差距,甚至产生精神危机感。我们更应该关注,用算法和数据喂饱的人工智能是怎样观察被我们忽视的周遭,它又能否激发出人类的诗性。

本文来自微信公众号:极客公园 (ID:geekpark),作者:Moonshot,编辑:靖宇  

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年5月4日
Next 2024年5月5日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日