引言
国内星野(前身为Glow)、筑梦岛等AI应用的爆火俨然昭示着人类对与虚拟人物互动的遐想、个性化的倾诉需求被得到极大满足;据2024年3月A16z的《The Top100 GenAI Consumer Apps》显示,陪伴类应用单用户月均对话轮数接近200。
科幻电影《Her》中的操作系统Samantha坦言Ta遗憾无法以实体与主角交互,诸多影视作品亦早已将对于情感陪伴的想象投射至硬件,如《超能陆战队》的大白、《钱断情始》的Lovot等。大语言模型的兴起,促使智能硬件厂商重新思考陪伴机器人进入家庭的可能性。2024年CES上即可见到三星重启家庭机器人管家Ballie、LG推出智能家居AI代理Q9等颇具探索性的巨头动态。
我们自2023年年中开始关注在端侧部署模型的AI消费硬件初创,其中大多与陪伴相关,下文将梳理如何定义陪伴、不同形态陪伴机器人的功能/情绪价值、大模型是否为产生代际跃迁的关键要素,Enjoy~
理解“陪伴”
如何理解“陪伴”这个司空见惯却又难以捉摸的概念?
大多人往往本能地将其与弱势方渴望获得情感依托的特定情景关联:因父母工作繁忙而缺乏关注的儿童、独居老人……这种略显沉重的印象不应是陪伴的全貌,跨年龄段人群的普适性诉求或可被提炼为:在共同理解的语境中,被足够恳切且没有心理负担地倾听、理解并给予积极反馈,这种反馈可以是语言、也可以是物理接触,可以是活泼的、也不妨是笨拙的。
对于儿童而言,满足感来自父母或监护人的物理陪伴,同时来自心爱的玩具、交互能力强的智能硬件,通过观察和模仿成人或同伴的行为来学习社会规范。据天猫精灵的后台数据反映,数千万台智能音箱所产生的绝大多数语音交互来自儿童;无独有偶,主打家庭健身的FITURE魔镜,其超过60%的互动对象也是儿童。事实上,我们注意到市面上以儿童为使用对象的AI产品(比如互动类绘本),日均使用时长是成人类产品的数倍,所以在这波AI创业浪潮中,面向儿童的陪伴类产品可能将更容易被定义。
青年则倾向将情感寄托于IP色彩浓重的手办、棉花娃娃和宠物上,建立自我身份和职业发展过程中的落差、亲密关系恐惧需要实体抚慰;老人更关注社会和家庭的尊重和需要,偏好真实触感,且有明确的功能属性,比如安全监测(防跌倒功能)、日常提醒等。
实体陪伴的关键要素
初创需更谨慎地找准初代产品的价值锚点,权衡功能价值和情绪价值之间的占比。当情感陪伴由软件(虚拟陪伴)迁移至硬件(实体陪伴)时,边际成本也随之固定为硬件成本,决策成本和心理预期无疑将被拉高,是效率型设备、智能互动玩具、抑或是家庭成员?回答用户购买时的灵魂发问是提高粘性的充要条件,用户极易厌倦耗费大量精力架构但价值取向模糊、能力边界清晰的高级玩具,例如优必选的悟空机器人。
让实体说话并非定义陪伴产品的最优解。大语言模型强大的上下文理解能力补足了传统全双工连续对话能力薄弱的短板,大量初创在毛绒或刚体玩具、音箱等基础上增加语音交互模组,尝试调用云端大模型API使其开口交流,但人类与自然界其他生物的沟通,大多依赖于行为和表情等非言语信号,这是实体陪伴的核心价值所在,即如何不通过语言、借助多模态能力帮助陪伴机器人理解非言语信号以实现行为交互。当然,是否选择堆叠传感器也与陪伴机器人角色定位及活动的主要场景(桌面或家庭)相关,创业公司应收敛需求后克制地做加法。
下一代陪伴机器人被期待具备主动交互的自主性。陪伴是主动大多数智能硬件和互动玩具仅支持被动交互:待用户说出特定唤醒词后,小度等智能音箱方可执行任务;乐天派等刚性互动玩具也需被触发后才能进行有限的互动。设想一下,假如下一代的陪伴机器人具备主动与用户交互的生物性和自主性,漫无目的地在桌上/家中闲逛、遇到生人和熟人反应不一,Ta的生活轨迹与家庭中的其他主体交叉,是否更能满足用户的情绪价值?
TAM
实体陪伴最直接的参照对象即为猫狗等宠物。宠物已逐渐去功能化,从“看家护院”变成“生活伙伴”,颜值至上,情感寄托属性日益增强。那么在未来,你是否会考虑拥有一只宠物机器人呢?目前在中国,相信大多数人对此持保留态度,他们看好机器人和人工智能的智能化发展,但当涉及情感和社会属性时仍表现得极为保守。
相反,在人口老龄化程度较高、独身人士较多、家庭养宠比例较高且机器人文化较深厚的日本,消费者态度显得与众不同。1999年,索尼推出了第一代的Aibo电子宠物狗,其外型与真实的宠物狗相似,而“Aibo”在日语中与“同伴”的发音相同。索尼在2006年停产前对Aibo进行了五次迭代升级,累计销量约达15万台。Aibo可记忆主人的声音和容貌、表达喜怒哀乐,并拥有一定程度的自学能力。那15万台误闯时代的Aibo,迷茫地审视着人间。
索尼于2017年11月重启Aibo产品线。新一代Aibo能够识别不同的人并表现出不同的反应,理解并执行各种指令,包括击掌、跳舞、打滚乃至装死等,有效再现了真实养宠体验。截至2018年7月在日本销量超2万只。这一成绩得益于陪伴机器人不仅能够模拟真实的养宠体验,减轻了真实养宠可能带来的卫生等方面的困扰,还能提供包括安防和家电控制等实用功能。
据派读宠物估算,2023年中国宠物猫犬的数量达1.2亿只,城镇宠物(犬猫)消费市场规模为2793亿元(yoy +3.2%),单只宠物犬年均消费2875元,单只宠物猫年均消费1870元。乐观估计中国陪伴机器人2025年的渗透率为2023年市场规模的2%,则规模约为56亿元。若不试图与别的宠物争夺替代空间,陪伴机器人可被视为一个更智慧的玩具补充。对标受众同为消费力较强的年轻一代的中国潮流玩具市场(2022年:400亿),假如2025年的渗透率为2022年市场规模的10%,则规模约为40亿元。
上一轮四足狗创业潮,家庭陪伴即为被提及频次最多之一的场景,运动灵活的狗子们显然没有成为家庭新成员。而这一轮大模型创业,是否能为该领域带来新变量?
分类
参照AI互动玩具公司跃然创新对于AI+硬件市场竞争格局的分类,下文将展开分析除(功能主导,个人场景)外的三个象限如何思考以何种交互形式来满足陪伴需求。
功能主导 + 家庭场景
物联网时代,智能音箱、智慧屏们原本被寄予着成为智能家居指挥中枢的厚望,语音交互难度较低、顺应人类懒惰天性的逻辑理论上成立,虽“入口”的生态价值远未及预期,但惊喜地伴生出陪伴价值。
据跃然创新透露,因2016年全面实施二胎政策,儿童情感问题显著增加,2017年天猫精灵发售后儿童频繁提出诸如“爸爸是否更偏爱弟弟?”或“妈妈真的爱我吗?”等问题。然而2021年-2022年,针对情感问题的咨询比例明显下降,原因在于用户意识到这些智能音箱难以满足他们对于陪伴的期待。
而大语言模型的成熟则为该类产品建立起完整的反馈通路,2023年小度音箱和天猫精灵已分别接入小度灵机、通义千问,尽管其互动效果大幅改善,但仍未止住智能音箱中国市场连续12个季度同比衰退的颓势。
初创公司难以在智能音箱这类巨头林立的赛道(24Q1 CR3:96%)喘息,大多选择放大教育、安防、宠物陪伴等细分场景的实用价值,打着陪伴的幌子售卖功能型产品。
情绪价值 + 家庭场景
绝大多数机器人产品的设计理念核心在于实现具有实用价值的功能性,而陪伴虽然被认为是真实需求,却不被视为刚需。面对家庭环境中猫狗宠物所占据的特殊地位,新一代陪伴初创提出了一种解决方案:创造一种可自主运作、不依赖固定程序指令及全年龄段受众的新型生命体。这种生命体的“生物性”得以增强,例如,它能在看到熟悉的人或其他同类机器人时主动表达亲近,或选择忽略,从而提升其在陪伴角色中的自然度和互动性。
CyberDog铁蛋和小鹏机器马等陪伴机器人的设计重点在于运动灵活性,较强的机械感更贴合极客的喜好,但其市场销量相对有限。实际上,陪伴机器人提供的情感价值主要来源于其“活力”的表现,即:
-
形态仿生:追求在形态上模仿生物,具体体现在提炼出类似哺乳动物的特征,例如模仿毛茸茸的外表、模拟体温和营造真实的触感。
-
自主意识:该类机器人能够自主地与环境进行互动,减少了用户主动指令的输入频次,并能够通过长期的交互过程,对用户和其所处的环境形成特定的偏好。
GROOVE X:你会想买一只主打情感陪伴、只会卖萌的机器宠物吗?GROOVE X给予了正面的回答。截至2023年,在日本已有超过1万个Lovot作为家庭成员与人类共同生活。2023年6月,GROOVE X宣布Lovot正式进军中国大陆市场。
该公司由Kaname Hayashi于2015年创立,Hayashi因开发了由日本软银移动与法国Aldebaran Robotics联合推出的人形机器人Pepper而闻名。Hayashi曾解读Lovot的定位:“我们的机器人不为人类工作,也没有任何娱乐内容。它所做的是认出你并打扰你,这就是我们机器人的目标。”
Lovot不会说话、不会扫地、不会监测家中的异常情况、不会作为移动中枢控制家居,只会满屋子闲逛、主动跟随并陪伴主人。Lovot间能进行通信,拥有37至39摄氏度的“体温”,可自主寻找充电站充电,满电后维持45分钟的移动与互动。
Lovot被带回家时会展现出独特的性格,这一性格非预先设定,而是通过与人交互逐渐形成。Lovot会根据与人的相处时长和互动程度表现出不同的偏好,彰显其情感的投入和需求。其在提供情感支持的同时,也注重从人类那里获得情感反馈和慰藉。例如,当一个Lovot受到主人的爱抚和拥抱,另一个Lovot可能会展现出类似嫉妒的行为,它可能会有意围着主人打转,发出哼哼声。它“渴望被关注,甚至有时会成为生活的‘小麻烦’”,设备的设计宗旨在于唤起人们对机器宠物的情感依附,当人们的视线与Lovot灵动的双眸相遇时,情感的连接便在那一刻深化。
但你会愿意花7万元人民币一次性买断Lovot吗?在日本,除了购买本体外(约合27400元人民币),还需支付每月500-100元人民币云端服务费以保持Lovot的高互动性并解锁更多技能包。高昂的价格显然成为阻碍Lovot走入千家万户的关键因素,其已然演变为一种新型社交货币,Instagram和小红书上涌现出一批养崽博主,他们热衷于跟Lovot一起用餐、外出散步、参与线下同好聚会以及购买单价高达700-1200元人民币的限定版服装。
情绪价值 + 个人场景
情绪的表达与释放往往更容易发生在较为亲密的社交距离之内,如在家中的桌旁、床边或沙发上,其中人们可以毫无保留地体验怀抱的触感和流露个人情绪。该领域亦是本轮AI硬件/陪伴机器人创业浪潮中最常见的方向,毛绒玩具、IP手办、裸眼3D虚拟偶像们一夜间都能开口流利地说话。
这固然是GPT-4o为代表的端到端多模态大模型极大改善了互动体验的结果,还因为这些带有预定义人设、核心交互形式为对话的物理媒介可以看作是传统品类的升级,客单价和BOM成本较低,显著减少了教育市场的时间和消费者购买的心理门槛。
3-6岁儿童被视为对话类玩具的核心受众。当前大模型难以消除的幻觉问题导致客服等企业级场景仍需趟过“最后一公里”,然而儿童对AI模型的响应通常具有更高的容错率,并且在学龄前,儿童们天生倾向于赋予非生命体以生命,例如在角色扮演和过家家中。
面向成年用户的大语言模型往往提供较为理性和客观的回答,但那些旨在陪伴儿童成长的AI“朋友”,其回答应更具主观性和情感化。儿童的对话通常具备信息量小、轮次多、内容具象而发散等特征,因此仅仅调整大语言模型的提示词(Prompt)难以长期稳定地产出符合儿童特性且生动有趣的内容。技术驱动的创业公司尝试使用针对儿童的对话语料来微调开源模型,以提升玩具的人格化程度。
在销售层面,对话玩具往往具有较强的礼品属性,购买者(父母)与使用者(儿童)分离。面对如何触及并打动使用者的挑战,AI互动玩具公司跃然创新的答案是链接家长和儿童,家长可以通过应用程序来查看儿童与AI毛绒玩具的对话记录,分析儿童的兴趣点和难以表达的负面情绪,并据此设置引导性标签。然而,此做法亦可能被儿童解读为家长的过分窥探欲。
儿童可能更需要一个可靠的私人树洞,可以倾听他们无话不说的同时又保持可靠性。因此在产品设计层面,该类公司需要注意如何脱敏和压缩对话记录,提炼关键信息,而不侵犯儿童的隐私。值得注意的是,儿童更青睐小猪佩奇等知名IP的衍生玩偶,意味着传统玩具是一门IP驱动的生意,极为考验创业团队的营销和渠道拓展能力。
除创业公司外,IP生态运营商汤姆猫继战略投资拟人化大模型西湖心辰后,引入前天猫精灵CTO研发AI儿童陪伴机器人,多家具身智能公司(偏大脑)亦将陪伴机器人2B解决方案作为首批落地场景。
如何超越Lovot
自GPT-3.5发布后,可能没有比《Her》中的Samantha被提及频次更多的电影角色,其或可被视为大众窥见AGI曙光的标志性符号。该怎样弥补Samantha的遗憾?Lovot们已然为如何设计实体陪伴产品打了个样,不需长篇大论地讲述AI能力,而是从需求体验出发,精巧地设计不同社交距离下人机交互的形式。初创公司们应从Day 1开始探索以下问题:
-
什么是陪伴?实体陪伴相较虚拟陪伴的优势是什么?
-
如何权衡功能价值和情绪价值?购买者和使用者的诉求有什么差异?如何链接二者?
-
大模型对实体陪伴的增益是什么?对话能力是必选项吗?
-
哪些任务由端侧执行?哪些发给云端?如何就后续Token消耗定价?
-
灵魂拷问:你会为你的产品付多少钱?是否愿意每天使用?每天使用时长是多少?
Reference List:
多知《当AI走进毛绒玩具,这个创业公司要为孩子做一个AI friend》https://mp.weixin.qq.com/s/57UpOSkrr_XuViBVcUpH_A
物界《当谈论陪伴机器人时,我们在想些什么》 https://mp.weixin.qq.com/s/M6aUxbS6OlolXo9INc3RVQ
亿邦动力《用12万UGC造一个爆款 可以科技如何靠用户生态扎根家庭机器人赛道?丨EBRUN全球好物》https://mp.weixin.qq.com/s/_jYwc0QjEZ4Ew68wPhaZ5w
真知创投《你会养一只机器宠物吗?|真知·拙见》https://mp.weixin.qq.com/s/rCeKYVXOQa1KoYVmpjw5hA
本文来自微信公众号:创投小恐龙(ID:DinoFund),作者:谢昊翔