“AI复活”,安慰还是生意?

AI复活技术制作的朱熹

“提供定制服务的公司,不仅考验底层技术能力,更考验的是渠道深度以及服务的落地程度,这决定了能否让用户真正把数字人用起来。

随着技术进步,“AI复活”的概念还在继续升级,比起一段视频、一个聊天机器人产品,有人提出了数字永生、数字陪伴、随身亲人等概念,“有富翁在自己还活着的时候,就开始着手复制自己,搭建自己的这种数字永生库”,董慧智称。

“起死回生”这件事,过去只在科幻电影里见过,但今年,被“复活”的案例越来越多。

2月底,知名音乐人包晓柏用AI“复活”女儿,女儿在妈妈生日时还为她唱了一首生日歌;3月初,商汤年会上,刚去世不久的商汤科技创始人汤晓鸥以数字人的形式被“复活”,还来了一场“汤式风格”的演讲;近日,还有有网友用AI技术“复活”李玟、乔任梁等已逝明星,备受争议。

和逝去的亲人“再见面”,这门此前隐秘小众的生意,开始频繁地出现在大众眼前。但因为用到的技术不同,价格不同,效果也不同。

花10元,能让去世亲人的照片“眨眼”,背后是简单的图像处理技术;花千元,能和没来及道别就离开的亲人视频通话,用到的是AI换脸变声技术;花万元,则可以和电子屏幕里亲人的克隆数字人聊天,数字人能说会动有表情,真实感更强。

“AI复活”是一门有强烈需求的生意,酝酿着亿级市场,盯上这块蛋糕的商家却鱼龙混杂。有的下载软件就能制作“会说话的照片”进行售卖;有的本身是数字人服务商,在向B端售卖直播、会展、主持人等数字人之外,开发面向C端的数字人定制APP;还有一批商家,看准了用户复活亲人、克隆明星的需求,用自研+接入第三方技术接口的方式,为用户提供定制化服务。

“AI复活”或许在将来会成为一个像拍照一样常见的服务,但其中也存在数据隐私、法律伦理等问题。有业内人士表示,AI换脸变声技术的成熟,还会让一些人借着用户对亲人的想念和信任实施诈骗,“回忆虽好,谨防被‘割’”,他提醒道。

一、“复活”亲人,需要多少钱?

目前市面上的“AI复活”产品,根据成本高低、技术难易,可以分为三个等级,也对应着用户在AI“复活”某人之后,与亲人“再次相见”的三种方式。

其中最低一档是照片驱动,俗称talking photo(能动的照片),前几年就有类似的APP火过一阵。

利用深度学习、图像处理等技术,就能让照片里人物的嘴巴和眼睛动起来;如果让照片里的人开口说话或唱歌,则要用到对口型(唇语匹配)和语音生成。“这些技术都已经成熟且开源,量产之后,单次成本可以压缩到10元以内。”有10年AI创业经验的极链科技创始人&总裁董慧智介绍。

第二档是表情捕捉驱动的伪直播,给真人模特换上逝者的形象和声音,进行语音电话或视频电话等互动,或生成祝福短视频等。

这里面用到了语音克隆、AI换脸、动捕(表情捕捉)、深度伪造(deepfake)等技术来变人变声。董慧智称,这是一种特别讨巧的方式,技术不新鲜,部分AI诈骗用到的是类似的技术。动捕器材及人力成本稍高一些,需要数千元。

这类“AI复活”的视频片段在短视频平台播放量很高,一般是小辈为家里的老人下订单,找人用逝者的脸和声音与老人通话,对老人谎称逝者在外工作,将“善意的谎言”继续,老人一般也看不出异样,只是频频抹泪。

第三档是近期比较火的用数字人技术“复活”亲人,因为交付的产品不一样,成本也有所不同。

一般来说,通过收集人物生前的照片、声音等数据来克隆数字人的形象和声音,然后底层搭载大语言模型模拟逝者的思想,可与之进行实时的文字或语音交流。

51数字人创始人陈鸿告诉“定焦”,一般产品交付的是一个带有数字人的屏幕,大屏有电视那么大,小屏可以是iPad那么大。用户登录账号之后,就能看到逝去亲人的数字人形象,用户可以通过语音或文字与数字人互动,产品还可以提供语音电话叫醒服务。

“定制类的‘复活亲人’业务,一般要5万元以上。”陈鸿称,因为客户都是长期付费,后续还会不断在细节上调优,也有一些客户是一个家族凑钱一起做,要求更高。

“AI复活”对于数据质量的要求非常高,被克隆者生前的照片、视频或语音样本越多、越清晰,数字人的相似度就越高。再输入一些个人特征数据,比兴趣爱好,才能模拟其性格。“素材不够全,成本还会再增加。”陈鸿表示。

因此,精度越高、数据越定制化,效果也就越接近真人,价格也更贵。所谓的精度,主要体现在以下几个方面:人物口型准确度、分辨率清晰度、动作复杂程度、服饰发型和表情丰富度、语音(音色、语气)相似度、是否有电音、是否有抑扬顿挫(多情感)、是否带交互、交互是否更贴合本人性格等。

放到数字人领域,需要完美克隆某个人的技术难度可谓“上不封顶”。商汤科技“复活”的创始人汤晓鸥,就是一个案例。

“数字人”汤晓鸥在年会上的演讲  图源 / 视频截图

商汤科技数字空间事业群数字文娱事业部总经理栾青告诉“定焦”,为了还原汤老师的音容笑貌,用到了不同技术。整个制作过程中,商汤运用了自研的TTS语音生成大模型,截取了汤老师四、五段不同说话风格的声音作为prompt(提示),总声音素材不过十几秒,还原了汤老师的东北口音、音色、常用的语气词和语调以及冷幽默的风格。

此外,商汤如影数字人技术团队采用了汤老师之前清晰有效的视频,用商汤自研的视频生成技术进行动作生成和场景过渡,还原走动、喝水等动作,以及微笑的表情。

受限于素材不多,以及算力、成本的考量,目前很多数字人的视频和产品看起来还是很“假”。“这些都不算是完整地‘复活’数字人,技术和服务的最高交付上限,也无法满足人们的最低需求下限”,陈鸿称。

形象不够像,就得用情绪价值来补,在数字人的设计上加入一些交互细节。他举例,比如一个客户的爷爷最喜欢老四,聊天时爷爷突然会说下个月是老四的生日了,家人要多聚、兄弟要和睦,客户就会一下子被打动。

总得来说,前两档用到的都是相对简单的图像处理、换脸和声音克隆技术,能看到人脸、模仿声音,但因为成本低,效果粗糙,市面上看到的还原度比较高且能动起来、能对话的都属于第三档数字人,越像越贵。

二、谁在靠克隆人赚钱?

从过往“复活亲人”的案例可以看到,大部分不像真人且让人出戏甚至尴尬。而随着生成式AI技术的发展,栾青观察到,“AI复活”在技术上的可行性和真实度上都变得更高,能让人投入、想哭,使得这类需求被进一步激发出来。

由此,一条产业链应运而生。在这条产业链上,一部分是跟风商家,一部分是数字人服务商,一部分是AI从业者,还有一部分是专门做定制AI复活(复活或克隆亲人、明星、企业家等)的玩家。

电商平台上,有不少店铺提供“AI复活”服务,让照片说话的标价多为10元、50元。短视频平台上,也有不少人以“AI造梦”“AI疗愈”的名义提供类似服务。“收费便宜、效果粗糙,但这是一个长期存在的长尾市场。”董慧智称。

这类生意也存在灰色空间,有短视频博主发布“复活”李玟、张国荣、乔任梁等已逝名人的视频,让他们开口唱歌和说话,虽然称“旨在致敬和纪念,无商业目的”,但此类视频获得的流量颇高,还有部分会借此引流做“亲人复活”生意。同时,一些提供“AI复活”服务的店铺也注明“只做怀念,人脸识别请绕道”。

目前,技术成熟的数字人服务商和AI从业者,更多是将商业模式放在B端,比如AI客服、数字人直播、AI老师、AI主持人、AI医疗等,有部分推出了面向C端的类似工具,但并未大规模宣传。

有网友曾用大模型初创公司MiniMax的语音大模型,将一段90秒的音频素材进行语音克隆,并生成智能体,与之进行语音对话。硅基智能也有“生命克隆和数字永生”业务,其旗下的炎帝大模型基于用户提供的数据克隆出数字人,用户则可以通过DUIX APP与数字人实时交互。

陈鸿和团队主要做的是高精度定制市场,平均一单5万元起,围绕大客户开发场景,比如数字墓地,去墓地缅怀先人时,先人从电子屏里走出来跟大家聊天;比如纪念馆智能工程,包括建筑空间搭建等;比如名人“复活”,用初期古画“复活”了朱熹等。

AI复活技术制作的朱熹

“提供定制服务的公司,不仅考验底层技术能力,更考验的是渠道深度以及服务的落地程度,这决定了能否让用户真正把数字人用起来。”陈鸿认为。

从技术提供方的角度来看,栾青认为,商汤如影的定位就是通过数字人技术赋能各个行业,谁更了解行业,谁更能下场服务好用户,谁有更深度的解决方案,谁就能吃到更多蛋糕,“复活亲人不是一个纯粹从技术角度就可以做的生意。”

“AI复活这门生意更适合中型团队去做”,董慧智分析,大公司的运营和研发成本很高,同样一套技术,他们会优先去做标准化、批量化、适用更多场景的B端生意。陈鸿也表示,大厂不愿意做,小团队没有实力做,这个市场年收入500万到1亿,是中型团队的机会”。

目前看来,“AI复活”看似门槛不高,但真正做好还要面对很多难题。

当前,“AI复活”还存在技术受限、素材储备缺乏、家中有人反对等局限,普及仍有难度。

大部分数字人需要攻克的技术难点是,能否做到人机难辨。栾青提到,数字人在说话、动作、场景衔接等方面已经向前进了一步,但在较长时间的交互过程当中,仍然未能达到真正的人机难辨,在情感传达、理解力、意识等方面还有待完善。

而真的想让一个人“复活”,细节体现在方方面面。陈鸿以一个交互场景举例说,在与数字人爷爷对话时,如果用户问到了数字人数据库里没有的信息,比如“谁是尼采”,数字人就会跳转到大模型,根据公开的答案回答,虽然可以持续进行多轮对话,但就会很假,用户的沉浸感就会被打断。

三、“AI复活”,仍需敬畏

“AI复活”的需求旺盛,但不是所有人都持支持态度,背后隐藏的隐私安全和伦理问题也不可忽视。 

支持派认可的是其提供的情绪价值,认为“复活”亲人,是对生者的慰藉和对遗憾的满足,是技术向善的例子。

质疑派则认为人永远不可能“复活”,也无法进行“授权”。即便“AI复活”得到了亲属的授权和认可,但逝者本人的意愿无从得知。

“数字永生没有那么容易,即使使用大模型,最终复刻出来的只是一个长着相同面孔的GPT,当他以相似的记忆和远胜于本人能力和智商跟你对话时,你的感受一定会好吗?”董慧智反问。

3月16日,针对儿子肖像被短视频创作者侵权使用一事,乔任梁父亲表示不能接受,感到不舒适,希望对方尽快下架,“他们未征求我们同意,是我侄女刷到视频发给我的,这是在揭伤疤。”

如果克隆数字人出现问题,对生者可能将带来二次伤害。太多影视剧作品探讨过其中的伦理困境和人性幽微。

2013年播出的《黑镜》,其中一集讲的便是女主“复活”了在车祸中去世的丈夫,虽然复制了丈夫的记忆和躯体,却无法复制情感和选择,这位AI丈夫无需睡觉、不会受伤,只会呆板地按照命令行事。女主意识到“你不是你,你只是涟漪”,最终将机器人锁在阁楼上,却怨恨自己离不开这虚假的真实。

随着“AI复活”产业链的成熟,“复活亲人”“克隆明星”的需求和案例增多,其中涉及的隐私数据泄露、AI诈骗等诸多法律风险,也受到关注

现实生活中,通过AI换脸实施诈骗的案例时有发生。今年315晚会就曝光了多起利用AI技术换脸变声成亲人,实施诈骗的案例。此外,假冒名人也是骗局中的重灾区。今年3月,刘德华经纪公司映艺娱乐通过微博发布声明,称刘德华声音被克隆伪造,提醒各方人士警惕骗局。

复刻亲人时,为了更高的还原度,用户只能对技术提供方保有更大的开放度,这就决定了用户很难保护自己,一旦遇到骗子,很难界定到底是服务还是诈骗。

对此,陈鸿建议,想要“AI复活亲人”的用户,在下单前应该签署合同,规定数字人的各项权利属于个人,以及提供的个人信息不被泄露。

“AI的发展是超速的,而安全问题不管是从法律层面、文化层面、公民意识层面还是技术层面的,都处于滞后状态。”董慧智称,最终产业的发展还是要靠从业者自律和监管条例的规范。

栾青称,行业的规范和安全是业务发展的大前提。在中国信通院牵头下,商汤联合多家AI公司共同制定了“可信数字人”的标准。

不可怀疑的是,人和AI的关系会在今后变得更加紧密和多元,“AI复活”这件事,以后有可能会成为一个标准服务,就跟打印一张照片一样简单。

随着技术进步,“AI复活”的概念还在继续升级,比起一段视频、一个聊天机器人产品,有人提出了数字永生、数字陪伴、随身亲人等概念,“有富翁在自己还活着的时候,就开始着手复制自己,搭建自己的这种数字永生库”,董慧智称。

2015年,俄罗斯亿万富翁德米特里·伊茨科夫发出倡议,宣称到2045年将为所有人打造一副机器人身体来实现永生,这项计划面临一定争议。2022年,伊隆·马斯克在推特上提到已经将自己的大脑上传到云端,并与自己的虚拟版本交谈过,但有人认为这是马斯克在宣传自己的脑机接口公司Neuralink。

随着“AI复活”褪去神秘感,行业或许也会开始进入价格内卷的时代,如果不想出现“劣币驱逐良币”的情况,行业还需保持敬畏之心。

本文来自微信公众号:定焦(ID:dingjiaoone),作者:苏琦,编辑:金玙璠

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年3月19日
下一篇 2024年3月19日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日