游戏版ChatGPT,要用AI实现NPC自由

还有谁能阻挡微软吗?

在公司成立近 50 年后,老牌巨头微软在近几年强势崛起。2023 年,更是微软的大年,一方面对动视暴雪超过 700 亿美元的惊天收购顺利完成,让公司一举成为全球第三大游戏公司;另一方面,作为 OpenAI 的最大“金主”,借着 ChatGPT 东风,微软又一跃成为科技巨头中的“AI 领头羊”。

目前,微软市值已达 2.73 万亿美元,和老对手苹果只差 9000 万美元的差距,反超似乎就在一瞬间。

最近,一单不太受关注的合作,似乎暴露了微软的下一步的目标——将游戏和 AI 结合起来。

不久前,微软和 AI 初创公司 Inworld 达成合作,将引入基于 AI 的“角色引擎”及“Copilot 助理”,为开发者提供一系列开发工具,以创建更真实、动态的 NPC。

对于此次合作,微软称“利用先进的 AI 技术,为游戏中的 NPC 注入更多的交互力和生命力,从而提升游戏的沉浸感和体验感。”

所以,Inworld 这家初创公司,到底凭什么拿到超过 1 亿美元的融资,并且抱上了微软的大腿?双方的合作,又会让 AI 对游戏产业造成怎样的影响?


一、如何打造AI NPC?

三年前,一部好莱坞大片《失控玩家》(Free Guy)让大家意识到,一个有了自主意识的 NPC,可能会把一个游戏“霍霍”成什么样。

但事实是,如果一个游戏里的 NPC 真的能有“意识”,可能会帮游戏公司一个大忙。因为 NPC 这个东西,开发起来真的太麻烦了。

一款有着复杂剧情大型 RPG 游戏中,需要开发无数个 NPC。例如,《荒野大镖客 2》中有超过 1000 个 NPC 角色,每个 NPC 都有自己的歌手、美术作者和配音演员,分布在 6 个章节的 100 多个任务中,耗时近 8 年、研发成本接近 5 亿美元

尽管如此,研究显示,52% 的玩家都在抱怨目前的 NPC“只会重复对话”,99% 的玩家在期待更智能的 NPC,甚至有 81% 的玩家愿意为其支付更多费用。

99% 的玩家在期待更智能的 NPC|图片来源:Inworld AI 官网

因此,Inworld 希望打造有“灵魂”的 NPC,通过用生成式 AI 来驱动 NPC 行为,使其动态地响应玩家的操作,从而提升游戏“沉浸感”,同时降低开发成本。

作为游戏界的新秀,目前,Inworld 获得的融资总额已超过 1 亿美元,公司估值也已经达到 5 亿美元,成为了AI+游戏领域资金最充足的初创公司。

可见,Inworld 的差异化竞争优势在于提供“个性化”的 AI 会话功能,而不是像 OpenAI 和 Google 等老牌厂商,提供由通用的机器学习模型驱动的 AI 对话。

虽然加入 AI 大模型后,NPC 有了更多对话可能性,但面部手势、肢体动作、情感语气也要有相应的表现,NPC 才能更流畅自然地与玩家对话。

因此,Inworld 让文字、声音及图像成为相互训练的数据,并在以 GPT-3 为核心的大语言模型的基础上,整合了多个大模型、音频模型以及 30 多个机器学习模型,打造了一个多模态开发引擎——“角色引擎”(Character Engine)

这些模型专责内容生成、信息处理、情绪感知、关系维护和行为预测等多个方面,从而支持多模式角色表达。

因此,“角色引擎”(Character Engine)打造出的AI NPC 可以模仿人类互动的深刻社会属性,表现出“复杂”而“逼真”的人类行为,可用于任何角色设计,从而帮助开发人员增强游戏性,提高玩家参与度。这也正是 Inworld 的强大之处。

“角色引擎”(Character Engine)提供多模态的 AI 角色 | 图片来源:Inworld AI 官网

事实上,“角色引擎”(Character Engine)的技术架构着眼于构建一个模拟人脑的复杂系统,由三层组成,分别是角色大脑(Character Brain)、情境网格(Contextual Mesh)和实时 AI(Real-Time AI)

角色大脑(Character Brain):这层旨在用 AI 技术赋予 NPC 近似于人类的认知、沟通和行为能力,还能让 AI NPC 从互动中学习成长,用情商处理人际关系,并具有记忆和回想能力,能够自主发起目标、执行行动并遵循自己的动机,从而推动故事发展,融入更广泛的玩家体验。

情境网格(Contextual Mesh):这层旨在通过允许开发人员为内容和安全机制、自定义知识和叙事控制设置参数,从而防止可能破坏叙事流程的 AI“幻觉”或违背游戏逻辑的互动,确保了 AI 角色在各种交互场景中的一致性和合理性

实时 AI(Real-Time AI):这层针对实时体验进行了优化,可提供可扩展的低延迟交互,实现以更快的推理速度和更低的成本实现高质量互动。

简而言之,“角色引擎”(Character Engine)的技术架构,不仅模拟了人类大脑的复杂结构,还涉及记忆处理、决策制定和情感演变的深层模拟,大大增加了玩家的“沉浸感”。

为了让用户和开发者快速构建并在游戏或应用中部署 AI 角色,Inworld 构建了 AI 虚拟角色的生成平台——Inworld Studio,还提供了给游戏开发者接入 Studio 中 NPC 的 SDK(软件开发套件)

在 Inworld Studio 创建 NPC 非常简单,无需任何代码,输入自然语言就能快速创建

用户登录后,首先需要用几句话设定好 NPC 的身份,并调整角色的个性组合,然后可以通过设置关键词,来决定该 NPC 的生活状态、背景认知、目标动机、情绪记忆等等,还可以设置具体问题进行固定对话。

轻松设定 NPC | 图片来源:Inworld AI 官网

在完成 AI 角色的创建后,可以使用与常用游戏引擎 Unity、Unreal Engine、 Roblox 等相适应的 SDK,快速实现角色与游戏场景的集成,大大提升交付速度,实现一次构建,随处部署。

开发人员和创作者可以通过 Unity 和 Unreal 来部署 Inworld AI 角色 | 图片来源:Inworld AI 官网

还值得一提的是,Inworld 生成的虚拟角色在准备正式进行交互和测试之前,会经历一个“训练”过程,可以选择通过 Inworld 的 Oculus 配套应用程序在 VR 中进行。

对此,Section 32, inf 的执行合伙人 Andy Harrison 表示,“Inworld 的 AI 平台消除了开发智能虚拟角色的复杂性,具有开启各种全新在线体验的潜力。”

目前,Inworld 采取了订阅制的商业模式,不同的定价标准取决于集成时间、超时费用、功能多样性以及定制化程度,主要采取了四种不同的标准,分别是免费、10 美元/月,50 美元/月和定制收费。

Free:无限制互动时间(不包括 Arcade)、每天 200 分钟集成互动时间、无限次数的角色创造。

Starter:无限制互动时间(包括 Arcade)、每天 1000 分钟集成互动时间、可创建多个 Workspace。

Professional:每天 5000 分钟集成互动时间、超低超时费用、可分享 Workspace、具有分析功能和 Beta 功能使用权。

Custom:高级叙事与安全控制、定制化和声音克隆、定制化集成与数据、离线模式、客户服务。

订阅服务的价格 | 图片来源:Inworld AI 官网

Inworld 的商业化路径是为小型游戏工作室和个人开发者服务;其次,与大型游戏厂商合作定制化项目,帮助他们建立和整合角色。

尽管如此,Inworld 的商业化前景目前还不明朗,面临着来自游戏引擎、游戏厂商,和其他 Chatbot 的三重竞争压力。


二、“角色大脑”背后的人

Inworld 成立于 2021 年 7 月,总部位于美国硅谷,由 Ilya Gelfenbeyn,Michael Ermolenko,Kylan Gibbs 共同创立,三人分别担任 CEO,CTO 和 CPO。

三位创始人,从左至右依次是 CTO Michael Emolenko, CEO Ilya Gelfenbeyn, CPO Kulan Gibbs  | 图片来源:Inworld AI 官网

这三位创始人都在 AI 领域有着丰富的工作经验。

Ilya Gelfenbeyn,Michael Ermolenko 之前创立了 API.AI。这家公司被 Google 收购后更名为 Dialogflow,合并到了 Google Cloud 之中,成为了市场上最受欢迎的对话式 AI 平台。Kylan Gibbs 曾在 DeepMind 担任应用生成语言模型产品的产品总监。

从过去的经验,他们发现语音、文字等单一应用的生成式 AI 市场已被苹果、Google 等大企业掌握,但很少有平台能同时做到文字、声音及图像的生成,于是,Inworld 尝试填补这个空白。

因此,Inworld 团队的目标是开发能够学习、适应并与玩家建立关系的 AI NPC,同时提供高质量的性能,并保持游戏的“沉浸感”。

事实上,Inworld 创立之初的目标是为元宇宙提供自由互动的虚拟人,但元宇宙发展缓慢,而大语言模型迅速崛起,团队看到了 LLM 与 NPC 结合的机会,便把目标调整为提供虚拟角色的“大脑”,同时希望能将技术应用到整个泛娱乐行业。

正如 Inworld 创始人之一,Ilya Gelfenbeyn 所解释的,“我们提供的是一个工具集,使开发人员能够为世界、不同类型的环境添加大脑并构建这些角色,使这些虚拟世界更加吸引人。”

除了构建 AI NPC,复刻现实生活中的“社交关系”,打造虚拟世界“生态”,也成为了 Inworld 发展的重心。

因此,Inworld 鼓励用户,创建虚拟世界的本地人口、虚拟影响者、以及可以与用户建立关系,并解锁更深入参与的数字人类。

构建真正智能的虚拟角色是复杂的,需要大量的专业化技术支撑,Inworld 目前仅自行开发了 NPC 的“大脑”,但 NPC 创建的生态系统还包括视觉、Avatar、硬件、运动等,因此 Inworld 建立了与这些系统兼容的产品,目前 3D 角色模型由 Ready Player Me 提供。

凭借独特的“优势”,创立之初,Inworld AI 就完成 720 万美元的种子轮融资,该轮融资由 Kleiner Perkins 和 CRV 共同领投,Meta 参投。

几个月后,Inworld 又受邀加入“迪斯尼孵化计划”(Disney Accelerator)。迪士尼将为其提供指导、投资资金以及进入迪士尼创意园区共享工作空间的机会,共同打造沉浸式体验的未来。

2022年8月23日,Inworld 宣布完成 5000 万美元的 A 轮融资,该轮融资由 Intel Capital 与 Section 32 领投,微软风险投资基金 M12 和 NTT DoCoMo Ventures 跟投。

图片来源:Inworld AI 官网

新的投资将主要用于研发、人员招聘、基础设施的投资,以及推出开源版本的“角色引擎”(Character Engine)

对此,Inworld AI 的联合创始人之一,Michael Ermolenko 表示,“Inworld AI 对开源的承诺证明了我们的信念,即合作推动创新。我们将与开源开发者社区合作,推动生成式 AI 的创新,提升整个游戏产业。”

目前,Inworld AI 已经为Team Miaozi(网易游戏旗下)、Niantic 8th Wall、LG UPlus(韩国第三大移动运营商)、Alpine Electronics、Skyrim、Stardew Valley 以及 Grand Theft Auto V 等提供了 AI 驱动的 NPC

更有开发商大方承认,“玩家的参与度、满意度和留存率都得到了提高。”

如今,Inworld AI 已成为开发者值得信赖的资源,开发者纷纷涌向该平台。为包括元宇宙、VR/AR、游戏等在内的沉浸式现实,创建虚拟角色,激发着新形式的游戏和媒体。

三、AI 革新游戏行业

一直以来,技术的局限性和可能性都决定了开发者所能创造的游戏世界。大型语言模型和生成式 AI 的出现,为游戏中的故事讲述和角色参与带来了无限的可能性。

Inworld AI 的联合创始人之一Kylan Gibbs 表示,“AI NPC 背后的技术将成为故事讲述、创意表达和创新游戏新时代的催化剂,未来的大部分游戏将是我们尚未想象到的游戏。”“最终,AI 技术的普及,将使游戏开发过程中的普通玩家也能参与到内容创作中来,形成玩家驱动的叙事,强化游戏循环。”

风险投资公司 Kleiner Perkins 的首席产品官 Bing Gordon 也表示,“AI 将重塑游戏玩家和游戏设计师的世界,将玩家置于幻想的中心,实现真正身临其境的世界和复杂的叙事。”

这对于游戏公司和游戏开发商来说,这将是一个巨大的机遇

从脚本对话转向玩家驱动的动态叙事,将提高游戏的沉浸感,从而提高游戏的可玩性、留存率和收入。

对此,英特尔投资公司董事总经理 Srini Ananth 也公开表示,“对沉浸式内容和体验的需求正在不断上升,这将带来蓬勃发展的创造者经济,并为个人开发者带来机遇。”

事实也的确如此。

财报显示,微软在游戏和 AI 领域的研发投入已连续多年保持增长,与此同时,竞争对手如索尼、任天堂等也在不断加强自身在游戏 AI 技术方面的研发。

2023 年 2 月,网易《逆水寒》手游已官宣实装国内首个“游戏 GPT”,其游戏内的智能 NPC 系统完全由 AI 驱动。

完美世界也相继成立了 AI 研发中心,并已将 AI 相关技术应用于游戏中的智能 NPC、场景建模、AI 绘画、AI 剧情、AI 配音等方面,《神魔大陆 2》将落地智能 NPC 等。

与此同时,Unity 也声称正在为游戏创作者构建 AI 游戏开发工具的生态系统,切入 UGC 游戏制作的市场。

不过,AI 大模型想要在游戏领域大规模落地,还需要解决昂贵的算力成本。可以说,在初期,这些巨额成本可能是阻碍智能 NPC 普及的重要原因。

除了对游戏公司和开发商的意义外,AI 的普及还将为长期支持游戏行业的芯片公司带来机会。

多年来,功能强大的芯片与游戏之间的互动,一直是 Nvidia 成功故事的一部分。

今年 5 月,英伟达更是宣布将提供定制 AI 模型代工服务——Avatar Cloud Engine(ACE)for Games。开发者可以使用该服务在其软件和游戏中搭建和部署定制化的语音、对话和动画 AI 模型。英伟达称,“该服务通过 AI 驱动的自然语言交互为 NPC 带来智能,从而改变游戏。”

最近,英伟达性能技术副总裁 John Spitzer 还公开表示,“所有开发人员都对 AI 影响游戏开发过程的方式感兴趣。他将为 NPC 的一个关键测试提供硬件支持。”

Inworld 的尝试,或许也预示着游戏行业的未来。若将来,围绕大语言模型搭建 AI NPC 系统的技术路线能够实现并跑通,游戏中的 AI NPC 真的能够与环境交互、具有记忆、不断形成社会,那么大型游戏体验,有没有可能不再是巨头的“自留地”,真正实现游戏的“创造平权”?

本文来自微信公众号:极客公园 (ID:geekpark),作者:美漪,编辑:靖宇

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年1月8日
Next 2024年1月8日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日