2024年,会迎来AI原生应用的浪潮?

一、肯定会迎来AI原生应用的浪潮

之前,文章更多是从图灵测试2.0和智能原生到底应该定义成什么样子来做解读,这次我们换个方法,举一个发生在“琢磨事”这个号对应的群里的具体且真实的例子。

上面说的结构大概率和之前说的Agent结构80%雷同:

二、和过去的应用对比哪里不同了

从技术角度看,基于过去的技术,不用大模型也不是完全不能做,尤其是对于做爬虫的兄弟。

五、图灵测试2.0

原始的图灵测试是这样:

这是一个纯粹的智能测试,本质是追求在封闭系统里面的逻辑自洽性。

如果说过去的文章更多的是基于过去十年产业经验对未来做的推断,那当产品收入达到某个量级后就相当于是推断得到了检验。这时候想到的反倒不是什么未来愿景,而是那句老话:星星之火必将燎原。就好像看到了许许多多的火种,潜藏于不太容易看到的层次上,一闪一闪冒着微弱的火光。

我对AI的信心从来没像这一刻这么强。这不是激进,能和这篇文章要一起看的是《为什么说AI现在还不行》,看着有点矛盾,但其实是一个事情的正反两面,统一于尺度判断。

一、肯定会迎来AI原生应用的浪潮

之前,文章更多是从图灵测试2.0和智能原生到底应该定义成什么样子来做解读,这次我们换个方法,举一个发生在“琢磨事”这个号对应的群里的具体且真实的例子。很不阳光,但仔细想想却很有意思。

背景很简单:我有个读者群,群并没什么特别的商业化目的,纯粹聚集了些对AI感兴趣的同学日常聊聊天,比如做些文章中观点和产业趋势的探讨。入群的也都是做这个行业并且对AI有点想法的同学。

然后有趣的事情发生了。

不知道什么时候群里混入了一些特别的人。

我个人作为群主,一般大家转发到群里的文章都会看看,时间一长就发现有几个同学不对劲,他们不定期发文章,可总的频率很高,每次发的文章标题很火,但内容很稀薄,也很短,内容中间必然带广告。除了发文章之外保持绝对沉默,从不发言。

这群是只要不骂街,谁爱说点啥就说点啥的风格,所以最初我也不怎么想理会。

可在某个瞬间,我突然意识到这不是真人,肯定都是些机器人。

从这个角度往回解读,就发现虽然套路有点无赖,但确实是一个很小的AI原生应用。纯血的。

我们想象下它后面的结构。

必然有一个联通真实世界捕捉热点的感知部分,从中选出对应的选题。

再针对选题自动生成内容。

生成内容的同时用爬虫爬取对应的群,想办法加进去(反馈环节)。这时候200人以下的群只要扫二维码就能加入,所以估计是重点关注对象。

进一步还要标识对应的群的属性,然后和文章的内容做匹配,再之后才是一定频率的不定期发送。

这么个应用,核心有三个部分:一部分对大模型进行调度,负责扫描和生产内容;一部分是日常任务,比如发文的原则;一部分同现实进行接轨等。

对现实进行感知,基于大模型进行内容生产,然后内容反馈回现实的世界,并在浏览的环节嵌入盈利环节。

典型新式智能原生应用。就是你很难想到会用这么个形式冒出来。

上面说的结构大概率和之前说的Agent结构80%雷同:

二、和过去的应用对比哪里不同了

从技术角度看,基于过去的技术,不用大模型也不是完全不能做,尤其是对于做爬虫的兄弟。但过去很难这么做出钱来(即使现在我也不知道这玩意能不能赚到钱,很想找到这帮哥们问问数,就当骚扰我好几天的成本了)

原因特别简单:当AI不足够成熟,你其实做不出那么多订阅号文章,并且还都匹配实时热点。

所以说这种应用是真的新类别的应用(当然也可以叫Agent)。它从感知到生产到盈利全场景是闭环的。

从我们经常说的图灵测试2.0的视角就是:它能够在一个完整商业场景上闭环,不需要人的介入,并且近似全自动的行动。行动的结果可以创造收入。

一旦这种场景成立,那这种应用就可以拿走对应那个场景下的,智能边界内的价值。

做上面这类应用的同学,未必会像我这做战略出身的人,天天琢磨套路,更可能就是觉得这事能干就干了。现在还少,但当广大产品和程序员同学了解到打造这么个东西的成本可能和旅游一次差不多的时候,估计做的人会越来越多。

可这种敏锐感知不是没限度的,通常最终还是会贴着套路走(经常说的从特殊到一般,一般再到特殊的过程)

上面这个例子正好契合了之前提到的套路的关键点:

纯粹数字空间,幻觉影响不大,通过图灵测试2.0等。

三、智能原生应用不是AIGC工具

还是要区分下这类应用和纯粹内容生成的工具。

虽然两者都顶着AI的帽子,但却有本质性差异。

AIGC工具本质上算法驱动,只有极少数的人在天时地利具备的情况下才可能。商业模式极其难以跑通。

智能原生应用的关键则落在应用上,是综合了技术后的产品力,这种产品力要能打破最后那1毫米的障碍。其实大多数人都能做并跑出现金流。这事我们并不陌生,当年的APP不就这样么。

过去是英国人在一战的时候发明了坦克,但坦克的真正发扬光大其实要等待德国人弄出来闪电战。

AIGC工具和智能原生应用的差别与此类似。

AIGC工具是坦克,而每个智能原生应用都是一场独特的战役。

对于AIGC工具,模型的独特性是关键。对于智能原生应用,深研模型本身可能反倒是有害,更需要往外看,在技术和场景的结合处定位准。

顺道一说,智能原生应用也不是GPTs。

加上GPTs的chatGPT自己其实就是一个超级智能原生应用,覆盖最为通用的场景。

这就是智能原生应用所隐喻的广阔空间。

几乎每个领域都会出现这类更加智能和自动的智能原生应用。所以现在刚刚露头的各种尝试才是星星之火。

并且随着大模型能力的持续提高,火苗只可能越来越大,而范围会越来越广。

会从上面那个极其无聊的场景扩展到各个方面。而当下差不多就是Windows应用的1995年,移动互联网的2007年。

真做起来还是很费劲,但能做了。

对于智能原生应用而言,第一关键的是图灵测试2.0

虽然前面提到过几次,这里还是要再说下,因为它实在像风筝的那根线一样,决定了不飘不行、但飘得太远也不行的尺度。

四、什么是智能原生应用和图灵测试

智能原生应用不飘是不行的,因为过去就没有这玩意,不飘,你就想象不出来产品需要定义成什么样子。

太飘也不行,太飘有点像本来想开饭店,然后发现路不行,决定先修路然后再开饭店(大部分做智能原生应用的会很像开饭店的那个,OpenAI这些才是修路的)

这样一来就需要一个中间的尺度。

这个尺度决定生死成败,重要性排第一。

第一决定了在特定时间长短事到底行不行,第二决定了矿究竟有多大。

还是前面那例子,那个场景其实能通过图灵测试2.0,然后矿究竟大不大取决于你内容生成的质量。

我们从应用这个角度重新描述一下图灵测试2.0。

五、图灵测试2.0

原始的图灵测试是这样:

这是一个纯粹的智能测试,本质是追求在封闭系统里面的逻辑自洽性。

现在我们把Agent类似的概念加入这个测试:

这就是图灵测试2.0。和1.0相比核心差异是什么呢?

去幻觉,有边界。

1.0是一个凌空的系统,具有合理性的幻觉其实有助于通过测试,但2.0不行,测试者同时从真实场景和被测试者接受反馈;其次就是测试边界的限定要求更高的智能深度,这很像赵括学兵法:能说得天花乱坠,但不一定能打仗;会打仗不一定兵法上什么都懂,但水战、陆战、马战好歹得会一个。

还是上面那个例子,这个例子下1.0和2.0共通的部分是生成的内容人要能看,2.0独有的部分是你生成的内容得是符合基础事实的,也要有点特色和风格,因为你的受众不是就看你的文章,也看别人的文章,纯胡扯广告估计点击率会低。

如果纯粹胡扯被认为是个人,从技术角度可以算通过1.0测试,但从商业角度则没那么有价值,转化率就差。

六、自己对自己的实现

能否通过图灵测试2.0的判断,与AIGC能力其实是绝配。

前者定义了技术在商业场景下的价值,而AIGC能力其实降低了实现它的成本。

从这个角度看,技术内定了自己的实现,这种必然性,不管从因果角度还是从偶然的角度解读都是很有趣的事情。

七、小结

即使方向对,也有能力,真做起来也会万分痛苦,这会像在无人区里奔跑。但这也正是价值所在,当所有的隐性知识都变成显性知识之后,绝大部分商业价值会消失,会变成一个角力的游戏,那就无趣得很了。

本文来自微信公众号:琢磨事(ID:zuomoshi),作者:老李话一三

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年1月8日
Next 2024年1月8日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日