大智能时代的产业再分工:“无数据,不智能”可以休矣

据此,本文提出大数据时代向大智能时代嬗变的论断,包括以下三方面命题:

首先,大模型的本质是智能的大规模集中供给,是智能的基础设施化。

大模型的本质是智能的大规模集中供给

生成式AI在诸多方面不同于传统AI。

智能手机、智能网络、智能城市、智能电网等词汇描述的是给定基础设施的智能化,指对异质性基础设施(手机、网络、城市、电网等)规模经济的个性化调度和外部性的多样化开发。

大模型推动数据与智能的解耦

笔者把这个新高潮命名为“大智能时代”,以区别于大数据时代。

炙手可热的生成式AI或大模型,将如何影响商业史走向?一个可能的思考角度是:大模型的入局将影响整个数字化生产力的分工结构。据此,本文提出大数据时代向大智能时代嬗变的论断,包括以下三方面命题:

首先,大模型的本质是智能的大规模集中供给,是智能的基础设施化;其次,这一趋势推动数据与智能的解耦,使得没有大数据的企业也可接入高质量智能;最后,由此带来的智能红利对中小企业尤为有利,或成为经济结构性增长的重要来源。以上挑战了大数据时代的思维范式,为相关人士理解数字化变局提供了一个有趣的思考起点。

大模型的本质是智能的大规模集中供给

生成式AI在诸多方面不同于传统AI。一方面,顾名思义,生成式AI擅长生成新内容,而传统AI局限于解释现有数据或者做出预测。投资机构a16z的Martin Casado认为:“微芯片将计算的边际成本降到了零,互联网将分发的边际成本降到了零,大模型则将创作的边际成本降到零。”

另一方面,基于自然语言的人机交互界面,生成式AI具备了技术民主化的特质。正如麦肯锡的Lareina Lee所说:“用户不需要任何数据科学或机器学习专业知识,就能有效地利用生成式AI完成工作。这就好比大型机只有技术专家才会使用,而个人电脑人人皆可掌握。”

然而,本文强调生成式AI灵活应对多种非预设任务的能力,区别于需根据预设任务进行专门设计的传统AI。要理解这一点,不妨考虑传统AI公司面临的商业模式困境。以AI四小龙为代表的“传统”AI公司尽管技术投入巨大,但难以摆脱为企业客户提供定制服务的低扩展性模式。

这是因为,要实现AI算法与特定任务情景的匹配,技术供应方不得不提供大量低自动化程度的工程服务,既拉低利润率又降低可扩展性。相比之下,体验过的人士不难认同,大模型好似百科全书,几乎所有领域都应对自如。尽管在专业领域需要模型“微调”,但正如“微调”二字所暗示的,其定制化程度远低于传统AI项目,预示着更好的经济性。

能力通用性和其他两个经济属性一起,成就了大模型的基础设施地位。一方面,大模型具备规模经济。众所周知,极度昂贵的训练成本,是大模型为通用性所付出的代价。其规模经济性体现在,模型参数规模超越某临界值后,其智能表现随参数规模增长呈非线性增长。作为这一规律的提出者和坚定信仰者,OpenAI在扩大模型参数规模的路上蒙眼狂奔。

另一方面,大模型具备生成性(generativity)。大模型提供者自身并不能充分发挥其价值,但其上可以“长出”各类面向真实用例的应用以实现难以预估的长尾价值。

大模型的本质是智能的集中化供给。作为基础设施,“集中供给”并不新鲜,新鲜的是“智能的集中供给”。我们需要区分基础设施的智能化和智能的基础设施化。

智能手机、智能网络、智能城市、智能电网等词汇描述的是给定基础设施的智能化,指对异质性基础设施(手机、网络、城市、电网等)规模经济的个性化调度和外部性的多样化开发。智能的基础设施化则是指智能的生产和供给本身具备了基础设施属性。

智能似乎天然与某个聪明的、不可复制的、充满创意的大脑相关,怎么可能基础设施化呢?如果它真的基础设施化了,又意味着什么呢?尽管这似乎是人类历史上第一次,但历史告诉我们,每次基础设施集中化过程都深刻地影响当时的生产力与生产关系。正如电力的集中化生产和大规模供给推动了第二次工业革命,智能的大规模集中供给有望把数字化时代推向新高潮。

大模型推动数据与智能的解耦

笔者把这个新高潮命名为“大智能时代”,以区别于大数据时代。大数据时代,投资人通常问一家公司,你有数据吗?即便有人意识到有数据的公司不一定能捕获其价值,但几乎所有人都认为没有数据一定不能够从智能中获益。以这种数据-智能紧耦合为底色的商业思维深刻地影响着商业实践。相关概念包括曾鸣教授提出的“数据智能”、脱胎自亚马逊飞轮效应的“数据飞轮”以及移植自平台经济学的“数据网络效应”

这些概念通常都会援引Google作为案例。Google经常被美国的反垄断机构约谈,一个原因是所谓的数据网络效应:搜索引擎的市场份额越大,用户数据就越多,而数据训练出来的机器算法就越来越智能,进而进一步提升其用户体验,导致更大的市场份额。曾鸣教授更是基于阿里巴巴的类似经验,提炼出以“数据智能”为基石的“智能商业”方法论。

Google首席经济学家Hal Varian则认为,Google的地位不是来自数据资源本身,而应归功于其卓越的数据科学与工程能力更好地释放了数据资源的价值。能力优势和数据网络效应都能带来竞争优势和份额,但前者是稀缺性创造的李嘉图租,后者是市场地位创造的垄断租。

他的潜台词是,你不能培养出卓越能力是你的事儿,不要给我扣垄断的帽子。不少人或嗤之以鼻,认为是Hal屁股决定脑袋。但OpenAI的异军突起表明,他可能是对的。ChatGPT对Google搜索的挑战并不依靠数据优势。GPT3.0之前的所有训练数据都来公开数据,但不妨碍OpenAI在大模型能力方面走在Google前面,威胁到其搜索业务。

真正重要的不是OpenAI比Google厉害,而是它这么厉害还能对外开放,而非像Google那样独家用于自家服务。当然,这方面更厉害的是Meta(即Facebook),开源了模型的参数且免费支持商用。大模型好似中央电厂,它持续提炼几乎人类的所有知识(数据),然后对大众输出,使得智能不需要在低水平重复开发。这挑战了大数据时代“无数据,不智能”的圭臬——企业的智能商业不一定以自身数据整合为前提。基于大模型的底层参数,企业只需要小数据去微调这个模型,便有可能开展“智能商业”。

值得强调的是,“数据与智能的解耦”并不意味着数据不重要,而意味着数据重要性在产业不同环节并非均匀分布。数据作为智能原料的地位无可撼动。变化在于,大模型使用这种原料上的效率远超其他,以至于有志于“智能商业”的企业构建自身数据飞轮可能丧失经济性。

数据飞轮或者数据网络效应的逻辑仍然成立,但问题是:当所有企业都试图转起自己的数据飞轮,凭什么是你脱颖而出呢?国家电网能够稳定输出电力时,为什么要在工厂旁边自建一个小发电厂呢?当然可能存在备份或补充的需要,但那是另一个逻辑。

释放智能红利,驱动经济结构性增长

数据与智能解耦带来的经济性被我称为智能红利。Martin所强调的创造内容边际成本为0是消费者侧的红利。比较一下传统的内容创造过程和基于生成式AI的内容创造过程,便不难理解。然而,经济发展主要靠企业生产率的提升。

智能红利在这方面体现在:企业原本需要精心构建、维护自身数据供应链才能实现 “智能商业”所需的“数据智能”,而智能大规模的集中供给可能大大节省这一过程所需的投资、时间、精力,使得企业可以专注于业务创新。

上述智能红利是促进数字经济结构性增长的利器。中国经济发展面临诸多挑战,而其持续增长的一个潜在来源是挖掘区域、行业发展不均背后的结构性潜力。众所周知,小微企业受制于较为落后的IT基础设施、孱弱的数据基础和有限的预算,数字化转型进程落后于大中型企业。那么,要实现数字经济结构性增长,有必要思考如何弥补上述企业侧的数字化鸿沟。

相对于其他数字化技术,生成式AI在实现这一目标方面得天独厚。一方面,生成式AI应用对企业自身的数字化准备程度要求相对较低。如果消费者都能使用,有什么理由小微企业不能呢?另一方面,在采纳生成式AI应用方面,小微企业具有“光脚的不怕穿鞋的”优势。诸多阻碍大中型企业采纳生成式AI的因素(如数据泄密)可能对小微企业影响甚微。

并且,大中型企业需要解决新旧IT之间融合的问题,小微企业也没有这方面的负担。总之,智能红利不是大中型企业的专属,而是小微企业能够站在同一智能起跑线上的历史性机遇。

接入生成式AI应用有两种方式。一是企业首先微调出自己独有的大模型,然后在私有或混合环境下为自身各类应用赋能;二是直接利用现有的大模型提供商的API(如基于GPT)开发生成式AI应用,供自己使用或者作为服务售卖给客户。两者都受益于智能的集中供给,但小微企业更可能通过后者获取智能红利,其中也蕴含着应用开发者的创业机遇。

结语

生成式AI和大模型的诞生纯属偶然。它好似从天而降的陨石,蛮不讲理地改变了原有产业格局和历史脉络。笔者作为数字化产业的参与者、观察者和研究者,勾勒了改变发生的一种可能。按照这一逻辑往下推演,可以得到对当下一些热门话题的不同观点,留待后续。

本文来自微信公众号:经济观察报 (ID:eeo-com-cn),作者:侯宏(北京大学国家发展研究院助理教授)

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年10月30日
下一篇 2023年10月30日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日