大模型不是巨头的宠物

 
在ChatGPT走红之前,国内只有少量的公司在从事基础大模型研发工作,因为大模型的技术以及服务能力还未被市场广泛接受,这些公司主要专注于技术研发和服务能力积累上。
 
在国内,真正在技术能力上有底气的基础大模型,都是在ChatGPT走红之前就开始训练了,那时候大模型还没有被大家熟知,很多人看不懂也不看好大模型,而坚持投入大模型的公司都对新技术非常笃定。

百模大战愈演愈烈,但很多从业者对大模型的疑问却越来越多。

 

在基础大模型领域,腾讯、阿里、百度等多个互联网巨头涌入,且阿里、百度、科大讯飞等大厂在最近一个月相继发布了最新版本的大模型产品,技术能力也有了较大提升;创业公司在迭代新版本的同时,还在“疯狂”融资,智谱AI于近日宣布今年已累计获得25亿元融资,成立近半年的百川智能已获3.5亿美元融资,这些创业公司的投资方中,也不乏腾讯、阿里、美团等互联网巨头。

 

中国真的需要这么多基础大模型吗?各家基础大模型公司都在疯狂“卷”技术参数,但市场到底需要什么样的大模型?在热闹且混乱的战局下,这些问题被越来越多的人提出来。

 

回答这个问题,得先搞清楚基础大模型在中国市场如何赚钱。虽然绝大部分人对大模型的感知是聊天机器人,也有不少用户在搜索信息、整理文档时开始使用这些产品,但相关企业难以从这些C端产品中赚到钱,甚至用户规模越大企业亏损越多。当下,基础大模型商业化最务实的方向还是在B端,服务于零售、金融、制造等领域企业降本提效,才能获得稳定的商业收益。

 

企业对基础大模型的需求无非3种:直接调取大模型API,获取相关大模型能力;基于大模型,贴合实际业务进行二次开发;基于大模型开发AI应用。这些需求考验基础大模型平台的技术能力,更考验其企业服务能力。

 

从服务能力上看,大模型初创公司和互联网巨头公司都要从零起步,没有人拥有先天优势。能更快洞察到客户需求,并提供稳定靠谱服务的平台才能脱颖而出。

 

大模型不是“吹”出来的

 

以ChatGPT走红为分界点,国内大模型的发展经历了冰火两重天。

 

在ChatGPT走红之前,国内只有少量的公司在从事基础大模型研发工作,因为大模型的技术以及服务能力还未被市场广泛接受,这些公司主要专注于技术研发和服务能力积累上。当ChatGPT走红之后,大量投资者和从业者涌入,大模型成了新风口。

 

市场火爆就容易催生投机者,他们不是深入钻研技术,而是讲故事、炒作概念,不管技术和服务能力如何,先把故事讲得天花乱坠,并以此获得资本市场和客户的认可。一位大模型从业者层打趣地对虎嗅表示,国内很多大模型公司都称自己和GPT-4的差距只有几个月,这是因为他们都在已经开源GPT-2基础之上做了一些训练就出来讲故事。

 

实际上,大模型的技术能力的进化并不是随便训练几个月就能实现的,因为这是一个复杂的系统,规模大非常重要,规模不达到一定程度无法产生更智能的进化。而提升大模型的训练规模,需要花费大量时间反复调试。调试过大模型训练参数的技术人员都理解这种困难:没有人告诉你应该怎么做,只能自己摸索,这个过程中会出现各种各样意想不到的状况,都需要花时间解决。

 

在国内,真正在技术能力上有底气的基础大模型,都是在ChatGPT走红之前就开始训练了,那时候大模型还没有被大家熟知,很多人看不懂也不看好大模型,而坚持投入大模型的公司都对新技术非常笃定。

 

比如,智源研究院在2020年发起首个超大规模预训练模型研究项目“悟道”,其2.0版本一度成为全球最大的万亿级模型。今年升级之后,“悟道” 涵盖语言、视觉、多模态等基础大模型,并已进入全面开源的阶段。

 

智谱AI同样在2020年就研发起了GLM预训练架构,还训练出了一个百亿规模参数的模型GLM-10B。10月27日,智谱AI发布了自研第三代对话大模型 ChatGLM3,其性能、推理能力、上下文容量等都相较于上一代有较大提升。与 ChatGLM2相比,ChatGLM3在44个中英文公开数据集测试中,均排在国内同尺寸模型首位。其中,MMLU提升36%、CEval提升33%、GSM8K提升179% 、BBH提升126%。

 

另外,在功能上,智谱AI 发布的多个国产自研大模型(ChatGLM、CodeGeeX、WebGLM、CogVLM等) 也是目前国内对标 OpenAI 系列大模型最完善的,且在生成式AI助手“智谱清言“上都是适用的。

这些最早一批做大模型的公司和炒概念、追风口的公司有本质区别。在大模型技术还没有爆火、市场还没有那么卷的时候,他们就投身其中,是因为把基础大模型技术价值和生意逻辑都想明白了。这种差别在大模型走红之后也非常明显,很多公司为了流量和话题度去涉足C端产品,而像智谱AI等最早一批涉足大模型的公司更聚焦在企业服务领域,所有的研发能力和服务能力也都围绕这个思路去布局,踏踏实实做积累,朝着为客户创造价值的方向去发展。

 

大模型的复杂性决定了技术和服务能力上积累时间更长的企业具备更强的优势。当市场上越来越多人意识到大模型大模型的复杂性,以及大模型进化所需要的时间,那些靠讲故事炒概念的大模型公司,生存空间将会越来越小,而认真积累技术和服务能力的公司才能经受住第一波竞争的考验。

 

没有繁荣生态的大模型,没有未来

                         

在大模型商业化的过程中,谁能在具备社会刚需的应用场景落地,谁就能最先形成自我造血的良性循环。

 

通用大模型具有更广泛的的应用范围,但在解决垂直领域特定问题时并不够专业。垂直大模型解特定领域问题的能力更强,但服务范围非常受限,这导致很多垂直大模型很难实现成本和商业收益的平衡,发展空间有限。

 

大模型应用的最终落点是要为生活和生产所用,能解决工作、生活中的实际问题,提升工作效率和生产力。综合目前通用大模型和垂直大模型的优劣势,当下大模型商业化过程中一个更为合适的思路是,通用大模型作为基座,把技术和服务能力开源给零售、金融、制造等领域,通用大模型和相关领域企业一起合作,共建应用场景。

 

受制于数据、算力、场景等限制,真正能跑通开源的大模型并不会太多。同时,作为基础技术底座,大模型的角色和PC、手机操作系统非常相似,将呈现“大树底下,寸草不生”的竞争格局,即一两个技术底座占据行业统治地位,所有的应用开发者都要基于这一两个技术底座开发。如果基座大模型不能形成繁荣的生态,就没有可持续发展的能力。

 

从PC、手机操作系统的发展历史来看,先发优势非常重要。当Windows统治PC市场,iOS和Android在手机领域二分天下之后,其他操作系统很难再有翻盘的空间。

 

大模型领域同样呈现一样的趋势。大模型将开启一个繁荣的AI应用生态,个人及企业的数据、能力或应用,都能快速变成AI插件,增强大模型的能力,也将让大模型更实用易用。

 

目前,百度、科大讯飞等巨头公司已经致力于生态建设,百度智能云千帆大模型平台2.0月活企业数近万家,覆盖了金融、教育、制造、能源、政务、交通等多个行业的400多个场景,科大讯飞的星火大模型平台开发者规模已超70万个。

 

一些在大模型领域积累较长时间的创业公司,也最早吃到了螃蟹。智谱AI目前客户数量超过1000家,共建生态的合作伙伴超100家,覆盖传媒、SaaS、教育、办公等多个场景。比如,WPS智能文档生成演示文稿内容、撰写新闻稿等能力背后,就有智谱AI的技术能力作为支撑。

在各个大模型平台的生态竞争中,最考验平台的就是其带给合作伙伴的价值以及和合作伙伴共同成长的能力。就以办公场景来说,演示文稿内容生成、文章内容撰写、风格改写对大模型平台的精度、推理等能力要求非常高,只有达到一定技术水平的大模型才有能力支撑这些应用,同时大模型平台还需要根据用户在实际应用中的反馈纠错迭代。

 

无论是巨头公司还是创业公司,哪怕资金和资源实力再强,都要从零开始一步一个脚印的积累迭代。所以,大模型平台在构建生态过程中,时间优势显得非常重要。这也是具有先发优势的创业公司和资金资源能力更强的互联网大厂能够旗鼓相当的原因。

 

百模大战,谁更适合中国市场?

 

虽然百模大战的战局热闹且混乱,但背后的竞争方向已非常清晰,技术和服务能力以及大模型平台构建生态的能力直接决定竞争的走向。

 

这些能力的构建需要时间积累,很难一蹴而就,但仅仅有时间的积累也是不够的。先发优势,除了早行动带来的时间差之外,还有精准洞察到市场需求的能力,即沿着一条正确的战略坚定而快速地行动,战略摇摆以及走弯路很容易把早行动积累的时间优势全部损耗掉。

 

当越来越多大模型平台都把重心转移到生态建设上之后,平台的战略定力和执行力在生态的竞争将变得越来越重要,谁能更高效地完成各个领域和场景从0到1的积累,谁的优势就更加明显。而当少数几家平台完成向超级平台的质变之后,竞争格局也就基本确定下来。

 

在大而复杂的国内市场,B端服务企业很容易出现战略摇摆以及走弯路的情况。一方面,国内市场企业所处的区域、经营规模不同,对大模型给企业智能化价值的认知有较大差异,愿意投入的资源和付出的成本也各不相同,较难找到一个标准化的解决方案;另一方面,不同领域企业对大模型能力的需求不同,甚至同一领域的不同企业对大模型的需求也不尽相同,在不同需求的撕扯下,大模型公司很容易从基础技术底座变成项目外包公司,而很难成为真正的超级平台。

 

在这样的环境下,相比于OpenAI的商业化方案,国内大模型平台的商业化落地需要更加注重细节。在一些平台的商业化思路上,我们看到了这样的趋势。

 

比如,除了常见的开放平台API服务以外,智谱AI除了还提供了云端私有化和本地私有化两种方案。云端私有化可协助企业基于私有数据打造专属大模型,拥有更强的安全性,而本地私有化是中国市场独有的方案,除了提供更加强大的模型,还提供完整的模型矩阵,以满足各种场景和需求。

针对本文生成、智能客服、数据标注等不同的客户需求以及大中小型企业的需求规模,智谱AI都提供了不同的解决方案,客户可根据自己的需求自由组合。这种更细节更灵活的服务模式,也是基于长期对中国市场的精准洞察而来的。

 

面对外部环境的不确定性,智谱AI还启动了国产芯片适配计划,和国内硬件厂商、芯片厂商合作,面对不同类型的用户不同类型的芯片提供不同等级的认证和测试,让大模型服务更安全可靠。当前,ChatGLM系列已支持10余种国产硬件生态,包括昇腾、神威超算、海光DCU、海飞科、沐曦曦云、算能科技、天数智芯、寒武纪、摩尔线程、百度昆仑芯、灵汐科技、长城超云,同步发布的可手机部署的端测模型ChatGLM3-1.5B和3B支持小米、vivo、三星等多种手机以及车载平台。

 

在百模大战的战局越是激烈,这些看似不起眼的细节就越重要,因为这些细节决定了外部合作伙伴的认可程度,也关系着大模型在不同场景下的落地速度。单纯发布一个大模型的门槛,没有市场想象那么高,但能够拥有高质量数据场景,才能持续迭代,形成竞争壁垒,而高质量数据场景的关键就在于外部合作伙伴——让更多合作伙伴愿意选择的平台,更容易跑通这个商业循环。

 

在这场竞争中,很多从业者认为赢家一定是资源和资金能力更强的巨头公司,其实不然。创业公司和巨头公司都需要身体力行,深耕细节,没有任何捷径。至于资金,并不是决定战局的根本,因为有核心竞争力的创业公司也并不会缺钱——即使智谱AI目前已获得大模型创业公司最高额的融资,还有更多新的投资者想入局。

 

如果换一个角度思考,其实对于谁是更适合中国企业的基座大模型,资本市场已经在用脚投票了。

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年10月28日
下一篇 2023年10月28日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日