开源的Meta,才是整个AI圈的希望?

与OpenAI拒绝Open他们的算法、路线、论文相反,Meta选择Open到底。

字节跳动在2023年12月被OpenAI停用账户,因为它在调用OpenAI的API开发自身大语言模型的时候,违反了OpenAI的服务条款。

人工智能公司开放传神(OpenCSG)创始人、CEO陈冉认为,开源的市场空间远比闭源大,但未来一定是开源和闭源两条路同时走,“OpenAI开源不开源其实不重要了。

OpenAI正变得越来越封闭,但它的对手Meta(前Facebook),却通过开源赢得不少赞誉。

1月18日,马克·扎克伯格宣布,Meta正在计划构建自己的AGI(通用人工智能),将在绝大多数领域中都达到或超越人类智能水平。同时他强调,保证会向大众开放这一技术,以便人人都能从中获益。

与OpenAI拒绝Open他们的算法、路线、论文相反,Meta选择Open到底。此前震惊业内的大模型LLaMA,大获好评的LLaMA 2,以及正在研发的LLaMA 3,都是开源的。它们成为很多AI公司研究、学习甚至抄袭的对象。

通过开源这一手段,Meta在某种程度上打破了大模型的垄断,成为OpenAI和谷歌双雄相争之外的第三股力量。一些人将扎克伯格视为大模型时代的英雄,有人在扎克伯格的帖子下留言,建议Meta更名为OpenAI,OpenAI更名为CloseAI。

事实上,Meta过去开源了它研发的几乎所有基础设施,比如用于Web和APP开发框架的React,以及机器学习框架PyTorch,而ChatGPT就是基于PyTorch开发的,OpenAI也运行在PyTorch上。按照Meta首席科学家杨立昆的话说,除谷歌外,全世界都运行在PyTorch上,因为谷歌有自己的系统。

只是,这些东西在过去都被Meta的负面新闻掩盖了——干预选举进程、提供虚假信息、危害青少年健康,在硅谷,骂Facebook曾是一种“政治正确”, 人们认为这是一家价值观败坏的公司。

如今风评大变,Meta一时仿佛成了整个AI圈的希望,它的股价在2023年上涨了160%,在美国前五大科技巨头中涨幅仅次于英伟达,最近重返万亿美元市值,股价创新高。而曾以挑战者姿态崛起的OpenAI,前不久刚经历了一场宫斗,散发出越来越浓的铜臭味。

OpenAI向左,Meta往右,两家原本没有太多交集的公司,正走出截然不同的路。

一、OpenAI,走向封闭

在讨论这两家公司的境况之前,我们先把时间拉回到十年前。

2013年,有一家叫DeepMind的AI公司,同时引起了谷歌和Facebook(当时还没更名为Meta)的注意。

当时这家公司刚崭露头角,嗅觉敏锐的谷歌和Facebook都想收购它。最终,谷歌在竞购中胜出,2014年1月将DeepMind收入囊中。三年后,DeepMind开发的AI机器人AlphaGo,以4:1击败了韩国围棋冠军李世石,一举成名。

谷歌收购DeepMind时,有两个人心里很不是滋味。一个是扎克伯格,他当时已经意识到AI的巨大前景;另一个是马斯克,他不想AI被谷歌这样的大公司控制。

于是,扎克伯格决定自己做,他花重金从纽约大学请来了计算机科学领域的权威人物杨立昆,启动FAIR项目,在Facebook成立了AI实验室。马斯克则和奥尔特曼成立了OpenAI,用来对抗谷歌。

从当时的情形来看,扎克伯格是为了自己的公司,马斯克是为了全人类。马斯克认为,由大公司控制的少量AI系统很不安全,唯一的办法是让尽可能多的人都拥有AI。所以OpenAI一开始就定位开源,是一个非营利性的机构。

马斯克当时说:“我们希望有一种类似于Linux版本的AI,不受任何个人或公司的控制。”

一个为私,一个为公,两家公司一开始就选了不同的路。

马斯克提到的Linux,是一款免费开源的操作系统。在互联网早期,计算机刚开始普及时,可用的操作系统不多,要么源代码被软件厂商严格保密,要么收取很高昂的费用。一个欧洲大学生开发出Linux操作系统的雏形,然后免费对外公开了自己的代码。

由于开源,全球程序员都加入进来改进代码,最终创造了Linux操作系统,且使用完全免费。这大大加速了计算机的普及。我们今天熟知的安卓系统,就是基于Linux内核,全球大部分手机都跑在这个系统上。

马斯克的想法很简单,AI时代也需要有这样一个开源开放的操作系统,市场不能让巨头独占。

OpenAI的启动资金来源于一批科技大佬捐赠,它一开始的确是按开源的路径走的,2019年发布的GPT-2,就是一个开源大模型,当年还有人用GPT-2为《权利的游戏》改写剧本结尾。

但也是在GPT-2发布之后,OpenAI逐渐走向封闭。它随后成立营利性子公司,接受了微软的数十亿美元投资。

在那之后,2020年发布的GPT-3,2022年升级的GPT-3.5,以及2023年3月发布的GPT-4,都是闭源模型,一开始OpenAI还公布论文,到后来连模型具体参数都不再公布。

而从整个大模型行业的竞争格局来看,“OpenAI-微软”“DeepMind-谷歌”的双巨头组合格局正式形成。

马斯克对此非常不满。他说,OpenAI设立时是一家开源公司,现在变成了一个闭源、受微软控制的逐利公司。这根本不是他想要的。

这期间Meta没闲着。除了折腾元宇宙,Meta的AI团队一直在研究大语言模型,并发布了一些开源项目。大家各做各的,互不干涉。

在OpenAI发布ChatGPT的几周前,Meta发布了一个类似的聊天机器人Galactica,专门用于撰写科学论文。谁知道这个产品不仅没引起轰动,还招来一片骂声,网友痛斥它会破坏科学出版。以至于Meta的人取消了演示,觉都睡不着。

当时人们关心的是Meta的元宇宙项目是不是快凉了,裁员裁到哪了,没人关心它的AI做得咋样。至于OpenAI,大家觉得它代表新势力,对它更加包容。

按照杨立昆的说法,两周后ChatGPT问世,被视为救世主降临。随后的很长时间里,OpenAI都是全球科技界的当红炸子鸡,登上神坛夺走了所有目光。人们津津乐道于,OpenAI是如何冲破谷歌的封锁,对巨头形成压制。

在崇尚个人英雄主义的美国,创业新秀挑战旧势力的剧本,向来充满话题性。于是大模型头部选手的竞争,变成了OpenAI和谷歌的双雄争霸。

但一向好强的扎克伯格不会袖手旁观。Meta秘密研发的LLaMA大模型,已经箭在弦上。

二、Meta才是全村的希望?

2023年2月,ChatGPT发布之后3个月,LLaMA的第一个版本开源,一开始这个模型只能用作研究。7月,升级之后的LLaMA 2支持免费商用。Meta把模型训练数据、训练方法、数据标注等大量细节都公布了,起始代码全部开源。

LLaMA 2性能非常突出,超过了所有的开源大模型。有人发现,其最大参数的版本比GPT-3参数量小,但效果更好。

曾经跟着马斯克从OpenAI跳到特斯拉,后来又被OpenAI挖回去的科学家Andrej Karpathy,将LLaMA 2的发布视为人工智能和大模型发展过程中的重要一天,因为这“是任何人都可以拿到模型权重的最强大语言模型。”

一时间,整个AI圈对Meta刮目相看。当一批巨头公司掀起大模型军备竞赛,试图通过技术封闭实现市场垄断时,Meta用LLaMA撕开了一条口子。OpenAI没做的事,Meta做到了。

英诺天使基金合伙人王晟戏称杨立昆为“Klaus LeCun”( 杨立昆英文名为Yann LeCun,Klaus Fuchs在二战期间向苏联提供了曼哈顿计划的信息)。王晟开玩笑:“不能只让美国拥有原子弹。”

王晟发现,ChatGPT出现之后,科技圈对大模型热情且迷茫。投资人中很多是看热闹,“因为第一看不懂,第二不敢投,第三投不到。一个新的技术范式出现,没人知道它的能力边界在哪里。”

王晟说,LLaMA开源对行业影响很大。“Meta过去这些年积累的大模型技术,本来都是不传之秘,结果一开源,迅速把很多认知拉平了。”

之前,国内团队研发大模型,只能从零到一不断试错,一旦有个点被卡住了,即便从技术角度来说并不是太难,但靠自己可能也需要花一两年时间才能解决,需要亲自踩很多坑。现在Meta直接把它的经验和数据拿出来,在思路和方法上给了行业非常重要的指引。

“在这个过程中大家学习了很多。假如没有LLAMA开源,国内大模型今天的水平可能会差很多,我们会大幅度被人甩下。”王晟说。

这也是为什么国内一下子突然涌现出200多个大模型。王小川的百川智能在公司成立仅两个月就发布了一款大模型,其实就是借鉴了LLaMA。李开复的零一万物推出的大模型,也是使用LLaMA的开源模型架构。

LLaMA开源对OpenAI最直观的影响,是有一堆中国公司跳出来“吊打”GPT。在他们的口径中,已经在多项指标上超过了GPT模型,虽然很多榜单都是刷出来的。

更深层次的影响在于,大模型开源社区的力量快速壮大,全球的程序员都能为开源做贡献。他们开发出各种开源数据集,迭代出更多新模型,缩小与闭源大模型的差距。所以谷歌的工程师说,谷歌没有护城河,OpenAI也没有。

Meta在科技圈的形象变得高大起来。回顾Meta的发展,其实它一直都有开源的传统。

早在2016年,Meta团队就开发并开源了深度学习框架PyTorch,它和谷歌的TensorFlow成为深度学习领域的两大主流框架。

跟OpenAI现在才开始秘密推进芯片制造项目不同,Meta在三年前就设计了自研AI推理芯片,并采用了开源架构。

在语言翻译方面它推出了很多开源模型,两年前发布的NLLB模型是维基百科的翻译供应商之一,2023年发布的SeamlessM4T可以翻译近百种语言,同时它还发布了全球最大的开放多模态翻译数据集。

有研究人员经过对比认为,Meta更倾向于信任、问责制以及通过开源实现人工智能的民主化。

反观OpenAI,它依然在技术上保持领先,但拒绝开放。

“没人知道OpenAI进展到什么程度了,包括它正在研发的GPT-5,是不是继续用的transformer都是未知数。现在大家都跟着GPT-3.5的技术路线在跑,假设它悄悄变换了方向,那大家就掉坑里了。因为没人知道正确路线是什么。”一位AI公司的创始人说。

同时它试图阻挡竞争对手,以保持自己的先发优势。

字节跳动在2023年12月被OpenAI停用账户,因为它在调用OpenAI的API开发自身大语言模型的时候,违反了OpenAI的服务条款。有悖商业伦理的行为肯定是不对的,但外界由此关注到OpenAI的商业条款,它禁止客户使用GPT输出的内容开发任何可能会给OpenAI带来竞争的AI模型。

值得注意的是,微软也有类似条款。它们将商业上的竞争优势看得很重要。

人工智能公司开放传神(OpenCSG)创始人、CEO陈冉认为,开源的市场空间远比闭源大,但未来一定是开源和闭源两条路同时走,“OpenAI开源不开源其实不重要了。”

三、开源闭源,谁对谁错?

究竟是OpenAI被利益蒙蔽了双眼,还是Meta大公无私要为全人类做贡献?

或许,它们在本质上并无不同。OpenAI既没有那么自私,Meta也不像网友鼓吹的那样高尚,区别只在于路线和策略。

若论对整个AI行业的贡献,OpenAI毫无疑问是最大的。毕竟,这一轮AI浪潮是由ChatGPT掀起的。它点燃了一把火,加速了大模型的普及。事实上,前两年大模型开源社区基本是围着GPT-3在转。

OpenAI不像谷歌、Meta那些巨头拥有雄厚的资金积累,早年大佬捐赠的资金早花得差不多了,没钱是做不了研发的,总不能用爱发电。所以OpenAI抱了微软的大腿,奥尔特曼想尽办法为OpenAI赚钱。

陈冉认为,OpenAI的成功其实是商业模式的成功,本质是投资人看到了巨大的商业价值和盈利模式。开源与闭源之间的竞争方向一定是挣钱模式的创新竞争。

Meta将技术开源,也不是只为他人做嫁衣。开源是一种策略,能吸引更多开发人员免费帮它迭代技术、修复漏洞,正所谓众人拾柴火焰高,但最核心的技术还是掌握在Meta手里,该打击对手的时候它不会手软。就像谷歌,它旗下的安卓是开源系统,但国内手机厂商做自己的系统还是会有很多限制。

而在大模型火起来之前,Meta掉进了元宇宙的深坑里无法自拔,砸钱、亏损、裁员,看不到任何希望。大模型是那根救命稻草,ChatGPT则是照亮前路的那束光。

再往深了看,闭源的OpenAI和开源的Meta,从根本上对AI的价值判断有分歧。

如果将AI比作未来世界的核武器,OpenAI认为它很危险,得谨慎,不能滥用。Meta则认为,核武器不能只掌握在少数几个玩家手里,应该开放研究。

关于AI的利弊之辩,是科技圈的一个老话题。马斯克就相信“AI危险论”,他担心有一天机器的智力、意识都超过了人类,可能会取代人类,摧毁人类文明。所以他当年牵头成立OpenAI,只是后来OpenAI没按他设想的路径走。

基于“防止AI取代人类”的愿景,行业里又延伸出两大派别。一派认为大量独立的AI系统比由大公司控制的少量AI系统更安全,AI的研究应该开源开放;另一派认为应该封闭研究,这可以减轻安全风险,防止不法分子滥用获得的代码。

OpenAI属于后者。支持它的人认为开源策略加大了风险,比如伦敦一家AI公司的CEO就认为,Meta是最不负责任的人工智能参与者,他问:“我们应该令核武器的设计透明化吗?”

Meta将开源视为最优策略,杨立昆就认为,机器最终会比人类更聪明,人类无法阻止坏人获取它,AI必须是开源的,只有让更多人参与其中,最终开发出的系统才会更安全。他认为马斯克的AI威胁论就是科幻小说看多了。

杨立昆曾经的合作伙伴,跟他一块获得图灵奖的杰弗里·辛顿,则持有不同观点,认为AI将对人类构成严重威胁。他的思想也许对他的学生伊利亚造成了影响。伊利亚是OpenAI的联合创始人兼首席科学家,几乎决定了OpenAI的技术路线,他也是OpenAI宫斗事件中开除奥尔特曼的关键人物。伊利亚一直致力于追求安全可靠的AGI。业内普遍认为,商业化和AGI的路线之争,引发了那场冲突。

所以,OpenAI和Meta有不同的信念。OpenAI将AGI视为终极目标,并且相信自己将会第一个实现它;Meta将开放平台视为最好的路径,试图制定开源标准。当然,它们都希望在这个过程里拿到应得的商业利益。

往长远看,AI的发展是螺旋式上升的,开源也好,闭源也罢,都将为其注入动能。究竟谁是真的在为全人类的未来操心,只有等待时间检验了。

本文来自微信公众号:定焦(ID:dingjiaoone),作者:定焦团队

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年1月26日
Next 2024年1月26日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日