本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究,题图来自:视觉中国
马斯克周一凌晨在其X社交平台发宣布,xAI将于本周内开源Grok。
X的官方账号马上转发,称这是马斯克控告奥特曼等人不开源ChatGPT之后,马上采取的行动。
开源,马斯克自己要说到做到
马斯克在几天前把OpenAI及奥特曼告上法庭,罪名是对方违背创始协议,把一家非营利、开源、为惠及人类而研发通用人工智能(AGI)的机构,变成了一家有营利部门、封闭、为创始人自己小圈子和科技巨头(目前就是微软)赚钱的企业。马斯克共计向OpenAI捐出了4000多万美元。
OpenAI也公开了四封当年的邮件,强有力地反击了马斯克的指控:“你当初承诺捐助如果不够,你负责捐到10亿美元;你也同意如果每年的研发经费不达到数亿甚至数十亿美元,根本不足以抗衡谷歌,需要对外融资;你也同意开源并不能保证安全的人工智能;你最后想把OpenAI合并到你的Tesla中,由你控制,为你的自动驾驶服务。”
Grok是马斯克的AI初创公司X.ai去年推出的一个模型,它是用了包括马斯克收购的社交媒体平台X(原名twitter)上的语料训练出来的。马斯克称其在对话中能更加开放灵活,直面现实,以区别于硅谷主流大模型生成的政治正确内容,即他所称的“woke”倾向。
当初他和奥特曼联合创办OpenAI时,主要是想抗衡谷歌。8年之后,他面对的是谷歌、微软/OpenAI,还要加上Meta。
Grok闭源走投无路
进入2024年以来,大模型三足鼎立之势已经明朗,GPT-4,Gemini,Claude3基本达到同一水准,加上最近发布的Inflection2.5和Mistral Large, 都号称性能接近或达到SOTA,谁还提起过Grok?周围听说过谁在用Grok吗?
Grok再封闭下去,将是一个二三流的闭源模型。它只有开源一条路了。
马斯克创办Grok的初心,并非为了开源,而是商业利益。它试图以Grok+X的订阅,一举两得,弥补X平台塌陷的广告收入。其实连X(前twitter)的普通用户都无法使用,比闭源还闭源。
想用上它,每年要交2万多块钱,每个月要交近2千元钱。
与扎克伯格“笼中决斗”开源模型
开源就是对抗Meta。Meta已经建立起世界上最大的算力集群,正在训练下一代开源大模型Llama3,预计也将接近或达到GPT-4的水平。尽管开源模型的性能与SOTA的闭源大模型有差距,但它能更快更灵活地部署到不同和行业、场景和设备上。目前开源大模型中已经形成了Llama和Mistral两大势力。
Grok的护城河在哪里?未来几年马斯克继续购买的几十万张H100卡,用于训练自动驾驶视觉大模型,加上X上的语料数据。
闭源+开源
开源与闭源双管齐下,成为今年大模型领域的一个新趋势。最近谷歌在发布“最强”闭源大模型Gemini Ultra之后,发布了开源模型Gemma 2B和7B,也是其加速推进AI的软硬件应用的战略举措。而Mistral则是从开源杀入闭源。Mistral 7B到MoE架构的Mistral 8X7B,继在多项测试指标超过了Llama 70B之后,现在开始挑战闭源大模型GPT-4和Claude 3了。Grok是完全开源,还是保留闭源?
Grok+汽车、机器人
目前无论是在PC设备终端,还是在推理引擎上,开源模型Llama2和Mistral 7B都是首选。而更多适配PC的7B模型,适配手机的2B或更小的模型,正在涌现。对于许多应用与模型公司来说,基于云的tokenonics无法成立的话,不妨向边缘走,向设备终端走。
马斯克是不会让Tesla汽车和擎天柱机器人去用别人家的模型的。
大选之年动心思
大选之年,美国社交媒体界正在发生着微妙的变化。美国国会与总统准备强令TikTok出售或者下架,特朗普态度大转弯,称为了抗衡扎克伯格的Meta社交媒体帝国,将支持TikTok。马斯克已经旗帜鲜明地站在共和党一派,用他的X社交平台加上Grok,加入一场真正的AI舆论战。
Grok的来历
Grok是个小说中代表火星人的词汇,是美国作家Robert A. Heinlein在1961年写的科幻小说《陌生人在异乡》(Stranger in a Strange Land)中创造的一个词。这个词很快在计算机、极客、黑客圈子里流行开来,并且成为60年代兴起的反主流文化中的一个重要词汇。它的基本意思就是既能认识本质又凭直觉做判断。
马斯克2023年准备推出自己的模型时,一度想用Groq,但另外一家初创AI企业Groq已经注册了商标,并且发出警告,于是马斯克就“盗用”了Grok。
最后,瞅一眼Grok的表现:
本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究