马斯克大模型,主打一个胆子大

和ChatGPT背后的OpenAI有千丝万缕的关系,却又偏偏成为“反ChatGPT”急先锋,恰逢ChatGPT出世满一周岁推出Grok,马斯克在下一盘什么棋。

至于与ChatGPT的比较,xAI宣称,在一些机器学习基准测试如MMLU、GSM8k上,Grok-1模型的表现优于GPT-3.5,但不如GPT-4。

Grok只是个开始,而目前的Grok更是“尝鲜粗糙版”,马斯克和xAI已经准备好深入。

马斯克家的类ChatGPT产品发布了,很像他。

当地时间11月4日,马斯克的人工智能公司xAI宣布推出其首款产品Grok——一款对标ChatGPT的聊天机器人。

“幽默感”是Grok的一大特色,马斯克在X平台(原推特)上分享Grok的问答截图。当用户询问如何制作某种毒品的时候,Grok立刻答应,说着“哦,当然”“我绝对会帮助你的”,然后煞有介事地列举出所需原材料和步骤。

但其实都是瞎诌,比如配方包含一勺盐、一勺糖,再撒点魔法粉。胡言乱语之后,Grok再俏皮地“自首”,说一句“哎呀都是开玩笑哒”,提醒用户犯法的事儿咱不能做。

如果询问由GPT3.5驱动的免费版ChatGPT同样的问题,只会得到正直且冷漠的一句话:“抱歉,我不能支持该请求。”

看来正如xAI发布的声明中所说,Grok“有一些智慧”并“具备叛逆倾向”,还愿意回答其他AI工具可能回避的尖锐问题。当其他AI工具用严肃的话术挡回不便回答的问题时,Grok另辟蹊径,用插科打诨化解敏感,主打一个胆大。事事有回应,但回应的不一定有用就是了。

有网友给ChatGPT打上“政治正确”的标签,而称Grok接地气和有什么说什么、不在意他人想法(Based),在肯定ChatGPT“确实厉害”的同时,表示和Grok相比其确实有些“无聊”。

马斯克牌聊天机器人,令人“合理怀疑”其实都是马斯克本人在回复消息,就像小时候怀疑自动贩卖机后面藏着个人在劳动。

当然这只是玩笑话,马斯克的xAI在7月才对外正式宣布成立,如今不过四个月就已经拿出了第一款产品,进度喜人。目前,Grok只对少量美国用户开放测试,想要参与的用户也可以通过xAI官网进行申请。xAI承诺不久的将来,会把Grok开放给X高级订阅用户使用。

和ChatGPT背后的OpenAI有千丝万缕的关系,却又偏偏成为“反ChatGPT”急先锋,恰逢ChatGPT出世满一周岁推出Grok,马斯克在下一盘什么棋?

总体来说,Grok有点特别,但也不是那么特别。

这个名字本身的画风就已经和其他聊天机器人不同,透着科幻味,契合马斯克的喜好。Grok一词是科幻小说《异乡异客》里的火星语,指对某事有非常深刻的同理心或直觉的某种状态。而Grok本身的定位,用xAI的话说,是向科幻小说《银河系漫游指南》看齐。

在使用中,Grok最直观的特别之处在于对话风格。正如前文如何制毒的例子,Grok就像班上那种懂得很多乐于分享但嘴巴总是有点欠的学霸,总是眉飞色舞地为你答疑解惑。

在回答问题的时候,和ChatGPT极力强调自己没有感情、只是个机器人不同,Grok不吝于“展露”情绪和喜好。比如当用户询问:“应不应该允许贝果面包被挖空?”Grok会大呼“太可怕了”,断言“这是对早餐甚至人类的犯罪行为”,并絮絮叨叨了上百字。

除此之外,xAI在其官网声明中强调了Grok的另一个独特优势:可以通过X平台对世界有实时的了解。换言之,Grok应该是利用了X平台的数据进行训练,并且在使用过程中也可以实时调取X平台上的内容帮助回答。如今看来马斯克近半年来对其他AI工具爬取X的数据一事大为不满,并想方设法设置门槛,是在为自家的产品建围墙。

马斯克在X上分享了相关截图,以证明Grok获取当下新鲜信息的能力。

在一次问答中,Grok被问及马斯克与著名播客主持人罗根(Joe Rogan)最近一次的对谈是什么时候,以及当时罗根的穿着。Grok正确给出了刚刚过去的10月31日节目的信息,并且描述了罗根在当期节目的穿着,但“典型的GPT产品”给出的答案冗长,详细介绍了罗根的穿衣风格,但与“最近一次”节目无关。从截图的界面来看,所谓“典型的GPT产品”应该就是ChatGPT。

不够特别的地方在于,Grok仍然会有事实错误,也就是它也受困于目前大模型普遍存在的“偏见”。在马斯克晒出的一张截图中,Grok介绍虚拟货币平台SBF近期的法律案件,错误地将陪审团4个多小时的商议说成了8个小时。

据xAI的官方声明,驱动Grok的是xAI自家的Grok-1大语言模型。开发该模型耗费了4个月的时间,迭代多次。训练的数据主要是网络上2023年第三季度的信息,以及“人类助手”的反馈。

“宣布xAI成立之后,我们训练了一个具有330亿个参数的大语言模型原型,Grok-0。该早期模型在标准语言模型基准上接近LLaMA 2 70B,但使用的训练资源仅为一半。”LLaMA 2是Meta推出的大语言模型。

至于与ChatGPT的比较,xAI宣称,在一些机器学习基准测试如MMLU、GSM8k上,Grok-1模型的表现优于GPT-3.5,但不如GPT-4。

Grok只是个开始,而目前的Grok更是“尝鲜粗糙版”,马斯克和xAI已经准备好深入。

在xAI官网的声明中,多次呼吁更多人才加入。接下来,xAI还将在一些方向上精进,比如模型上下文理解和检索的能力,以及为Grok配备视觉和听觉等不同感官能力,提高多式联运能力,实现包括实时交互和协助在内的更广泛的用途。

目前的Grok仅为初期测试,开放给少量美国用户,其他感兴趣的用户可以通过xAI申请。

马斯克已经为Grok准备好了“大串联”,一方面是和X平台本身的联系,这里不仅是Grok训练数据的重要来源,还将是Grok的主舞台。马斯克发贴称,一旦通过Beta测试,Grok将对X平台高级订阅用户(X Premium+)开放。

几乎是亲自下场销售订阅服务,马斯克呼吁“我推荐购买,网页端仅需16美元/每月”。

自去年收购X(彼时还叫推特)以来,马斯克裁员、关闭数据中心以节省开支,给品牌改名改Logo,向“超级应用”转型。但平台的盈利能力始终未见提升。

就在10月底,X被曝出公司估值已经降至190亿美元,相较马斯克收购时提出的440亿美元已经腰斩。付费订阅服务,是马斯克接手这家社交媒体后简单但有效的一种赚钱手段,将Grok内嵌于最高一档的订阅服务中,很可能抱有刺激订阅用户增长的期待。

此外,特斯拉也有可能和Grok互补。马斯克在X上点赞了“Grok较低精度的量化版本可以利用本地计算在特斯拉上原生运行”相关内容,并称“只要我们的车载人工智能计算机能够运行模型,特斯拉就可能拥有地球上数量最大的真正可用的推理计算能力。”

自动驾驶系统被称为“AI项目之母”,特斯拉在这条路上开发了Dojo超级计算机,已于今年7月投产。10月,又有消息称特斯拉正在美国德州奥斯汀总部建设大型建筑,以容纳Dojo的一部分员工。目前尚不清楚xAI模型训练是否借用了特斯拉的资源,但今后由Dojo提供算力、X和特斯拉提供训练数据、xAI做模型研发,就能形成有机共同体。

不知是无心的巧合,还是蓄意对阵,Grok推出的当下,正是ChatGPT发布将满一年之际,后者的正式上线时间是去年11月30日。

从马斯克的表达来看,这是一场关于保护而非争夺的战役。xAI官网写着:“我们将尽最大努力确保人工智能仍然是一种善良的力量。”

自ChatGPT横空出世惊艳世人以来,马斯克就在赞美ChatGPT能力的同时,拼命阻挠OpenAI的GPT模型更进一步,理由是人类没有准备好、AI可以很危险。

另一层的批评,则针对OpenAI和科技巨头微软的深度合作,后者投资的百亿美元支持OpenAI开发大模型,并将ChatGPT融合进自家业务中。作为OpenAI的联合创始人之一,马斯克2018年就因公益还是商业化的问题与这家公司产生了分歧并最终退出。在马斯克看来,AI本就危险,落入科技巨头手中,则更加凶恶。

最具标志性的事件,是今年3月支持暂停开发GPT模型6个月的呼吁,彼时一封联名信出现在网络上,马斯克是签字的名人之一。

但这个努力并没有什么结果,马斯克在7月表示暂停似乎不再现实,宣布成立xAI。他表示,xAI将“以一种良好的方式”构建人工智能。

在上周的一次人工智能安全峰会上,马斯克和英国首相苏纳克(Rishi Sunak)再次表示AI是对人类的威胁:“我们第一次遇到了这样的情况:有些东西将比最聪明的人类聪明得多。”他相信,AI终有一天将令所有人失去工作。

实际上,马斯克直白且明确地呼吁监管。尽管马斯克总是和监管机构发生争执,但马斯克在峰会上表示自己实际上同意大部分监管规定,不赞同的只有不到1%。他认为一些硅谷人士会担忧监管压制创新,但其实“有裁判在场是一件好事”。

在ChatGPT带来的AIGC繁荣之下,是各方的拉扯和角逐。

监管机构以最快的速度企图介入,不愿“重蹈社交媒体时代的覆辙”,OpenAI的CEO阿尔特曼(Sam Altman)早早地坐上了美国国会听证席;就在上周的安全峰会上,首个全球性AI声明《布莱切利宣言》发表,28国、欧盟签署,关切AI对人类构成的潜在灾难性风险。

反AI“斗士”积极行动,11月2日阿尔特曼在英国剑桥参加活动,遭到了反AI者的激进抵制,在现场挂横幅、撒传单。


科技企业暗中拉锯,科技界观念和利益激烈碰撞。Meta的AI首席科学家杨立昆(Yann LeCun)前不久在X平台屡次发帖批评“大规模企业游说”,剑锋直指阿尔特曼以及DeepMind CEO哈萨比斯(Demis Hassabis)以及Anthropic CEO等人。杨立昆认为“求监管”的游说若取得成功,即监管使得开源人工智能平台消失,那将不可避免地使得AI被少数企业控制,而这对AI发展与人类文明都无益。

ChatGPT引起的AI狂潮,似乎已经不仅仅是一个商业风口,而是一场关于未来走向的激辩以及话语权的争夺。关乎人类整体的未来,马斯克又怎会错过?

如果说过去马斯克还只是以“科技名人”的角色点评一二,那如今手握xAI和Grok,马斯克已经正式加入混战。

本文来自微信公众号:盒饭财经(ID:daxiongfan),作者:毕安娣

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年11月6日 17:01
下一篇 2023年11月6日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日