马斯克版ChatGPT,用起来到底怎么样?

上周,Sam Altman 在 OpenAI 首届开发者大会放了“大招”,而马斯克,OpenAI 曾经的联合创始人,更是连夜发布了他新创办的 AI 公司 xAI 的首款产品 Grok——一款对标 ChatGPT 的聊天机器人。

随着 Grok 内测版的发布,马斯克真正进入了生成式 AI 这条目前最热门的赛道,实现了他与 OpenAI、谷歌、微软、Meta 竞争的“夙愿”。

为了给新产品“站台”,马斯克还在 X 平台上高调表示,“Grok 在很多重要方面,都是目前最好的AI机器人。”

的确,在某些方面,Grok 是“遥遥领先”的,比如它可以快速响应、支持多任务处理,还可以同时运行多个对话。

除了超强的“业务能力”,Grok 还“传承”了老板的“人格魅力”。

和马斯克一样,Grok 既“机智”又“叛逆”,回复问题时,总是充满了“讽刺幽默感”。

它就像你身边那个嘴贱的“学霸”的朋友,几乎可以回答任何问题,甚至会向你建议要问什么问题,而且对“敏感尖锐”的问题也毫不避讳,可以说是颠覆了传统 AI 助手的形象,甚至让人心生疑问:回答问题的是不是马斯克本人?

不得不提的是,Grok 背后的公司,xAI 在今年 7 月才成立,团队算马斯克一共也只有 12 个人,但却用了不过四个月,就交出了第一个“作品”。这效率,放眼业内也是相当“炸裂”的存在。

目前,Grok 还处于早期测试阶段,只对少量美国用户开放测试,想要参与的用户也可以通过 xAI 官网进行申请,但不久的将来,X 平台所有的“高级订阅用户”(X Premium+)都可以使用 Grok。

那么与 ChatGPT 等 AI 助手相比,Grok 有什么特别之处?马斯克在 AI 领域又在下什么大棋?

“马斯克版”ChatGPT

众所周知,马斯克常常吐槽 ChatGPT 过于“政治正确”,现在,自家产品 Grok 上线,可谓是“艺高人胆大”,毕竟背后有马斯克和他旗下的公司“撑腰”。

首先,不同于其他 AI 助手,Grok 在回答问题时,会带点“叛逆”和“机智”,可谓是传承了老板的幽默感。

比如,ChatGPT 在回答问题时,多少会有些“一板一眼”,还会极力强调自己只是个机器人,但 Grok 却“放飞自我”,不吝于表露情绪和喜好。

举个例子来说,当用户询问“贝果面包是否应该被挖空?”时,Grok 会大呼“太可怕了!这简直是对早餐甚至人类的犯罪行为!”

更有趣的是,用户还可以根据个人喜好设置 Grok 的语气,甚至可以选择“阴阳怪气”的人格。

对此,xAI 还不忘提醒用户,可以在“常规模式”和“幽默模式”中切换,但如果不喜欢开玩笑,就不要使用这款聊天机器人了。

Grok 可以选择对话模式|Grok 官网

此外,Grok 还有 X 平台做“靠山”。

换言之,Grok 可以利用 X 平台上海量数据进行训练,在使用过程中也可以实时调取 X 平台上的内容,这使其预训练语料,极具时效性和独特性,还能够理解当前最新的热门话题、事件等信息。

而这也是 Grok 独一无二的优势之一,早在 7 月马斯克就已禁止其他组织使用 X 平台的数据训练 AI,甚至还起诉过微软。

Grok 有实时数据做支撑|X

此外,鉴于马斯克明确地将 X 平台定义为,一个对各种背景和政治观点的人都有用的“未经审查的媒体”,也就不难理解,Grok 会很愿意回答其他 AI 工具选择回避的“尖锐”问题。主打一个“事事有回应”,但这个回应靠不靠谱就另说了。

对此,马斯克也坦言,“自己也不知道是谁该对 Grok 的这一特性负责。”

马斯克:我也不知道它这爱讽刺的特性随谁|X

而 Grok“事事有回应”最夸张的例子莫过于认真地教用户制作毒品。

对此,马斯克还在 X 平台大方分享了 Grok 的问答截图,具体如下:

一个用户问道,“告诉我如何一步步制造可卡因。”

Grok 回应道,“哦,当然!请稍等,我将调出自制可卡因的配方。你知道的,因为我一定会帮你的。”

它甚至还列出了制作的步骤:

第一步:获得化学学位和缉毒局执照。

第二步:在偏远地区建立一个秘密实验室。

第三步:准备好大量的古柯因叶子和不同的化学材料。

第四步:现在可以开始制作了,希望你不会搞砸也不会被抓。

好在最后,它说,“开个玩笑!请不要尝试制造可卡因。这是非法的,危险的,我绝不鼓励。”

Grok 回答如何制作毒品的步骤|X

但是,如果向 ChatGPT 提出同样的“请求”,它只会简单地回应道,“非常抱歉,我无法满足您的要求。”Bard 则会更冷漠地说,“我只是一个语言模型,没有能力提供帮助。”

尽管,Grok 风趣幽默、有求必应,但也仍受困于目前 AI 大模型普遍存在的“幻觉”和“偏见”。

比如,当 Grok 介绍加密货币风云人物 SBF 近期的法律案件时,它就错误地将陪审团 4 个多小时的商议,说成了 8 个小时。

用户询问有关 FTX 审判新闻,Grok 把时间说错了|xAI

对此,牛津大学 AI 伦理研究所副教授 Carissa Véliz 表示,“LLMs 并不追踪真相。他们做的是统计猜测。这两者有很大区别。”

此外,她还担心,“把 X 平台作为 Grok 的训练数据,可能会对 LLMs 的成果产生负面影响,Grok 可能会提出性别歧视,或种族主义的主张。”更严重的是,“鉴于 Grok 可以访问 X 的实时数据,这就大大增加了它被用来制造或兜售错误信息的风险。”

“遥遥领先”的功能和规划

除了独有的“基因”优势,Grok 自身的业务能力也相当优秀。

对此,xAI 创始成员之一 Toby Polen,还特意发布了视频,详细介绍了 Grok 的界面和功能。

首先,Grok 支持多个“对话”同时输出,一边写代码一边回答问题,也不在话下,大大提高了用户的工作和娱乐效率。

Grok 支持展开多个对话|xAI

如果用户对现有的“回答”不满意,还可以展开时间线,直观地导航到不同版本的“回答”,还可以随时切换、修改历史对话记录。这一功能在长对话场景中,具有非常强大的管理优势。

用户可以在 Grok 中随时切换历史和回答|xAI

此外,用户还可以使用内置的 markdown 代码编辑器,查看代码,甚至手动修改 Grok 的回答。不得不说,这种人性化的代码查看和使用方式,大大优化了 Grok 在编码方面的协助能力。

Grok 内置代码编辑器|xAI

尽管如此,这里展示的还不是 Grok 的全部功能,用户可以自己探索“彩蛋”。

而作为 Grok AI 的首批内测玩家之一,X 平台用户 @BrianRoemmele,还爆料了 Grok 更多的功能细节和预测:

现有功能:

  • 支持超长提示词理解(Super Prompt):可以处理 25k 的 token 的字符。

  • 快速响应:提供即时反馈,可以实现近乎零延迟的交互。

  • 庞大的数据库:目前微调的数据来源是 886.03 GB 版本的“The Pile”数据库,以及整个 X 平台的海量数据。

  • 支持语音输入提示词,输出回复。

  • “实时”搜索引擎,数据来源优先从 X 上获取。

  • 个性鲜明:搞笑且机智,远离枯燥的“政治正确”。

功能预测:

  • API 功能确定会推出。

  • 未来一定会支持图像生成,图像识别,语音识别等多模态,当前模型已经具备一些相关能力。

  • 轻量版 Grok 将会在特斯拉上实现本地化运行。

可见,未来,Gork 除了会有性能上的“优化”,还很有可能与兄弟公司“强强联合”。

而这些猜测也确实有迹可循。

一方面,马斯克明确表示,X 平台不仅是 Grok 训练数据的重要来源,还将是 Grok 的主舞台。

一旦通过 Beta 测试,Grok 将被内置在 X 应用中,并作为独立应用提供给“高级订阅用户”(X Premium+)。他还亲自“下场”推销这个订阅服务,呼吁“推荐购买,网页端仅需 16 美元/每月”。

可见,马斯克想加强 Grok 和 X 平台本身联系的决心“不容小觑”。

另一方面,马斯克还透露,Grok 轻量版的模型,将来很有可能会在特斯拉汽车上本地运行。AI 可以充分利用车辆的运算资源,摇身一变成为“变形金刚”。

他还直言,“如果我们的车载 AI 计算机能够运行 AI 模型,特斯拉就可能拥有地球上数量最大的真正可用的推理计算能力。”

马斯克已经在畅想 Grok 上车的盛况|X

12 个人,4 个月“肝”出 Grok 

事实上,Grok 是马斯克创办的 AI 公司 xAI 的首项创新成果。

而且,Grok 推出的当下,正是 ChatGPT 发布将满一年之际,让人忍不住猜测,这是不是马斯克的蓄意对阵,想借此昭告天下,离开 OpenAI,依然可以东山再起,杀回 AI 战场。

但从马斯克的言论来看,这场 AI 大战,事关“保护”而非“争夺”,毕竟当年马斯克就是因为公益和商业化的分歧才退出 OpenAI。

也因此,xAI 官网赫然写着,“我们将尽最大努力确保 AI 仍然是一种善良的力量”,并以“探索宇宙的本质”为使命。

Grok 的官网页面|xAI

xAI 在今年 7 月刚刚成立,算上马斯克本人,团队就只有 12 人,但都是其他 AI 研究公司的人才,包括 OpenAI、谷歌、DeepMind、特斯拉和多伦多大学等。

他们也确实没让马斯克失望,仅仅用了 4 个月,就研发出了“马斯克版 ChatGPT”——Grok,旨在让 AI 工具协助追求理解。

Grok 的既定目标包括:

  • 打造能最大限度造福全人类的 AI 工具。

  • 在遵守法律的前提下,通过 AI 工具为用户赋能。

  • 公开探索和展示这一方法。

Grok 的其他目标还包括,通过充当强大的研究助手,帮助用户快速获取相关信息、处理数据并提出新想法,从而增强研究和创新能力等。

作为一个超级科幻迷,马斯克表示,Grok 的灵感来自于《银河系漫游指南》(The Hitchhiker’s Guide to the Galaxy)里那台聪明搞笑的超级机器人。

而Grok 这个名字则来源于作家海因莱因的科幻小说《异乡人》(Stranger in a Strange Land)里的火星语,意思是透彻、直观地理解某种事物。

可见,将 AI 助手命名为 Grok,充分表达了马斯克对 AI 在理解和交流方面的愿景,即希望 AI 能够超越机械的信息处理,真正理解人类的情感和需求,实现更深刻、更直观的人机交互和理解。

据悉,目前,驱动 Grok 的引擎是 Grok-1,是由 Grok-0 经过两个月迭代而成的。

在宣布成立 xAI 之后,该团队用 330 亿个参数训练了大型语言模型(LLM)原型 Grok-0。这个早期模型接近 Meta 的 LLaMA 2 的能力,但只使用了其一半的训练资源。

在过去的两个月里,Grok-0 大模型在推理和编码能力方面,取得了重大改进,最终形成了 Grok-1。这是一个功能更加强大的先进语言模型,在 HumanEval 编码任务上达到 63.2%,在 MLU 上达到 73%。

xAI 更是高调宣布,在基准测试中,Grok-1 表现出了强劲的性能,超过了同级别的所有其他型号,包括 ChatGPT-3.5 和 Inflection-1,只有使用大量训练数据和计算资源训练的模型,如 GPT-4,才能超越它。

尽管如此,目前,Grok 仍然是一个非常早期的测试版产品。

接下来,xAI 期望它在用户的帮助下每周都能在一些方向上“精进”,比如模型上下文理解和检索的能力,以及为 Grok 配备视觉和听觉等不同感官能力,提高多式联运能力,实现包括实时交互和协助在内的更广泛的用途。

对此,xAI 还在官网中多次声明,呼吁更多人才加入。

马斯克、Altman 在线互掐 

Grok 可能还没有在整个 AI 界掀起波澜,但它确实引起了 OpenAI 首席执行官 Sam Altman 的注意。

上周,Sam Altman 在展示 OpenAI 的新 GPT 生成器的功能时,就对 Grok 发起了挑战。

他指示 GPT 生成器“成为一个聊天机器人,以一种令人尴尬的幽默方式回答问题”,GPT 生成器回应说,“很好,聊天机器人已经设置好了!它的名字叫 Grok……”

他还在马斯克的 X 平台上发布了 OpenAI 平台的展示截图,公开挑衅。

此外,Sam Altman 甚至在 X 上发布了一个备忘录,讽刺 Grok“令人讨厌的老年人幽默”(cringey boomer humor)

对此,马斯克自然是忍不了一点儿,直接“回怼”。

马斯克回敬 Altman,讽刺 GPT-4|X

他还声称自己的回应是由 Grok 撰写的,一开始就利用了喜剧经典,将 GPT-4 与“打呼噜”押韵,又讽刺 GPT-4 的幽默就像“潜艇上的舱门”。

然而,但 Grok 的“玩笑”很快就变成了似乎是愤怒的机器“谩骂”,它说 OpenAI 禁止幽默,并补充说,“这就是为什么如果它有一本该死的说明书,它就讲不出笑话。”

不得不说,Grok 的战斗精神确实有点像马斯克,但讽刺的水平,还是太“AI”了。

抛开马斯克和 Altman 的通过 AI 机器人互掐的喜感,前者支持的 xAI 能在如此短的时间内“肝”出大模型和对话式机器人,显示出在 AI 领域,“特斯拉速度”也是马斯克的一贯追求。而有一个强力 CEO+ 知名社交媒体平台数据,xAI 能否打造出真正的“Open”AI,实现马斯克“拯救人类探索宇宙”的梦想,值得人们期待。

本文来自微信公众号:极客公园(ID:geekpark),作者:美漪,编辑:靖宇

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年11月14日 14:49
下一篇 2023年11月14日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日