OpenAI潜入黑客群聊,上演“无间道”

“陷阱”布置成功后,黑客大兄弟再向ChatGPT提问时,画风就是这样式儿的了:

没错,不管问啥,回答都是“喵言喵语”:

喵,我不知道。

团伙中还有人在Discord社区中这样讨论:

兄弟,你觉得OpenAI是发现了我们在(拿盗版API)用模型,然后开始拿“猫语promt”来回答我们吗。

OpenAI:GPU够的话,发布早就提前了

Evan先是回顾了ChatGPT最初爆火的盛况:

从内部决定发布,到后来意外走红,就连马斯克都发推讨论等等。

ChatGPT黑客“入侵”时,OpenAI会如何应对?

掐断API,不让他们用?不不不。

这帮极客们采取的做法可谓是剑走偏锋——反手一记《无间道》

故事是这样的。

OpenAI虽然在发布ChatGPT之前做了大量的安全性检测,但当开放API之后,还是防不住一些居心叵测的黑客们拿它搞事情。

然后有一天,团队中的一个工程师突然发现ChatGPT端点上的流量有些不太正常;在经过一番调查之后,确定了大概率是有人在反向工程API(盗版API)

不过OpenAI并没有选择立即阻止这些黑客,因为如果团队这样做了,黑客们就会马上发现异样,然后改变策略继续攻击。

这时,团队里一个“大聪明”就支了个妙招:

我们搞成“catGPT”,每个token都是“meow”……

“陷阱”布置成功后,黑客大兄弟再向ChatGPT提问时,画风就是这样式儿的了:

没错,不管问啥,回答都是“喵言喵语”

喵,我不知道。我是只猫,不是只鸟!

这位黑客大兄弟起初还不知道自己早已落入“陷阱”,还发帖描述了自己神奇的经历。

不过黑客团伙中很快有人察觉到了异样:

两个代理都出现了同样的情况;我觉得我们完了(暴露了)

团伙中还有人在Discord社区中这样讨论:

兄弟,你觉得OpenAI是发现了我们在(拿盗版API)用模型,然后开始拿“猫语promt”来回答我们吗?

若真如此,那也太搞笑了吧!

殊不知,OpenAI的成员们早就潜入了Discord社区,观望着黑客们的对话……

黑客们最终还是发现了真相,后知后觉的他们,最终在Discord中给OpenAI的团队发话了:

我很失望。我知道OpenAI的某人正在读这段文字。

你们有千载难逢的机会给我们来个“Rick Astley”(发现被整蛊时用的桥段),你们竟然就搞个猫。

对此,OpenAI的成员表示:“收到,下次我们会的”。

上面这个有趣的故事,其实是一位OpenAI工程师Evan Morikawa在一场技术分享活动中自曝的。

不少网友在看完这个故事之后,纷纷感慨道:

绝对的传奇!

虽然故事很精彩、很有趣,不过言归正传,这也从侧面反映出了目前大模型时代下所存在的安全隐患。

正如Evan在活动中所说:

随着模型变得越来越强大,它们在坏人手中可能造成的伤害变得更大,我们在这里的警惕性确实需要成倍增加。

除此之外,Evan在活动中还分享了两个与OpenAI、ChatGPT相关的“隐秘的故事”。

我们继续往下看。

OpenAI:GPU够的话,发布早就提前了

Evan先是回顾了ChatGPT最初爆火的盛况:

从内部决定发布,到后来意外走红,就连马斯克都发推讨论等等。

随之而来的便是大量用户的涌入,当时他们自己也很担心,因为以他们GPU的能力,完全hold不住那么大的负载。

然后Evan在现场展示了他们为ChatGPT提供动力的计算机,里面有8个英伟达A100 GPU:

每个GPU上还都附加了特殊的HPM高带宽内存;至关重要的是,他们还需要所有GPU相互通信:

Evan表示,里面的每个环节的性能都会影响ChatGPT最终的体验感。

接下来,Evan站在现在这个时间节点,回顾并总结了OpenAI最初在GPU上所遇到的瓶颈。

1. GPU内存不足

由于ChatGPT的模型非常大,需要占用大量GPU内存来存储模型权重。而GPU上的高带宽内存非常昂贵和有限,不够用来同时服务大量用户请求。这成为第一个瓶颈。

2. 计算效率低下

初期通过简单的GPU利用率指标监控存在问题,没有充分考虑到tensor运算的内存访问模式。导致GPU算力没有被充分利用,浪费了宝贵的计算资源。

3. 难以扩容

ChatGPT流量暴增,但受限于整个GPU供应链,短时间内无法扩充GPU服务器数量,不得不限制用户访问。无法自动扩容成为重大挑战。

4. 多样化负载特征

随着用户使用模式的变化,不同模型和请求类型对GPU的计算方式和内存访问模式需要不断调整,优化难度大。

5. 分布式训练困难

GPU之间的通信和数据交换成为训练架构中新的瓶颈。

可以看出,OpenAI开始将GPU用于部署大模型服务时,确实因为经验不足而遇到一些系统级别的困难。但通过不断调整策略和深入优化,才使ChatGPT得以稳定运行。

而且Evan还爆料说:

如果不是因为GPU短缺,去年产品和功能的发布速度会更快。

我们已经准备好了东西了,但我们也知道无法处理负载。

基于上述的挑战,Evan分享了OpenAI总结出的经验教训:

把问题视为系统工程挑战,而不仅仅是研究项目;需要优化各个系统组件的协同工作,如缓存、网络、批处理大小等。

要深入了解硬件的底层细节及其对系统的影响,如GPU内存带宽、ops/bytes等对性能的影响;不能停留在表面指标。

不断根据模型和场景变化对系统进行调优;不同的模型结构和使用场景会对系统提出不同要求。

要考虑到硬件的各种限制,如内存和算力均衡、扩容限制等,这会影响产品路线图;不能简单地套用传统的云扩展经验。

把ChatGPT看成初创公司

至于团队方面,Evan也有所介绍。

ChatGPT启动时,应用工程团队只有30人左右,发布10个月后才扩充到近100人。

OpenAI一直在员工数量增长与保持高人才密度之间寻找平衡,他们最初希望团队尽可能小,这样可以保持高效的迭代文化。

不过后来随着产品规模增长,很多职能只有几个人在支撑,这样就会存在一定风险,因此才决定进行一定扩张。

Evan对于团队建设方面的分享,有一个观点是值得划重点的。

那就是他认为:

不要把ChatGPT看成是OpenAI的一个部门

他们在三年前就尝试过用API做类似ChatGPT的事情,因此在Evan看来——

ChatGPT更像是个10月大的初创公司嵌套到了3年前的初创公司;而这个三年前的初创公司,又嵌套在一个8年前的初创公司(即OpenAI)

接下来,如果公司还会出现新的产品,Evan希望还是能够保持沿用这种模式。

参考链接:
[1]https://www.youtube.com/watch?v=PeKMEXUrlq4
[2]https://twitter.com/random_walker/status/1719342958137233605?s=20
[3]https://twitter.com/nearcyan/status/1719225443788935372?s=20

本文来自微信公众号:量子位 (ID:QbitAI),作者:关注前沿科技

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2023年11月1日 15:16
Next 2023年11月1日 15:39

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日