ChatGPT又变强了,OpenAI会变成下一个苹果吗?

 
开发助手
 
OpenAI此次更新中,着重面向开发者推出了Assistant。
 
用户可以直接创建ChatGPT的自定义版本,在开发者大会现场,两位OpenAI工作人员现场演示了GPT的构建方法。
 

开发者zolika84在测试语音识别whisper-api时,90分钟就用掉了120美元额度

过去半年中,OpenAI的估值水涨船高,总融资超过140亿美元,但OpenAI的资金消耗速度惊人。

“今天,有大约200万开发者在使用我们的API进行各种用例的开发。超过92%的财富500强公司正在使用我们的产品进行构建,而现在ChatGPT每周活跃用户大约有1亿。”

 

北京时间11月7日凌晨,在OpenAI的首次开发者大会上,Sam Altman公布了过去一年中OpenAI的骄人成绩。

 

如会前流传的消息,本次大会上推出了ChatGPT的最新版本GPT-4 Turbo,以及众多全新功能。更重要的是,OpenAI宣布要围绕GPT打造AI平台,推出GPT Store,并提出了GPTs的概念,用户可以利用GPT Builder工具,创建自己的GPT。

 

从ChatGPT被比喻为AI的iPhone时刻,恐怕Sam Altman就已经把目标瞄准了苹果。不过,他的野心更大,不仅要把ChatGPT做成下一个iOS,还要进一步加强与用户的绑定,让每个用户都有机会成为开发者。

 

王炸:GPT-4 Turbo

 

本次发布的LLM(大语言模型)更新主要包括:

 

  • 最新的GPT-4 Turbo,支持128k上下文窗口,且价格更低,输出更快。

  • 全新的Assistants API,使开发人员更容易构建自己的人工智能应用程序。

  • 新的多模态功能,包括视觉、图像创建(DALL·E 3)和文本转语音(TTS)。

OpenAI开发者大会的发布的重要更新

 

长上下文

 

长上下文正在成为百模大战的“主战场”。对比众多新模型,GPT-4的32k token上下文窗口已不那么出色。此次GPT-4 Turbo更新的上下文窗口达到128k,是GPT-4的四倍,且超过了竞对Anthropic此前推出的100k token的Claude 2。

 

Sam Altman在演示中称128k token大约相当于300页纸的文字量,英国版的《哈利·波特与魔法石》差不多就是300页,指环王三部曲平均每本是400页。

 

不过,GPT-4 Turbo的上下文长度也并非最长。一周前,百川智能发布的Baichuan2-192K,上下文窗口长度为192K,能够处理约35万个汉字。

 

开发助手

 

OpenAI此次更新中,着重面向开发者推出了Assistant API,使开发者能在应用中集成类似代理的AI体验。

 

这个API允许AI助手执行具体任务,调用模型和工具,并处理一些复杂的编程和数据处理工作。它支持多种用途,如自然语言数据分析、编码辅助、旅行规划等。

 

助手API具有持久化线程功能,简化了状态管理,并允许调用开发者定义的函数。此外,它还提供了代码解释器和检索工具,可在外部数据上运行和检索信息。数据保护方面,开发者可自主管理其传递给API的数据。现在,开发者可以通过助手API游乐场,无需编码进行测试。

 

此外,OpenAI对函数调用进行了更新,现在模型可以在单个消息中调用多个函数,并更准确地返回正确的函数参数。GPT-4 Turbo在遵循指令生成特定格式时表现更佳,并支持新的JSON模式以确保输出有效的JSON对象。新增的API参数response_format允许模型输出语法正确的JSON。此外,通过新的seed参数,模型可以产生可重现的输出,有助于调试和编写单元测试。OpenAI还计划推出返回输出令牌对数概率的功能,以便在构建“自动完成”等功能时使用。

 

知识更新

 

GPT-4的知识库更新到2023年4月。目前ChatGPT中使用的GPT-4模型,已经将知识库更新到了2023年4月,不过GPT-3.5的知识库仍然停留在2022年1月。

 

新的多模态模型

 

在多模态能力方面,GPT-4 Turbo的API将集成DALL-E3,以及文生语音模型TTS(text-to-speech)。

 

开发者可以通过API直接调用GPT-4 Turbo with vision中的DALL-E3模型,进行图片识别和图片生成。事实上,DALL·E 3上线之后,ChatGPT Plus用户就已经可以在GPT-4模块下调用DALL·E 3进行图片创作,以及多模态的图片识别了。不过,这次是以API的形式,将多模态的能力开放给开发者。

 

此外,OpenAI还上线了新的TTS文生语音功能。类似能力,在ChatGPT手机端也已经上线了一段时间(不过目前实测中文还是有一点英语口语),此次也是针对开发者的API开放。目前TTS的语音包共有六种声音可选,可以输出Opus、AAC和FLAC三种格式,尚不支持自建声音。

 

价格更低,输出更快

 

“在模型持续的迭代中,我们的价格也在不断下降。”Sam Altman介绍说,相比于GPT-4,GPT-4 Turbo的输入价格只有1/3,0.01美元每1000 token;输出价格为0.03美元每 1000 token,只有原来的1/2。而内容生成的速度,提高了2倍。

 

 

又一个iPhone时刻:GPT Store

 

在ChatGPT插件上线的时候,就有很多人将其比喻为安卓市场或是iOS的App Store。如今,OpenAI真的推出了AI版本的App Store——GPT Store。

 

用户可以直接创建ChatGPT的自定义版本,在开发者大会现场,两位OpenAI工作人员现场演示了GPT的构建方法。

 

OpenAI工作人员Jessica shay现场演示了利用GPT Builder构建一个能与行程表互动的 GPTs。并以对话的形式命令 GPT 给 Sam Altman 发信息, Altman也在现场接收到了这条信息。

 

另一个更加专业的演示则是OpenAI 的工作人员现场演示Assistants API的用法:它不仅能列出巴黎旅游建议,还能在地图上将计划中提到的地点按类别标记出来。

 

Sam Altman表示OpenAI 将会在本月底上线 GPT Store,开发者可以通过GPT Store分享、发布自己的 GPTs。此外,GPT Store产生的收入OpenAI也将按一定比例与开发者分成,不过具体的分配方案还尚未公开。

 

关于钱和微软

 

在现场的Assistants API演示过程中,OpenAI工作人员开放了一个现场抽奖,第一波抽奖是随机选了5个到场工程师每人发了500美元的开发者额度。第二波则直接给到场的900多名软件开发人员及参会嘉宾每人发了500美元额度。

 

看似“撒币”的行为,其实对于OpenAI来说,也没有特别大方,因为API额度消耗的速度对于正常开发者来说,实在是太快了。多位开发者曾在OpenAI社区中表达了OpenAI发放的120美元的开发者试用优惠额度很快就会用光。

 

开发者zolika84在测试语音识别whisper-api时,90分钟就用掉了120美元额度

过去半年中,OpenAI的估值水涨船高,总融资超过140亿美元,但OpenAI的资金消耗速度惊人。

 

一方面,OpenAI需要支付大量的算力和研发成本;另一方面,还要为未来不确定的法律问题做准备。

 

本次大会,OpenAI推出了copyright shield功能,用于保护用户不受到版权问题困扰,不光从技术上规避版权风险,当用户遇到版权问题时OpenAI也会协助解决。

 

过去几个月中,OpenAI一直被美国的众多版权所有者联合维权,多家出版集团都在向OpenAI伸手要钱。在版权问题方面,未来的商业化推广道路需要有庞大的资金支持。在美国的法律环境下,要推出这样一项服务,OpenAI大概率也已经盘算好了败诉后的退路。

 

说到钱,就不得不提到OpenAI一直以来的大金主:微软。坊间一直流传着两家不合的传闻。Sam Altman的演讲中,只邀请了微软CEO Satya Nadella一个嘉宾,似乎是在向外界证明OpenAI和微软的无间合作。

 

在演讲中,Sam Altman直白地问Satya Nadella:微软和OpenAI的合作关系怎么样?

 

Satya Nadella幽默地回答说:“事实上,我记得你第一次向我伸出手时说,‘嘿,你有一些 Azure 积分吗’,比起那时,我们已经取得了很大的进步。”

 

微软始终是基础设施提供者,赚的是基础设施的钱。Satya Nadella反复强调:“我们的首要任务是构建最好的系统,以便你可以构建最好的模型,然后将其全部提供给开发人员。”

 

不过,Satya Nadella并没有否认微软开发团队在AI方面的研究工作,他表示:“我们自己也是开发者,我们也在构建产品。”

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2023年11月7日
Next 2023年11月7日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日