逼近GPT-4的新模型,为何选择了闭源?

当明星般的开源大模型公司Mistral宣布发布了旗舰大模型Large时,人们为它欢呼,以为是开源的又一次胜利。

去年5月成立的法国AI初创公司Mistral,号称以开源为使命,去年底推出了开源模型Mistral。,Mistral模型系列服务报价

它的商业模式类似于OpenAI面向开发者提供API有偿服务,基于token用量计价,目前输入百万token。

当明星般的开源大模型公司Mistral宣布发布了旗舰大模型Large时,人们为它欢呼,以为是开源的又一次胜利。

结果发现它是一个闭源大模型,你不知道它有多少参数,只知道它自称具备一流的推理能力,在语言、数学、编程、知识等方面直逼GPT-4,超过了之前的老二Claude2。

当年OpenAI成立时,它号称要为了人类的利益,对抗谷歌的垄断,建立开放的人工智能,结果在推出GPT-3之后就封闭了。它说要在使命与商业利益之间做出平衡。

去年5月成立的法国AI初创公司Mistral,号称以开源为使命,去年底推出了开源模型Mistral 7B,Mistral 8X7B,风头盖过了Meta的Llama2。刚刚,它不仅发布了一个闭源模型,而且还接受了微软的投资,同样说要实现使命与商业利益之间的平衡。

商业、应用与政治,是开源独角兽Mistral推出闭源大模型的几重考虑。

目前最先进的闭源大模型,已经初步建立了商业模式,即token经济(tokenomics)。OpenAI去年的年化收入达到了20亿美元,并且预计今年会达到40亿美元。它的估值在2023年翻了三倍,在最近完成的一轮融资中,达到了860亿美元。

另一家独角兽AI公司Ahthropic,拥有排名第二的闭源大模型Claude2,去年其收入也达到了年化近10亿美元,去年的几轮融资数额为近70亿美元,估值已经达到了184亿美元。

Mistral能挑战OpenAI吗?它号称要做到“在AI世界里资本效率最高”,目前估值为20亿欧元,相比GPT-4训练投入了上亿美元,Mistral Large只投入了2000万美元。它在商业上要对标OpenAI,但从投入和融资上并没有显示出挑战OpenAI的雄心。

来源:Mistral官网 ,Mistral模型系列服务报价

它的商业模式类似于OpenAI面向开发者提供API有偿服务,基于token用量计价,目前输入百万token 8美元,输出百万token 24美元。上下文长度32K。目前只支持文本、转换、代码生成。

相比之下的GPT-4 Turbo, 128k上下文, 百万token输入10美元,输出30美元。

Mistral Large的原生函数调用和JSON 模式受到了称赞,RAG功能(检索增强生成)增强了它的准确性。但仍有不少疑惑,它的价格非常接近OpenAI,但它的差异性何在?

GPT-4、Mistral Large(预训练)、Claude 2、Gemini Pro 1.0、GPT 3.5 和 LLaMA 2 70B 在 MMLU 上的比较(衡量大规模多任务语言理解)。 

 

开源与闭源双管齐下,成为今年大模型领域的一个新趋势。最近谷歌在发布”最强“闭源大模型Gemini Ultra之后,发布了开源模型Gemma 2B 和7B,也是其加速推进AI的软硬件应用的战略举措。

而Mistral则是从开源杀入闭源。Mistral 7B到MoE架构的Mistral 8X7B,继在多项测试指标超过了Llama 70B之后,现在开始挑战闭源大模型GPT-4和Claude 2了。

目前无论是在PC设备终端,还是推理引擎上,开源模型Llama2和Mistral 7B都成为首选。而更多适配PC的7B模型,适配手机的2B或更小的模型,正在涌现。对于许多应用与模型公司来说,基于云的tokenonics无法成立的话,不妨向边缘走,向设备终端走。

第三个是政治考虑。Au Large不仅是Mistral的旗舰模型,是法兰西的旗舰模型,也是整个欧盟的旗舰模型。Mistral甚至代表欧盟大模型企业,影响到了人工智能法案 (AI ACT)的立法过程。在AI主权的趋势下,欧洲要建立起自己的大模型经济。这次微软的投资,只有1500万欧元,并且在云服务领域展开合作,并非外界夸张地以为微软又控制了一个大模型。

微软将在西班牙和德国投资50亿美元,建立数据中心。不管怎么说,欧盟在自己的境内,建立起了用自己的数据训练自己的大模型的基础设施。它首先服务的语言是英语、法语、西班牙语、德语和意大利语。

市场上领先的 LLM 模型在广泛常识、推理和知识基准上的表现:MMLU(测量理解中的大规模多任务语言)、HellaSwag(10-shot)、Wino Grande(5-shot)、Arc Challenge(5 次)、Arc Challenge(25 次)、TriviaQA(5 次)和 TruthfulQA。

除了 Mistral Large 之外,Mistral还发布了一个较小版本的闭源模型Small,其性能优于Mixtral 8x7B,并且延迟较低,为用户在开源产品与Large之间提供了选择。

Mistral还推出了一款名为Le Chat的聊天助手。任何人都可以在chat.mistral.ai上注册并试用,但因为注册人数太多,许多人被放到了等候名单上。目前该服务的访问是免费的,用户可以在三种不同的模型之间进行选择 – Mistral Small、Mistral Large 以及设计简洁的Mistral Next。Mistral还计划为企业客户推出Le Chat的付费版本。

这家位于巴黎的公司2023年5月才成立,团队由谷歌Deepmind和Meta前员工组成,最初6人团队以7页PPT融到了8亿元(相当人民币),成为一段传奇。

本文来自微信公众号:未尽研究 (ID:Weijin_Research),作者:未尽研究

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年2月28日
Next 2024年2月28日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日