成立仅半年的AI公司,怎么成了OpenAI最大劲敌?

新晋AI独角兽,180天翻7倍

2023年5月,Mistral。

在经过这场种子轮之后,Mistral。

开源模型新王者,逼近GPT-4

而Mistral。

相较于OpenAI的封闭式GPT-3.5以及Meta的Llama2家族,Mixtral。

与此同时,Mistral。很多企业不想将敏感数据放入到类似OpenAI这种封闭的“黑匣子”系统,这也让Mistral。

新晋AI独角兽,180天翻7倍

2023年5月,Mistral AI在法国巴黎异军突起。彼时这一家只有6名员工的公司,凭借着7页PPT,创纪录地获得了1.13亿美元的种子轮融资,打响了欧洲争夺AI头部的第一枪。

令业界震惊的是,这一次融资足足挤进了14家投资方。而且投资阵容的豪华程度,完全不亚于世界头部企业的级别。

既有美国头部老牌VC,光速创投、红点创投、指数创投;也有豪华家办,老佛爷百货所有者 Moulin-Houzé 家族办公室、意大利最有钱的阿涅利家族旗下基金Exor Ventures;还有欧洲各国风投和知名企业及高管等等。

在经过这场种子轮之后,Mistral AI的估值就已经达到了2.6亿美元。而这仅仅是个开始。

今年12月,Mistral AI再次宣布完成4.15亿美元融资,更有硅谷的风险投资公司a16z、英伟达、Salesforce、法国巴黎银行等众多机构参与。此时,Mistral AI估值已经从半年前的2.6亿美元飙升至约20亿美元。

两次成功融资,让Mistral AI这家仅20多人的公司,正式跻身独角兽行列,更是创下了开源公司史上最快增长纪录。

开源模型新王者,逼近GPT-4

而Mistral AI带来的震惊不止一个。除了备受瞩目的第二轮融资外,Mistral AI在没有发布会、没有宣传、甚至没有解释的情况下,悄然发布了其首个MoE(Mixture of Experts)开源模型——Mixtral 8x7B,瞬间引爆了开源社区,让众多开发者夜不能寐。

相较于OpenAI的封闭式GPT-3.5以及Meta的Llama2家族,Mixtral 8x7B的性能不仅不逊色,甚至更为出色,直逼GPT-4。

据官方介绍,Mixtral 8x7B是开放权重的高质量稀疏混合专家模型(SMoE),采用 Apache 2.0 License 开源,由8个拥有70亿参数的专家网络组成,这种结构不仅提高了模型处理信息的效率,还降低了运行成本。

在多项基准测试中,Mixtral的表现都优于Llama 2-70B,推理速度更是提升了6倍。尤其是与GPT-3.5相比,甚至更胜一筹。

举例而言,它能够出色地处理32k长度的上下文,支持英语、法语、意大利语、德语和西班牙语,并在代码生成方面展现出卓越的性能。此外,它还支持微调为指令跟随模型,在MT-Bench上获得了8.3分的高分。

与此同时,Mistral AI还开放了首个平台服务的测试版——la plateforme。平台提供了三个基于指令生成文本的聊天模型,以及一个嵌入模型。目前,mistral-tiny和mistral-small已经正式发布,而性能更强的mistral-medium还处在测试阶段。

值得注意的是,尽管Mistral AI提供了两个模型供直接下载,但其最佳模型目前只能通过API访问。公司计划通过基础模型实现盈利,这也是Mistral AI开放开发者平台测试版的原因。有了这个平台,其他公司将能够通过API付费使用Mistral AI的模型。

这一举措也标志着Mistral AI在开源的道路上,并没有停下商业化的脚步。

下一个 OpenAI?全欧洲的希望

严格来说,Mistral AI的出现可谓成为了“全法国的希望”。自互联网泡沫时代以来,欧洲就鲜少涌现出有重大影响的科技公司。

但Mistral AI创立仅半年有余,就已经在人工智能领域崭露头角,靠开发效率和开源优势“叫板”硅谷AI巨头。

它的技术不仅能够与OpenAI相匹敌,目标也很明显:成为开源版的OpenAI。

在OpenAI、谷歌等竞争对手看来,开源往往伴随着潜在风险,因为原始技术可能被用于传播假信息和其他有害内容。 

但Mistral AI却坚持技术以开源软件的形式共享,让任何人都可以自由地复制、修改和再利用这些计算机代码。这也为那些希望迅速构建自己的聊天机器人的外部开发者,提供了所需的一切。

Mistral AI创始人表示,“尽管OpenAI名字里有Open,但其实完全不Open。很多企业不想将敏感数据放入到类似OpenAI这种封闭的“黑匣子”系统,这也让Mistral AI看到了机会。”他指出公司主打的是差异化的“错位竞争”,将开源、企业级和聚焦欧洲市场作为自己的定位。

按照他的说法,开源主要有2个优势。首先是可以避免训练数据的法律问题;其次是有助于吸引更多顶级开发者的加入。而Mistral AI所要做的就是通过提高数据源的质量和可控性,为模型提供可选的数据源访问。

在这一点上,甚至连法国总统马克龙也表达了对Mistral AI的支持,称之为“法国的OpenAI”。

马克龙还称,“我们将在培训和研究方面疯狂投资”。在巴黎的VivaTech上,马克龙宣布提供5.62亿美元的新资金投入AI领域,以追赶美国和中国市场。

马克龙此言非虚,凭借着“全欧洲的希望”,法国已经有了敢于向全球人工智能挑战的野心。而在产品、资金和政府的支持下,Mistral AI现在要做的就是抢占市场,赶超OpenAI。

参考链接:

https://36kr.com/p/2330666412957317

https://xueqiu.com/2193837505/256484400

https://www.thepaper.cn/newsDetail_forward_25627223

https://baijiahao.baidu.com/s?id=1784430928719833606&wfr=spider&for=pc

本文来自微信公众号:新火种(ID:gh_838b518e4b33),作者:文子,编辑:小迪

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2023年12月15日
下一篇 2023年12月15日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日