Kimi爆火后,大厂角逐长文本

而随着Kimi的崛起,这也让大模型的讨论焦点从大模型本身转移到了应用端,2024年是否会成为AI大模型应用落地元年。那么,2024年是否会成为AI大模型应用落地元年。”曹均涛告诉记者,梦饷在去年为创作者做了AI创作平台,虽然能生成模特图,但是成图率并不高,还是需要技术升级和内部做技术提示词、算法模型的调优,这个平台到现在还没有开放,“现在大家都在找应用场景,估计2024年开始能够看到更多AI、大模型带来的变化”。

月之暗面不再“晦暗”。近期,由这家公司创作的大模型应用Kimi,吸引了大量目光。Kimi产生的效应已经从大模型圈外溢至资本市场,Kimi概念股在上周应运而生。用户激增,巨大流量突然涌入,甚至让Kimi服务器一度宕机。

Kimi在这一轮大模型应用当中突围,核心优势在于长文本读取和解析能力颇为巧合的是,就在22日晚间,阿里高调宣布通义千问开放1000万字长文本能力。360当晚紧随其后,宣布360智脑正式内测500万字长文本处理功能,即将入驻360AI浏览器。

而据《科创板日报》了解,百度也将在下个月开放200~500万的长文本能力。

阿里巴巴、百度等互联网巨头纷纷布局并升级自家的大模型产品,强化长文本处理能力,正让业界重新审视长文本处理在大模型领域的必要性和重要性。而随着Kimi的崛起,这也让大模型的讨论焦点从大模型本身转移到了应用端,2024年是否会成为AI大模型应用落地元年?

长文本是必要的吗?

相较于其他大模型应用,Kimi的长处在于长文本分析联网搜索、文档处理和等功能上,尤其在深度解析厚重书籍内容方面,其性能远超远超其他模型。3月18日,月之暗面甚至一口气将无损上下文长度提升了十倍,直达200万字级别。

据目前的用户体验来看,Kimi也不是全能选手。有用户反馈表示,对于一些较为困难的任务,包括结构化信息处理和图像中潦草文字的识别以及对话连续性,Kimi仍显示出一些短板。在生成能力和语音能力上,目前Kimi还未加入这些模态。

尽管如此,长文本能力的重要性仍不言而喻。目前,市面上的大模型应用,GPT-4Turbo-128k公布的文本范围约为10万汉字,Claude3200k上下文约16万汉字。

一家AI上市公司大模型架构业务人士告诉记者,由于模型训练结构的限制,以往大模型的文本范围都不算长,但复杂任务和行业知识通常是长篇巨制,这种情况下,只能拆分输入提问,但这可能会导致输出的结果上下不连贯逻辑不通顺。长文本可以全篇连贯的去理解上下文,满足理解和问答的需求,长文本能力在此时是具备优势的。

而国内大厂们,则正在长文本领域快速布局。

百度在下个月将对文心一言进行升级,届时也将开放长文本能力,文本范围在200~500万。目前,文心一言的文本最高上限在2.8万。

而阿里已经先行一步。22日晚间,阿里的通义千问官宣升级,向所有人免费开放1000万字的长文档处理功能。用户可通过通义千问网站和APP快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。

360紧随其后,其在当晚宣布,360智脑正式内测500万字长文本处理功能,即将入驻360AI浏览器。

Kimi成功在前,阿里、百度、360先后角逐长文本。长文本能力会是大模型未来差异化的竞争点吗?

上述大模型架构人士表示,长文本能力目前在训练和效果上仍存在一些难点,比如如何避免遗漏细节。事实上,文本长度也可以通过RoPE等算法技术去拓展,但是此时会严重丢失细节,这就导致输出效果不准确。因此,核心标准是看输出结果的精准性连贯性,并不是文本长度越长越好。

另外一名大模型行业人士也告诉记者,长文本实际是大模型的基础能力,只要算力资源足够,理论上长文本可以追求无限长,“但是如果使用场景根本用不上长文本,那么此时的长文本就没有任何意义”。

2024年是大模型应用落地元年吗?

Kimi的火爆,一定程度上也反应了当下国内大模型的发展阶段,从打基建开始走向应用落地。那么,2024年是否会成为AI大模型应用落地元年?

澜舟科技CEO周明认为,从长远来看,人工智能在逼近AGI。而经过去一年的发展,大模型已经具备了落地的能力,企业侧也积攒了很多业务落地场景。加上国家政策的推动,2024年将会是大模型落地元年。

零一万物联合创始人祁瑞峰也表达了类似的看法,但他是聚焦在B端场景。目前,内容生成、理解、摘要和对话等应用仍占据主导,但随着新一代模型推理、决策和执行能力的提升,有望更快地将AI技术植入企业业务系统,真正开启大模型赋能的腾飞。

电商是AI应用最具代表性的领域之一。魔珐科技目前是阿里妈妈、淘宝直播生态官方指定的3D超写实虚拟直播服务商,旗下有一款3D虚拟人直播AIGC产品“有光”。

魔珐科技CEO柴金祥表示,电商是公司AI产品应用的最主要一个行业。从已有的使用效果来看,多个知名头部美妆品牌在使用魔珐科技提供的3D虚拟人后,午夜6小时的直播时段内累计年GMV增量高达数千万。3D虚拟直播午夜超级直播广告投放高于行业均值2倍以上,ROI大于5倍。

尽管2024年被寄予厚望,但是各方仍然保持着审慎乐观的态度。

祁瑞峰认为,在C端市场,目前成本还很高,商业模式还未完全跑通。即便是对于现在已经可以创收的B端市场,周明也认为,要想做好产品标准化和完整交付,训练和部署成本、行业适配能力、幻象问题、数据安全四方面的问题,还有待解决。

梦饷科技CTO曹均涛表示,虽然AI在电商行业的应用,想象空间非常大,梦饷也在通过GPT大模型重构业务场景,包括解决模特图片生成、素材差异化、服装秀、AI创作助手、聊天室导购等问题。

“但是现在的阶段,基础设施并不完善。”曹均涛告诉记者,梦饷在去年为创作者做了AI创作平台,虽然能生成模特图,但是成图率并不高,还是需要技术升级和内部做技术提示词、算法模型的调优,这个平台到现在还没有开放,“现在大家都在找应用场景,估计2024年开始能够看到更多AI、大模型带来的变化”。

在42章经创始人曲凯看来,2024年仍会是技术上不断突破的一年,很难真的做到大规模的落地和有非常多的场景,不过,不管是在B端还是C端,今年有望看到更多应用开始跑出来。与此同时,应用端的项目今年也将更受投资人青睐。

“去年大家投了非常多资金和精力在大模型本身,要想将这个故事持续下去,就需要有落地,因此会在应用端继续探索,找到PMF(Product Market Fit,产品市场匹配)。”曲凯说。

本文来自微信公众号:财联社 (ID:cailianpress),作者:旭日

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
(0)
上一篇 2024年3月25日
下一篇 2024年3月25日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日