来源:秋水笔弹
在最近的一次活动上,周鸿祎抛出了“去年看大模型像原子弹,今年年初再看大模型就跟茶叶蛋似的”的论调,如其所言,开源大模型、大模型超市层出不穷,行业模型、小参数模型也开始百花齐放,百度也逐渐把重心转移到了应用生态以及付费商业化工作当中。
但是从GPT-3到GPT-4的能力跃升,到GPT-5可能带来的迅猛发展来看,水哥以为,大模型通用能力还在以指数级别的速度进化着,现在打扫战场恐怕为时尚早,对于被围追堵截的中国以及中国企业而言,更是如此。
与GPT深度捆绑的微软创始人比尔·盖茨在年初也发声,强调大模型这款人工智能技术在未来五年内将实现显著的变革。
Sam Altman也透露了GPT-5的最新进展,很可能已经大幅超越了GPT-4的能力范围,他认为,如果 GPT-4 目前解决了人类任务的 10%,GPT-5 应该是 15% 或者 20%。他还用“初代 iPhone 和最新 iPhone15”的对比,来形容AI未来所能实现的进步。
从这种走向来看,大模型还在朝着通用人工智能的道路迅速挺进。
事实上,也是人工智能打开的可能性,让美国铁了心对中国围追堵截,拜登政府已经提议要求美国云服务公司进行自查,以确定外国实体是否正在访问美国数据中心以训练人工智能模型,防止中国利用美国技术进行人工智能的发展。
今天的中国发展通用人工智能,是势在必行的事,“宜将剩勇追穷寇,不可沽名学霸王”。在刘庆峰看来,今天,大模型绝不是像茶叶蛋一样不值钱,通用人工智能的自主可控,既决定了产业链安全,也决定了国家安全。如果中国没有大模型,那么工业、民生、科研以及各个专用领域都会极大地落后于世界。
那么,大模型真的到了打扫战场的时候吗?这个掀起了全球新一轮风险投资热潮的产品创新,到底是茶叶蛋,还是原子弹?
中国第一个基于国产算力的大模型,到底能不能打?“能够真正对标美国最先进技术的大模型,全中国将来没有几个,讯飞星火一定是其中之一”,科大讯飞这种自信的底气来自于何处?
一、通用人工智能时代,中国更需要wintel组合
大模型当然不是茶叶蛋,相反它是通用人工智能的曙光,就好像,互联网发展到今天,是一系列科技创新所促成的,互联协议只是打开了一个技术的潘多拉魔盒。
互联网的发明最早是为了在科学和军事计算机之间共享文件,但是今天它在一系列创新技术的推动下,从根本上改变了娱乐、商业、制造业和个人通信。
大模型打开另一个通用人工智能系列技术创新的潘多拉盒子,与人类第一次使用蒸汽机、电灯泡一样,都是新一轮创新浪潮的开端。
这种可能性,正是美国不择手段围堵中国的根本动机。
美国的围追堵截,也坚定了很多中国企业家通过自主创新实现人工智能产业突围的决心,已经被美国拉入实体黑名单的科大讯飞危机意识就非常强烈,在科大讯飞创始人刘庆峰看来:“当前,发展通用人工智能是我们必须要做的事情,否则工业、科研、民生等各个专用领域都会极大落后于世界,而中国是世界唯一有望成为智慧涌现第二极的国家。”
在前几天科大讯飞发布会的大模型升级效果来看,从智能算力底层开始,实现自主创新的国产替代也并非没有可能的。
2023年10月,科大讯飞携手华为,基于首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”,启动了对标GPT-4的更大参数规模的大模型训练。
虽然训练时间还不到一百天,讯飞星火V3.5的逻辑推理、语言理解、文本生成、数学答题、多模态等核心能力已经实现了显著提升,接近了GPT-4水平,其中语言理解、数学能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。
互联网的发展出现了软件与硬件的厂商产业联盟wintel 组合,算力的进步,与软件是相辅相成的,Wintel联盟依靠英特尔摩尔定律的算力升级和微软Windows系统的升级换代,双方彼此支撑推动了个人电脑长达二十多年的迅速进化。
今天华为、讯飞的算力与大模型组合,作为中国大模型产业的产业联盟,一方面为中国解决算力自主问题提供了产业落地空间,另一方面,也为软硬一体化的中国人工智能发展开辟了道路。
除了自主安全这项其他国产大模型没有的优势,事实上,在语音交互这项通用能力上,科大讯飞已经实现了对GPT-4的反超。据刘庆峰介绍,国内首个语音大模型星火语音大模型,中文、英语、法语、俄语等首批37个主流语种的语音识别效果超过OpenAI Whisper V3。
语音大模型的优势,为科大讯飞在未来打开机器人产业的未来空间,也让科大讯飞在语音赛道二十多年的能力优势,在大模型时代,能够进一步放大。
不过,当前讯飞星火V3.5在小样本快速训练、多模态深度学习训练、超复杂深度理解等领域距离GPT-4的最好水平还有差距,刘庆峰认为,我们要清醒理智看到差距,“一定要在通用大模型的底层能力上持续对标国际最先进水平,从算法研究包括更小的算力上做出相对更优效果。”
不论国产与美国的差距,还是大模型今天的水平与通用人工智能的差距,都决定了这依然是一场长跑,只有看到远景并坚持下去,才有可能赢得最终的胜利。
二、落地大考:跨越技术与市场的创新鸿沟
大模型打开的通用人工智能道路还有很远的路要走,众所周知,人们往往在短期高估技术的发展,而在长期低估了技术的发展,今天大模型也差不多,短期淘汰赛会非常惨烈,站住脚就已经很难。
根据技术的扩散周期,大模型创业竞赛正进入冲刺淘汰赛段,大模型逐渐形成专门的早期市场,能否赢得早期市场,站稳脚跟,获取下一步的入场券,成为每个公司必须面对的首要问题。
在这个阶段,只有同时拥有远大愿景、与丰富产业数据与经验的公司,才有进一步跑出的希望。
但是这些恰恰是科大讯飞的优势所在,教育、医疗、消费者、智慧城市、运营商、汽车等多个G/B领域是科大讯飞根据地业务,二十多年积累的人工智能行业认知、技术以及数据,都是今天其大模型深度差异化的能力来源。
为什么讯飞大模型能快速进行大规模产业落地?举一个例子:通用技术的比拼,如同射箭比赛,比拼行业大模型,除了技术能力之外,还要拼对行业的“画靶子”能力。以教育为例,有关“小学生英语学习”的大模型,首先需要了解小学英语的学习目标,还要定义小学生英语学习的范围,不能超纲,并要找到适合孩子学习习惯和学习阶段的方法——这些标准,都要先定义,这就是“画靶子的能力”。
每个行业都有着长链条的价值链,复杂的上下游以及复杂的专业领域数据与知识,很多厂商没有做过行业,是不具备画靶子的能力的,没有办法深入行业的本质。但是讯飞在多个领域都深耕多年,不仅能画靶子,也有专业的团队和数据积累——这样才能做出行业真正适用的大模型。
从人才培养角度来说,行业+技术的复合人才很短缺,而讯飞做了人工智能行业25年,能穿透行业的人有很多,头部、腰部力量很强。
在技术顶天、应用落地的战略下,科大讯飞这么多年在行业应用上,已经形成了成熟的“GBC联动”模式。
把大模型技术的创造力,转化为促进产业增长的新质生产力,正在成为千行百业的共同选择。基于全国产化算力打造的讯飞星火V3.5支持异构算力调度,可实现行业大模型训练提效90%,支持23个企业应用场景的敏捷优化。星火大模型还与奇瑞汽车、太平洋保险、交通银行、国家能源集团等企业,打造千行百业的大模型应用标杆。
随着数学和推理能力的升级,多模态能力逐步进阶,通用大模型能力的升级,决定了落地生产力的提升级别,放大了科大讯飞“GBC联动”的市场优势。
多年推动行业AI化的努力,为科大讯飞大模型商业模式找到了最好的落地方向,为科大讯飞切取更大份额的GBC端的应用和终端硬件产品市场,打开了空间。
赢得早期市场,也意味着赢得了进入下一轮竞赛的入场券。
三、百模大战的泡沫中,会有伟大的公司从中崛起
通用人工智能这条道路,其实已经经历了多次热潮与漫长的冬季。
大模型的出现,让通用人工智能看到了曙光,也让坚持通用人工智能路线的公司看到了曙光。
人工智能的来路比大模型更久远,其未来也更长远,只有一直深耕这条赛道的人才、公司,才有可能抓住偶然出现的技术创新以及时代机遇。
今天,决定输赢的不是公司体量的大小,这就是为什么OpenAI能够率先跑出,它当然也需要微软的资金加持,但是这不是简单的资金算力问题,更重要的团队多年的积累跟长期的技术研发,带来的技术人类反馈机制的技术新突破,无论大厂、小厂的努力,在这场技术长跑当中,每一个关键技术突破,都会壮大其继续前行的技术底座,凭借这些积累,OpenAI、谷歌、科大讯飞这些持续深耕技术企业也都成为了大模型竞赛的关键角色。
在多次迭代、2023年5月正式发布的认知大模型之后,刘庆峰就很骄傲地说:“这次大模型攻关,90后带队,项目中也大都是90后。”老中青传帮带的扎实人才梯队与技术的厚积薄发相辅相成。
在刘庆峰看来,认知大模型本质上是一次对话式的通用智慧的涌现,语音和语言的核心能力是基础条件,科大讯飞是中国该领域的国家队。
在强大的人才团队努力下,科大讯飞在认知智能领域早已取得一系列全球领先成果。2019年,在斯坦福大学发起的国际著名的SQuAD机器阅读理解比赛中,在英文阅读理解中首次超过了人类平均水平。2022年在艾伦研究院组织的OpenBookQA科学常识推理比赛中,单模型首次超过了人类平均水平。
科大讯飞在过去24年一直专注在人工智能,拥有关键算法创新的两个核心策源地——认知智能全国重点实验室、语音及语言信息处理国家工程研究中心,有充分的技术积累。这次星火大模型的每一行代码、每一个算法模块都是自己做的,而不是拿第三方的开源平台训练的。
科大讯飞通过算力端与华为合作,率先解决了算力国产化的问题,同时在人工智能算法方面二十多年的技术人才积累,以及硬件终端多年的市场积累带来的从教育、医疗到政务优质且独特的细分行业市场数据,让它在互联网巨头的刺刀丛中,依然游刃有余。
更重要的是通用人工智能的信仰,对大模型通用能力持续迭代的坚持,很可能会让这家AI公司走得更远。
随着大模型通用能力的指数级强化,机器人、具身智能以及在千行百业进行深度应用的市场空间,都已经逐渐打开。
今天的大模型特别是人工智能,都还处于早期创业创新阶段,对此,刘庆峰也强调,今天的通用大模型并不一定就代表人工智能的全部未来,还有很多创新要做,比如跟脑科学的互动、跟对抗网络的深度连接,我们要做的工作非常之多,需要一整个创新生态。但是,我们一定要有勇气和信心在底层的大模型上持续对标。
大模型魔力的全部发挥,还有待需要更多的技术突破,比如更强大的通用智能算法,更多的感知算法,譬如具身智能,这需要更多具有通用人工智能信仰的、以及市场嗅觉的人才以及公司去攻关突破。
重复造轮的百模大战,当中肯定有泡沫的成分,但是,如果把时间拉长,这种泡沫式的繁荣就像互联网网页时代的千禧年创业一样,是必经之路,但是泡沫当中,一定会有伟大的公司从中崛起,中国绝对不能缺席。