作者|陶然 编辑|魏晓
讯飞星火离GPT-4又近了一步。
2024年1月30日下午,科大讯飞星火大模型3.5版本正式发布,公司董事长刘庆峰保持着和此前每次发布会一样的激动神情,照例将星火大模型与GPT-4模型能力和具体应用分别对比。
语言理解、数学能力已经超过GPT-4 Turbo,代码能力达到GPT-4 Turbo的 96%,多模态理解达到GPT-4V的 91%。
毕竟,过去一年,自称追赶者的科大讯飞反复强调着对标:2023年对标GPT-3.5,2024上半年对标GPT-4。
但这一次,比起对标GPT,科大讯飞似乎更有意强调另一项更为基础的工程:国产自主可控的算力平台。
这次大模型版本更新,官方最早给出的预告中就明确表示,星火V3.5是“首个基于全国产化算力平台训练的全民开放大模型”。而在今天的发布会现场,刘庆峰又多次谈及国产、华为、谈及讯飞与华为如何被极限施压、怎么合作破局。
核心组件之一,便是与华为合作开发的大模型算力平台“飞星一号”。
去年上半年,我们就和华为成立了联合的特战队,5月6号星火大模型发布之后,任正非看到了成果之后,亲自决定要派华为史上最高规格的特战队加入(讯飞)联合研发。
时任华为轮值董事长徐直军也表示,他对国产大模型“充满信心”。
华为大约已经成了国内科技行业的诺亚方舟,来来往往,大家都想攀上这艘大船。
“全国产化”
距离这场发布会上被多次提及的“飞星一号”首次发布的日期,实际上已经过去了三个月。
早在2023年10月的第六届世界声博会,科大讯飞就已经同华为官宣了“飞星一号”大模型算力平台的亮相。当时的说法是,该平台基于华为昇腾生态打造、自主可控,可用来训练对标GPT-4的、上万亿浮点参数规模的大模型。
在此之前,科大讯飞和华为已经将昇腾910B的能力,由对标英伟达A100的20%、30%提升到了90%。
科大讯飞也在此平台的基础上,开启了星火大模型对标GPT-4的更大规模训练。
这样来看,今天“首个基于全国产化算力平台训练”的大模型发布,可以被视作“飞星一号”的首批大模型落地成果。在保持AI能力升级的前提下实现“全国产化”,也足够验证讯飞与华为联合打造的算力平台已经具备了相当的实用性。
此前发布工具,现在陆续开始有了成果。
发布会现场的演讲,还透露了更多细节——“飞星一号”刚刚开始(运行)90多天,且中途还有很多工具调优的过程,训练时间比较短。以及,刘庆峰非常有信心,讯飞今年上半年“还会有非常大的提升。”
对于公司与华为的合作,刘庆峰称其为“深度联手”,并表示国内有很多相关生态也在快速跟进,大模型产业的两个方向,一是源头技术向GPT-4(以及今年可能会更新的5)这些行业顶尖看齐,二是大模型需要大规模落地产业化。
总之,自主可控是大模型长期主义的前提。包括讯飞在内,国内不少科技企业显然已不再指望外部环境有转机,国产化算力硬件的性能如今及时跟上,卡脖子问题的解法已经越来越多、越来越便捷。
高投入一年之后
一天前,1月29日,科大讯飞发布了2023年度业绩预告。
初步计算,科大讯飞2023年预计实现营业收入200亿人民币以上,同比增长约7%;归母净利润6.45至7.3亿元,同比增长15%-30%;扣除非经常性损益后的净利润 8000万元至1.2亿元,同比骤降71%-81%。
对于扣非净利润大幅度下降的原因,科大讯飞在公告中给出了与此前财报季相似的解释,即公司在核心技术自主可控和产业链可控的国产化替代方面坚定投入,抢抓通用人工智能的历史新机遇,在自主可控平台上加大认知大模型研发投入。
高投入能带来技术优势,但不可避免会影响当期利润。
公司过去一年的股价也是大起大落,2023年6月一度涨至每股81.88元高位,最新收盘价仅为/股,近乎腰斩。
这样来看,刘庆峰在发布会上强调的大模型落地产业化,无疑更为迫切。
讯飞还是选择从老本行开始发力,语音、教育和医疗:发布会上,星火语音大模型首次发布,介绍称该模型由多语种语音合成,在首批37个主流语种上已整体超越OpenAI的Whisper-large-v3;主打/G、内置星火大模型V3.5的新一代星火智慧黑板发布,具备多模态理解、自然语言交互等大模型标配能力。
以及,前段时间市场消息显示,拆分自科大讯飞的讯飞医疗拟在港股主板上市,主打概念就包含AI医疗。去年10月24日星火大模型V3.0的发布会中,讯飞方面称星火大模型“已经在医疗领域超越GPT-4”。
只是,从营收数据上看,讯飞医疗在2021年、2022年分别录得净亏损8940.1万元、2.09亿元,2023年前三季度则由上年同期的1.63亿元亏损增加至1.7亿元,并未有任何依靠AI盈利的迹象。
AI医疗的效果和变现能力成色几何,还有待时间检验。
倘若真如一些分析师的预测,通用大模型在数量上已经供大于求,最终能获得可观收益的玩家不会剩下太多,那高投入的讯飞想成为赢家之一,就必须找到高回报的途径,并验证这种途径的可行性。
大模型本体已经完备的科大讯飞,还在等待收获期。
来源|AI蓝媒汇 作者|陶然