01
「不想留后路」
科技行业有个共识:技术的发展不是均匀的,而是以浪潮的形式演进。置身其内的每个人,都应该看清楚浪潮,赶上浪潮。
不过对于科技公司来说,看清和赶上浪潮都是有门槛的。看清的前提是对技术趋势作出准确判断,赶上则要求速度和长期积淀缺一不可。在此基础之上,企业所处的不同生态位、不同「家世背景」,将决定各自在变革浪潮中所扮演的不同角色和使命。
比如在大模型打开的美丽新世界中,科大讯飞就属于不留「退路」的一类。它专注人工智能20多年,终于等来这个足以开启增长新时代的技术大浪。为了成为其中的引领者,这家公司急切地立下一系列精确到日的Flag——
今年5月发布讯飞星火V1.0时,董事长刘庆峰当场宣布,8月15日发布星火V2.0,实现多模态能力;10月24日发布星火V3.0,全面对标ChatGPT(中文超越,英文相当)。
这一迭代时间表甚至被写进了讯飞三季度财报。
在这个背景下,科大讯飞全球1024开发者节成为了现场验收时刻。
根据国务院发展中心国研经济研究院的横评报告,星火大模型综合能力已超越ChatGPT,且在教育、医疗和法律行业表现尤为突出。「整体超越ChatGPT、医疗领域超越GPT-4」,台上的刘庆峰声音沙哑却铿锵有力。事实上,他全程情绪激奋、频繁挥动手臂,把一场发布会开出了军事动员大会的即视感。
台下一名深受感染的合作伙伴说,「老刘技术出身,但真适合营销,太有激情了。」
在展示了星火大模型在教育、医疗等领域的落地能力后,刘庆峰又立了一个新的Flag——2024年上半年对标GPT-4,「这绝不仅仅是一个简单的技术对标问题,我们要走出自己的技术路线,走出自己的产业方向,形成自己完整的生态。」
会后受访时,他回应了讯飞看似激进的时间表背后的动因,「这(注:通用人工智能)是我们所有人的梦想和发自内心的追求,不想留后路。当然,要科学的不留后路。」
熟悉讯飞发展历程的人大概都清楚,这是一家典型的技术公司,1999年以语音切入人工智能领域后,讯飞对技术领先的追求近乎执拗。在其公司战略「顶天立地」中,「顶天」指的就是追求核心技术领先。这种雄心也奠定了讯飞在智能语音领域的龙头地位。
但在上一波人工智能浪潮(2016年-2019年)中,讯飞虽然打开了知名度,当时的主场却是计算机视觉四小龙的,不像这波认知大模型浪潮,基底是自然语言处理,上面叠加多模态,属于讯飞的优势领域之一。
刘庆峰加了限定词「科学」,想强调定时间表不是拍脑袋想出来的,「当时不了解讯飞的人可能在看笑话,但目前证明,基本上每个时间点都是实现的。」
他将原因归结为讯飞过去十多年在自然语言处理领域的技术积累、产品和场景落地经验,尽管其间踩过很多坑,也曾受到争议和质疑,但内部对技术实现的每一个环节是很清楚的,所以敢于「吹牛」。
这当然是理想的一面。
未被谈及的另一面或许与捍卫生态位有关。童话故事《爱丽丝漫游仙境》中,红皇后曾告诫爱丽丝:「你必须尽力地不停地跑,才能使你保持在原地」。由此演化而来的「红皇后假说」提醒着每一位行业先行者:在大的时代机遇面前,你要始终比竞争对手跑得更快。
02
星火大模型到了哪一步?
讯飞在大模型上跑得够快吗?
首先明确一点,告别卷参数阶段以后,大模型「跑得快」的标准正变成好用和实用。在本月初的一场AI行业大会上,被问到国内哪几个大模型更好用时,两名营销圈人士分别提到讯飞星火,「尤其在教育领域,优势明显」。
刘庆峰在会上透露,自讯飞星火9月5日对公众开放以来,当前已有1200万用户。升级到V3.0后,讯飞星火在七大能力——文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态上有了持续的提升。
比如做数学题时能自动提炼规律——即观察一个新的算式,它可以自己发现规律,然后解决新的问题;也可以跟随指令,帮助孩子在人机共创下制作出有趣的有声绘本。
如果说以ChatGPT为代表的生成式AI带来了交互方式的变革,从讯飞的现场演示中,我们多少能看到这一技术路线的演进方向——从多轮对话到主动对话,然后跨越到启发探究式对话。
每一步交互方式的阶跃,理论上都孕育着大模型走向「实用」的机会。多轮对话交互是个人助理、智能客服类产品的载体;而具备主动对话和启发式对话能力后,大模型在教育领域有望像老师一样,对孩子们的学习因材施教;在医疗领域辅助医生诊断、作出用药建议;在心理学领域,如心理医生一般深入交谈,帮助问诊者对创伤和冲突寻因。
据《降噪NoNoise》了解,心理咨询被认为是大模型能发挥作用的最佳场景之一。京东健康相关人士此前透露,机器部分性能甚至可以比人工表现更好、更稳定。
讯飞本次也发布了面向学校场景的AI心理伙伴,在灌入10亿+条心理类数据、40万+篇期刊文献、100万+通脱敏心理对话案例、550万+个心理评估数据后,该AI心理伙伴据称可以「听懂」孩子心事,给出解决问题的个性化指导建议,并在对话结束后第一时间生成心理咨询报告,同时将需要预警的信息发给心理老师。「孩子们通常不愿意跟家长和老师敞开心扉,只有通过AI的启发式对话,才有可能真正解决大量孩子的心理减压和疏导问题」。
尽管全面对标ChatGPT,刘庆峰也承认,国产大模型必须正视和GPT-4的差距。「国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上距GPT4还有差距。」
在纷纷宣布完成对ChatGPT从0到1的技术追赶后,国内人工智能第一梯队的公司已经进入更复杂的环节:一方面基础大模型要继续全面对标GPT-4,甚至走出自己的技术路线;另一方面,要找到爆款行业应用,就像2010年前后《愤怒的小鸟》、Instagram之于App Store。
毕竟未来谁能够获得最多的用户反馈和数据,谁就能进一步增强自身大模型的竞争优势,让飞轮转动起来。
03
大模型收费的前提是社会刚需
在一场大模型发布会中,有关商业化路径的问题几乎成为标配。
大模型的训练及运行成本极高:坊间传闻GPT-4一次训练成本估计要6300万美元,且由于每次提问都需要进行大量新的计算,难以形成标准软件的规律效益,企业投入成本是个不小挑战。
强如微软,其首批生成式AI产品中的代码服务GitHub Copilot已经陷入亏损。全球大模型类产品中,目前能够实现盈利的只有一个Midjourney。
讯飞的思路是先深入行业,满足社会刚性需求。说白了,先从好用到实用。刘庆峰有个判断,像讯飞星火App一类的C端个人助手,可以让公众更加直观了解大模型,先用起来;但真正能带来行业价值的还是做生产力工具。
要成为一个能收费的生产力工具,关键还要看产品是否真正解决刚性需求,而不是可有可无的东西。
在上一轮AI技术低谷时,第四范式创始人戴文渊曾提到AI落地时所面临的窘境,「现在几乎没有企业不用到AI的技术,但是如果说哪个企业把AI拿掉后活不下去,这样的企业也很少。」
腾讯云智能负责人、优图实验室负责人吴运声此前也分析过to B端的诉求,「企业需要的是在实际场景中真正解决某个问题,而不是在100个场景中解决70%-80%的问题。」
讯飞显然也看到了这一点。去年12月15日启动大模型攻关项目时,其内部就定下「1+N」同步并行推进的模式,1是基础大模型,N则是行业应用。
从一开始就设计应用场景,或许与讯飞此前长期探索AI领域的商业化落地有关。早期讯飞AI技术很强,但忽视市场需求,导致C端产品叫好不叫座,由此走过一些弯路。即便在上一波AI浪潮中,技术变现的挑战始终存在,尤其在互联网大厂掀起免费大战后,外界更为关注讯飞的商业模式能否支撑起千亿市值。
此后讯飞在教育、办公、医疗、法律、工业、智能硬件等领域逐渐探索出商业变现模式。2023年上半年,讯飞开放平台及消费者业务营收占比已经达到30.9%。
行业大模型阶段,也对竞赛选手的能力提出新型要求。如果说通用技术的比拼如同射箭比赛,业内已有的评价维度相当于已经画好了箭靶,各家卷技术评分即可:到了深入行业阶段,各家首先拼的是对行业的理解深度,用讯飞研究院院长刘聪的话说,比的是「画靶子」的能力。
以教育为例,一个有关「小学生英语学习」的大模型,首先需要了解小学英语的学习目标、定义学习范围、词汇量范围、语句类型、语句长度等指标不能超纲,同时还要找到适合孩子学习习惯和学习阶段的方法——这些标准都要先定义,即「画靶子」。
在这个过程中,如果大模型厂商没有做过行业,很难描画出精准的靶心。像本次讯飞发布的具备英语AI答疑辅学的讯飞AI学习机、全新升级的智能编程助手iFlyCode2.0、教育领域的AI心理伙伴、医疗领域的晓医助手等,均离不开过往的行业积累。
除了结合自己主营业务发布AI原生应用,讯飞还与法律、工业、智能汽车等12个行业龙头联合发布行业模型,这样不仅能「画靶子」,叠加专业的团队储备和数据积累,更有机会做出真正适用行业的大模型。
刘庆峰预计,到2024年,大模型给讯飞带来的整体商业收益将会有明显体现。今年5月宣布讯飞星火V1.0内置到AI学习机后,讯飞学习机的销量增长超过200%。
当然前提是大模型的实用性得到市场认可。讯飞在会上也对外公布了一组大模型赋能前后,工业互联网平台对企业吸引力的变化:工业大模型羚羊平台9月20日发布后,短短一个月零3天,用户总量增长59%。在过去一年半以上的时间,该工业平台总共积累了43万用户、累计提供服务近200万次;而在过去短短的一个月,用户增加了25万,提供服务新增170万次。
据我们了解,不止讯飞,各大模型厂商在商业化上都处于边走边看的探索阶段。
04
星火如何燎原?
这个阶段仍离不开拼速度。
刘庆峰的紧迫感很强。会后接受媒体群访时,他说,「我们有一堆想法要赶快落实,这些想法已经在算法上验证过,就等时间去干。所以明年新增毛利分配我们会全部投入到大模型研发,至少明年还没到关注投入产出比的时候。」
言外之意,技术目标仍是第一位的。这是应用生态繁荣的基础。
今年以来,讯飞凭借强技术的理念,逐渐打开国际市场。不久前在日本大阪公立学校系统的英语口语与写作项目中,讯飞成为单一来源服务商。大阪2025年将要办世博会,希望通过接入讯飞的产品提升学生的英语水平。
生态平台方面,自5月6日星火发布以来,讯飞开放平台新增143.4万开发者团队,同比增幅331%,其中新增大模型开发者17.8万。大模型也显著降低了开发者门槛,在讯飞星火上,已有1.5万助手开发者,开发超2.9万个助手应用。
「现在就是把速度干得更快。」在立下明年上半年对标GPT-4的里程碑后,刘庆峰说,技术方向已经看得很清楚,只是仍受制于时间和算力。在算力上,讯飞宣布与华为联合推出基于昇腾生态的自主创新大模型算力底座「飞星一号」平台,支持讯飞星火大模型实现更大规模的训练。
在上一波人工智能浪潮中,虽然同样喊出AI赋能千行百业,讯飞这类老牌技术公司跑得有点磕磕绊绊,同时还要遭受互联网巨头的挤压。
中国大模型发展增长态势 图源:《中国人工智能大模型地图研究报告》
若不是从这波大模型浪潮中脱颖而出,外界可能根本不会意识到,讯飞并未止于智能语音,而是早就知把AI研究深入到更广阔的认知智能领域,并先后搭建讯飞超脑、认知智能全国重点实验室等平台。
同北上广的互联网大厂相比,这家坐落于合肥的技术公司,参与大模型研发的有1000多人,这支成建制的科研体系有并不逊于互联网大厂的人才储备,甚至当互联网大厂因频繁业务调整,削减对前沿技术研究的投入时,合肥似乎表现得更有定力。
这大概是讯飞在今年能够快速推出星火大模型、并不断高调立下各种Flag的底层原因——相信技术浪潮总会涌来,然后持续投入,确保自己一直留在牌桌上。
等浪潮真的来了,赶上它。
正如福特汽车创始人的那句至理名言——关于未来,无论你觉得行还是不行,你终将都是对的。
关键在于行动。能否构建中国自己的大模型,大抵也是如此。