大模型的价值释放有多大想象力,大模型赛道的玩家对落地就有多焦虑。
征途是星辰大海,投入是无底洞窟,如果落地的产出缺了或是慢了,风口过后的可持续发展和迭代都是空谈。
细数一下比较成功的落地案例:前有妙鸭相机靠9.9一组写真点燃朋友圈,可写真这个需求太小、不太可持续;后有360半年报披露其大模型业务创收2000万元,尽管与15.6亿元的研发投入相比只是沧海一粟,但好歹见到了现金流,算得上是一个积极信号。
一个清晰的事实是,目前大模型的落地途径比较单一,比较可靠的商业模式只有to B方向的大模型部署以及模型使用、训练的算力需求两种,其价值释放的缓慢可想而知。
即使是这两种花了大半年时间摸清楚的逻辑,在智能化这样的买方市场中,还有不少需要技术服务商突破的隔阂,例如怎么打开中小企业市场、减少定制化导致的高人力成本等。
进一步说,各行各业迫切需要看到可靠的落地案例与方向,打消他们的顾虑,一起掏钱帮助大模型赛道的玩家们走上可持续的正轨。
我们对话了多家行业企业,试图管中窥豹,为大模型的价值释放“摸底”。我们了解到的情况是,服务商“鞭长莫及”的中小企业市场中,相当一部分以调用开源模型来先吃螃蟹的企业已经收获了不小的效率跃升。而目前服务商们一致发力的,以制造业为主的KA市场却对大模型相当不感冒。
这对国内大模型玩家而言不算是个好消息。
最大挑战:幻觉
美国社会学家Marc Prensky曾于2001年提出“数字原住民”的概念,泛指在21世纪的数字时代中成长起来的年轻人。而在大模型的冲击下,2023年进入社会的年轻人或许将成为首批“AI原住民”。
就像7月初入职某家SaaS企业销售岗的小张,因如今互联网语境中充斥着的“万辞王”、“不打800个电话不能走”等段子而忐忑不安时,大模型帮助他在人生第一份工作中稳定下来。
小张入职第一天,他预想中“一位老销售带人熟悉业务”的流程并未出现,而是领导简单介绍了一下工作强度、时间安排等情况后,就扔给他一个网址和一个文档,让他“看文档熟悉业务,有不懂的在网址里提问”。
小张的第一份工作就这么开始了。据他所说,除了入职的头两天去了公司坐班,往后将近两个月时间都在外跑业务,只有团队开会的时候会回公司述职。而工作中遇到的疑问如HR SaaS的客户案例、销售话术、市场价格比对等,他都可以在网址中提问从而获取答案。
“我找阳哥(领导)的次数估计连我提问次数的一半都不到”,小张说,所谓网址便是大模型的交互页面,该公司将大模型能力应用在了新人销售的培训和业务展开上。
据了解,该公司采用的第三方AI服务商的产品,模型能力来源于ChatGPT。他们将此前已成文档的市场价格走向、公司业务流程、常见客户QA等信息交由大模型整合为数据集,并提供快速检索能力。据公司领导林阳介绍,大模型目前已经做到为新人销售培训平均节约5天时间,这还是在尚未计入老销售的时间成本的前提下。
此外,大模型还进入他们多个岗位的工作流,如研发部门的初级代码编写、人力部门的JD编写以及运营部门的客户报告等。
只是林阳还告诉光子星球,大模型能力只在销售环节“效果拔群”,其余部门在使用上却不尽如人意,主要起辅助作用。比如代码生成大多局限于前端,而且生成内容必须经由人工校对。
人工校对必要性的背后是大模型难以避免的幻觉现象,简单来说就是“一本正经地胡说八道”。其成因在于训练数据存在偏差以及训练方法NTP(预测文本)等。一个典型的例子是,我们让某多模态模型生成一张“松鼠鳜鱼”的图片,生成结果与这道徽菜实际的样子八竿子打不着。
显而易见,幻觉是大模型落地严肃商业场景的最大挑战之一,尤其是工业、金融等对精确度要求极致的场景。事实上,早在大模型之前,工业机器人与智能投研等AI应用就试图在工业、金融领域找到战场。在部分业内人士看来,这些尝试都免不了“形而上学”的意味。
老陈是南方头部流体控制企业的高级工程师,浸淫流体控制设备十数年,甚至曾带领团队参与核级流体控制设备的生产。作为典型的工厂老人,他对AI在工业流程中的应用嗤之以鼻。
“工业生产第一要的是稳定安全,只要‘幻觉’问题存在,对稳定安全就是一种威胁”,老陈说,“我看到的所谓工业机器人,宣传了也有小十年的,到现在还只能做一些焊接、码垛之类的简单活儿。”
老陈所言虽有些过激,却不无道理,毕竟连创造GPT的OpenAI早在2021年便放弃了机器人业务。至于近来全球顶级公司开始关注的人形机器人赛道才刚刚开始,更别提应用了。
老陈所见所思的工业数智化,更多在于避免工人的重复劳动以提高效率。例如与供应链上下游共同采买的云端系统,让产业链的各环节可以实时上传生产进度、器胚良品率等数据,协调生产节奏与订单交付时间,避免返工的情况。
老陈还向我们分享了一件趣事,曾经他们公司接触过一家主要提供CV领域产品检验服务的第三方AI服务提供商,他也受邀参加了服务体验。“他们的模型需要大概20秒来判断一个设备是否达到出厂需求,我们高级技工只需要目检8秒,那我还不如花钱多雇点技工呢。”
更进一步说,大模型应用严肃场景,需要突破的关键一点还在于成本问题。
举个例子,工业生产中最常见的仪器之一是读取环境温度、湿度等参数的传感器,一旦传感器读数高于或低于某一阈值,便需要机器执行不同指令,如减缓来料速度、加入冷却液等。这不需要应用成本高昂的模型,只需要在传感器所涉及的小系统内设置一个既定的“规则”即可。
结合工业场景需求,我们不难理解工业界相对模型会更偏向于规则的做法。但不可否认的是,许多制造业公司早在大模型前便已引入机器学习模型迭代业务,尤其是在一些数据量巨大、人工设计规则难以穷举的场景。
这或许也是工业方向大模型服务的发力点所在。而大模型目前展现的简单内容生成能力与高昂的部署成本完全是对工业场景的一种错配。
“多快好省,越简单越好”是老陈视角下,工业界对新兴技术应用的需求。目前看来,大模型似乎与之并不沾边,更多的应用会集中在非业务核心板块上。
数据之海中掘金
AGI是终极命题,我们对大模型的期待自然不能止步于幻觉。以大模型为代表的AI能力也并非无法在所有严肃场景应用,而是需要准确认知大模型的能力边界所在。
细想一下,上文提到的案例企业之所以会认为大模型的价值有限,主要是因为幻觉问题导致生成内容的不可解释、不可追溯。那么,我们能否跳出为ChatGPT所锚定的AIGC范式,以其他方式推动大模型释放价值呢?
只需简单转变思路,我们即使在以严谨著称的金融行业,也能寻到了大模型释放正向价值的案例。
据ESG数据服务商秩鼎CTO王彬介绍,秩鼎的大模型在调用商业模型API的情况下,极大提高了其数据处理相关业务的效率,而其中最大的突破在于做到了传统金融体系之外的数据映射。
通常,传统金融体系中的数据映射基本围绕上市公司股票代码做映射即可,而ESG领域中存在大量“另类数据”,如专利、行政处罚、新闻报道等,这些数据要素所关联的主体的称呼、层级各异,存在职员、工作室、部门、子公司等不同维度的数据信息,映射难度非常大,“就像就上百万家公司一个一个做天眼查的查询”。
而大模型的加入,让秩鼎可以对同一上市公司主体延伸的子公司、业务、股权与工商信息等数据进行识别与提取,最终做到映射的效果。这项成果目前已在中信、华夏、易方达等头部公募与银行、保险等金融细分行业中落地,客户反馈良好。
目前,秩鼎已将大模型能力嵌入其数据处理的多个环节,大模型既可以作为特定数据的“搜索引擎”,也可以作为文本分析的智能助手,如将微博、网页新闻等舆情监测系统抓取的海量低质量数据做进一步提取;或是解析招股书、财报等复杂文本,以数据标准化的方式初步分析某一上司公司相关新闻的新闻情绪等。
作为尝到大模型甜头的少数企业之一,秩鼎对大模型价值释放的前景却格外审慎。王彬将to B应用简单分为三层,从低到高分别是数据层、工具层与决策层。在他看来,而大模型的价值释放主要集中在数据层,工具层的应用“基本上帮不上忙”,至于决策层则是大模型“可望不可即”的领域。
“打个比方,海量数据其实就是一个大金矿,工具是自然用以探金、掘金,大模型目前完全可以胜任前期的探索工作。可一旦深入数据的应用,就会卡在确定性、可靠性之前,更高层的决策就别提了”,王彬说。
限于金融视域,王彬对大模型的应用场景可能略有局限,但我们仔细梳理当下大模型应用,不难发现其以数据为核心来释放价值的底层逻辑。
例如上文所提到的企服企业,其嵌入大模型的代码编写、客户报告、培训资料等工作流环节虽是以内容生成的方式呈现,但本质上也不过是对粗放数据的初步处理,在一定程度上保障精确性的同时极大压缩了信息密度,以提高职员的工作效率。
即使是最简单的销售话术,销售小张也需要在大模型生成答案之后再经过自己的一些加工美化方能发给客户。这其实进一步佐证了大模型在工作流中的地位——局限于初步处理环节,而且大多无法脱离人的把关。
更进一步说,把关的必要性来自于模型无法根除的幻觉问题,那么在业务落地上,这一问题能否在未来寻到解法?
这个问题的答案可以自大模型风起前的深度学习方案中窥得一二。
实际上,早在大模型之前的机器学习就已经遭遇了“幻觉”的前身——过拟合。即机器学习过程中会发生的“强行”总结共性和规律的情况。好比我国历史上家喻户晓的司马迁、蔡伦与郑和,他们的共同身份是太监,而机器很可能会由此得出“太监是成功的必要条件”这样令人哭笑不得的结论。
这是由机器学习的方法所决定的,就像大模型的幻觉来源于Transformer框架,这意味着类似问题基本上没有一劳永逸的解法。
如果说各行各业积累的大量数据是金矿,那么大模型就是我们试图挖掘数据价值的探头,它能帮助我们找到金矿中的金子,甚至进行初步的攫取,但要用来挖矿甚至判断什么是金矿,那还是差了些意思。
释放价值的正确姿势
大模型释放价值是一个比较大的命题,但我们将他拆解一下,实际上也就是大模型用来做什么,以及该怎么用。而大模型服务商们似乎过于追求参数、能力等硬核指标,反而在解决实际问题上显得有些“畏首畏尾”,比较典型的是至今尚处于场景探索阶段的金融大模型。
显然,服务商们对大模型进入千行百业的畅想难免给人一种“好高骛远”的印象。毕竟智能化的供需双方很多时候根本处在两套话语体系,互联网外的行业采购代表很多都不知道大模型是什么,如果再不“约束”一下大模型的能力边界,反而容易适得其反,进入各说各话的怪圈。
那么大模型的价值释放会给我们什么感觉?
十数年前,上班打卡要么在小本本上亲笔签名,好点的则是伸出大拇指按一下指纹打卡机。当下,我们上班打卡只需要在靠近公司的时候掏出手机。这一前一后的变化,在于以在线OA为基础的协同办公应用的出现。作为企业级应用,协同办公让“打卡”这一环节愈发简单、省时,让使用者足以养成使用习惯。
更进一步,习惯的养成会模糊我们对事物的感觉,下意识认为“本应如此”,类似的场景还有站街边挥手招车与当下在电梯里便会打开的网约车。这种“无感沉浸”的感觉既是消费市场的追求,也是企业市场的需求。大模型如果希望能在千行百业释放价值,“无感”同样是重要指标。
“大模型被我们集成进数据中台了,相比以往,除了数据处理的效率提升外,几乎没什么感觉,也没有对工作流程有什么其他的明显影响”,王彬说。
在他看来,即使大模型成本再高、技术创新再多,只要大模型不是类似“圣杯”定位的万金油方案,那么其价值释放也只限于工作流中的某个或某些环节。
更值一提的是,王彬还特别强调了现阶段的大模型应用还需其他技术做辅助,例如PDF识别这项数据处理业务。如果简单将PDF丢给大模型的话,文字识别与文字整理将耗费大量算力与时间。而我们仅需在将PDF丢给大模型处理前,用低成本的OCR方案给出文字,那么大模型的处理效率将会成倍提升,成本降低自不必说。
工作流这一概念诞生于上世纪IT爆发所带动的办公自动化风潮,如果我们将IT概念从中抽离,工作流所包含的人与机器交互、标准化、高效率等逻辑实际上与福特发明的“流水线”有异曲同工之处。大模型好比是流水线中的高精刻刀,在该环节能带来效率的显著提升,但并非放之四海而皆准,而且需要精确的使用方法。
只不过,王彬与其团队对大模型的应用建立在其对深度学习和数据中台的认知基础之上,作为应用经验,难以“推己及人”至更广泛的非IT企业,我们不能要求每一个希望获得大模型能力的企业都得自备一个带有AI背景的工程师团队。
因此在明确应用边界与方向后,大模型进一步要做的是向协同办公靠拢,提供低成本可复制的解决方案。而行业当下普遍展开的定制化合作与之背道而驰,这会让客户群体局限于资源更多的大客户。依靠工程师力大飞砖跑出来的个案即使宣传再多,也入不了中小企业的法眼。
山不来就我,我便去就山。大模型扎根行业需要的是用标准化、低成本的封装,代替高度定制化的成本叙事,此外,还需要服务商将注意力从“炼丹”之上挪开少许,拿出做SaaS的精神。在一个买方市场中坚持用户本位的思想,再正常不过了。