大中型上市银行加码金融大模型研发,场景广泛应用尚待时日

竞逐金融大模型

年报显示,工商银行在2023年度建立了行业内首个全面自主研发且具有千亿参数级别的AI大模型技术体系,并在多元金融业务场景中实现了创新性应用。

具体来看,工商银行、建设银行、农业银行、中国银行、交通银行、邮储银行在2023年的科技投入分别为272.46亿元、250.24亿元、248.50亿元、223.97亿元、120.27亿元和112.78亿元,同比分别增长3.90%、7.45%、7.06%、3.97%、3.41%和5.88%。

2024年会成为大模型深度应用于金融领域的元年吗?解答这个问题,或许可以从上市银行2023年年报里一探究竟。

年报显示,多家大中型上市银行继续加码科技投入,特别是加快大模型技术研发和实际业务应用的步伐。

IDC中国副总裁兼首席分析师武连峰分析,从规划到实际落地应用,金融行业的大模型项目可能会经历一个相对漫长且审慎的周期,包括前期的计算能力准备、概念验证测试及必要的算力资源购置等多个阶段。

竞逐金融大模型

年报显示,工商银行在2023年度建立了行业内首个全面自主研发且具有千亿参数级别的AI大模型技术体系,并在多元金融业务场景中实现了创新性应用。

工商银行董事长廖林在该行2023年度业绩发布会上表示,工商银行在深化“数字工行”(D-ICBC)战略过程中,充分利用人工智能及大模型等前沿技术手段,有效促进了工商银行数字化生产能力和效率的提升。

建设银行年报显示,该行加强“三大中台”基础架构建设,并启动“方舟计划”,推动金融大模型的建设和实际应用,建立常态化的数字化经营管理模式。

农业银行在年报中透露,该行通过成立人工智能创新实验室加快推进大模型技术的研究和培育工作。

中国银行则在年报中展示了其在智慧安全防护、网点运营等方面的计算机视觉技术应用,并开始试验大模型技术在内部知识服务、自动化编程辅助等场景的可行性。

邮储银行年报显示,紧随大模型在金融领域的应用潮流,该行正在研发测试、运营管理、客户市场营销、智能风险控制等多个层面积极开展大模型技术的探索与实践。

部分上市银行大模型研发、应用进展情况

来源:上市银行年报

年报显示,大中型银行正在不断加大科技投入。六家国有大型商业银行的信息科技总投入已连续三年超过千亿元,其中2021年为1074.93亿元;2022年为1165.49亿元;2023年为1228.22亿元,较2022年增长5.38%。

具体来看,工商银行、建设银行、农业银行、中国银行、交通银行、邮储银行在2023年的科技投入分别为272.46亿元、250.24亿元、248.50亿元、223.97亿元、120.27亿元和112.78亿元,同比分别增长3.90%、7.45%、7.06%、3.97%、3.41%和5.88%。

在全国性股份制银行中,招商银行和中信银行在2023年的科技投入超过了交通银行和邮储银行。其中,中信银行的2023年信息科技投入为121.53亿元,同比增长38.90%,占营业收入的5.90%。

招商银行、平安银行和光大银行在2023年的科技投入比上年有所下降。其中,平安银行的科技投入已经自2021年以来连续三年出现下降。年报显示,该行2021年IT 资本性支出及费用投入为73.83亿元,2022年IT资本性支出及费用投入为69.29亿元,2023年IT资本性支出及费用投入为63.43亿元。

数据来源:上市银行年报

萨摩耶云科技集团创始人、董事长兼首席执行官林建明表示,大模型的出现为银行数字化转型注入了强大且更为直接的新动能,但目前金融大模型的应用能力仍处于初级阶段。

该集团是国内独立云服务科技解决方案提供商。林建明称,从银行2023年年报披露的信息来看,近年来大多数银行都在加大科技投入,其中金融大模型成为科技投入的重点之一。对于大多数金融机构而言,自建大模型并不现实,调用通用大模型叠加金融专业领域的数据,可以使模型更加符合金融行业的特点和要求,提高模型在金融领域的适应性和准确性。

离广泛应用还有多远

当前金融大模型主要应用于一系列内部业务环节,如知识检索与智能答疑、编程辅助、客户服务热线智能化、自动化文档编写、复杂数据分析、精准营销材料自动生成等试点项目。

网商银行高级工程师方珂认为,金融行业对安全、风险要求极为严苛,大模型应用仍然有很多问题需要解决。尤其是大模型会出现“幻觉”,如果错判了客户的经营情况,带来的将是真金白银的损失。因此,在网商银行大雁系统实际应用中,大模型绘制的产业链图谱会向风控系统提供客户识别、经营评分和画像,但最终小微经营者获得的贷款额度,仍然是风控系统多维度交叉验证的结果。

微众银行数字金融发展部负责人姚辉亚表示,从技术和应用层面来看,生成式AI优势在于创造力,但副产品是不可避免地带来幻觉现象,而金融行业的大多数场景往往需要追求准确性和可解释性,比如要求能对风险进行精准定价与管理,向客户推荐适当的产品,并明确揭示风险。基于两者特性的交集,适配的应用场景是让大模型和生成式AI成为员工的助理,在赋能员工提高效率和创造力的同时做好兜底判断,而非直接让大模型直面客户提供服务。

姚辉亚认为,当前国内金融机构在大模型领域的核心竞争力集中在应用层,通常是基于内部的专有数据,选择合适的基础大模型基座进行精调,形成垂直行业场景的大模型应用。由于基础大模型的技术迭代较快、不同场景适用不同路线的基础大模型、硬件的国产化兼容性不足等挑战,目前较缺乏能支持一站式工作、模型可插拔的工程化平台。微众银行正在集中力量,打造全行统一的AI工程化平台,构建AI原生科技能力,期望实现模型可插拔、成效可度量、模型生命周期可管理、运算资源可调配、编程可视化(低代码)等特性,赋能内部各业务团队在应用层百花齐放,提升自动化与智能化水平。

林建明判断,如果将大模型的能力放在金融行业中去处理原有的任务,会对很多工作产生颠覆性的影响。相比现有的AI技术,大模型技术有望在金融风险管理、量化交易、个性化投资建议、金融欺诈检测和预防和智能客户服务等场景具有广泛的应用潜力和影响力。尽管大模型技术在许多领域展现出巨大的潜力,但在金融领域的应用仍处于起步探索阶段。

林建明认为,金融行业是数据密集型行业,涉及海量的金融数据和复杂的金融业务。金融数据包含敏感的个人和机构信息,而大模型需要大量的数据进行训练和应用。因此,确保数据隐私和安全成为一个重要的挑战。另外,金融行业是一个对于模型的可解释性和鲁棒性(系统或算法在面对不同的环境和条件时,仍能保持稳定和可靠的能力)等要求非常高的行业,而大语言模型当下输出结果的可解释性目前是相对封闭、不透明的,同时,其稳定性也仍然受到数据、算法、训练等方面的干扰,表现出非鲁棒性的特征。

武连峰说,尽管金融行业在大模型领域的投资强度显著增加,但由于金融业对合规性和风险管理的极高要求,在部署这类先进技术时必须确保与所有现行监管政策相符。

本文来自微信公众号:经济观察报 (ID:eeo-com-cn),作者:胡群

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2024年4月20日
Next 2024年4月20日

相关推荐

  • 水温80度:AI行业真假繁荣的临界点

    我们从来没拥有过这么成功的AI主导的产品。

    (这种分析统计并不那么准,但大致数量级是差不多的)

    这两个产品碰巧可以用来比较有两个原因:

    一个是它们在本质上是一种东西,只不过一个更通用,一个更垂直。

    蓝海的海峡

    未来成功的AI产品是什么样,大致形态已经比较清楚了,从智能音箱和Copilot这两个成功的AI产品上已经能看到足够的产品特征。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时“罢工”,全网打工人都慌了

    美西时间午夜12点开始,陆续有用户发现自己的ChatGPT要么响应超时、要么没有对话框或提示流量过载,忽然无法正常工作了。

    因为发现AI用久了,导致现在“离了ChatGPT,大脑根本无法运转”。”

    等等,又不是只有一个聊天机器人,难道地球离了ChatGPT就不转了。

    大模型连崩原因猜想,谷歌躺赢流量激增6成

    GPT归位,人们的工作终于又恢复了秩序。

    未来科技 2024年6月5日
  • ChatGPT宕机8小时,谷歌Gemini搜索量激增60%

    ChatGPT一天宕机两次

    谷歌Gemini搜索量激增近60%

    ChatGPT在全球拥有约1.8亿活跃用户,已成为部分人群工作流程的关键部分。

    过去24小时内提交的关于OpenAI宕机的问题报告

    图片来源:Downdetector

    ChatGPT系统崩溃后,有网友在社交媒体X上发帖警告道:“ChatGPT最近发生的2.5小时全球中断,为我们所有依赖AI工具来支持业务的人敲响了警钟。

    未来科技 2024年6月5日
  • ChatGPT、Perplexity、Claude同时大崩溃,AI集体罢工让全网都慌了

    接着OpenAI也在官网更新了恢复服务公告,表示“我们经历了一次重大故障,影响了所有ChatGPT用户的所有计划。Generator调查显示,在ChatGPT首次故障后的四小时内,谷歌AI聊天机器人Gemini搜索量激增60%,达到327058次。

    而且研究团队表示,“Gemini”搜索量的增长与“ChatGPT故障”关键词的搜索趋势高度相关,显示出用户把Gemini视为ChatGPT的直接替代选项。

    未来科技 2024年6月5日
  • 深度对话苹果iPad团队:玻璃的传承与演变

    iPad最为原始的外观专利

    没错,这就是iPad最初被设想的样子:全面屏,圆角矩形,纤薄,就像一片掌心里的玻璃。

    2010年发布的初代iPad

    好在乔布斯的遗志,并未被iPad团队遗忘。

    初代iPad宣传片画面

    乔布斯赞同这一想法,于是快速将资源投入平板电脑项目,意欲打造一款与众不同的「上网本」,这就是iPad早年的产品定义。

    iPad进化的底色

    苹果发布会留下过很多「名场面」,初代iPad发布会的末尾就是一例。

    未来科技 2024年6月5日
  • 底层逻辑未通,影视业的AI革命正在褪色…

    GPT、Sora均为革命性产品,引发了舆论风暴,但它在上个月发布的“多模态语音对谈”Sky语音,却由于声音太像电影明星斯嘉丽·约翰逊,被正主强烈警告,被迫下架。

    华尔街日报也在唱衰,认为“AI工具创新步伐正在放缓,实用性有限,运行成本过高”:

    首先,互联网上已经没有更多额外的数据供人工智能模型收集、训练。

    03、

    如果说训练“数字人”、使用AI配音本质上瞄向的仍是影视行业固有的发展方向,那么还有另外一群人试图从根本上颠覆影视行业的生产逻辑和产品形态。

    但分歧点正在于此,电影公司希望通过使用AI技术来降低成本,但又不希望自己的内容被AI公司所窃取。

    未来科技 2024年6月5日
  • KAN会引起大模型的范式转变吗?

    “先变后加”代替“先加后变”的设计,使得KAN的每一个连接都相当于一个“小型网络”, 能实现更强的表达能力。

    KAN的主要贡献在于,在当前深度学习的背景下重新审视K氏表示定理,将上述创新网络泛化到任意宽度和深度,并以科学发现为目标进行了一系列实验,展示了其作为“AI+科学”基础模型的潜在作用。

    KAN与MLP的对照表:

    KAN使神经元之间的非线性转变更加细粒度和多样化。

    未来科技 2024年6月5日
  • 这个国家,也开始发芯片补贴了

    //mp.weixin.qq.com/s/tIHSNsqF6HRVe2mabgfp6Q
    [4]中国安防协会:欧盟批准430亿欧元芯片补贴计划:2030年产量占全球份额翻番.2023.4.19.https。//mp.weixin.qq.com/s/VnEjzKhmZbuBUFclzGFloA
    [6]潮电穿戴:印度半导体投资大跃进,一锤砸下1090亿,政府补贴一半.2024.3.5https。

    未来科技 2024年6月5日
  • 大模型的电力经济学:中国AI需要多少电力?

    这些报告研究对象(数字中心、智能数据中心、加密货币等)、研究市场(全球、中国与美国等)、研究周期(多数截至2030年)各不相同,但基本逻辑大同小异:先根据芯片等硬件的算力与功率,计算出数据中心的用电量,再根据算力增长的预期、芯片能效提升的预期,以及数据中心能效(PUE)提升的预期,来推测未来一段时间内智能数据中心的用电量增长情况。

    未来科技 2024年6月5日
  • 你正和20万人一起接受AI面试

    原本客户还担心候选人能否接受AI面试这件事,但在2020年以后,候选人进行AI面试的过程已经是完全自动化的,包括面试过程中AI面试官回答候选人的问题,AI面试官对候选人提问以及基于候选人的回答对候选人进行至多三个轮次的深度追问。

    以近屿智能与客户合作的校验周期至少3年来看,方小雷认为AI应用不太可能一下子爆发,包括近屿智能在内的中国AI应用企业或许要迎来一个把SaaS做起来的好机会。

    未来科技 2024年6月4日