大模型进击产业一线，必卷智能体

与去年百模大战、靠算力堆出通用大模型不同，今年的大模型产业落地，要靠业务跑出来。

文｜赵艳秋徐鑫

编｜牛慧

今年是大模型产业落地元年。从年初到现在，客户对大模型的预期越来越高，要求解决更多的业务场景问题。

在这个过程中，智能体正在爆发——越来越多的客户希望自身应用，能向下一代智能体（Agent）的方向演进。

简单说，如果将大模型比作大脑，智能体就像是大脑的手脚和四肢。它能拆解客户复杂的需求，调用工作流和工具，成为一个真正的业务小助手。由于它的门槛足够低，可以让更多人入门。而今天大多数AI原生应用，几乎都能用智能体搭建。

业界所有大模型公司和生态企业都在做智能体。这也意味着，大模型落地已进入“必卷智能体”的阶段。

在7月30日于上海举办的2024京东云峰会上，京东正式发布言犀智能体平台，它是一站式智能体开发平台。京东云判断，智能体、数字人、具身智能是未来大模型与终端用户的核心交互介质。其中，智能体更偏云端，是企业AI原生应用的重要推手。

实际上，京东云此次发布了包括言犀智能体平台在内的、支持大模型落地的全栈产品，加速大模型全场景落地。

“通用大模型靠算力堆出来，企业大模型则靠业务跑出来。”京东技术委员会主席、京东云事业部总裁曹鹏在云峰会上说。通过日臻完善的产品和工具平台体系，大模型才能与产业结合，发挥最大潜力。

数智前线获悉，京东云大模型全栈产品是在京东供应链这一超级孵化器中孵化而来。目前，在京东内部已有超过100个大模型的应用，支撑了超过60万员工和20万的商家的应用。

“一线对智能体的热情令我惊讶”

京东相关负责人表示，在实践中感受到，智能体是今年大模型落地中，应用效果最好的工具平台之一。

京东发布的言犀智能体平台，实际上是一个“内生外化”的产品。它从去年10月开始研发，今年春季在京东和一些生态链企业开放使用，仅仅几个月时间里，员工就搭建了3300多个智能体。“让我们惊讶。”该负责人说。同时，平台上也形成了上千个工作流、知识库，受欢迎程度，超出预期。

“这可能与京东业务人员多，链条又足够长有关。”一个有趣的现象是，过去一些年，京东在核心的零售供应链，投入了大量AI算法团队。而这次大模型的变革，却为那些过去没有被AI影响到的群体，带来颠覆性的变化。一线业务、职能、产品经理等都结合自己的工作，创建Agent。

比如，有人搭建了长视频剪辑Agent。因为京东内部有大量培训视频要剪辑，过去大家要手动去找到相应部分，再用剪辑软件去剪，一周只能剪几个。现在这个视频剪辑助手，只要上传视频和要求，就可以利用大模型多模态能力，找到对应的帧，员工再去剪辑，一周可以完成上百个。

另一个智能小哥助手，为快递小哥做路径规划、智能提示，解放他们的双手；在京东的智能体市场上，有大量活跃的Agent。有电话营销质检智能体，已产生百万级访问量，替代人工做营销电话的审核与校验……此外，京东有超60万员工，还有大量通用场景智能体，如报销类、学习类。

由于针对大量一线员工使用，言犀智能体平台支持了零代码开发，让没有算法背景的员工，也能通过可视化、拖拽方式来搭建智能体。“智能体平台就是让每一份AI灵感都能快速落地。”京东相关负责人对此深有体会。

智能体给组织协作也带来了改变。之前一些业务部门协同时，要找对方拉会，需要开发还要制定排期。现在大家自发把各自的工具和API注册到智能体平台上，实现了底层能力的链接，其他部门员工可直接调用，协作也变得不一样。

在经历内部锤炼后，言犀智能体平台对外开放。在商业模式上，提供公有云和私有化部署。

市场上已推出的智能体平台，不少侧重在个人开发者，但言犀智能体平台更针对行业。它在内部孵化时，获得京东零售、健康、物流各板块的广泛使用，沉淀了相应的行业解决方案。这次发布中，言犀智能体平台预置了相关配置模版和插件，以及100多种行业解决方案，客户用1分钟即可构建专属智能体。

针对企业如何用好智能体，京东相关负责人建议，尤其要注意两方面：一是要持续挖掘爆款，打造标杆。比如，京东每周会根据数据，选拔智能体在官方市场上架，吸引更多人使用。“黑客马拉松则再将其推高一个档次，一浪高过一浪。”

另一则与平台运营相关。如何支撑成千上万员工的应用？一方面要建立有企业特色的类目体系，将成千上万的智能体分好类，方便大家查找；另一是及时沉淀成熟解决方案，用户可以直接使用。

智能体做出的AI原生应用，给企业软件市场也带来变化。一些智能体直接替代了原有企业的SaaS软件，一些则嵌入到SaaS系统中去。言犀智能体平台也提供了简单的应用发布环节，企业可将搭建的智能体通过Web、API等方式，发布到内部IM，如企业微信及协同办公渠道。

业界看到，Agent目前仍然处于非常初级的阶段，未来会产生更多意想不到的Agent能力，这有赖于长千上万的企业应用者。他们使用的过程，将是AI Agent进化的过程。

智能体背后，大模型的锻造流水线

言犀智能体平台目前已接入数十个大模型。而这些模型，由言犀AI开发计算平台输送而来。在上海云峰会期间，言犀AI开发计算平台全面升级到2.0，并根据大模型落地关键点，突出了其中的关键能力。

第一个能力是模型压缩+模型拉升。从去年底开始，各家企业的主要精力，都是根据客户的使用场景，在基础大模型上裁剪、拉升出各种小模型。曹鹏介绍，这是因为即便经历了军备竞赛式的投入，通用大模型到了真正的场景里，“仍差了那薄薄的一层纸，需要专门调优”。而且不少场景要求模型反应速度要快，推理成本要低，小模型的市场反而更大。

目前，企业一般是采用一个模型群组，来实现不同场景的应用。这些模型群组，需要对通用大模型进行萃取压缩，以及灌注企业知识进行放大而来。在言犀AI开发计算平台上，用户可通过零代码方式，通过这样的推和拉，能快速获取到一个企业的专业模型。同时，推理的成本降低100%，速度提升1.5倍。

“目前业界通常分两步走——压缩和垂域模型微调。”京东人工智能业务部相关负责人说，但言犀AI开发计算平台可在压缩的过程中，将垂域知识灌注进去。这也是京东广泛采纳的一个方案。

第二个能力是数据准备。每个行业都有大量数据，包括多模态数据。这需要工具链具备极强的处理能力。

同时，过程数据的缺失，是业界落地大模型中，遇到的最大障碍。“比如我们看到一个症状，以及专家的处置建议，但并不知道专家的推理逻辑是什么。”京东健康相关负责人告诉数智前线，如果没有推理逻辑，就解决不了幻觉问题。

“我们今天花了很大力气，通过专家和大模型去补充。”一种是通过RAG的方式，这是当下业界必不可少的技术，给模型文献资料，让它自动化地捕捉推理链路；另一种通过专家来补充。工具平台能不能帮专家团队提效，也是业界在拼的技术关键。

此外，大模型合成数据非常火爆。“如何在垂域合成数据，与种子数据比较贴近，团队也做了深入工作。”京东人工智能业务部相关负责人说。

第三个能力是模型评估。它包括通用能力评估以及垂域能力评估。针对通用大模型评测，市场上有一些不错的榜单，公开了代码和评测数据集，可以自动评测，直接出分。“要先保通用能力。如果没有通用能力，就没有垂域。”

至于垂域评测，京东在健康、零售等有评测数据集，用户在调完模型后，也能再评测垂域。这也是自动化的。当然，也有一些人工评测，比如健康场景中人更懂业务，平台也提供类似众包的方式，让大家参与评测。

在产业之中，构建一个评测系统非常关键。“与其说怎么训练好一个垂域模型，不如有一个评测体系能告诉你，模型该往哪个方向去进步，这件事情尤其重要。”除了工具平台外，京东也搭建了评测团队，“这是我们的幕后英雄”。

AI大底座，加速大模型全场景落地

伴随着大模型及智能体应用到产业一线，业界发现，计算、网络、存储等底层基础设施也需要适应新局面，解决新挑战。

最典型的一点，当下产业端的大模型应用实践，要打造更开放的基础设施平台，比如支持多云、多芯、多活，能够承接多种模型，从而满足复杂的应用场景和业务需求。

目前，多模态大模型的打造，需要的算力是之前的10倍甚至百倍。全球企业都有一个特点，基于异构算力，来完成模型的训练、调用和推理，解决普遍面临的算力紧缺并提升性价比。

除了计算，在存储方面，模型训练高峰时段可能在数十秒内就要处理 TB 级别的数据存储，而传统应用中，这些海量小文件的处理任务，可分散在几个月时间跨度里完成。这使得存储产品必须朝向更高吞吐、更高IOPS、更高带宽和更低延时进化。“同样的GPU算力规模下，存储性能的高低，可能带来模型训练周期3倍的差异。”曹鹏在演讲中提到。

在Scaling law之下，超大规模集群对硬件间的网络效率提出挑战。不久前，马斯克高调披露已建成10万卡H100超级算力中心，业界对背后的网络架构——英伟达Spectrum-X也极为关注。毕竟，稳健、低延迟的网络关乎到集群里的计算资源能否被充分利用。

这些动向都表明，基础设施关乎大模型的落地进程。而在这场系统战面前，厂商们需要构建更强大的AI底座，才能加速大模型在全场景落地。

京东云峰会上，披露了京东云AI底座的最近演进。如在高性能的存力方面，作为京东云自主研发的新一代存储产品云海，历经了10余年京东自身复杂场景历练，能提供大模型超大量数据传输所需的极致性能。

峰会上，全面升级到3.0版本的京东云云海，在吞吐、带宽、延时等性能上进一步提升，为大模型全面落地提供了更坚实的支撑。云海也与所有主流国产化平台兼容互认。

据了解，目前京东云云海在建设银行等重量级金融机构中大模型训练中，提供了底层数据存储的支撑。同时在上层应用上，也通过数据要素的合作，帮助这些企业去做线上数字化转型。

在算力层面，京东打造了云舰AI算力云平台。它具备了对多元异构算力资源的统一管理和调度能力，包括各类CPU、GPU和国产化AI加速芯片，支持多地域分布式算力的统一调度，提供高性价比的算力供给。

另外，vGPU池化方案，通过GPU异构资源池化，能将AI算力利用率提升70%，可有效降低算力成本。行业普遍存在算力焦虑，这也是京东云提供的一种解法。

此外，京东云大模型安全可信平台，涵盖超过200种特有的红蓝对抗攻击手法，覆盖监管合规要求的全部31类风险类型，风险分析准确率高达95%以上。

针对大模型企业今年以来的价格战，曹鹏提到，去年京东云峰会就提过要通过技术升级来降低成本，要全网比价，对标主流云厂商的最低成交价再低10%。目前，京东云有超过100个产品规格通过比价售卖，并设立10亿比价金，把技术带来的红利回馈给开发者群体。

总体而言，在2024京东云峰会中，京东通过发布从基础设施、模型服务，再到智能体应用的全栈产品，正加速与产业的融合，从而让更多企业的大模型落地，通过业务跑出来。

大模型进击产业一线，必卷智能体

相关推荐