垂直行业大模型“封神”背后,AI数据服务走入“深水区”

在2023年中国国际服务贸易交易会期间,国内头部AI数据服务厂商云测数据在去年发布的“AI工程化的数据解决方案”基础上全面升级,重点面向垂直行业大模型提出了全生命周期的AI数据解决方案,为大模型应用落地提供关键支撑。在AI数据服务领域,云测数据提出“面向垂直行业大模型AI数据解决方案”,站在下半年垂直行业大模型进一步爆发的节点上将继续引领AI数据服务行业。

文 | 智能相对论

作者 | 沈浪

由ChatGPT掀起的这股大模型浪潮,从通用领域席卷垂直领域。现阶段,越来越多的行业都在开发专用垂直细分赛道的大模型产品,以加速AI应用的场景化落地进程。

譬如,在电商领域,平台和商家正在利用大模型重塑各个零售环节。如智能导购,可基于消费者的海量消费数据为其提供商品推荐、商品挑选攻略、行程建议等。同时,大模型还能理解海量商品的详情数据,快速生成电商运营需要的商品主图、营销海报、详情页等等。

除此之外,电商垂类大模型在智能客服、供应链优化等场景上也都能基于海量数据的深度学习,快速掌握特定的售前售后话术、供应链订单处理等,全方位革新电商领域的零售模式和消费体验。

随着应用成果的落地,垂直行业大模型的价值正在释放,数字生产力持续提升。而作为人工智能三驾马车之一的数据要素也在这个时刻被提上新的战略高度——不难发现,垂直行业大模型的价值释放离不开海量数据的支持。对应的,上游的AI数据服务商已经针对数据层面提出了新的解决方案。在2023年中国国际服务贸易交易会期间,国内头部AI数据服务厂商云测数据在去年发布的“AI工程化的数据解决方案”基础上全面升级,重点面向垂直行业大模型提出了全生命周期的AI数据解决方案,为大模型应用落地提供关键支撑。

以大模型应用为支点,在大量市场场景需求的撬动下,人工智能产业链上下游的板块正在迎来全新变革,数据层面的升级已经跃然纸上。

大模型应用“封神”的背后,是什么样的AI数据服务在支持?

大模型的爆发加速了人工智能的应用进程,同时也对整个算法产业链带来了新的挑战。在数据层面,过去生产数据、收集数据、加工数据、存储数据等流程就不再适用当前的市场需求,或者说无法高效地、很好地解决新出现的问题。

下游的AI应用融入大模型技术进行全新升级,上游的AI数据服务也同样面临着变革。那么,什么样的AI数据服务才是垂直行业大模型场景下需要的、适用的?

一、标准化

垂直行业大模型技术成果涌现的背后,对应是AI数据需求大幅增长。如何满足大幅增长的场景化数据需求,首要不是盲目扩大数据生产,而是提高AI数据的通用性、易用性,也就是标准化的问题,避免AI数据服务做“无用功”,保证数据的真实、有效、易用是满足垂直行业大模型爆发式增长需求的关键。

譬如,在智能网联汽车行业,《智能网联汽车激光雷达点云数据标注要求及方法》(T/CSAE 213-2021)、《智能网联汽车场景数据图像标注要求与方法》(T/CSAE 212-2021)等团体标准的发布,就为智能网联汽车的研发和测试提供了一套切实可行的场景数据点云标注方法,很好地推动了智能网联汽车的研发和测试。

垂直行业大模型“封神”背后,AI数据服务走入“深水区”

其中最直观的感受则在于,过去AI数据服务行业各企业对图像标注的要求与方法都各不相同,标注结果文件各异,严重影响后续数据的统一使用。随着相关标准的发布,对标注流程和标注结果的保存形式都进行了规范,进而提升标注数据的通用性。

而在这个过程中,行业TOP地位的厂商往往都是标准的引领者,促使其在接下来的市场规范中获得了更大的话语权和主动权。譬如,以上智能网联汽车场景数据的两大标准,背后都有云测数据的参与。

这家头部AI数据服务商在参与标准制定,为行业攻陷自家经验和技术能力的同时,也更快、更好地掌握了数据标注相关场景的标准化,并应用到自家的产品和解决方案中。其中,基于对行业标准化的理解,云测数据发布的面向垂直行业大模型AI数据解决方案不仅能提供大规模感知数据能力,还能智驾企业减少数据采集周期,提升数据标注效率,降本增效,助力相关企业在数据层面实现研发领跑。

二、工程化

随着大模型技术的融入,人工智能应用进程正持续加速,而在供给端,AI数据服务也面临着数据生产、收集、处理、加工、存储等全生命周期流程的升级,从而才能满足AI数据的大幅度增长需求。简单来说,对应AI工程化的大趋势,AI数据服务也迎来了工程化的深度升级。

这里,云测数据发布的“面向垂直行业大模型AI数据解决方案”呈现出来的结果就是一条相对清晰的路径——通过丰富的数据标注工具、成熟的API集成能力、高效的数据闭环,加上人员管理及项目管理体系以及安全交付软硬件支持的方式,云测数据在保证数据隐私安全的环境下,对垂直行业大模型所需的海量数据实现了全生命周期管理。

垂直行业大模型“封神”背后,AI数据服务走入“深水区”

更直观来说,对应AI数据服务的各个流程环节,云测数据都能提供对应的工具、技术能力、管理体系,好似成熟的制造生产线一般,一步步地完成数据从无到有的生产,从粗糙到精细的加工等目标,以供下游的垂直行业大模型用于预训练。

以基础的数据标注为例,云测数据目前提供了相对全面的平台工具模块,包括了点云融合跟踪、OCR文字转写、视频标注、语音转写、语音切割、文本判断、文本生成等等,充分满足行业垂直大模型的多模态数据标注需求。

垂直行业大模型“封神”背后,AI数据服务走入“深水区”

三、场景化

今年以来,市场的焦点从通用大模型转向了垂直行业大模型,其背后是对技术应用落地的追求,同时也释放了一个足以撬动整条人工智能产业链的趋势——场景化。在AI数据服务领域,厂商不再盲目追求广泛的海量数据,而是针对某一特定领域或场景的有效数据。

场景的聚焦是加速垂直行业大模型落地的关键,同时也意味着更高要求的AI数据服务。以智能网联汽车为例,云测数据为其提供的AI数据解决方案目前就包括三部分,分别为基础数据库、定制化数据采集和标注服务以及包括数据采集标注、数据管理的全方位数据工具链。

简单来说,随着场景化趋势的发展,AI数据服务的定制化将越来越深入,不仅要针对某一特定行业或场景提供专业服务,还有可能聚焦某一公司或某一技术模块提供高度定制化数据服务。

同时,基于场景化的AI数据需求也远超常规,随着行业大模型的持续升级,场景的细分也会越来越精细,对应的数据需求更加严格。在与「智能相对论」的交流中,云测数据总经理贾宇航就提到,在智能网联汽车领域,为满足相关场景的丰富性,云测数据可以需要提供包含数据采集、数据生产、平台工具在内的AI数据服务,从而满足相关大模型的预训练需求。

总的来说,对应人工智能产业链上下游的关系,AI数据服务需要服务于垂直行业大模型的需求。现阶段,垂直行业大模型加速落地,需要更多、更有效、更精准的场景数据,AI数据服务的升级有迹可循。

AI数据服务走入“深水区”,头部厂商如何继续保持引领?

市场趋势的变化往往最先被行业TOP厂商所感知和反馈。在AI数据服务领域,云测数据提出“面向垂直行业大模型AI数据解决方案”,站在下半年垂直行业大模型进一步爆发的节点上将继续引领AI数据服务行业。

那么,只是纯粹的进场快,就能实现行业引领吗?显然不是。

结合垂直行业大模型发展的市场需求,云测数据的“面向垂直行业大模型AI数据解决方案”所呈现出来的更关键的价值在于其背后三大思维。

一、聚焦赛道,重视价值回归

垂直行业大模型的爆发式增长让“百模大战”愈演愈烈,各行各业都在做相应的大模型产品,呈现出来的市场机会很多,但是对应的AI数据服务需求也在升级。这就意味着不能用通用思维来做垂直行业大模型的AI数据服务,也很难有能力把所有行业都覆盖。

那么,在这个过程,厂商就需要有所取舍。目前,云测数据“面向垂直行业大模型AI数据服务解决方案”主要落地在零售电商、金融保险、智能网联汽车等领域。而这些都是云测数据从创立之初就聚焦深耕的行业,具备相应的数据积累、行业知识、项目经验以及客户资源等。

在云测数据总经理贾宇航看来,云测数据做垂直行业大模型的AI数据服务,首要的关键点是价值考量。

一方面,要做就先做有积累、有基础的领域——基于这个思路,云测数据在提供场景化数据采集方案的同时,也会在微调任务后对应行业需求提供专业的评测体系和服务,让AI数据服务更有价值。

另一方面,尽管垂直行业大模型很火,但商业化落地程度仍具有局限性。对于云测数据而言,结合过去的服务经验、项目经验筛选有市场需求的领域深耕,是对企业自身发展的负责,避免在过热的市场环境中迷失自我,失去发展价值。

二、纵横升级,强化基本功

垂直行业大模型应用落地是一个纵横能力协同的过程。云测数据总经理贾宇航将这一过程理解为“搭积木”,横向强化底座能力,有一个稳定的基础,纵向深耕场景化,对应不同的行业进行微调、优化,给出专业的解决方案。

具体来看,云测数据基于AI工程化的数据服务升级,在横向上就构建了一套包括数据可视化、扩展工具模块、数据权限管理体系等在内的AI数据服务解决方案,应对大模型预训练本身所需要的数据需求。

纵向上则针对不同的场景,基于行业理解提供专精解决方案,比如对应智能网联汽车研发与测试所需要的车外环境感知、车内智能座舱、人体动作识别等,满足垂直行业大模型的进阶需求。

三、坚守底线,规避行业敏感点

且不说数据领域本身就敏感,作为建立在海量数据之上的垂直行业大模型应用对数据的需求就非常严格,数据安全是一方面,数据的独特性、权威性、有效性则是另一方面。

对此,云测数据作为行业TOP企业始终将数据隐私安全放在业务开展的首位。云测数据总经理贾宇航表示,为了确保垂直行业大模型用于训练的数据合法合规,云测数据都会与企业客户签订数据授权协议。同时,云测数据在过去多年的发展中也会建立具备自由版权的数据集,以帮助更多行业客户去获取更多的高质量数据。此外,云测数据更是一家满足ISO27001和ISO27701标准的AI数据服务厂商,并先后获得ISO9001、ISO20000、CMMI3等相关认证。

结语

AI数据作为生产资料,是推动整个AI行业发展的必要一环,也是人工智能商业化的主要驱动力之一。换句话来说,高质量的数据决定了AI的落地程度也不为过。云测数据总经理贾宇航曾提出类似的观点。

而垂直行业大模型的爆发式增长,也就意味着AI数据需求的澎湃发展。围绕高质量数据为需求,垂直行业大模型的落地才有真正意义的基础。这是AI数据服务厂商的机会,也是人工智能产业突破发展的关键。

声明: 该内容为作者独立观点,不代表新零售资讯观点或立场,文章为网友投稿上传,版权归原作者所有,未经允许不得转载。 新零售资讯站仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。 如对本稿件有异议或投诉,请联系:wuchangxu@youzan.com
Like (0)
Previous 2023年9月26日
Next 2023年9月26日

相关推荐

  • 抖音不再陪小杨哥“疯狂”

    就在抖音电商峰会一周前,快手一哥辛巴炮轰小杨哥,指责其在质检、售后、赔偿态度等方面存在问题,模仿辛选的商业模式,以及小杨哥此前销售的一些产品如茅台酒、梅菜扣肉等存在质量问题,如果小杨哥不处理,他将用一亿元替小杨哥进行赔付。
    在2022年9月的抖音电商作者峰会上,刚转型直播带货一年的小杨哥,第一次获得了抖音电商的卓越个人奖。
    在短视频时代,抖音成就了小杨哥,正如小杨哥感谢抖音那般,“它具有很强的开放性和包容性,它给每一个人都提供平等展示自我的机会”,小杨哥也为抖音带来了很多用户,高峰时期小杨哥抖音粉丝量超过了1.2亿。

    2024年9月20日
  • 科隆新材IPO:业绩波动、内控缺位或成上市“拦路虎”

    上半年业绩表现不佳
    科隆新材的主营业务是液压组合密封件和液压软管等橡塑新材料产品的研发、生产和销售,以及煤矿辅助运输设备的整车设计、生产、销售和维修,同时也为风电、军工、高铁等行业客户提供定制化橡塑新材料产品。
    同时,如果未来煤炭主体能源地位被快速替代,下游客户新机装备需求减少,科隆新材又未能拓展旧机维修业务,或是未能适应市场变化、新技术和新产品未能顺应市场发展趋势,那么科隆新材就存在橡塑新材料产品经营业绩下滑的风险,甚至可能会对公司整体经营业绩造成不利影响。

    商业密码 2024年9月20日
  • 淘宝倒逼新风向:一场电商减负运动

    但售后服务同时也是电商变革最复杂的一环,开店、佣金、流量推广都只是商家与平台间的服务交易,售后却涉及平台导向、商家成本和消费者体验三方,且受社会消费情绪变化、平台生态优劣的直接制约,是各方利益最难平衡的地方。
    我们也发现,在这个过程中,电商平台的自我角色定位也在调整,从推出「仅退款」的游戏规则制定者、大家长,逐渐过渡到生态系统的设计者、平衡商家和消费者利益的服务商。

    商业密码 2024年9月20日
  • 博浪AI时代,阿里、华为“硬碰硬”

    根据申万一级行业分类,阿里巴巴概念板块156家上市公司分布于22个行业,其中传媒、电子、商贸零售、通信、医药生物分别聚集了50、25、13、11、9只概念股。
    根据申万一级行业分类,华为概念板块896家上市公司分布于28个行业,其中,计算机、电子、机械设备、通信、电力设备分别聚集了220、193、92、65、61只概念股。

    商业密码 2024年9月20日
  • 员工挂“罪牌”戴纸托手铐引质疑,80后王云安创立的古茗又“翻车”了

    员工头挂“罪牌”手戴纸托手铐,古茗玩梗惨遭翻车
    近日,古茗员工头挂“罪牌”、手戴形似手铐纸托的视频,在社交平台上广泛传播,引发诸多网友热议。
    至于上海,王云安认为该市场毗邻浙江,因此会有一定的消费者基础,但是上海奶茶行业竞争激烈,外卖比例很高,相对来说门店的收益更难做好,“我们在进省会城市,以及大的一线城市的时候,我们一定是做好准备了再去的,比如上海的消费者到底要什么,我们进去应该怎么做才可以让更多的店做得更好,古茗能够给上海的消费者带来什么样的不同呢,这些是我们要去思考的。

    商业密码 2024年9月20日
  • 古井教父悲情收场

    1986年之后的十年里,古井的资产增长了18倍,利润增长了24倍,王效金也因此被称为“古井教父”,甚至是“中国酒界第一人”。
    这款拥有1800多年历史的安徽名酒也许永远也不会再与茅台并肩了,但如今也可以称得上再度振兴,尤其是这一切还建立在王效金的固执和自大,当年差一点毁了古井贡酒的基础上。
    他甚至曾经在公开场合说过,王效金就是古井,古井就是王效金,“效忠”古井就是效忠他。

    2024年9月20日
  • 直言AI不如原创,吴克群凭什么?

    吴克群的原创音乐哲学
    来到《音乐缘计划》,吴克群分外真诚。
    如此来看,吴克群选择参与《音乐缘计划》这一原创音乐综艺,正是源自于他与原创音乐人之间的惺惺相惜。
    在分享创作心得、探讨音乐理念时,吴克群不再简单是一个综艺节目的嘉宾,他也是作为一名原创音乐人出现在舞台上,让一切热爱与纯粹都具象化。
    于是,面对当下音乐生态的顽疾,新生代音乐人的困境,吴克群会在稳定的音乐事业之外,积极参与各种原创音乐活动。

    商业密码 2024年9月20日
  • 专门“收割”妈妈们的特百惠,被时代抛弃了

    02特百惠被时代抛弃了
    《新品略财经》记得三四年前,在深圳龙华区某购物中心还开了一家特百惠的店,也曾在店里买过东西,当时的印象是特百惠的产品卖得还不错。
    在《新品略财经》看来,特百惠既是时代的产物,也是被时代抛弃的产物,这与消费环境、消费需求、市场竞争,乃至是与特百惠的传统商业模式等各方面密切相关。
    从产品层面来说,特百惠是化学科技运用到日用物品的代表案例,在特百惠诞生的年代,家庭有着食物保鲜难的痛点,特别是在冰箱不普及的年代,特百惠犹如“刚需”般存在。

    商业密码 2024年9月20日
  • 县城消费的另一面:喝奶茶的少了,钓鱼的多了

    图源:作者拍摄

    图源:作者拍摄
    刘子涵继续说道,现在同学之所以不愿意喝新茶饮,还有一部分原因是,学生们对新茶饮的口感愈发失去新鲜感。

    图源:作者拍摄
    但并不是所有县城零食折扣店都这么火爆,中秋节假日当晚当地赵一鸣零食折扣店偌大的门店看不到太多顾客,收银台前也仅有几个顾客在排队结算。

    图源:受访者提供

    有人为钓鱼投入千元,有人干起代购
    和新茶饮相对冷清、零食折扣店门店客流分化不同的是,部分业态在县城仍迎来火爆。

    2024年9月19日
  • 闪回科技二度冲刺港股,深陷盈利困境,雷军看走眼了?

    在回收生意的上游,闪回科技通过闪回收从消费电子厂商、零售商、运营商以及C端消费者处获取二手手机供给。
    在下游销售端,闪回科技以“闪回有品”面向B端商户和消费者进行二手机和新机的销售,公司接近90%营收由闪回有品贡献。”

    B端渠道的手机厂商是闪回科技高增长最大的助力,但与之相伴的是,面对强势的手机大厂,闪回科技没有议价权,还需要向手机厂商支付高昂的保证金和促销服务费。

    2024年9月19日