一是紧张的算力,二是数据治理的难题,三是应用落地如何解决幻觉问题,四是一些特殊领域AI算法的持续升级提出要求。
文|徐鑫 周享玥
编|赵艳秋
你可能设想过这样一种场景:有一个随身的AI医药健康助手,生病不用排长队,问问这个智能助手它就能给出诊疗判断;体检结束后看到结果不用担心看不懂,它能准确提醒你注意事项;想要减肥了告诉这个助手,它时刻提醒你饮食和运动事项……
大模型的风吹到医药健康领域后,这样的智能问答助手已初具雏形。不仅如此,数据显示,过去大半年有近50款医药健康相关的大模型产品推向市场,从高校、医院到药企,行业上下反应剧烈、动作迅速。
分析人士认为,这一方面与行业内迫切希望利用数智化手段提质增效的需求密切相关,也侧面反映了全社会医药健康服务的需求日益增长和供给不足的矛盾,给各方带来了普遍困扰。
12月9日,在华为云数字健康创新高峰论坛上,产学研医等医药健康领域各方共同探讨了大数据、AI等技术加持下数字健康的发展前景。其中,华为云基于盘古大模型推出的“华为云医药健康解决方案”正在基因测序、药物研发和临床研究等领域落地。
业界的共识是,医药健康场景关乎生命安全,对技术的可解释性、可控性要求极高,大模型技术要真正在医药健康领域落地应用,需要大模型底座厂商和行业内企业共同协作,也有赖更大范围内基础设施的建设与完善。
01
医药健康领域的痛,谁能解
相信每个人对医院各类检查项目大摆长龙的场景都不陌生。
在人头涌动的背后,医生其实早已负重前行。行业内有统计,我国每年有25亿人次要接受各种医学图像的检查,相关需求以每年30%速度递增,但影像科医生每年却只增长4.1%。这其中存在着巨大供需缺口。
据了解,在一线城市的三甲医院,影像科的医生每天每人大约需要阅读4万帧图像。但普通人的体验却是,到大医院做影像检查,两到三天才能拿到报告,效率仍有待提升。
拿到报告还不算完。专业术语过多,普通人根本看不懂,医生则需要花费大量精力解读,可能还会出现漏诊。一位医生就感慨,亲戚朋友经常给他发化验单,让看一下有没有问题,需不需要看病。他因此设想,能否用人工智能技术做一些基础知识的问答产品?
类似的问题在诊疗过程中还有很多。患者体验不佳,医生分身乏术,大量时间都被重复性工作占用。
除了诊疗过程,更上游的药物研发也有大量的痛点需求。比如行业内一直存在“双10”的说法,简单来说,就是一款药物(创新药物)从靶点确认、立项到最后报产上市,要投入“10年时间+10亿美元”,且90%的临床药物研发都以失败告终,投资风险极大。
行业对这些沉疴早有认知,使用新兴技术在这一领域提质增效,已是各方共识。
顶层设计层面也早有部署。根据“健康中国2030”“数字中国建设整体布局规划”等战略规划,近年来大数据、云计算和人工智能等新兴技术已加速与医药健康产业创新融合。
今年大模型热潮来临后,医药健康场景里此前经年累月的痛点又多了解决思路。
技术带来的巨大想象力迅速被引爆。“大家在迅速切入这个领域”,业内人士观察到,学术界、医院端以及从事药物研发的企业,对大模型的反应都很沸腾。
国内外科技巨头也已行动,纷纷公布医药健康领域的大模型应用探索。
这些如火如荼的动作,一方面反映医药健康行业普遍存在数智化升级需求。另一方面,业内人士判断,医药健康领域存在大量信息和数据,且需要进行上下文理解、分析判断的信息较多,正好与大模型的强语义和推理能力天然契合。大模型将成为解决医药健康领域痛点的一项更好的技术手段。
比如,在中医药研发方面,大模型就能够为其增添新的助力。中医药的文献种类繁杂,数量众多,理论体系流派也很丰富,加之现代医学的发展,积累了大量的知识和分析工具。这些理论体系背后存在逻辑关系,靠人的大脑去总结和提炼,不一定能够把潜在的逻辑关系汇总起来。大模型可整合已有知识,为研发人员梳理错综复杂的中医药背后的逻辑关系,推测新的潜在关系。
业界已有医药企业开始行动。其中,国内现代中药龙头企业天士力医药集团借助大模型来加速中药创新与转化,解决传统中药信息稀疏、离散等研发痛点,推动中医药知识宝库的传承。目前,天士力正基于华为云医学大模型打造数智中药研发大模型。
02
用好大模型,先过这几关
目前医药健康行业对大模型技术的态度相对务实。一位行业资深人士介绍,他们与客户交流时不会特别夸大模型的作用,在诊疗环节当下主要目标是取代场景里频繁消耗医务人员精力的工作。例如在住院报告的总结、医嘱生成、智能分诊、报告单解读等场景,希望把困扰行业多年的重复性劳动取代掉。
同时,业界也坦承,这项技术要真正深入到医药等行业,还要解决非常具体的工程落地难题,其中既包括行业普遍关注的算力瓶颈、数据等普遍性问题,也有领域内的特殊场景带来的新挑战。
首先,是行业普遍关心的算力问题。大模型浪潮下,AI算力呈现出指数级增长。尤其今年AI算力极度紧张,一位业界平台负责人称,业界整体面临算力从哪来的问题。有数据统计,未来10年AI算力将增长500倍。
而在模型调用方式上,有些企业对数据隐私更敏感,他们希望一些对数据隐私更敏感的企业希望数据和算力都在本地,这也需要底层模型能支持更灵活的调用和部署。因而,能支撑多元算力,满足自主可控需求成为行业普遍的需求。
其次,数据治理相关的工作也是一大考验,这是因为大模型的智能程度与输入的数据质量高度有关。然而,医药健康行业的数据处理难度颇大,这是因为医药健康相关数据往往分散在不同系统,结构格式不一,需要花费大量时间将海量不便于计算推理的数据,变成方便统计计算的数据。一位医生此前告诉数智前线,在临床采集环节当下就缺乏统一的数据标准,这对后续数据数据清理和处理带来了极大的挑战。
同时,医药健康场景里很多数据不出医院,通常基于私域数据去做训练和微调。一位资深从业者提到,ChatGPT等基础大模型产品应用到B端,很难一上来就达到企业级可用。底座大模型的厂商需要完善各类套件和开发框架,比如数据工作流、训练和定制工作流等,让客户能够更容易将模型接入到一些系统里。
此外,如何获得和用好高质量数据,包括用哪类数据去做微调也非常考验落地团队的经验。比如他们就发现医案是比较高质量的病历,并且经过专家审核,在模型微调需要少量但高质量数据时,可以发挥比较大的作用。
第三,具体到应用环节,如何解决大模型的智能涌现以及由此相伴的幻觉问题,也颇受业界关注。医药健康行业数字化解决方案人士透露,实际上生成能力在一些应用场景里有突出价值,如药物研发环节,由于药物研发整个流程非常长,失败率高,通过大模型可以生成人第一时间想不到的分子结构,能给研发人员带来很多新启发。
但在辅诊等环节,行业的特殊性使得医生和病患更希望生成的结果可信赖、可溯源,尽可能规避幻觉问题。如在辅诊中,医学上有非常多临床诊疗路径,大模型作出决策后,如果返回结果能显示来自哪种诊疗路径,决策就更受信赖。
最后,在一些特殊的领域,要用好大模型技术,还要解一些领域内特有的难题,这就对AI算法的持续升级提出要求。例如中医药的经典文献来自古籍,而大模型对于古籍的理解能力还有待提升,这需要手工根据古籍构建思维链来训练模型。
03
盘古大模型给医药行业按下加速键
针对医药健康行业数智化升级中普遍存在的数据规模和数据质量问题以及AI算法持续升级、算力底座和自主安全创新等关键难点,华为云推出了医药健康解决方案,以盘古大模型为驱动,以分布式云基础设施和昇腾AI云服务为算力底座,提供包括盘古医学大模型、盘古药物分子大模型和基因测序在内的盘古for医药健康解决方案,以及医药健康数据平台,加速产业高质量发展。
具体来说,华为云从算力、数据和应用场景等层面,以“应用创新”“数智创新”“算力创新”三级创新,解决行业多重痛点,加速大模型落地。
算力创新层面,针对业界普遍的算力焦虑,华为云在贵安、乌兰察布、芜湖3大AI云算力中心,上线了昇腾AI云服务,给业界提供了更多元、高效、长稳的算力服务选择。华为云大数据与人工智能领域总裁尤鹏在论坛演讲中即表示,大家再也不需要高价去抢购GPU,也不需要担心GPU将来的供应连续性问题。同时,使用昇腾AI云服务也避免了自建AI数据中心的长周期等待、管理复杂等问题,澎湃算力、即开即用0等待。
华为云大数据与人工智能领域总裁尤鹏
据了解,华为云昇腾AI云服务从算力(昇腾算力)、芯片使能(CANN算子库)、AI框架(MindSpore AI计算框架)到AI平台(AI开发生产线ModelArts)实现全栈自主创新;性能上,具备单集群2000P Flops的澎湃算力,同时千卡训练30天长稳率达到90%,训练作业故障自动恢复,非自动场景下恢复时长小于30分钟。有业内人士对数智前线坦言,行业虽有“百芯大战”之说,不过当下华为云昇腾AI云服务,几乎是企业在GPU算力之外最优的替代。
数智创新层面,为方便灵活调用模型,解决数据处理痛点,华为云有专门医药健康大数据平台,打通数据孤岛,实现数据跨部门共享。另外华为提供的模型部署和调用方式非常灵活,企业既能公有云上获得服务,也可以私有化部署。
应用创新层面,经过多年投入,华为云在大模型领域的布局完整覆盖了基因测序、药物研发和临床研究等医药健康行业重点场景,可为更多场景的应用创新,提供完备的应用开发支撑。以基因测序领域为例,华为云提供全球首个基因组自动AutoGenome和全新多组学AutoML框架AutoOmics,能帮助国内研究机构掌握数字主权的完全控制权。
还有场景模型开发人士提到,行业模型和细化场景模型,分层解耦,这种开放合作框架更方便伙伴去做细分场景创新。
一位业内人士也告诉数智前线,他们发现当下大语言模型发展速度非常快,会根据行业变化及时对技术路线做调整。华为云的开放架构和L0.5模型,就给他们打开了思路,极大的拓展了大模型应用的场景和空间。
基于这些平台和创新性工具,目前,医药健康行业里一批先锋用户已率先将大模型技术应用到了医学检验、药物研发、病原微生物鉴定和基因测序等领域,并产生了实际效果。
比如在医检环节,润达医疗基于盘古医学大模型构建医检大模型良医小慧,能够高效提取结构化数据,帮助解读医生工作站需要处理的化验单,让医患更快了解检测结果。目前,它能识别解读超过4500个项目,2800种疾病,通过综合考虑患者的病史,病症和其他相关因素,为患者提供更全面、详尽的评估。
药物研发领域,西交大一附院基于华为云盘古药物分子大模型,在做新靶点新类别广谱抗菌药研发,已大大加速研发周期。这一案例最近还入选了中国人工智能产业发展联盟(AIIA)组织评选的2023AIIA十大先锋案例。
结 语
医药数智发展正按下“加速键”。业界也认识到,仍然有不少行业性挑战需要克服和应对。
来自医药研发领域的信息化人士和医院管理者指出,一些行业性体制机制仍然有待建设。以数据为例,一方面,临床数据采集缺乏相应的标准和规范,可能会影响数据的准确性和质量。另外,组织和机构间的信息壁垒高,缺乏行业层面的医药健康数据建设和联通机制。这可能会制约数字赋能健康的进度。
而更完善的机制体制建立,则考验产业各方的实践智慧和协作能力。当下正处于人工智能大规模变革行业的前夜。大模型是迄今为止最复杂的系统工程,真正落地到行业、机构、企业需要全链条全领域生态的深度协同。
可以想见的是,随着深耕行业的云厂商持续将医药健康知识及经验与AI技术结合,大模型将加速医药健康行业数智化进程,提升每个人的健康体验。