文 | 智能相对论
作者 | 叶远风
两会政府工作报告中明确指出要制定支持数字经济高质量发展政策,开展“人工智能+”行动,这意味着,“人工智能+”已经成为国策。
在这种大背景下,大模型的重要性无疑被抬到了新的高度。
此时,有能力为大模型提供算力资源、算力服务、训练加速、部署应用等多样化支持的云计算,因其特殊能力也承载了重要使命。
需要有人站出来,谁会脱颖而出?
显然,生来就承担着推动数智经济高质量发展重任的国云,在这方面会走得更积极、更远。
典型如,人民日报发布的2023数字经济论坛特别报道中提到,“天翼云打造了具备‘科技创新、自主可控、安全可信、云网融合、生态开放、绿色低碳’六大特征的国家关键信息基础设施平台”。而天翼云一系列技术创新深耕,也对云计算如何深入推动大模型发展进行了一次系统呈现。
在天翼云身上,云计算与大模型如何在智能化大时代“贴身飞行”,有了一个样板。
全面支撑能力:全需求打穿,云计算责无旁贷
云计算对大模型的支持是全方位的,这既是一种“能力”,又是一种“要求”。
从响应“国策”而言,云计算要对大模型“有求必应”,才能在全社会层面加速大模型创新与落地,不留“木桶短板”;
从政企客户角度而言,大模型作为“新事物”,只有全方位的满足需求,才能帮助企业更好地实现智能化转型升级,赢得市场竞争优势。
通过持续在技术领域深耕,天翼云已构建起全栈大模型智算服务。
直白地说,“你要什么,这里都给你准备好了。”
在全球巨大的大模型算力缺口面前,迫切需要最底层、最基础又最为关键的算力资源?
天翼云打造了智算数据中心AIDC,提供充足、高效、低门槛的基础设施支撑,让不同类型的政企业务大模型创新发展不被算力卡脖子。
在多样化的算力利用过程中,需要体系化的算力服务支撑?
天翼云智算基础设施“云骁”具备高阶算力供给、资源高效利用、多种能力服务一站式提供的特性,在持续创新投入下,又进一步升级成为云智超一体化基础设施服务平台,构建了高性能RoCE网络、并行文件存储等服务,重点提升了训练加速、网络加速等核心能力,同时升级了运维体系,实现了对基础设施的全面故障预测和感知。
现在,在吉利汽车、胜利油田等企业,“云骁”正在提供智算、超算服务,推动传统产业数智化转型升级更进一步。
面对大模型最重要的基石之一——数据,既需要更可能多地获取、置备,又希望能有更高效率、更安全的管理?
依托中国电信自主研发技术,天翼云推出了数据要素服务平台“灵泽”,能提供“聚、治、享、用”一体化政企数据可信流通中台,做到了数据归集与共享、安全开发、流通交易分配一体化,以实现数据“资源化、资产化、资本化”的共识目标。
在海南,“灵泽”平台助力当地打造了海南省数据产品超市,并将业务范围扩展到了多省市。
大模型创新研发全流程十分繁琐,工程化工作急需要全新的平台支撑?
天翼云一站式智算服务平台“慧聚”,将软件开发的工程化能力“平移”到了大模型这里,可以为客户提供一站式全链路的大模型生产应用的流水线,训练、微调、部署、推理等全面引导与支持,政企客户只需要专注于模型升级和应用落地即可。
某种程度上,“慧聚”在全社会创造了一个“大模型工厂”,能够实现大模型应用的批量化落地产出。
最后,在具体的场景中希望快速获取直接的大模型应用,实现提效降本?
天翼云除了给大模型创新研发提供支持,自身也针对重要垂直领域研发了专业的大模型。
例如,在贵阳市人民政府政务场景和数据支持下,天翼云推出了其首个行业大模型——政务大模型“慧泽”,具有政务知识覆盖全面、办事意图理解精准、政务事项处理高效以及安全机制可靠的特点,面向政府工作者、市民提供专业、高效、个性化的政务服务。
又例如,利用自家“慧聚”这座“大模型工厂”,天翼云与其生态合作方推出了海纳视联大模型,在城市治理、行业视觉、社区乡村、数字家庭等多个领域都能够提供综合解决方案。
……
可以看到,只要有需要大模型的地方,天翼云的服务都“如影随形”,这是云计算全面支撑能力的直接展现。
当“综合型”选手出现,“无短板”能力的价值也呈现出来。
天翼云服务的思必驰科技股份有限公司推出了集大语言模型应用的生产、调试、发布、体验、应用于一体的大模型应用平台。在算力基础设施、算力调度以及训练能力打造等方面,天翼云给予思必驰全方位的支持,让思必驰DFM-2大模型能够更好地应用到众多企业当中,实现跨领域多意图、文档问答、多人交互等能力的快速应用落地。
在大模型全需求打穿后,大模型开发者、大模型提供者、应用厂商、政府与科研机构、行业协会等得到了更充分而全面的能力支持,可以预见,更多更好的智能化应用将走入日常工作、生活当中,“人工智能+”发展进程将大大提速。
创新引领能力:有先进的技术创新,云计算才能驱动时代发展
除了能力的全面性,大模型对云计算的另一个重要的“要求”是,能够在具体的能力构建上走得更为深入。
毕竟,作为大模型创新全过程的重要承载,云计算本身的技术创新,就在一定程度上引领了大模型发展的高度——它不只是被动承接大模型提出的需求。
而这种创新引领,相比较服务与能力的全面性,某种程度上更考验云计算长期的技术积累,是“硬骨头”,只有真正长期积淀才能做到。
天翼云能够站出来彰显国云担当,背后的长期投入必不可少。
有信息显示,近些年来,中国电信主动投身数字产业大变局,其投资年增长达7%,投资结构持续向天翼云、AI、安全、数字化平台等数字产业倾斜。
在云、网、数、智、安等五大能力协同发展下,天翼云正在云计算领域不断进行最前沿的技术创新,满足并推动大模型创新。
典型如,提供基础算力的智算数据中心AIDC建设,天翼云并不满足于只做一个“大算力输出”的中心,而是坚持“适度超前”布局智能算力基础设施,通过各种协同创新实现智算中心不仅“建得好”更“用得好”。
比如,智算中心最令人头疼的能耗问题上,天翼云通过液冷智算服务器等创新,实现了PUE等指标的进一步优化,大大提升能效比,让大模型与同样是未来时代主题的“低碳”实现了合流。
具体案例上,在三亚崖州湾科技城,天翼云提供了通用计算集群、国产化CPU计算集群、集群调度和应用平台以及集群网络安全平台等一整套软硬结合的一体化超算解决方案,对内实现更好的算力资源调度与动态绿色节能,对外高效满足当地科研、基因测序、生命科学、海洋气象、遥感等优势产业所需计算能力,带动大模型等创新迸发,以基础设施的创新来撬动地方经济发展。
类似的还有天翼云智算基础设施“云骁”,天翼云并没有止步于简单的算力综合统筹,而是继续往下深挖,面向ChatGPT类大模型训练、无人驾驶、生命科学等场景,提供针对性的服务,从而大大降低科研创新成本。在这背后,高性能RoCE网络、并行文件存储、智能运维等创新是重要加持。
此外,“慧聚”帮助大模型训练的过程也伴随有算子加速、模型并行、断点续训等技术难点的突破,成功将高性能计算能力、分布式算力调度能力、训练和推理多环节加速技术、高性能数据存储技术进行封装,最终大幅提升了稳定性、训练推理速度等核心指标。
总的看来,天翼云的一系列能力禀赋都不是一蹴而就的,都是在技术创新领域长期深耕的一种必然结果——当有引领行业变革的技术热点出现时,天翼云自身能力禀赋就能够接得住,抗得起,打得赢。
由此,当大模型热潮来临时,天翼云可以自然而然地贴合大模型需求、引领大模型创新。
优势融合能力:与宏观环境相结合,充分发挥本土资源能力禀赋
在广度、深度之外,本土大模型毫无疑问还要充分结合本土资源与能力禀赋,以实现加速发展。
在这方面,中国最主要的资源与能力禀赋是什么?
除了庞大的单一下游市场带来的充分市场价值反哺,最凸显的莫过于强大的基础设施建设水准,这集中体现在算力上。
而这种算力优势要更好地体现出来,如同路网一样,“拉通”是关键。
因此,算力一张网实现全局统筹调度,是中国发展大模型最主要的优势之一,以算力为核心的数字信息基础设施,成为国家战略性布局的关键组成部分。
天翼云一直在努力践行的一件事,即云网融合。
其中,天翼云算力分发网络平台“息壤”已经入选国资委2022年度央企十大超级工程,该平台致力于推动主要云厂商和大型超算云实现算力并网,服务“东数西算”国家工程,同时为国家双碳战略贡献力量(算网本身也有更充分利用能耗资源的价值)。 “息壤”突破了算力度量、算力感知、算网融合多项技术,支持多方算力并网、交易和结算。目前,天翼云自有算力资源已经率先纳入调度管理。
“息壤”可实现高效的全国算力调度,其成为全国范围内的一个算力传输枢纽,进行着每分钟数万次、每天上千万次的算力统筹和调度,时时刻刻加速着“人工智能+”的发展,满足千行百业对算力的极致需求。
“息壤”正在让我国算力资源优势得到更充分的展现。
而这种跳出企业个体、面向全产业的行为,就是国云履行自身责任担当的最好体现。
结语
天翼云打造了一个契合“人工智能+”国策的云计算样板,而值得注意的,还有所有技术、产品和解决方案的全栈自主可控,这亦是“人工智能+”国策的期许。
在大模型时代,天翼云等厂商的努力,也使得自主可控不再意味着“性能让步”,不再是“被迫替代与选择”。广泛而深入的创新加持,让自主可控同样成为“更优选择”。
依托国云智算底座,发挥国云安全优势,以天翼云为代表的国云正在与产业各方合作伙伴紧密协作,共建繁荣的大模型创新生态。国云未来可期,大模型发展未来可期。