俗话说,省下来的就是利润。在全球都处于VUCA的时代,更是如此。
近年来,随着云计算的广泛应用,云成本管理成为企业关注的重点。FinOps(云成本优化)作为一种新兴的云成本管理方式,吸引了行业和众多投资者的目光。
FinOps往往被误认为是Finance和Operations的缩写,但它其实是Finance和DevOps的整合。
通过协同工作、数据驱动成本决策等方式,将云成本的责任从内部IT团队分散到整个公司里,从而帮助企业更好地管理云计算成本。
作为一种新型管理实践,FinOps可让财务、技术和业务团队紧密合作,通过精确的成本评估、资源分类和成本分配来实现降本增效。
据权威研究机构预测,到2025年,全球70%的企业将采用FinOps来管理云成本。在最近Forrester发布的一份关于明年云计算行业十大发展趋势报告中,FinOps更是被视为重要技术趋势之一。
6月,IBM以46亿美元收购了FinOps软件领域的巨头Apptio,显示出IBM对FinOps的高度重视。
IBM明白,随着AGI和AIGC等领域的迅速发展,对云计算资源的有效管理和控制将成为企业获得竞争优势的关键,FinOps将在这场竞赛中扮演重要角色。
让花在云上的每一分钱 都带来更大价值
2022年8月,Gartner发布新版本技术成熟度曲线,首次提出新技术概念“Augmented FinOps”(增强型敏捷金融)正处于创新孵化阶段。
Augmented FinOps是FinOps发展的进阶阶段,指通过人工智能和机器学习令传统DevOps概念中的敏捷开发、持续集成和部署以及最终用户反馈处理自动化,应用于财务治理、预算编制和成本优化工作中。
FinOps及其衍生技术发展,正成为众多企业资源运营的重要实践抓手。
3月,《Flexera 2023年云计算现状报告》中显示,82%的受访者表示,他们面临的最大挑战是管理云支出。
近一半(45%)受访者表示,由于经济不确定性,他们预计的云使用量和支出要比原计划中的略高或大幅度提高。
因此,云成本管理的关注度也许并不令人意外。如今的经济波动意味着,尽管云的使用和支出依然保持强劲增长,但企业对与之相关的费用越来越敏感。
在国内,FinOps基金会、CNCF、中国信通院等机构近年来也不断提出FinOps技术标准、云成本优化实施框架等,为企业的FinOps实践提供技术标准和工具参考。
FinOps定义了一系列云财务管理规则和最佳实践,其最终目的是要最低的成本来创造最大的价值。
简单来说,FinOps理论倡导开发团队、运维团队、业务团队和财务团队彼此合作,数据驱动,构建成本可视化能力,并将成本考核分配给每个团队和项目。
FinOps指出了成本优化的三个阶段:成本感知节点关注成本可视化、成本分摊等;成本优化阶段可聚焦目标制定,然后通过费率优化和用量优化来节省成本;运维阶段通过持续优化流程、规范和资源运营手段等实现持续成本优化。
FinOps还有一些成熟度评估模型,来评估企业做得好不好。
FinOps过程包括彻底了解支出去向、分析使用模式,以及就需要进行哪些更改做出明智的决策。
这可以是关闭未使用的实例、调整实例大小以匹配工作负载,或者确定要使用的更便宜的区域或实例。这是一个持续的过程,需要根据业务需求和云环境的发展进行定期审查和调整。
FinOps增强了业务敏捷性,通过了解云使用情况和成本,可以就云策略做出更快、更明智的决策。这种敏捷性使我们能够更有效地响应业务环境的变化并充分利用新机会。
此外,通过优化实现成本节约,企业可以在推动增长和创新的领域进行再投资。这可以是任何事情,从推出新产品、进入新市场或投资研发。在当今快节奏的商业环境中,这种增强的敏捷性是一个显著的竞争优势。
FinOps另一个主要好处是提高资源利用率。通过识别未充分利用的资源,可以确保从云投资中获得最大收益。
提高资源利用率可以带来更好的性能,因为资源不会浪费在未充分利用或不必要的实例上。它还有助于容量规划,因为可以更好地了解使用模式,并可以做出更准确的预测和分配。
在治理和合规性方面,FinOps发挥着至关重要的作用。对于云服务,如果管理不当,成本很容易失控。
这可能会导致预算合规性甚至财务报告方面的问题。通过实施有效的云成本优化策略,企业可以确保其不超出预算并遵守财务法规。这降低了经济处罚的风险,并提高了企业的透明度和问责制。
FinOps实践常见的五个“误区”
去年,中国信通院发起了FinOps现状调查报告,从调查报告的一些问题反馈来看,FinOps在国内的发展还面临着很多困难。其中,缺乏“业务-应用-平台-资源”的穿透管理视图、缺乏成本感知、缺乏相关系统和工具支撑是目前企业在IT资源精细化运营过程中面临的前三大难点。IT资源成本预测是企业在IT资源成本管理面临最为突出的困难。
在FinOps实践中,也有一些需要躲避的“误区”需要特别注意。
-
没有监控和分析云支出
FinOps最大的误区之一是缺乏对云支出的一致监控和分析。如果不清楚钱花到哪里去了,就不可能做出优化成本的明智决定。
为了规避这种误区,企业可以创建所有云资源的综合清单。这应该包括实例类型、存储卷、数据传输成本和使用的任何其他服务等详细信息。
接下来,创建一个跟踪这些成本的系统,许多云提供商为此提供了内置工具。
监控和分析云支出的目标不仅是为了获取当前成本,它还涉及识别趋势、了解推动支出的因素以及做出主动决策以优化支出。
-
过度配置资源
在本地环境中,通常根据峰值需求提供资源以避免性能问题。然而,在云中,这种方法可能会导致严重的浪费。
云计算的妙处在于它的弹性,企业可以根据需要扩展或缩减资源。要利用这一点,需要充分了解工作负载及其要求。
这涉及监控使用模式并相应地调整配置的资源。同样,许多云提供商提供了工具来帮助解决这个问题。
-
忽略未使用或孤立的资源
云资源某种程度上就像是“房子”:如今搭建新房的速度确实越来越快,但已建成的新房常常堆满杂物,或是入住人数总是远低于估计值。
为了保证总有可用的房间,大量新建确实是个办法,但新建同样也要再花费一笔,为什么不同时回头清理一下那些旧房间?
随着时间的推移,未使用或孤立的资源可能会增加大量成本,例如未连接的存储卷或空闲的虚拟机。
解决这个问题的方法是养成定期检查云环境,并清理不再需要的任何资源的习惯。这不仅可以降低成本,还有助于保持环境井然有序且高效。
在某些情况下,资源可能未得到充分利用,而不是完全未使用。在这种情况下,缩小规模或整合这些资源可以节省成本。
-
忽略预留实例或节省计划
FinOps的最有效方法之一是利用预留实例或节省计划。这些是云提供商提供的产品,让企业承诺一定使用容量,以换取折扣价格。
然而,由于缺乏对产品的理解或担心被承诺锁定,许多企业回避这些产品。虽然这些承诺需要企业仔细规划,但节省的成本将是可观的。
要充分利用预留实例或节省计划,首先企业要确定可能长期持续运行的工作负载,之后比较按需运行这些工作负载与保留实例,或节省计划下运行这些工作负载的成本。在大多数情况下,会发现后一种选择可以节省大量成本。
-
忽略区域定价差异
最后一个误区是缺乏对区域定价差异的认识。云提供商在其他地区的服务通常有不同的定价。通过战略性地选择在哪里部署资源,可以利用这些价格差异并实现显著的节省。
许多云提供商提供定价服务,可以帮助比较跨区域的成本。通过使用这些工具并花时间了解定价结构,可以做出明智的决策来优化云成本。
FinOps已在进行时
实际上,各厂商的实践是优先于FinOps理论的,是厂商的反馈和抽象形成了FinOps理论。FinOps的出现,让大厂们的优化经验得到了更体系化的表达。
以腾讯为例,其数年前就开始盘整闲置资源加入统一调度平台,通过货币化结算做精细化运营,通过考核方式推动业务资源利用率提高。
这些经营手段在FinOps系统理论出现之前就已经存在,但在2021加入FinOps基金会以后,随着对FinOps理论的更加深入的理解,腾讯才意识到这与FinOps的概念不谋而合,并这些实践经验回馈给社区,进一步丰富FinOps理论框架。
阿里集团搭建了自己的混合云资源管理平台(HCRM),推进自身成本数字化从无到有的建设,重新疏通集团内部的云资源计费和结算链路。
字节跳动内部的云账单分析,多云架构下对不同厂商定价策略的审视,推荐、广告、搜索的在离线任务混合部署等。目前,字节跳动在云成本优化上的最佳实践,将通过火山引擎对外提供服务。
在腾讯,云业务成本中心承担着FinOps团队的职责,其内部构建了丰富的成本和利用率绩效看板,其呈现各种数据,如利用率、成熟度、核算数据等,每个业务的负责人、平台成熟度负责团队和个人都要为结果负责,促进大家去做实时决策。
成本看板主要包括两个维度:第一个是哪个账号买了哪些资源,第二个是哪些业务使用了这些资源,包括一些分摊细节。
虽然FinOps已成为大势所趋,但其正处于快速发展的早期阶段,这也意味着很大的机会。
对于企业来说,早期的实践和转变总会带来阵痛,实践者需要做好这样的心理准备。而FinOps未来如何帮助企业把云“用好”,还需要全行业的不懈努力和探索。