科技云报道:是时候全员FinOps了吗?
时间: 2024-04-10 21:13:13 | 作者: 雷竞技最新地址
上,国外某企业的真实案例引发了热议。一开始该企业只顾技术创新,积极上云,不顾成本。
直到有一天,高层介入喊停:“这个云不能再上了,成本已经远大于收益了”。该企业因为成本失控导致上云进度延迟两年,严重影响企业技术创新。
随着企业上云越来越普及,企业会发现用云成本也水涨船高,似乎与当初云计算诞生时宣称的“降低IT成本”理念背道而驰。
正因如此,云时代如何有效控制成本、质量和效率,成为企业用云管云的新课题。与之对应的云成本优化(FinOps)一词,也慢慢的变流行。
CNCF发布的云原生2023年趋势预测报告中,10个热点趋势中有4个与FinOps相关,分别是FinOps、GreenOps、GitOps和削减成本。
FinOps的历史并不悠久,公有云早期用户Adobe和Intuit在2012年首次描绘出了FinOps的雏形。FinOps本质上是一个理论框架,没有特定的技术栈,其方法论来自各个云厂商最佳实践的整合和抽象,从组织流程、识别浪费、优化措施等方面给出建议。
FinOps定义了一系列云财务管理规则和最佳实践,通过助力工程和财务团队、技术和业务团队彼此合作,进行数据驱动的成本决策,使组织能轻松的获得最大收益。
FinOps基金会的这张图被引用了很多次,图里简单列出了FinOps理论的原则、目标和参与方等。
FinOps理论的最终目的是要最低的成本来创造最大的价值,并指出了成本优化的三个阶段:
这三个方面牵扯广、执行难,是一个需要拉动企业全员参与的系统工程,因此成功的前提是组织目标的高度对齐,全员经营意识的建立,组织坚定的执行力和不断的提高的执行效率,实践的本身就是对组织效率的大练兵。
知名IT软件企业Flexera对云计算决策者进行年度调研已经持续12年,在3月8日发布的《Flexera 2023年云计算现状报告》中显示,82%的收房的人说,他们面临的最大挑战是管理云支出。
近一半(45%)收房的人说,由于经济不确定性,他们预计的云使用量和支出要比原计划中的略高或大幅度提高。
因此,云成本管理的关注度也许并不令人意外。如今的经济波动意味着,尽管云的使用和支出依然保持强劲增长,但企业对与之相关的费用越来越敏感。
企业要做到降本增效,无非是两个途径:一是减量,减少浪费。国外有调查报告数据显示,现在至少有35%的云资源是被浪费掉的。二是减价,从计费模式切入优化。
第二,构建精确的IT资源全景地图。通过CMDB的方式构建一个企业全局的资源图谱,便于各个团队之间的沟通,或者在谈某个项目或某一个环境的降本增效时,确保大家的信息是对齐的。
第三,合理的标签。成本的分摊,是通过在IT资源全景地图上,基于系统的层次架构、技术架构、业务架构等来分摊,在这其中有一套标签体系是很重要的,需要把它当成日常重要的工作来做。
第四,有效的IT资源利用率监控。很多时候,企业做IT资源的可观测性,大家比较关注系统可用性监控,或是性能监控,不太重视资源利用率的监控。如果连利用率监控都监控不准的话,那么就没法判断哪些资源是浪费的。
值得注意的是,面向FinOps的利用率监控和传统的运维监控不太一样。传统的运维监控比较关注平均利用率,而FinOps更加关注峰值。如果不按照峰值去算容量的话,那么降本增效之后,系统大概率就崩溃了。
除了减量减价的优化方式,还有一些被忽视的“省钱之道”也需要受到企业关注,例如:
●选择对自己最合适的多云架构。并非所有的业务都适合上云,有的业务上了云之后可能更贵。同时,需关注多云的最大公约数,保证既能跨云,又不会被某一个云厂商锁定。
●善用托管服务。比如有的企业数据中心上云后,将原有数据中心的机器托管给服务商,基于原有的机器去上云,能节约一大笔成本。
尽管FinOps在国内提及不多,但早在2020年12月,中国信通院就牵头成立FinOps产业推进方阵,推进规模化实践。
在那些率先拥抱云原生的互联网大公司内部,云成本优化的种子其实早就生根萌芽,形成了最佳实践的方法论。FinOps的出现,让大厂们的优化经验得到了更体系化的表达。
以字节跳动为例,他们内部已有相关实践,例如云账单分析,多云架构下对不同厂商定价策略的审视,推荐、广告、搜索的在离线任务混合部署等。目前,字节跳动在云成本优化上的最佳实践,将通过火山引擎对外提供服务。
阿里集团也搭建了自己的混合云资源管理平台(HCRM),推进自身成本数字化从无到有的建设,重新疏通集团内部的云资源计费和结算链路。
在腾讯内部,云业务成本中心承担着FinOps团队的职责,需要背上资源优化的考核指标,从平台侧、业务侧着手,还可以向上汇报,通过GM的层级去推动。
以腾讯为例,其内部构建了丰富的成本和利用率绩效看板,每天晾晒绩效,做得好或不好都会及时披露。
腾讯内部的成本看板最重要的包含两个维度:第一个是哪个帐号买了哪些资源,第二个是哪些业务使用了这些资源,包括一些分摊细节。
此外,还有面向平台和业务的利用率、成熟度等成熟度指标看板,主要了解资源大盘的整体情况,看投入到正常的使用中部分用得好不好,同时盘活闲置资源、减少浪费。
业务优化:在云控制台上提供了资源优化专项页面,基于业务的资源用量历史进行预测,构建业务资源画像,并给出资源优化建议。
规格建议:通过对比业务资源的申请量和使用量,能告诉业务能节约的成本数据,然后业务能够最终靠系统的控制台直接做优化。
弹性建议:比如某个工作日资源使用非常高,但周末基本没流量,这时候周末就要缩容,这些业务也能够最终靠控制台自己优化。
调度优化:提出了面向真实利用率的动态调度能力,管理员设定节点目标利用率,只要利用率还未达标,调度器就可以调度更多业务进来。
混部能力:引入差异化 SLA,允许高优在线业务和低优近离线业务混部,压榨每一分算力,同时离线服务可以在发生资源竞争时立即让渡资源需求,实现对在线业务零干扰。
据悉,腾讯内部的在线业务通过调度优化手段把资源利用率拉到48%,再加上离线混部,部分集群资源利用率能够达到65%以上。
整体来看,腾讯CPU规模达到了5000万核,而云成本优化总节省30亿元。
尽管互联网大公司们已做出表率,在FinOps实践中取得了可观的成绩,这是否意味着眼下所有的企业都应该进入到FinOps的实践中?
事实上,企业对上云的关注点是循序渐进的:第一阶段企业关注的更多是隐私、稳定,以及行业监督管理政策;第二阶段则是云与业务、研发、管理等体系的适配,关注效率的提升;第三阶段,才会来到成本优化的层次。
目前大多数国内企业还处在业务迁上云原生的时期,当企业面对业务压力时,成本管控的优先级自然会先“放一放”;当业务趋于稳定,应用的容器化、架构的现代化接近完成,也就是时候将关注点转到成本优化上来。
“很多企业在上云的过程中,只是把过去的经验简单粗暴的套用在新技术栈上。也有众多团队武断地认为成本优化和业务稳定性是相背离的,二者只能取其一”,该专家表示。
FinOps是大势所趋,而且正处于加快速度进行发展的早期阶段。对公司来说,早期的实践和转变总会带来阵痛,实践者一定要做好这样的心理上的准备。而 FinOps未来如何帮企业把云“用好”,还需要全行业的不懈努力和探索。
专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能区块链等领域。
来源:芯极速,谢谢 编辑:感知芯视界 Link 芯极速消息,网上爆料出上汽飞凡智驾负责人已离职,上汽研发总院飞凡智驾事业部
今日看点丨消息称苹果汽车项目向现实低头:延后至 2028 年交卷;消息称上汽飞凡汽车智驾团队
,近日有网友爆料称,上汽智驾首席产品官 Pia Hu 已经离职,他也是上汽研发总院飞凡品牌智能驾驶业务开发团队
? /
? /
? /
您好,我在使用ad7991时遇到一些问题 使用ad7991配置寄存器是上电配置一次就行
信 创业心态 AI驱动 用户第一 阿里正式交棒到吴泳铭手上,阿里新任CEO吴泳铭发
信,宣布两大战略重心:用户为先、AI驱动。在吴泳铭看来,用户第一,所有业务的根基是用户
?如何计算IGBT器件的工作结温Tvj /
华为作为全球领先的通信设施和技术服务供应商,在5G领域扮演着很重要的角色。然而,由于美国政府对华为施加的制裁,华为芯片由于被列入实体清单,无法采购
? /
7月14日,踏歌智行“国能新疆准东露天煤矿无人驾驶宽体自卸车运输运营”项目在开始调试的 两个月内 ,进入“安
下车”常态化阶段,无人宽体车行驶速度最高达到35km/h,在 我国矿区无人驾驶领域打破
早、中、晚三班运行,三台无人矿卡编组参与到矿区日常作业中。江铜德兴铜矿项目负责人向《江西日报》介绍:”电动轮无人驾驶项目现在已确定进入了‘安
5月29日,新华社《瞭望东方周刊》策划推出《“东数西算”发力》专题系列
,并刊登《算力商机》《算力兴黔》两篇专稿文章,深度聚焦“东数西算”布局下算力经济的澎湃之势,
:算力兴黔 /
计算是一种基于互联网的计算模式,它允许用户利用互联网访问可扩展的计算资源,而无需直接控制这些资源。
计算的出现改变了传统计算模式的局面,为用户更好的提供了灵活性更好、高效和可靠的计算环境。
基于OpenHarmony适配移植的对STOMP协议支持长连接收发消息
Labview在生成安装文件的时候,提示“在本计算机上找不到已选定的某些安装程序”
上,国外某企业的真实案例引发了热议。一开始该企业只顾技术创新,积极上云,不顾成本。
直到有一天,高层介入喊停:“这个云不能再上了,成本已经远大于收益了”。该企业因为成本失控导致上云进度延迟两年,严重影响企业技术创新。
随着企业上云越来越普及,企业会发现用云成本也水涨船高,似乎与当初云计算诞生时宣称的“降低IT成本”理念背道而驰。
正因如此,云时代如何有效控制成本、质量和效率,成为企业用云管云的新课题。与之对应的云成本优化(FinOps)一词,也慢慢的变流行。
CNCF发布的云原生2023年趋势预测报告中,10个热点趋势中有4个与FinOps相关,分别是FinOps、GreenOps、GitOps和削减成本。
FinOps的历史并不悠久,公有云早期用户Adobe和Intuit在2012年首次描绘出了FinOps的雏形。FinOps本质上是一个理论框架,没有特定的技术栈,其方法论来自各个云厂商最佳实践的整合和抽象,从组织流程、识别浪费、优化措施等方面给出建议。
FinOps定义了一系列云财务管理规则和最佳实践,通过助力工程和财务团队、技术和业务团队彼此合作,进行数据驱动的成本决策,使组织能轻松的获得最大收益。
FinOps基金会的这张图被引用了很多次,图里简单列出了FinOps理论的原则、目标和参与方等。
FinOps理论的最终目的是要最低的成本来创造最大的价值,并指出了成本优化的三个阶段:
这三个方面牵扯广、执行难,是一个需要拉动企业全员参与的系统工程,因此成功的前提是组织目标的高度对齐,全员经营意识的建立,组织坚定的执行力和不断的提高的执行效率,实践的本身就是对组织效率的大练兵。
知名IT软件企业Flexera对云计算决策者进行年度调研已经持续12年,在3月8日发布的《Flexera 2023年云计算现状报告》中显示,82%的收房的人说,他们面临的最大挑战是管理云支出。
近一半(45%)收房的人说,由于经济不确定性,他们预计的云使用量和支出要比原计划中的略高或大幅度提高。
因此,云成本管理的关注度也许并不令人意外。如今的经济波动意味着,尽管云的使用和支出依然保持强劲增长,但企业对与之相关的费用越来越敏感。
企业要做到降本增效,无非是两个途径:一是减量,减少浪费。国外有调查报告数据显示,现在至少有35%的云资源是被浪费掉的。二是减价,从计费模式切入优化。
第二,构建精确的IT资源全景地图。通过CMDB的方式构建一个企业全局的资源图谱,便于各个团队之间的沟通,或者在谈某个项目或某一个环境的降本增效时,确保大家的信息是对齐的。
第三,合理的标签。成本的分摊,是通过在IT资源全景地图上,基于系统的层次架构、技术架构、业务架构等来分摊,在这其中有一套标签体系是很重要的,需要把它当成日常重要的工作来做。
第四,有效的IT资源利用率监控。很多时候,企业做IT资源的可观测性,大家比较关注系统可用性监控,或是性能监控,不太重视资源利用率的监控。如果连利用率监控都监控不准的话,那么就没法判断哪些资源是浪费的。
值得注意的是,面向FinOps的利用率监控和传统的运维监控不太一样。传统的运维监控比较关注平均利用率,而FinOps更加关注峰值。如果不按照峰值去算容量的话,那么降本增效之后,系统大概率就崩溃了。
除了减量减价的优化方式,还有一些被忽视的“省钱之道”也需要受到企业关注,例如:
●选择对自己最合适的多云架构。并非所有的业务都适合上云,有的业务上了云之后可能更贵。同时,需关注多云的最大公约数,保证既能跨云,又不会被某一个云厂商锁定。
●善用托管服务。比如有的企业数据中心上云后,将原有数据中心的机器托管给服务商,基于原有的机器去上云,能节约一大笔成本。
尽管FinOps在国内提及不多,但早在2020年12月,中国信通院就牵头成立FinOps产业推进方阵,推进规模化实践。
在那些率先拥抱云原生的互联网大公司内部,云成本优化的种子其实早就生根萌芽,形成了最佳实践的方法论。FinOps的出现,让大厂们的优化经验得到了更体系化的表达。
以字节跳动为例,他们内部已有相关实践,例如云账单分析,多云架构下对不同厂商定价策略的审视,推荐、广告、搜索的在离线任务混合部署等。目前,字节跳动在云成本优化上的最佳实践,将通过火山引擎对外提供服务。
阿里集团也搭建了自己的混合云资源管理平台(HCRM),推进自身成本数字化从无到有的建设,重新疏通集团内部的云资源计费和结算链路。
在腾讯内部,云业务成本中心承担着FinOps团队的职责,需要背上资源优化的考核指标,从平台侧、业务侧着手,还可以向上汇报,通过GM的层级去推动。
以腾讯为例,其内部构建了丰富的成本和利用率绩效看板,每天晾晒绩效,做得好或不好都会及时披露。
腾讯内部的成本看板最重要的包含两个维度:第一个是哪个帐号买了哪些资源,第二个是哪些业务使用了这些资源,包括一些分摊细节。
此外,还有面向平台和业务的利用率、成熟度等成熟度指标看板,主要了解资源大盘的整体情况,看投入到正常的使用中部分用得好不好,同时盘活闲置资源、减少浪费。
业务优化:在云控制台上提供了资源优化专项页面,基于业务的资源用量历史进行预测,构建业务资源画像,并给出资源优化建议。
规格建议:通过对比业务资源的申请量和使用量,能告诉业务能节约的成本数据,然后业务能够最终靠系统的控制台直接做优化。
弹性建议:比如某个工作日资源使用非常高,但周末基本没流量,这时候周末就要缩容,这些业务也能够最终靠控制台自己优化。
调度优化:提出了面向真实利用率的动态调度能力,管理员设定节点目标利用率,只要利用率还未达标,调度器就可以调度更多业务进来。
混部能力:引入差异化 SLA,允许高优在线业务和低优近离线业务混部,压榨每一分算力,同时离线服务可以在发生资源竞争时立即让渡资源需求,实现对在线业务零干扰。
据悉,腾讯内部的在线业务通过调度优化手段把资源利用率拉到48%,再加上离线混部,部分集群资源利用率能够达到65%以上。
整体来看,腾讯CPU规模达到了5000万核,而云成本优化总节省30亿元。
尽管互联网大公司们已做出表率,在FinOps实践中取得了可观的成绩,这是否意味着眼下所有的企业都应该进入到FinOps的实践中?
事实上,企业对上云的关注点是循序渐进的:第一阶段企业关注的更多是隐私、稳定,以及行业监督管理政策;第二阶段则是云与业务、研发、管理等体系的适配,关注效率的提升;第三阶段,才会来到成本优化的层次。
目前大多数国内企业还处在业务迁上云原生的时期,当企业面对业务压力时,成本管控的优先级自然会先“放一放”;当业务趋于稳定,应用的容器化、架构的现代化接近完成,也就是时候将关注点转到成本优化上来。
“很多企业在上云的过程中,只是把过去的经验简单粗暴的套用在新技术栈上。也有众多团队武断地认为成本优化和业务稳定性是相背离的,二者只能取其一”,该专家表示。
FinOps是大势所趋,而且正处于加快速度进行发展的早期阶段。对公司来说,早期的实践和转变总会带来阵痛,实践者一定要做好这样的心理上的准备。而 FinOps未来如何帮企业把云“用好”,还需要全行业的不懈努力和探索。
专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能区块链等领域。
来源:芯极速,谢谢 编辑:感知芯视界 Link 芯极速消息,网上爆料出上汽飞凡智驾负责人已离职,上汽研发总院飞凡智驾事业部
今日看点丨消息称苹果汽车项目向现实低头:延后至 2028 年交卷;消息称上汽飞凡汽车智驾团队
,近日有网友爆料称,上汽智驾首席产品官 Pia Hu 已经离职,他也是上汽研发总院飞凡品牌智能驾驶业务开发团队
? /
? /
? /
您好,我在使用ad7991时遇到一些问题 使用ad7991配置寄存器是上电配置一次就行
信 创业心态 AI驱动 用户第一 阿里正式交棒到吴泳铭手上,阿里新任CEO吴泳铭发
信,宣布两大战略重心:用户为先、AI驱动。在吴泳铭看来,用户第一,所有业务的根基是用户
?如何计算IGBT器件的工作结温Tvj /
华为作为全球领先的通信设施和技术服务供应商,在5G领域扮演着很重要的角色。然而,由于美国政府对华为施加的制裁,华为芯片由于被列入实体清单,无法采购
? /
7月14日,踏歌智行“国能新疆准东露天煤矿无人驾驶宽体自卸车运输运营”项目在开始调试的 两个月内 ,进入“安
下车”常态化阶段,无人宽体车行驶速度最高达到35km/h,在 我国矿区无人驾驶领域打破
早、中、晚三班运行,三台无人矿卡编组参与到矿区日常作业中。江铜德兴铜矿项目负责人向《江西日报》介绍:”电动轮无人驾驶项目现在已确定进入了‘安
5月29日,新华社《瞭望东方周刊》策划推出《“东数西算”发力》专题系列
,并刊登《算力商机》《算力兴黔》两篇专稿文章,深度聚焦“东数西算”布局下算力经济的澎湃之势,
:算力兴黔 /
计算是一种基于互联网的计算模式,它允许用户利用互联网访问可扩展的计算资源,而无需直接控制这些资源。
计算的出现改变了传统计算模式的局面,为用户更好的提供了灵活性更好、高效和可靠的计算环境。
基于OpenHarmony适配移植的对STOMP协议支持长连接收发消息
Labview在生成安装文件的时候,提示“在本计算机上找不到已选定的某些安装程序”
------分隔线----------------------------