時至今日,云計算已逐步替代傳統IT中服務器、存儲、虛擬化等單體軟硬件的IT架構,成為企業IT能力中最重要的組成部分。企業在利用云計算帶來的便利、敏捷的同時,也越來越多依靠云計算提供的持續服務能力,云計算已經當仁不讓成為企業IT架構的核心。
起初企業選擇云計算的一大動因是云廠商宣稱云計算能夠帶來IT成本的節約,但隨著企業深入使用云計算后,云計算到底能不能降低IT成本這個話題,一直是多方爭議的焦點。很多企業的實際經歷,都反映了云計算無法實際降低企業IT成本。雖然在資源彈性、簡化運維、以及服務共享上,云計算確實占據一些優勢,但也會帶來平均資源利用率不高、學習成本高、部署要求高等隱形的成本問題。孰是孰非,這個問題該如何解決呢?
我最初進入IT行業就是從事云計算方面的工作,后續隨著工作方向的變化,逐漸向企業架構、IT架構、數據治理、敏捷研發等方向轉型。隨著知識領域的擴展,以及從綜合的視角來觀察企業IT環境,我逐漸認識到,云計算并不能完全代表企業IT,云計算是一種工具,工具的作用始終是幫助組織提升效率、降低風險、改善質量,工具本身無對錯,關鍵是使用的人以及如何使用。工欲善其事,必先利其器,有利器方可善益事,我們不應再糾結于云計算本身是否能降低成本,而應該看我們該如何利用好云計算這項技術。成本治理以及降本這件事情,不僅僅是云計算的事情,也不僅僅是企業IT的事情,而是一個綜合了多方面人員、體系、流程、工具的協同工作。
本篇文章主題為成本治理,而非企業IT降本,實際上是希望大家對成本管理有一個清晰的認識,降本是成本治理的一個場景,做好成本管理和治理比單方面的降本更為重要,成本治理的目標并不只是降本,而是將企業IT成本的發生與產生的現實價值真正的對應起來。
那么我們如何協同企業IT與云計算,能夠在保證效率的同時,持續有效的管控成本呢?下面我將從成本治理的體系標準、方法和案例來逐一說明。
一. 云計算與企業IT
云計算并不是為企業而生的,云計算最初是面向所有的消費者的,但經過多年的發展后,企業的的確確成為了云計算最大的應用場景。為了能夠厘清企業IT與云計算的關系,我們需要了解一下云計算和企業IT的發展趨勢。
1.1 云計算的最新發展趨勢(部分內容參考CHATGPT)
截至2024年,云計算已經成為企業和個人采用的關鍵IT技術之一,企業開始深度使用云計算,同時個人對云計算的應用顯著增長,云計算已經不再具備高技術門檻,而成為普世型的企業及個人數字化能力平臺。云計算產業和技術的成熟不代表云計算的發展已處于穩定期,AI大模型的突破以及與行業結合的瓜熟蒂落,給云計算帶來了顯著的、劇烈的變化。所有的一切因素都預示著未來幾年云計算將繼續演變和創新,其發展趨勢體現在多個方面:
1)混合多云策略持續增長:當組織對于云計算的了解、實踐以及對云計算底層技術逐漸掌握后,更多的組織更加意愿于采用多云混合策略,以利用不同云服務提供商的特定優勢,同時保持關鍵數據和應用程序的靈活性和控制力。當然這也依賴于組織和人員IT能力的持續提升,以及更高效的管理體系和便捷的工具能力。
2)容器、微服務架構持續普及:容器技術、微服務架構、DevOps已從創新技術逐漸成為開發和部署應用程序的標準方法。組織也基于此類技術構建了敏捷的應用架構、持續開發和全球交付的技術能力,這些技術提高了應用程序的可移植性、可伸縮性和效率,使得云原生應用普及,構建和管理更加靈活。盡管云原生技術有一定的學習成本,但越來越多的組織和人員已經逐漸掌握該部分核心能力,未來將主要的方向用于云原生服務治理和云原生安全能力提升。
3)邊緣計算的興起:物聯網設備的增加和5G網絡的部署,使邊緣計算從窄算力向寬算力持續發展成為可能,端邊傳輸帶寬大大提升,5G站點的密集分布降低了無線網絡時延,云側集中處理能力穩步增強。未來持續通過在數據產生地點(即“邊緣”)進行業務和數據處理,進一步降低延遲,提高應用性能和客戶感知,降低數據傳輸成本,最終形成啞鈴型的未來架構。
4)云智能體:云平臺變得更加智能,通過集成神經網絡、機器學習、領域大模型等功能,云平臺提供兼具人類專家經驗和人工智能模型的全方位云平臺管理能力,包括成本管理、能耗管理、資源調度管理、應用運行管理到全自動運維等高階服務。這些能力使企業可以進一步擺脫人工操作帶來的風險,不斷通過自動的數據洞察來優化管理操作,人類專家只需從倫理層對云智能體展開監督和治理。
5)可持續性和綠色計算:對環境友好是云計算能夠繼續發展的重要條件,云服務使用企業已采取措施減少其數據中心的碳足跡。這包括使用可再生能源、提高能效比和采用更環保的冷卻技術。能耗的精細化可持續管理也成為云計算降本的重要手段。
6)安全和合規性的加強:隨著云計算的普及,應用系統的構建效率迅速提升,數據產生的速度也極大的提升,數據安全和隱私保護成為了重要議題。組織在云計算實踐中,形成了對云計算安全體系、安全能力的歸納總結,如加密、身份和訪問管理以及定期安全審計。同時合規性也是一個重點,尤其是與云計算伴生的云數據庫、大數據平臺等,在處理敏感數據時,要求符合《數據安全法》、GDPR等法規的要求。
7)行業云解決方案:特定行業企業,已根據行業業務場景和需求開發并使用行業云服務能力和解決方案(如金融、醫療、制造、交通、能源、泛互聯網)。這些解決方案旨在滿足特定行業對云計算可靠性、合規性、安全性、集成能力和性能需求。
8)云計算降本:在大部分深入使用云計算的企業中,通過云計算降本成為了企業持續應用云計算的重要原因,未來一段時期的重點方向是通過深入挖掘企業IT與云計算的融合增益,使投資中占比最高的云計算持續降本增效,改善企業IT的投入回報率。
云計算的發展趨勢指向更加靈活、智能、安全、可持續和高性價比的方向。隨著技術的不斷進步和業務需求的不斷演化,云計算將繼續引領數字化轉型的浪潮。
1.2 企業IT的發展趨勢(部分內容參考CHATGPT)
截至2024年,企業IT領域正經歷著前所未有的變革,這些變革重新定義企業如何運用技術來推動業務增長、提高效率和增強競爭力。以下是企業IT發展的一些關鍵趨勢:
1)數字化轉型的加速和深化:企業正在加速其數字化轉型進程,以適應迅速變化的市場需求和消費者行為,同時部分企業已進入數字化轉型深水區,亟待采用深度數據智能能力滿足新的業務場景。數字技術包括云原生、人工智能、區塊鏈、大數據和物聯網已經大規模的應用,未來突破性技術如多模態大模型、WEB3、量子技術、類腦技術、數據編織等,用于優化運營、改善流程、提升客戶體驗和創新產品/服務。
2)云計算的深入應用:云計算已成為企業IT基礎設施的核心,混合多云策略被廣泛采用。企業利用云計算的靈活性、可擴展性和成本效益,來支持全球業務、經營分析、業務部署和業務連續性計劃。
3)邊緣計算:隨著IoT設備的普及和5G技術的部署,邊緣計算正成為企業IT的重要組成部分。企業在園區智能管理、生產制造環節、供應鏈全流程等領域充分利用端邊云的協同能力,實現信息感知、數據洞察、智能決策和分部執行。
4)安全的新挑戰:技術的進步使安全攻擊和安全防御的對抗愈發激烈,各類攻擊形式日益復雜,企業信息和數據資產日益龐大,IT安全成為企業的首要關注點。人工介入安全防御已無法適應快速變化的安全態勢,企業正在采用更先進的安全技術和實踐,如零信任架構、企業全方位安全態勢感知、應用安全和自動化威脅檢測與響應來保護業務和數據免受威脅。
5)人工智能與業務結合:生成式和決策AI與業務結合已成為各家企業的首要關注點,部分企業已將自動化和AI集成到其IT操作和業務流程中,以提高效率和減少人為錯誤,包括使用機器學習優化生產管理,工業質檢,自動化常規IT作業、智能客服等。未來生成式AI將進一步與企業業務結合,與決策AI結合,共同輔助企業業務發展。
6)可持續性IT實踐:隨著對環境影響關注的日益增加,企業開始采用可持續性IT實踐,如優化數據中心的能效、采用綠色計算技術和實施電子廢物回收計劃。這不僅有助于減少企業的環境影響,也成為企業社會責任的一部分。
7)數據治理和合規性:隨著數據量的激增和隱私法規的加強(如GDPR和CCPA),企業必須加強數據治理和合規性。這包括實施嚴格的數據管理政策、加強數據加密和確保數據處理活動符合相關法律和標準。
8)持續降本增效:全球地緣政治、疫情等原因造成企業經營壓力增大,IT部分需要通過精細化管理,提質增效,一方面快速響應業務,一方面持續降低成本。
企業IT的發展趨勢反映了技術的快速進步和企業對于提高競爭力、效率和創新能力的不斷追求。隨著新技術的出現和業務需求的變化,企業需要不斷適應和更新其IT策略和解決方案。
1.3 云計算與企業IT之間的關系
我們站在企業的角度看云計算還是站在云計算的角度看企業,仿佛是一個鏡子的兩面,雖然實質是同一個,但不同的視角看上去,呈現的是不同的觀點和意見。
近年來云計算產業發展迅猛,據權威咨詢機構統計,截止2024年中國云計算產值已到8000億,預計2025年將達到10000億,從增長趨勢上看,復合增長率從2020年的50%到2024年的33%,增長趨勢已趨于平穩。
圖 中國云計算產業發展趨勢
同樣,云計算在企業IT的占比也穩步上升,預計至2025年,云計算將占據企業IT投入的50%,企業將廣泛應用云計算帶來的快速、彈性、高可用等能力,企業IT將以云計算為最主要的工具能力。
圖 云計算在企業IT投入占比
從云計算和企業IT的發展趨勢上看,二者有很多重合之處,但又不是完全相同。企業IT應用了很多云計算的技術,但云計算又不能滿足企業IT的所有訴求。有一段時期,云計算試圖能夠代替企業IT,承擔企業IT的全部職能,但在發展過程中,不同企業的個性化需求,以及傳統IT的發展,最終沒有讓云計算一家獨大。事實證明,無論企業IT還是云計算,都是為企業發展服務的工具,真正決定方向的是企業自身,掌握好二者的關系,讓企業IT和云計算能夠更好的融合,發揮最大的效力,即是成功的發展路徑。因此,企業IT成本治理也即主要是云計算的成本治理。
圖 云計算與企業IT的關系
二. 什么是IT成本治理
大部分人對成本治理的第一感知就是如何省錢,降成本,實際上成本治理工作并不是單一維度的去省錢,而是通過多維度的觀測度量、改進優化來使IT成本的發生更加合理,提供面向價值的服務。企業IT成本治理該怎么進行,該如何實施呢,我們從成本治理的組織體系、標準體系和執行體系三個維度來分析。
2.1 IT成本治理工作的組織
盡管IT成本管理是降本增效的重要路徑,但IT成本管理活動卻未在大多數企業組織形成明確職責,雖然涉及部門眾多,但未有責任主體,因此也未形成標準的方法體系。很多IT行業標準都涉及了成本相關的內容,我們對這一系列行業標準進行探索,最終確定企業IT成本應從三個方向進行管理,即面向資源的成本治理、面向服務的成本治理,面向企業經營可持續性的成本治理。
圖 IT成本與企業關系
通常,企業IT成本治理屬于企業IT管理或企業治理的范疇,應由企業技術委員會下設的IT治理委員會或成本治理委員會聯合相關部門及業務部門發起,企業IT治理委員會由企業IT管理部門聯合干系部門形成的虛擬團隊組成。如企業未設置技術管理體系,則可由信息中心或IT架構管理部門負責發起成本治理專項工作,由各干系部門執行。目前也有部分企業采用了輪轉方案,各業務部門輪流承擔成本治理專項的發起工作。
圖 IT成本治理組織架構
IT成本治理團隊職責:
1、 承接企業IT戰略和企業治理工作中成本方面的工作
2、 確定IT成本治理的原則、目標、范圍和方法
3、 構建IT成本治理體系,制定成本管理標準,確定成本治理的流程和方案
4、 確定成本治理工作的角色職責和組織分工
5、 IT成本相關制度的審核、發布
6、 協同成本管理涉及的相關部門,建立成本治理工作機制
7、 制定IT成本治理的指標
8、 評價IT成本治理的成果
2.2 IT成本治理參考標準
2.2.1 ITIL,信息技術基礎架構庫
ITIL為企業的IT服務管理實踐提供了一個客觀、嚴謹、可量化的標準和規范,企業的IT部門和最終用戶可以根據自己的能力和需求定義自己所要求的不同IT服務水平,參考ITIL來規劃和制定其IT基礎架構及服務管理,從而確保IT服務管理能為企業的業務運作提供更好的支持。對企業來說,實施ITIL的最大意義在于把IT與業務緊密地結合起來了,即IT架構與業務架構保持緊密的聯系,從而讓企業的IT投資回報最大化。
ITIL框架最核心的部分被稱為服務生命周期,包括服務戰略、服務設計、服務過渡、服務運營和持續服務改進等五個階段。每個階段都具有特定的目標和最佳實踐,以支持組織實現卓越的IT服務管理。從服務消費者的角度來看,服務關系涉及兩種類型的成本:
? 服務從消費者中移除的成本(價值主張的一部分)。
? 服務對消費者造成的成本(服務消費成本)。
消費服務的總成本包括服務提供商收取的價格(如果適用),以及其他成本,如員工培訓,網絡利用成本,采購等。一些消費者將此描述為他們必須“投資”消費服務。
當消費者評估他們期望服務創建的價值時,會考慮這兩種類型的成本。為了確保對服務關系做出正確的決定,重要的是要充分理解這兩種類型的成本。我們從成本治理的角度,主要是優化服務對消費者造成的成本,這類成本不一定對客戶可見,但可以為客戶創造更多的價值。
另外企業在設置IT預算時,需要設定預算和持續監測當前預算,為實現這一目標,需側重于捕獲預測和實際服務需求。它將這一需求轉化為用于設定預算和費率的預期運營和項目成本,以確保為產品和服務提供充足的資金。基于服務的預算編制旨在了解預算并根據提供或使用服務的全部成本。
ITIL還包括資產管理(ITAM),專門用于管理IT設備和基礎架構的生命周期和總成本。了解資產的成本和價值對于理解產品和服務的成本和價值至關重要,因此是服務提供商所做的一切的重要基礎因素。IT資產管理有助于提高資產及其價值的可見性,以及成本的可測量,這是成功的服務管理以及對其他實踐有用的關鍵因素。
2.2.2 COBIT,信息系統和技術控制目標
COBIT作為國際公認的IT管理與控制框架,已在世界一百多個國家的重要組織與企業中運用,指導這些組織有效地利用信息資源,有效地管理與信息相關的風險。作為目前IT治理的核心模型,COBIT包含四個主要的控制域:IT規劃和組織(Planning and Organization)、系統獲得和實施(Acquisition and Implementation)、交付與支持(Delivery and Support)以及信息系統運行性能監控(Monitoring)。治理工作被列入評估、指導和監控 (EDM) 領域,向下監督管理領域,成本管理歸屬在EDM02和EDM04中。
EDM01 確保治理框架的設置和維護。
EDM02 確保實現效益 保證從IT促成的舉措、服務及資產中獲得最佳價值;以經濟高效的方式提供解決方案和服務;可靠準確地維護成本和效益信息,從而有效和高效地支持業務需求。
EDM03 確保風險優化。
EDM04 確保資源優化 確保以最優的方式滿足企業的資源需求,優化IT成本,提高效益實現的可能性,并為未來的改變做好準備。
EDM05 確保利益相關方參與。
COBIT體系要求IT成本與業務架構、IT架構關聯,在高效支持業務需求的前提下,保障成本最優。IT成本治理需要圍繞業務架構進行設計,通過架構層面分解形成成本治理方案,確保成本治理的有效性。
圖 COBIT治理體系
2.2.3 IT-ESG,可持續IT
ESG是環境、社會和公司治理三個名詞的縮寫,是從環境、社會和公司治理三個維度評估企業經營的可持續性與對社會價值觀念的影響。ESG強調企業要注重生態環境保護、履行社會責任、提高治理水平,目前國內很多ESG評級使用MSCI ESG評級標準。
企業在IT技術上大量采用云計算或使用公有云服務,帶動了數據中心的能耗增長,增加了碳排放。因此通過云計算的降本可以節約能耗,可直觀完成企業的ESG中對環境的承諾:
云計算通過資源共享集約的方式,大幅降低企業IT資源采購,降低電能使用和制造相應IT設備所產生的碳排放;
云計算結合智能調度的方式,提升云資源的利用率,并通過調度業務削峰填谷的方式,充分利用電能的波峰波谷,節約企業成本;
云計算數據中心充分采用綠電方案,中和傳統能源方式帶來的碳排放;
云計算統一安全體系,保障企業、個人和社會的統一隱私信息安全;
云計算技術大大提升了企業的經營效率,降低了全社會整體供應鏈的成本,降低了企業風險;
企業IT成本治理可以作為ESG中環境和企業治理的重點工作內容,也可以借助ESG形成企業IT成本治理的行業標準。在企業行使ESG責任的同時,把IT成本治理作為協調環境,完成企業治理的主要工作,從企業治理的角度和ESG的角度同時推進以云計算為主的IT成本管控。
環境 | 氣候變化 | 碳排放 |
氣候變化的脆弱性 | ||
影響環境的融資 | ||
產品碳足跡 | ||
自然資本 | 生物多樣性和土地利用 | |
原材料采購 | ||
水資源短缺 | ||
污染物與廢棄物 | 電子廢棄物 | |
包裝材料和廢棄物 | ||
有毒排放和廢棄物 | ||
環境機遇 | 清潔技術機遇 | |
綠色建筑機遇 | ||
可再生能源機遇 | ||
治理 | 公司治理 | 董事會 |
薪酬 | ||
所有權及控制權 | ||
會計 | ||
商業行為 | 商業道德 | |
稅務透明 |
表 ESG分解
2.2.4 FINOPS,是“Finance”和“DevOps”的綜合體
FinOps是由隸屬于Linux基金會的FinOps基金會發起并向全球推廣的,最早是從公有云應用的維度,而并未站在企業的視角,因此并非能夠完全考慮企業IT方面的全部訴求。
FinOps是一種團隊管理云成本的方式,可以由企業中形成一個中心化的最佳實踐團隊驅動,通過跨團隊協同工作,在組織內部傳遞一種自我管理、培養成本意識的文化,強調通信和協作,也被稱為“云財務管理”、“云財務工程”、“云成本管理”等。FinOps的核心是紀律、實踐、文化和價值,參與人員包括工程師、采購人員、財務人員、產品人員和FinOps實踐者。
圖 FinOps框架體系
通知:通知是 FinOps 框架的第一階段。這一階段旨在為所有利益相關者提供所需的信息,以便于他們了解情況,從而做出有關云計算使用的經濟高效的明智決策。
優化:優化是 FinOps 框架的下一階段,重點是想方設法節約成本。
運營:運營是 FinOps 框架的最后一個階段。在這一階段,組織會根據業務目標持續評估績效,然后想方設法改進 FinOps 實踐。優化工作到位后,組織可以借助自動化來實施策略,在不影響性能的情況下不斷調整云資源來控制成本。
圖 FinOps方法論
FinOps實踐的重要階段是單位經濟支出的管理。單位經濟是FinOps最重要的概念之一,它將云支出與業務指標(總收入、出貨量、付費用戶、客戶訂單等)作比較,從而計算云資源投入產出比。結合業務經營特征,我們可以選取每購物訂單云支出、每物流派送云支出、每市民服務云支出、每車輛制造云支出等作為業務指標。另外,FinOps強調的問責制,形成了云計算成本管理的閉環機制,成本管理職責的確定,形成了成本優化的強大動力。
FinOps在一定程度上給出了占據企業IT最大比例的云計算的成本治理辦法,并且在成本管理過程中沉淀了單位經濟指標、團隊協作實踐、文化與價值等方法,也可以作為非云計算環境下IT成本治理的標準方案。
2.3 IT成本治理的執行
通常,企業IT成本治理屬于企業IT治理的專項活動,有技術委員會聯合業務部門發起,企業IT治理委員會由企業IT管理部門聯合干系部門形成虛擬團隊執行。也可納入企業治理范疇,由董事會指定審計及合規部門聯合執行。重要的干系部門通常包括企業戰略、企業IT、財務、計劃采購、PMO質量部門、業務部門等,治理過程主要依賴企業IT的IT架構、組織、流程、工具體系等。IT成本治理體系及流程固化后,后續轉移至PMO組織作為定期工作任務發起專項工作。
IT成本治理執行成果,需要定制指標來衡量,可參照FinOps中的單位經濟支出變化來衡量成果。治理成果需在企業高層決策會議或投資委員會會議上匯報。
IT成本治理執行周期,可以跟隨預算、審計、內控等專項工作后,成立成本治理專項工作,也可以按年度,每年定期啟動成本治理工作。
目前也有企業通過托管方式來幫助企業管理云計算等IT成本。Antimetal是一款為企業用戶實現云成本管理的自動化和優化的工具,目前主要幫助使用AWS的企業用戶進行云資源成本治理,幫助客戶節省AWS資源,未來會延伸到更多的云平臺。
目前Antimetal提供云成本治理方案主要來源于兩個能力,一個是AI預測模型,通過分析市場數據和用戶歷史云資源用量來預測用戶云資源利用,最大化節約資源購買。模型可以掃描企業數千個不同的數據點,動態擴展覆蓋范圍,最高可以為客戶節省75%的云服務賬單。另一個是成為云資源的做市商,可以在用戶池中最大化RI轉化,平衡買賣需求。
同時Antimetal提供Autopilot能力,用戶授權后,AI引擎可以托管用戶賬戶,代理企業執行操作,購買和賣出AWS用量。
托管公司進行的企業IT成本管理的問題是,托管公司并不一定能夠全面了解企業IT業務場景,只能基于AI模型對成本進行管理,因此可能遇到模型不匹配或者企業個性化需求無法滿足的問題。
三. 以云計算為核心的企業IT成本治理方案
云計算平臺已成為企業IT核心基礎設施,雖然這兩年有部分聲音即云計算成本較高,部分企業為了成本的管控開始下云,但也有些企業為了節約成本裁撤了企業IT團隊,將應用全部搬遷到公有云,這些結果恰恰說明要想真正治理好以云計算為主的企業IT成本,還是要應用好云計算這件工具,云計算仍然是那個高效、穩定、集約的數字化生產力。
如何做成本治理以及降本,方法很多,但真正有效果的方法還是需要企業結合自身的戰略、業務場景和文化,通過組合和協作的方式來構建體系。下面有一些方法和實踐,能夠應對企業復雜的場景,目前主要是三個維度,戰略上采用與企業架構結合做成本治理,戰術上以技術能力降本、管理實踐管控成本為主。
3.1 企業架構與成本治理
大家知道每一家企業都有諸如組織結構、流程體系、支撐系統等,那么如何通過一種形象的方式的來描述這些呢,這就是企業架構的目標。企業架構(Enterprise Architecture)最早的思想雛形來自企業建模領域。20世紀80年代中期之前,幾乎只有學術界對企業再造或企業建模的思想感興趣,但使用的理論和模型通常被限于某個信息系統的設計和開發。企業架構的目的是,在貫穿整個企業范圍內,將通常碎片化的已有流程(手動和自動)優化為一個對變化做出響應并支持業務戰略達成的綜合環境。
企業架構包括:業務架構,定義業務戰略、治理、組織和關鍵業務流程;數據架構,描述組織的邏輯與物理數據資產及數據管理資源的結構;應用架構,提供包含待部署的獨立應用及其之間交互作用和與組織的核心業務流程間的關系的藍圖;技術架構,描述支持業務、數據和應用服務部署所需的邏輯的軟件與硬件能力。
圖 企業架構
企業架構清晰的展現了企業的運行狀況,也為我們尋找成本治理的路徑提供了極大的幫助。我們可以通過對企業架構的改進和優化來實現成本治理的目標。
3.2.1 架構復用
企業架構一個重要目標就是形成可復用的架構資產,供后續的架構設計應用,這樣既可以保證后續的架構設計遵循最佳實踐,同時也無需重復完成架構設計。無論是業務架構、應用架構、數據架構還是技術架構,都可以從架構參考庫中提取已有的架構信息。
復用機制同時是一套系統化的過程,這包括識別可復用的架構資產、評估其適用性、適配到新的上下文中,以及維護架構資產庫。復用機制需要進行管控,以便架構信息能夠安全、快捷的傳遞到應用方,同時防止架構資產的濫用和泄密。這種機制的實施可以顯著提高效率,減少重復工作,并加速企業架構的交付。
例如,一個金融機構在拓展業務中,在中國境內和東南亞拓展,需要遵守不同的數據管理標準和統一的云基礎設施標準。通過建立數據模型、數據標準、云計算架構標準,以及相對應的表、圖、矩陣,可以確保這些拓展機構應用的所有數據相關的、云計算相關的構建塊,會被存儲到架構庫內并做版本控制,后續可供國內和東南亞的其他業務方、應用方查找和應用。復用機制也可幫助企業在歐洲的機構組織,開發的一套數據質量最佳實踐,同時經過必要的調整后迅速傳遞到美洲分支機構投入使用。
圖 架構存儲工具
架構復用可以使企業架構實踐保持一致性、高效性和適應性(個性化)的策略。通過精心設計的架構復用機制,企業架構師能夠在快速變化的商業環境中,確保架構的可持續性和長期價值。據統計,一些優秀企業在數字化和全球化的進程中,企業架構的復用率可以達到60%-70%,同時不同部門和團隊能夠共享視野、資源和專長。單從成本治理的角度來看,架構復用可以降低20%-25%的整體成本,同時確保架構體系的低風險。
3.2.2 業務技術一體化
前面講到了企業架構是分層的形式,把企業的業務和技術支撐體系進行了分離,便于梳理清楚各領域的職責和邊界。但隨著業務與技術分工的明確,業務部門也和技術部門形成了天然的鴻溝,最終的結果是業務不懂技術,技術部門也遠離業務。業務技術一體化最初的想法是希望業務和技術再次緊密結合,以適配當今快速多變的商業環境,實踐中發現業務技術一體化更大的優勢是很好的優化了業務應用的成本,成為當今非常流行的架構體系。
業務技術一體化平臺的定位:
? 幫助企業高效構建業務共享服務中心或應用技術平臺,降低架構管理復雜度。
? 助力企業核心架構的持續優化、持續沉淀可復用、可擴展的業務架構能力和技術架構能力,加速企業創新,消除數據孤島,幫助企業實現數字化跨越式的發展。
? 引入架構開發管理機制,所有架構開發在主平臺上擴展,始終保持架構體系透明,架構能力最優。
? 引入云原生微服務等技術,支持一體化平臺建設,從而減少業務系統的重復建設,節約成本。
圖 業務技術一體化模型
通過DDD領域驅動的思想梳理、識別各垂直業務的需求,在一體化平臺上沉淀業務矩陣與共享服務能力,并將能力以擴展點的方式進行外放,最終形成企業業務資產,通過不斷累積業務資產進行復用創造價值。同時業務架構和技術架構體系遵從平臺沉淀的架構,并根據自身要求向平臺提出改進需求,平臺根據需求及最佳實踐完成相應能力升級。
通過一套平臺解決架構開發、架構管理、架構沉淀的問題,可以大幅降低原有支撐業務系統所需的云計算等IT基礎設施,同時通過云原生調度優化業務使用方式,統一技術中臺、微服務化、單元化應用,整體可帶來40%的成本優化空間。當然,這套體系的應用還有賴于企業對應用架構、技術架構的強管控能力,以及較高的產研運人員綜合水平,會帶來部分人力成本的增加。
3.2.3 多云統一技術中臺
技術架構是企業IT核心,廣義的技術架構包括應用架構、數據架構、安全架構、基礎設施架構、中間層架構、邊緣架構、集成架構等,狹義的技術架構主要指基礎設施和技術平臺架構。隨著云計算的發展,很多企業以云計算為核心構建企業技術架構,包括私有云、公有云、混合云以及配套的IaaS、PaaS形成了支撐企業業務的核心技術體系。企業可以以成本管理視角維度,驅動技術架構優化,保持架構平穩的基礎上尋找可以優化的成本空間。
現在主流的場景是,很多企業的業務場景都遍布全國甚至全球,因此規劃了多云多地域的技術架構,不同云廠商基礎設施的差異增加了管理復雜度,同時技術綁定造成成本綁定,服務質量不同也對業務造成影響。云原生、IOT等新技術的應用,也給混合多云的資源使用優化與降本帶來了難題。目前遇到的挑戰包括:
· 大規模資源需求下,多云之間資源無法調度,導致部分資源閑置;
· 資源節點負載分擔不合理,不同集群之間無法共享負載;
· 缺乏系統資源模型,對未來業務資源需求缺乏準確預測,造成短缺或閑置;
· 多個技術平臺能力參差不齊,學習成本高,運維復雜;
上述問題核心是:如何能夠在多云環境下,快速、智能的調度資源,提升資源利用率,降低被廠商綁定的風險。應用統一的技術平臺,消除不同技術平臺帶來的差異。
多云統一:通過一套平臺控管多云環境,通過云原生技術實現IT資源與云平臺的解耦,保障資源能夠快速在多云之間切換,從而使云成本保持相對穩定,不會因為云供應商的原因突增突降。使用統一的技術平臺,屏蔽不同技術平臺的差異,降低業務切換成本。
智能調度:依托云計算領域大模型能力,結合應用資源消耗預測,形成云資源調度模型,將各類應用合理的進行混合調度部署。在資源限定的條件下,通過分級調度應對流量突發的場景,可有效管控成本。
資源填充和整理:資源填充與碎片整理,由于不同的云資源或硬件規格性能不同,通過資源調度任務進行統一填充式調度,以達到資源的填充利用和資源的時空復用效果。
圖 多云統一技術平臺
隨著PaaS服務在企業IT所占成本占比逐年攀升,PaaS平臺的資源調度也越來越重要。PaaS服務可以通過容器化,基于容器平臺的智能調度,應對各種復雜場景。自動監控、智能調度,可同時支持閾值、定時、自定義等多種伸縮模式。
混合云場景下的統一PaaS服務,相對每朵云各自的PaaS服務,從容災、運維、資源利用、成本等維度上有較大的優勢;通過大數據、人工智能、物聯網、區塊鏈等領域層級PaaS平臺的逐步容器化,可實現相對于物理機、云主機等更好的彈性調度能力。
3.2 技術領域降本方案
根據Flexera 2022年調查數據,企業用云費用平均被浪費了32%,雖然企業從IT采購管理、成本洞察優化運營、多云架構、FinOps多部門聯合云計算成本治理等方面深入踐行成本治理文化理念,但能夠達到的效果已接近天花板。因此企業不能僅從傳統的方式,而需要對云計算底層結構和原理層面進行深入分析,從而找到更好更優的方案。
3.3.1 云計算降本方案
云計算底層應用了很多技術,是技術密集型的產品。目前從云平臺層面看降本的手段并不是很豐富,近些年底層技術并沒有突破性的進展,當然個別云計算大廠擁有核心技術但未公開,此類場景目前還屬于黑盒狀態。我們就現有云計算體系技術架構,分析一下可能提升成本效率的路徑。
云計算超分場景
資源超分是云計算成熟的應用場景,包括CPU、GPU、存儲池都可以通過該功能實現“資源放大”(內存通常不超分),實際上企業在購買云計算,尤其是公有云的時候,使用的大都是云計算廠商超分過的資源,但通過良好的資源管理,是不影響企業用戶使用的。在私有云場景和混合云場景,企業也可以通過這種方式,放大邏輯上的資源配額,在不增加資源投入的基礎上滿足業務應用的資源需求,前提是對應用系統運行狀況實時監控,并能夠根據業務需求動態調動資源。以下示例為CPU不超分場景和1:2超分場景下的對比:
圖 方案一虛擬機CPU非超分場景
圖 方案二虛擬機CPU 1:2超分場景
我們可以看到方案二相對方案一增加了一倍的CPU資源,但實際物理核心CPU并沒有增加。通過虛擬化技術為虛擬機操作系統通過時分復用實現了多線程占用,虛擬機不與實際的線程綁定,而通過虛擬化平臺進行時分調度。方案二的問題是當多個虛擬機同時使用的線程都達到計算主頻的高峰時,各個虛擬機之間會爭搶CPU運算能力,造成互相影響,因此需要上層針對應用負載有更好的調度能力,避免資源爭搶的問題。
據統計,目前國內大部分企業的云計算虛擬機的負載在15-20%,超分可以應對云計算平臺上利用率低的問題,對負載較低的應用,可以集中部署到超分資源池,在虛擬化基礎上進一步實現資源的共享,可顯著降低云計算建設成本。
應用資源混部
前面講到的超分場景,會遇到部署了不同業務應用虛擬機資源爭搶問題,混合部署方式可以在一定程度上避免這些問題。
混合部署,也有說法叫潮汐調度,京東內部叫離在線混合部署。混合部署是一種降低成本的方法,將眾多應用通過一定規則定義后,再按不同的策略部署到相同的資源組上(一個容器集群或一個虛擬機組)。例如可以將日活型應用和夜活型應用部署到一起,日間優先日活型應用,夜間提供更多資源給夜活型應用,可以大幅節約資源。
從集群維度來看,混部是將多種應用在一個集群內部署,通過預測分析應用特性,實現業務在資源使用上的錯峰填谷,以達到提升集群資源利用率的效果。
從節點維度來看,混部就是將多個容器或虛擬機部署在同一個節點上,這些資源里的應用既包括在線(流式處理)類型,也包括離線(批處理)類型;
總的來說,將在線業務和離線任務混部到相同物理資源上,通過資源隔離、調度等控制手段,充分使用資源,同時保證服務的穩定性。
圖 智能混部技術
混部能夠解決的問題:
? 提升集群資源利用率,降低成本;
? 實現各類應用的資源容量,分配量,使用量的清晰洞察;
? 在資源調度和單機服務質量上精細化管理策略;
? 分級可靠的資源超賣,滿足差異化的資源質量需求;
? 及時識別干擾源,避免影響在線服務;
由于混合部署方式比較復雜,需要自動化的部署工具,支持滾動部署發布、增量部署發布、灰度部署發布,以及資源自動化回收?;旌喜渴疬€可以提升發布效率,例如靜態資源混部可以達到分鐘級的發布時間。
裝箱調度
裝箱是一個很有趣的數學問題,是一個組合優化問題。裝箱問題也叫背包問題,以一維經典裝箱問題為例,其數學模型可描述如下:S=(S1,S2,..Sn),其中0
裝箱問題是典型的NP(Non-Deterministic Polynomial,非確定多項式)問題,即在多項式時間內無法精確求解,一般采用近似算法,即啟發式算法,這樣可以迅速得到滿意解,但不一定是最優解。常見的算法包括NF(Next Fit)近似算法,FF(First Fit)近似算法,FFD(First Fit Decreasing)近似算法,BF(best Fit),BFD(Best Fit Deceasing)等。
如下圖所示,單臺服務器具備2顆24核心的CPU,超線程可以提供192顆vCPU,剔除虛擬化平臺的管理開銷,分配不同的虛擬機機型,那么能夠得到的虛擬機數量是不同的?,F實情況是如果沒有一個很好的算法,那么服務器會產生非常多的“碎片”,很多幾U幾G的資源會被浪費掉,極大影響服務器的分配率,因此應根據承載的業務類型適時調整資源規格,避免過多的浪費。
圖 虛擬機裝箱演示
同時,虛擬機部署涉及多個維度,如虛擬機的物理核數、內存大小、硬盤大小、帶寬等,按哪個維度進行排序,就需要針對具體的場景進行分析比較。如按物理核數來排序,可以分配10臺虛擬機;按內存排序,可能只有8臺;按帶寬排序,可能只能分配6臺等等,因此需要綜合考慮應用對資源的需求,平衡好各項性能要求,在保障資源供應的基礎上提升資源分配效率,減少資源浪費。
在部署過程中還需考慮NUMA、DPDK、親和性、帶寬等約束條件,需要確保虛擬機均衡分配。而且為了方便調整也支持手工部署,資源分配算法需要具備普適性。
解決好裝箱問題,根據業務類型特征規劃好資源類型,并進行動態的優化,可以大幅降低云計算的成本,是很多云廠商的核心競爭力。我先前也聽到過自定義規格來匹配計算機型這類技術理念,如3U7G,11U30G等,但后期沒有跟蹤到這類的實踐。在國產化領域使用ARM架構帶來的跨片和跨DIE性能下降,也會帶來碎片問題,同樣需要大家重視。
云計算技術場景 | 技術方案 | 優化效果 |
云計算超分場景 | 利用虛擬化技術實現CPU/GPU/存儲超分 | 15%-20% |
應用資源混部 | 通過應用畫像,確定應用類型,結合應用特征進行混合部署,充分利用資源 | 10% |
裝箱調度 | 結合實際業務場景,利用裝箱算法,優化資源分配方式,減少碎片 | 20% |
表 技術方案對比
3.3.2 云原生成本治理
云原生已成為企業數字化轉型的重要基礎設施,Gartner曾經預測,云原生平臺將在五年時間內成為95%以上新數字化項目的基礎,而2021年這一比例還不到40%。
云原生為企業帶來便利的同時,也引入了降本難題。云原生是以容器、微服務、DevOps等技術為基礎建立的一套云技術產品體系,容器動態調度、集群等技術特征帶來了資源規劃難,分賬難,管理難的問題。
云原生K8S容器集群中,多數應用采用共享集群方式,應用負載對計算、存儲和網絡資源的消耗不同且經常變化,需要對于不同的POD進行業務標記,并進行成本評估模型建設,以完成成本計量和分攤。國內云廠商中,阿里云在云原生成本管理有非常多的業務實踐,包括容器FinOps,多云成本治理等方面有非常好的方案。
京東在云原生、虛擬化和物理服務器混合場景下,有更多的成本治理實踐,尤其是在大規模的業務場景中,以及使用云原生技術降低PaaS類服務成本方面有顯著的成果。如使用HPA彈性伸縮技術,VPA垂直擴容技術彈性快速完成擴縮容,如降低PaaS服務副本數,冷數據治理、集群串聯等,另外需要重點講一下以阿基米德調度系統為核心的智能資源體系。
智能資源管理體系包括基于機器學習的阿基米德智能調度器、基于K8S的資源使用率提升策略以及應用離在線混部方案,非常適合大規模業務調度場景。
圖 智能資源體系
阿基米德智能調度器:
利用機器學習算法,應用畫像等進行資源使用預測,基于實際使用率調度,保護節點負載;
調度速度優化結合應用維度均衡調度策略;
調度過程全程可視化結合仿真回放策略調優;
資源使用率提升策略:
智能分析集群、節點組、節點資源使用情況,推薦合適優化手段;
應用離在線混部方案:
雙重資源視角,通過空閑資源識別獲取離線可用資源,不搶占在線資源配額
豐富的隔離維度,CPU、內存、磁盤、網絡等維度精細隔離;
全局水位、離線水位、離線最低資源保障;
通過以上結合資源管理的成本治理方案,可建立起云原生體系成本管理模型,與云基礎設施成本運營方案充分融合,實現整體成本可控。
補充說明一下,Severless技術可以在一定程度上節省應用使用服務器的資源,但調度方式比較復雜,我本人也未能深入研究,因此就不在這里討論了。
3.3.3 研發成本管理
云計算和云原生技術的推廣,改變了企業的研發方式,以敏捷+DevOps的研發模式,越來越多的出現在企業的研發組織中,但相對傳統研發模式,企業采用敏捷DevOps研發模式的成本是增加了還是減少了,研發成本如何管理和優化,也引發了廣泛的討論。
我在參加敏捷大師課的時候,我的老師一直拿敏捷研發對研發成本影響這個示例教導我們,敏捷研發模式并不能降低成本,如果把精益和敏捷作為降本手段的話那只能是降本增“笑”。實際上成本的衡量是個多維的辯證問題,工作環節增多了不一定就低效,工時增加了也可能帶來其他方面的改進,應用全生命周期是分開管理還是一站式管理也要看企業研發具體的場景、研發人員能力以及工具情況,總之一句話,我們在改進研發的道路上持續關注成本的合理性。
研發體系中可以通過研發貨幣化,工時管理,效能度量等方式量化成本,并以此基礎改進成本構成。除此之外,我理解激發人員自身的改進意愿和關注點,能夠起到更為顯著的效果。同時關注精益方法和敏捷工程實踐中,需要摒棄的八種浪費,可以幫助我們在研發過程中,找到改進的方向。
1、 缺陷 -- 通過質量內建避免更多的缺陷
2、 搬運 -- 減少研發中的搬運,如需求、代碼、測試,盡量一體化
3、 過度生產 -- 按整體節奏開發,減少前置或后置
4、 庫存 -- 按計劃協同生產,減少庫存
5、 等待 -- 同步生產,避免其他組織或部門等待
6、 不良人機工程 -- 提升研發工具效率
7、 未利用技能 -- 人盡其用
8、 過度加工 -- 減少不必要的開發
以研發數據為基礎構建一體化研發流程體系,可以在一定程度上減少研發領域的浪費;
通過導入先進的研發文化,在架構、質量、協同上提升能力,同樣可以改善成本,提升效率。
3.3.4 智能運維
運維工作占到企業IT部門工作內容的相當大一部分,OPEX的持續投入也讓企業IT部門被冠以“成本中心”而非“價值中心”。如何摘掉成本大戶這個帽子,讓運維工作變得“絲滑”,讓IT部門能夠體現直觀的價值,我們通過引入先進的技術體系來實現這個目標。
AIOPS智能運維通過使用人工智能(AI)、機器學習(ML)和其他高級數據分析技術,自動化識別和解決企業IT和云計算平臺的運行故障。AIOPS依賴企業IT系統中的CMDB、ITSM等基礎信息系統,通過各類IT服務(機房、物理機、網絡設備、虛擬化、云平臺、公有云等)生成的大量監控數據、事件信息、系統日志、運維操作等信息來監控所有企業IT資產,且對所有應用程序和系統之間的拓撲關系清晰可見。通過監測網絡、平臺和應用的運行數據,結合AI推薦的運維模型,運維系統進行非人工干預,例如主動剔除潛在故障磁盤、網絡路徑優化等運維操作,快速實時的進行故障和事件處置,極大縮短了故障時長。
某運營商在該公司云網體系整體應用AIOPS模型的成效比較顯著,它減少了人力成本的投入,也降低了故障帶來損失。該運營商經過測算,每年人力成本減少上千萬,告警處理時間下降了75%,故障平均發現時長縮短了50%,IT投訴處理時長縮短了93.5%,工單的流轉效率提升了66.7%,智能問答降單率達29.1%。
當然AIOPS 需要大量對模型的調優、演進甚至改進優化的過程,成本是非常高的。但模型相對固化后,成本保持恒定甚至下降,而且可以通過推廣進一步降低邊際成本。
3.3.5 綠色節能數據中心
數據中心能耗占據企業IT成本開銷的重頭,尤其是AI大模型等密集算力應用越來越多應用到企業IT領域。企業數據中心需要采用先進的技術和管理方案,通過節能改造不斷降低運營成本,同時更多采用環保的可再生能源。
數據中心節能改造包括需求收集、需求分解、需求評估、需求確認以及改造實施幾個階段。以下是數據中心在節能改造中的具體場景:
1、 數據中心減碳降耗設計
數據中心在設計階段即應充分考慮節能并減少碳排放,包括數據中心制冷方式選擇、供電方式優化,結合地理環境的布局,能源回收等,主要是提升節能效率,采用綠電等再生能源減少碳排放。
2、 綠色建筑設施認證對標
綠色建筑評價指標體系由節地與室外環境、節能與能源利用、節水與水資源利用、節材與材料資源利用、室內環境質量和運營管理(住宅建筑)或全生命周期綜合性能(公共建筑)六類指標組成。每類指標包括控制項、一般項與優選項。企業數據中心可與綠色建筑設施認證標準進行對標,按其星級評估企業數據中心綠色建筑等級,并制定建筑節能改造規劃。
3、 BIM建筑信息建模/CFD熱流體仿真
BIM建筑信息建模是通過建立虛擬的建筑工程三維模型,利用數字化技術,為這個模型提供完整的、與實際情況一致的建筑工程信息庫。熱流體CFD利用計算機仿真流體的流動和熱傳遞,充分利用虛擬仿真分析數據中心熱能流動結果設計。
以上兩類工具可以幫助企業IT部門更好的監控數據中心的發熱和散熱效率,通過人為干預或自動控制系統,改善數據中心運行環境,精細化能耗管理。
4、 能效評估
評估體系包括能源數據統計、能耗數據分析、能耗審計、節能改造評估、改造報告和改進措施建議。數據中心的節能改造成果需要專業的評估機制,該評估機制需要作為企業IT成本治理的構建物進行管理,評估結果需要經治理組織評審。
3.3.6 國產化降本
根據國家安可要求和整體安排,政府、金融以及央國企等都需要按計劃完成企業核心業務系統的國產化改造。目前國產化基礎設施由于芯片工藝水平和軟件能力等原因,在性能上與國際上成熟的WINTEL體系仍有差距,為了彌補性能上的差距,需要企業在國產化改造過程中使用更多的基礎設施來彌補差距,因此帶來的成本的上升。
通過系統性的方法進行企業國產化成本治理規劃,幫助企業從成本可視、成本運營、成本優化三個角度建立可持續的國產化成本管控標準和治理體系,提升國產化投資性價比。
國產化改造成本解構
? 全面資產管理,國產化軟硬件資產成本記錄
? 軟件工具鏈連續性診斷,精細化軟件成本
? 成本精準使用率監控,多維度成本報表
標準化服務規范
? 國產軟硬件服務統一標準化
? 規范國產化資源全生命周期管控流程
? 定期回顧審核成本狀態,糾偏、優化
全面優化國產化性能
? 采用分布式彈性架構,開放集成架構
? 基礎設施到應用軟件選型參考庫,提升性價比
? 國產化應用全鏈條性能調優,提高容量及利用率
國產化改造中成本治理的核心是集中能力做好性能優化,用最少的資源實現最大的效果,這樣才能大幅降低改造成本和使用成本,同時也能帶動國內國產化軟硬件的持續進步。
3.3 管理協同成本管控
前面我們介紹了很多成本治理的技術方案,技術方案如果沒有好的管理體系來支撐,也無法發揮出最好的效果。除了技術方案外,我們也總結了一些通過管理協同方式來進行成本治理的方法,這些方法圍繞著成本規劃、成本計算、成本運營等環節,用以作為技術方案的有益補充。
3.3.1 成本的精細化管理
成本精細化管理是成本可視化的關鍵步驟,其基礎是能夠對企業IT成本的精確計量。對于云計算來講就需要能夠對云資源的消耗形成統一的計量標準,對于使用了公有云服務的企業客戶來講,需要將計費賬單,包括包年包月、預留實例等計費方式逆向成云資源的計量,并且需要在一定程度上了解云服務商的計費方式。
通用的云服務商定價模式包括兩類,一種是競爭定價,一種是成本+毛利定價。從云資源維度上看,就是資源費用 + 軟件費用 + 運維費用,舉例來說RDS服務,是包含了RDS軟件(數據庫軟件)費用 + 承載RDS服務的虛擬機或物理機資源費用 + 運維服務費用。明確成本構成后,即可以根據企業實際情況確定改進的方向。
結合計量數據,再定向抓取云服務商的計費數據,就可以建立起企業IT成本運營分析中心,實現成本賬單數據按部門、產品、應用等維度的分攤能力,促使各團隊提升成本意識,改善成本構成。存量數據經過分析后,可以作為項目管理團隊、研發團隊、運維團隊等的預算規劃依據,同時可以提供成本變化趨勢,優化資源計費方案等。
圖 企業IT成本管理中心示例
3.3.2 成本文化建設
當我第一次看到戴明博士的管理十四條原則時,我覺得七十年前戴明博士的管理理念就非常先進了,尤其是在企業員工的角度。據我觀察,任何管理手段都是有上限的,如果想突破這個上限,有兩個方式比較有效,一種是激勵,一種是文化。
戴明管理十四條:
13.鼓勵接受再教育和自我提高
14.采取行動,實現轉變
企業IT成本治理,離不開文化對人的影響,需要員工真正理解成本意識和方法對企業和個人能夠帶來的價值。在成本治理文化中,我們可以參考FinOps框架中對成本文化的普及和推動:
首先,尋找熱衷于FinOps、成本優化、效率或數據驅動的技術使用的人,以加速實現業務目標;
其次,企業高層或核心人員,以及重要干系人需要支持推動成本文化建設;
然后確定成本文化建設方式:
?將成本治理發展為協作社區;
?考慮有助于促進成功的工具,例如成本報告和儀表板;
?定期分享新的進展,慶祝小的勝利,以展示價值;
?尋找通過其他組織優先事項和舉措擴大規模的機會;
?探索“做大”的方法,啟動可得到充分支持的 FinOps 實踐;
?學習借鑒組織內的其他成功計劃;
3.3.3 組織成本優化
組織成本優化是個非常有挑戰的課題,涉及到人的調整都是非常復雜和難以評價的。隨著數字化、智能化能力越來越多被應用的到企業的業務場景中,IT組織勢必要隨之發展進化。組織優化更多是以價值為導向的變革和以人員能力持續發展為目標的實踐,是提升回報而并不是簡單的降低成本。
1、 IT組織應聚焦價值體現,將非核心價值工作進行外包(如重復性運維、機房管理、非核心安全崗位);
2、 組織人員應有能力模型和能力發展路徑規劃,以適應新的業務場景;
3、 鼓勵以絕對考核為主,相對考核為輔,參考OKR目標設定;
4、 組織協同效率作為評價項,溝通成本是組織的重要成本之一;
3.3.4 輕資產模式
企業IT中的資產組成包括組織人員及辦公場所、機房、邊緣站點、硬件設備、軟件及無形資產、公有云服務、線路帶寬等,其中機房、硬件設備、自有研發組織等都屬于重資產。我們大家知道,重資產的特征是高投入,回報周期長,風險較大等,盡管此類資產對于企業長期的收益是重要的、不可替代的,但隨著市場環境的急劇變化,企業IT服務能力不得不跟隨業務腳步快速的調整,IT類重資產投入已成為企業審慎考慮的決策點。
如何對資產類型進行優化,仍需要企業結合自身場景,借鑒先進的實踐,不斷探索,不斷優化:
1、 減少服務器等硬件的采購,通過軟件平臺+硬件服務器租賃的方式,靈活管理資源池。由于是企業自有的軟件平臺,可以在硬件資源池的基礎上靈活的使用超分、裝箱、智能調度、混部等技術,具備極強的自主性,也可以進行快速遷移,降低了一次性資金投入的壓力;
2、 對于企業自研場景,通過合作聯合開發的方式,將一部分研發成本轉移給合作方,知識產權共享,可有效分解成本壓力,降低研發投入的風險,也可融合外部能力;
四. 業界IT成本治理實踐
4.1 某企業業務技術一體化實踐
某企業是一家全球知名的大型零售品牌商,其產品共分四大類,產品全生命周期包含上游原材料生產及采購、產品研發、工業生產制造、下游渠道營銷、端到端供應鏈、客戶服務體系、零售門店等,年銷售額千億規模。
該企業IT主要為采購供應商模式并結合少部分自研能力,在長期的發展過程中,企業內部構建了數百套應用系統用以支撐業務發展。2022年該企業數字化部門通過變革最終確定了IT項目技術評審機制,由數字化部門技術委員會負責評審工作,對數字化項目擁有一票否決權。在項目評審中,專家發現很多數字化項目中的應用系統,有至少50%的功能是重復的,而且用戶或周邊系統訪問這些功能的頻率不高,這樣就形成了大量的重復建設。專家們希望能夠把一些核心業務能力進行復用,后續數字化項目無需重復建設,于是啟動了業務技術一體化項目。
圖 業務技術一體化實踐
通過對企業核心價值鏈條中的核心業務場景進行梳理,形成了可以復用的業務領域,確定業務身份、領域服務、擴展點等,建設業務編排能力,形成業務技術一體化體系。
協同:業務系統資產化,核心數字資產實現累積與復用,提升系統研發效率,減少重復建設和采購成本。
治理:基于一體化平臺,實現前臺業務或ISV研發團隊間有機協同,降低研發門檻、快速交付高質量產品。
成本:基于平臺框架與運行時引擎達到收斂技術棧目標,降低運營維護成本。
效率:通過高質量可復用的資產,低技術門檻的業務可視化與流程編排大幅提升研發效率。
我認為該企業在成本治理方面最為成功的方面并不是采用了業務技術一體化這個體系,而是技術專家團隊能夠在保持傳統的IT建設模式的情況下,還能夠發現成本可以優化的方向,這取決于團隊的技術能力和項目經驗,目前并不是每家企業都能夠擁有這樣的團隊。
4.2 某企業統一技術中臺實踐
某企業是一家央企的子公司,該企業的數字化能力是集團眾多企業中最先進的,因此該企業作為集團落實數字化轉型“十四五”總體目標的試點企業。該企業的數字技術服務平臺項目于2021年啟動,經過6個月的時間平臺上線發布,后續承載了該企業80%的業務系統的運行。平臺基于多云統一技術中臺體系,提供云原生容器、數據庫、中間件等基礎組件、微服務平臺、DevOps平臺及諸多通用接口服務,同時配合運營、安全、集成、開發等體系和規范,在降本、統一、增效、合規等方面充分發揮價值。
圖 統一技術平臺
通過平臺項目,該企業在IT成本治理上取得了非常大的成果:
1、通過統一的技術服務平臺,將原有各業務部門提報的IT應用項目的技術棧進行了統一,統一使用云原生技術體系,以及應用數據庫和中間件等通用服務。這樣不僅大大降低了異構技術棧的維護成本,同時也將供應商軟件套件銷售方式,改為標品+定制開發+通用中間件方式,對應用軟件采購進行解構,細化了成本支出,便于比價和考核。
2、通過統一的技術服務平臺,納管了集團的云計算基礎設施,將原有虛擬機資源供給方式為容器與虛擬機結合的資源供給方式。通過容器超分技術,增加了資源供給,間接提升了CPU利用率。改造后,月均資源消耗下降了20%。
3、通過多云DevOps流水線CD能力,優化應用制品發布流程,提升了應用管理效率。
4、構建運維運營體系,為數字平臺的運營及使用提供指導,以便管理團隊更好為業務部門提供高可用、高可靠的技術服務。
4.3 京東某業態云計算成本治理實踐
中心化團隊驅動FinOps是FinOps實踐的核心原則之一,京東某業態FinOps實踐探索也是由一個中心化的最佳實踐團隊來驅動的。首先結合業務現狀,確定由平臺技術部門做為中心化的最佳實踐團隊牽頭開展FinOps實踐探索。平臺技術部門自2021年初從解決服務器成本管理面臨的主要問題出發,借鑒FinOps官方主推的成本洞察(Inform)、成本優化(Optimize)、成本運營(Operate)的理念層層遞進,按循環迭代的方式開展了集成本洞察、優化和運營為一體的成本管理鏈路能力建設,打造了基于多云環境的資源管理與成本運營的平臺。在技術能力建設的同時,注重數據能力沉淀,平臺逐步積累了近三年的服務器使用相關數據。在技術與數據能力迭代升級的同時,平臺部門于2021年初牽頭在業態內部成立了一個成本運營虛擬組織,依托平臺已有的成本管理鏈路能力和資源使用相關的數據,按技術驅動、數據驅動、運營驅動三個方面來推動跨團隊協作的成本管理和資源優化,實施各類更精細化的成本運營措施,經過持續了近3年的成本運營,累計節省資源成本上千萬元,并形成了可推廣的成本優化方法論。
1、成本可視化
? 已有資源正確歸屬問題
? 新增資源正確歸屬問題
? 月度成本賬單數據按部門、產品、應用維度的分攤能力
2、成本優化
? 提升計算資源利用率
? 計費策略優化
?降低數據庫歷史數據存儲成本和從庫成本
3、成本持續改進和運營
? 成本治理組織協同
? 新增資源預算管控
? 成本運營
? 高效成本協同工具打造
? 重大成本風險治理
該業態成本治理組織深入領會了FinOps在企業IT成本治理的方法體系,并有效運用,在集團內部打造了成本治理的標桿。
五. 總結
“不謀萬世者,不足謀一時;不謀全局者,不足謀一域。”
企業IT的成本治理并非一蹴而就,既要站在高處,用宏觀的視角統攬全局,又要扎到深處,通過細節的改變積少成多。本文希望能夠讓大家更全面的思考云計算、企業IT、成本三者之間的關系,有機結合這三個方面,幫助企業良性的發展。
審核編輯 黃宇
-
云計算
+關注
關注
39文章
7855瀏覽量
137703 -
IT
+關注
關注
2文章
868瀏覽量
63597
發布評論請先 登錄
相關推薦
評論