高性能計算要求存儲系統具有必要的性能和容量,以確保可靠的操作,但是這些系統的價格很高。
高性能計算(HPC)存儲的總擁有成本(TCO)超出每GB的初始價格,這意味著IT團隊必須考慮其他價格變量。除系統本身的價格外,還有8個因素會導致HPC存儲成本增加。
1不斷變化的業務需求
業務需求會隨時間變化,支持它們的工作負載也是如此。HPC存儲必須適應這些變化,這可能需要及時重新配置、升級和增加容量。例如,存儲系統應能夠進行擴展,同時確保最少停機時間,因為延誤會導致收入損失和生產率下降。即使很少停機, IT部門仍必須購買和部署其他硬件,而這會增加總體TCO。
在某些情況下,企業可能會過度配置其存儲系統,以適應將來的業務需求和工作負載波動。但是,這可能導致不必要的支出和更高的長期維護成本,這也會增加總擁有成本。實際上,HPC系統很少會達到100%的利用率(通常接近80%),而且過度配置的存儲會進一步影響長期成本。同時,請注意不要過度使用HPC存儲系統,因為這會損害應用程序的性能和生產率。
2可靠性和可用性
HPC存儲系統應支持持續操作,且確保最少服務中斷的情況。該系統應該能夠處理驅動器和節點故障,以及其他計劃外的中斷,同時保持可用性和性能。主要有兩種方法可以滿足這些要求:前期投資于正確的存儲基礎架構上,或者后續花費更多的時間和金錢來保持系統正常運行。兩種選擇都會影響總體擁有成本,但后者通常會導致更高的HPC存儲成本。
另一個考慮因素是存儲配置。例如,某些RAID級別在驅動器間保持奇偶校驗,以提高可靠性,但這需要額外的原始容量。高可用性的存儲系統通常會部署冗余組件,例如多路徑I / O或雙控制器。IT團隊可能還會保留備用零件,例如額外的電源。此外,員工必須定期更新或更換組件。所有這些因素都會增加總擁有成本。
3系統和數據保護
對于大多數企業而言,保護存儲系統及其數據是最重要的工作,但是這些保護工作具有成本。
存儲硬件、軟件和固件中內置安全功能會增加TCO,維護安全基礎架構所需的日常操作同樣會增加TCO。例如,企業需要花費時間和資源來管理私鑰和訪問控制、監視存儲和網絡系統,確保符合適用的法規,以及定期執行安全性和合規性審核。
災難恢復策略也會增加總體擁有成本。備份、快照和故障轉移操作通常需要額外設備、軟件或服務以及人員。同時,IT團隊還必須在物理上保護存儲系統,這需要附加的火災警報、檢測設備或其他監視工具。
4配套軟件和服務
存儲供應商通常會提供可選的支持和服務合同,這可能會顯著提高系統的總體擁有成本,具體金額將取決于供應商和服務水平。企業可選擇較低前期成本的最小覆蓋范圍,但這可能會增加其停機的風險,從而導致日后的HPC存儲成本更高。有些第三方公司提供存儲維護服務,該服務可能比供應商的計劃便宜,但IT團隊仍必須將這些成本計入TCO。
TCO還應反映支持該存儲系統的軟件的任何許可費用。這包括直接推動存儲操作的軟件,以及與HPC存儲系統結合使用的第三方軟件(例如,專用文件系統或軟件定義的存儲)。另外,TCO計算應考慮管理和監視存儲基礎架構所需的任何其他系統或服務。
5存儲網絡基礎設施
存儲系統必須能夠與其他HPC組件及其他組件進行通信,這就需要可靠的高速網絡基礎架構,以維持運行。
無論網絡結構是以太網、光纖通道還是InfiniBand,IT部門都需要部署和維護組件,例如電纜、交換機、適配器或負載平衡器。在計算存儲總擁有成本時,網絡成本比較復雜,因為其他HPC組件會共享網絡。即使這樣,存儲總擁有成本也應至少反映這些網絡成本的一部分。
像存儲系統本身一樣,網絡基礎結構也可能有其自己的服務合同或軟件許可費。此外,網絡可能會包括冗余組件,例如交換機或適配器,以避免任何單點故障。IT部門可能會維護備件或采取其他措施來限制停機時間,并保持性能。組件更新周期也會增加網絡成本。
6操作環境
HPC存儲系統需要數據中心空間才能運行。盡管現在HPC系統更密集,可減少部分空間,但IT團隊仍應在TCO估算中包含這些成本以及相關的數據中心維護和維修費用。
另一個大支出是為存儲系統供電和冷卻相關的成本。閃存等技術可以降低功耗,但它們仍會增加總體能源成本。
TCO應該考慮對數據中心進行的任何必要更改,以為存儲系統做準備。例如,更密集的機架存儲可能需要更新電源、增強散熱或強化地板。數據中心可能還需要更多的布線或防火系統,以及額外的冗余,例如額外的發電機或不間斷電源。
7人員配備要求
另一個大筆支出是部署和維護HPC存儲系統所需的人員。這包括IT員工花費在采購、設置、配置、集成和測試系統的時間。這還包括持續的管理工作,這可能很復雜且很耗時。IT團隊必須確保系統以最高的性能運行,同時將中斷和停機時間降到最低,這可能會顯著增加TCO。
向新存儲系統的過渡過程也需要時間和資源,包括將數據從舊系統遷移到HPC存儲。在某些情況下,IT團隊可能需要招募合格的人員來部署和維護系統,或者他們可能需要培訓現有人員。這取決于存儲系統本身和員工的情況。無論哪種方式,都可能需要進行投資。
8計劃外停機
為了減少開支,企業可能會傾向于購買可靠性較差的存儲系統,或者限制員工培訓和雇用方面的投資。但是,這可能會導致更長或更頻繁的停機時間,并可能導致收入損失。
在Hyperion Research于2020年5月發布的一項研究中,約有一半的受訪者表示其HPC存儲系統每月或一次以上發生故障。這些受訪者表示,停機時間從不到一天到一周不等,一天的停機時間可能從100,000美元以下到100萬美元以上不等。
HPC服務中斷會對依靠該技術來持續提高生產力和創新的企業造成嚴重影響。當系統出現故障時,他們的工作通常會停止,從而導致長期的財務后果。盡管這些HPC存儲成本可能難以計算,但應始終將它們包括在TCO估算中,尤其是在比較產品時。
責任編輯:xj
原文標題:根據8個因素計算HPC存儲成本
文章出處:【微信公眾號:存儲D1net】歡迎添加關注!文章轉載請注明出處。
-
HPC
+關注
關注
0文章
323瀏覽量
23824 -
儲存
+關注
關注
3文章
201瀏覽量
22404 -
高性能計算
+關注
關注
0文章
83瀏覽量
13421
原文標題:根據8個因素計算HPC存儲成本
文章出處:【微信號:D1Net11,微信公眾號:存儲D1net】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論