數據中心管理工作需要你定期學習新知識,這會使你的工作變得有趣或緊張–取決于在探索新主題時你所擁有的資源。
下面讓我們看看2020年最受歡迎的SearchDataCenter技巧,這些技巧可幫助你獲得知識并深入研究新的興趣領域。
分析服務器故障的主要原因
如果沒有服務器,任何數據中心基礎架構都無法運行。這意味著我們必須嘗試預測可能導致代價高昂的停機時間的任何潛在問題或事件—特別是對于關鍵任務硬件。
服務器故障的主要原因包括電源中斷、灰塵阻塞和溫度調節不良、固件過時、硬件配置問題和網絡攻擊。
面對這么多可能導致服務器故障的情況,重要的是部署有效的備用電源硬件;定期進行物理維護并使用ASHRAE準則設置溫度;部署定期軟件更新策略;持續檢查電纜設置;并遵守安全協議。
對于總體規劃,你的團隊應確保所有備用電源設置都可以正常工作,并且,制定災難恢復計劃,以防所有數據中心意外脫機的情況。
了解Linux
Linux是服務器和數據中心管理的行業標準,但是對于它的確切含義以及它在數據中心中的功能,仍然存在疑問。在最基本的級別上,Linux是操作系統,你可以在基礎架構中的服務器上運行。
但Linux又很不尋常,因為它是開源操作系統,這會影響許可。GNU通用公共許可證有條款說明你可以在何種情況下使用、修改和分發該操作系統。在這種許可模式下,其想法是該操作系統仍是開源的,可供所有人免費使用。
Linux與macOS和Windows OS的另一個主要區別是內核。由于開源社區不斷維護和更新內核,因此它是需要實時維護的服務器基礎結構的理想選擇。Linux內核包含用于內存管理、進程管理、網絡堆棧、虛擬文件系統和系統調用接口的子系統,以及架構和設備驅動程序。
設置IT更新策略
根據你企業的規模,你可能會參與IT預算或采購策略。每當高層管理人員決定采購新技術時,重要的是要考慮業務原因,即為什么要臨時更新其基礎架構。
升級任何技術的最大原因是服務器硬件(對任何數據中心來說都是必不可少的部分)隨著時間推移而變得越來越不可靠。IDC研究指出,服務器性能平均每年下降14%。
另外,如果你每年或每兩年更新服務器硬件,則你的團隊可以了解更準確的整體預計支出。這意味著你可以預測企業將花多少錢來升級硬件,而不用處理因過載或過度運行硬件帶來的任何意外費用。
除服務器技術外,更新策略還使你的企業有機會使用更環保更節能的硬件來降低總體運營成本。
購買更新的硬件是整合基礎架構并簡化數據中心管理的一種方法,無論你只是需要更少的計算機還是決定運行更多的虛擬或基于云的應用程序。
解決內核恐慌問題
沒有人喜歡系統全面停機。就像Window的藍屏死機一樣,內核恐慌是指某些情況會突然使你的OS崩潰,例如內存不足、惡意軟件、軟件錯誤或驅動程序崩潰。
為了弄清楚如何使操作系統恢復在線狀態,可以使用kdump崩潰工具。通過此過程,你可以使用kdump工具在崩潰時收集所有系統信息,并執行根本原因分析,以對Linux內核進行故障排除。
通過Linux發行版、兩個VM客戶端和網絡文件系統,你可以使用一系列命令來安裝網絡文件系統、確定要在何處存儲系統日志,然后模擬內核崩潰。通過此設置,你可以確定崩潰期間運行了哪些進程、打開了哪些文件以及存儲在虛擬內存中的內容。
這些信息以及kdump崩潰工具是執行任何分析并使Linux內核恢復正常的必經之路。
正確停用大型機
在醫療保健和金融等行業,大型機技術仍然具有相關性。盡管隨著新基礎架構出現以及人員退休,你的企業可能沒有專業技能或需要運行這些大規模計算設置。
如果你考慮停用大型機,第一步是讓你的團隊決定哪些數據應保留在企業內以及大型機應支持的軟件。這將幫助你運行應用程序清單,從而確定企業仍需要或可停用的應用程序。
你可以調查大型機的外包業務,但這可能非常昂貴,盡管這是最簡單的選擇。這樣做可以使過渡更加順暢,并消除有關物理硬件處理的問題。
還可以選擇重新構建大型機應用程序,使其可在x86硬件運行,以便你可以將軟件托管在自己的數據中心或云端。只要沒有重大代碼更改,此選項就很容易,但是當該軟件脫離大型機,你需要使用應用程序數據的頻率可能會影響你決定將其托管的位置。你還必須查看你的團隊必須采用哪些新應用程序來應對大型機不再可用這一事實。
最后,還有大型機的物理處置,這不是簡單的事情。為了正確安全地進行移除,你應該遷移所有必要的數據,對存儲進行消磁或銷毀任何硬盤驅動器。
責編AJX
-
Linux
+關注
關注
87文章
11316瀏覽量
209814 -
服務器
+關注
關注
12文章
9225瀏覽量
85617 -
數據中心
+關注
關注
16文章
4803瀏覽量
72208
發布評論請先 登錄
相關推薦
評論