隨著 IT 領域的持續演變,新的趨勢正在涌現并有望在 2025 年重塑企業對待技術的方式。從生成式 AI 到數據主權,未來一年各行各業都將面臨重新思考其戰略以適應新變化的挑戰。基于關鍵觀察與行業信號, 以下是 Ampere 對 2025 年做出的四大預測。
趨勢一
從實驗到執行:生成式 AI 推理成為焦點
生成式 AI 正在從單純的實驗性工具轉變為能夠提供巨大商業價值的全面集成解決方案。雖然在過去一年中,生成式 AI 的應用主要集中在基于公共數據的聊天機器人上,但未來的重點是將其應用于私密、安全的數據集,以創建更具價值的工具。金融、保險和電子商務等行業的企業正準備采用這些技術,從專有數據中提取有價值的見解。
部署靈活性將至關重要。隨著 AI 工作負載擴展到各種環境——包括本地部署、邊緣和氣隙(air-gapped)隔離托管設施——對延遲敏感的應用程序將要求基礎設施更接近用戶,部署在現有數據中心和接入點(PoPs)中。此外,推理不再是一個獨立的工作負載。支持檢索增強生成(RAG)和應用集成等任務將需要強大的通用計算與 AI 專用資源相結合,同時強調效率與可擴展性。
趨勢二
推動未來發展:可再生能源增長疊加效率提升
隨著計算需求的激增,電力需求也在快速增加。然而,電網過載與地域性電力限制正迫使各行業尋求新的解決方案。隨著小型、區域分布式數據中心的出現,太陽能、風能和地熱等可再生能源逐漸受到青睞。這些項目的發展需要更長的時間,才能滿足 IT 基礎設施增長的即時需求。
然而,效率的提升刻不容緩。為了避免短期內采用新型不可再生能源或延長其使用壽命,硬件優化將在減少電力需求方面發揮關鍵作用。用現代高效的處理器替代老舊的高能耗系統,可以大幅降低能耗,使現有基礎設施更具可持續性。這種效率轉變對于在增加能源需求和兼顧環境管理責任之間取得平衡至關重要。
趨勢三
密度增長:充分釋放每個機架與數據中心的潛能
鑒于 AI 計算需求的快速增長,大規模密度已成為計算效率的新基準。解決方案的構建不再局限于節點層面,而是擴展到了機架和數據中心層面。這意味著企業正在通過充分利用現有硬件來最大化每個機架的工作負載。與因效率低下而常常導致資源利用不足的傳統系統不同,現代架構設計旨在消除浪費,并提高機架和數據中心規模上的平均利用率,同時避免不可預測性帶來的負面影響。
在解決方案層面,密度優化的挑戰不僅局限于 AI 專用(AI-only)工作負載。某些 AI 工作負載,特別是推理型工作負載,正在推動基礎設施變革以適應混合用途環境,而通用計算密度也同樣重要。在軟件工程組織中,更高效的虛擬化和容器化技術結合更高效的容器和 PAC(power aware coding)實踐,將實現更好的資源劃分,使企業能夠在不犧牲性能的情況下實現更高的利用率。
趨勢四
主權與安全:企業級 AI 崛起
數據主權與安全將在 2025 年對 AI 部署策略產生重要影響。企業越來越多的認識到專有數據集的價值,并將其視為具有競爭力的資產。這一轉變意味著,AI 推理工作負載不僅將在超大規模的公有云上運行,還會在更安全的環境中運行,如私有云、本地數據中心或私有托管設施。
數據泄露和 AI 算法篡改的風險凸顯了對安全、隔離基礎設施的需求。隨著企業在 AI 驅動創新領域展開競爭,保護知識產權和敏感信息的能力將成為成功的關鍵。此外,這一趨勢還將擴大企業自有計算資源的作用,創建一個更加分散和安全的 AI 生態系統。這種主權和安全需求,再加上需要將計算資源放在更靠近用戶的地方,將分散計算資源,并催生計算量更大的邊緣架構。
-
機器人
+關注
關注
211文章
28438瀏覽量
207192 -
可再生能源
+關注
關注
1文章
701瀏覽量
39536 -
生成式AI
+關注
關注
0文章
504瀏覽量
478
原文標題:Ampere 年度展望:2025 年重塑 IT 格局的四大關鍵趨勢
文章出處:【微信號:AmpereComputing,微信公眾號:安晟培半導體】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論