最近,英特爾財務長DavidZinsner表示,雖然數據中心芯片需求在過去兩季有所好轉,但庫存消化將比電腦芯片更長,可能還要過幾季才能達到較佳的狀態。在這個AI被炒的火熱的時代,當英特爾說數據中心芯片的庫存正在積壓,出乎很多人的意料。
01 前所未有的壓力
PC產業正同時經歷“加速運算”和“生成式AI”兩大轉變。據Gartner最新報告,2023年全球用于AI的硬件銷售收入預計將達到534億美元,按年增長20.9%,這一銷售還將在2024年進一步增長到671億美元,在2027年進一步增長到1194億美元。
今年,不少互聯網公司紛紛開發自己的大模型。3月,百度制作了類似ChatGPT的項目ErnieBot;4月,騰訊云發布了新的服務器集群,該集群可供其他人租用計算能力;阿里巴巴計劃將所有產品插入大型語言模型,包括在線購物平臺淘寶和地圖工具高德地圖。
據報道,目前百度、騰訊、阿里巴巴和字節跳動四家公司合計向英偉達訂購了價值50億美元的AI芯片。這些芯片包括英偉達2023年發貨的10萬塊A800芯片,價值10億美元,另外價值40億美元的芯片將在2024年交付。
數據中心芯片風光一時無兩。目前,數據中心領域有三大巨頭:英特爾、英偉達、AMD。在數據中心CPU方面,根據Counterpoint數據,2022年英特爾以71%的份額保持數據中心市場的領先地位,AMD以20%的市場份額位居第二。
在數據中心GPU方面,英偉達不僅占有一席之地,甚至可以說幾乎“壟斷”。英偉達數據中心產品的客戶主要來自云服務商和大型互聯網公司,它們貢獻了英偉達大約一半的數據中心收入。英偉達的GPU用于ChatGPT等人工智能應用程序背后大模型的訓練和推理,目前科技公司對英偉達最高端的人工智能芯片H100的需求極大。
從今年的業績來看,英偉達是毋庸置疑的收入暴漲,尤其是在數據中心領域,在英偉達公布的截至7月30日的季度財報中,英偉達數據中心業務收入增長141%至103億美元,占其總收入比超過76%。按照這種趨勢,有分析師估計,到2025財年,英偉達的數據中心部門收入將擴大到400億美元。
英偉達如此強勢,其他兩大巨頭自然頗受影響。
AMD對數據中心同時供應CPU、GPU、FPGA、DPU和SoC,二季度AMD的數據中心業務下滑了。根據其財報數據,AMD數據中心營收為13.21億美元,同比下滑11%。AMD坦言,報告期內的Epyc處理器銷售沒有預期那么好,而且加大的研發支出也攤薄了利潤率。
從二季度的業績來看,英特爾數據中心和人工智能業務銷售額從去年同期的47億美元下降15%至40億美元。英特爾首席執行官帕特·基辛格表示,服務器CPU的庫存過剩將持續到今年下半年,數據中心芯片銷售將在第三季度小幅下降,在第四季度恢復。
對于英特爾抱怨數據中心芯片庫存積壓,分析師陸行之表示:“庫存難消耗有兩種原因,一是產能利用率維持高檔不墜、超過穩定需求,二是需求下降速度快過產能利用率下降速度。”他認為,英特爾在數據中心早已喪失話語權。依據預算的排擠效應,每買一臺AI服務器,就少買幾臺通用服務器,即使功用不盡相同,但這趨勢應該會持續數個季度,甚至數年。
一臺AI服務器價格比通用服務器貴20倍以上,也因此客戶無法大幅加碼服務器采購預算,只能少買數臺通用服務器。如果一臺AI服務器使用兩顆英特爾的CPU,假設少買三臺,那就少了6顆比較便宜的CPU需求,也就是為什么英特爾的CPU庫存被積壓。
實際上,不止陸行之認為英特爾在數據中心早已喪失話語權。Global X分析師Tejas Dessai也認為,英特爾等對于AI著墨不深的傳統芯片企業,恐面臨市占率下滑窘境。也有業內人士表示,生成式AI改變了數據中心平臺的戰局,英特爾、AMD正面臨前所未有的壓力。
02 CPU開始淪為配角
今年的市場中,通用服務器和AI服務器需求出現了兩極分化。
AI服務器和通用服務器的差異是什么?實際上,比起通用服務器以CPU為主要算力,AI服務器則是以GPU為主要架構,通過異質運算架構提高運算能力。目前依據應用的類型,AI服務器可以分為訓練和推理兩種。
從前電腦、服務器最重要的零組件是CPU,但隨著需要大量運算能力的AI應用出現后,CPU開始淪為配角,GPU的時代開啟了。
從目前AI服務器的市場來看,一張主板需要1~8個GPU、1~2個CPU,以及1個Arm Grace CPU,其中英偉達的GPU市場占有率超過8成,并以運算效能達5 PetaFLOPS的DGX A100和H100為AI服務器運算主力。
即使英偉達的GPU價格高昂,但是效率是遠高于其他產品的。一起來算一筆賬,假設建置數據中心預算為1000萬美元,可以選擇建置1座搭載960顆CPU、電力消耗達11GW的數據中心,可提供1倍的大型語言模型LLM處理性能;但是選擇建置1座有48顆GPU、功耗僅需3.2GW的數據中心,且LLM資料處理量是CPU的44倍。
從綜合成本收益來看,還是占優。更何況英偉達GPU在人工智能的推理和計算方面獨具優勢。因此一些財務實力不雄厚甚至負債累累的初創企業也在搶購英偉達芯片。這也就是為什么黃仁勛之前表示:買的越多,省的越多(The more you buy,the more you save.)。
在15年前,黃仁勛就表示,CUDA運算效果較CPU高出10~100倍。GPU應用能力早已不亞于CPU,甚至更勝一籌,自家GPU持續擴大生態系統(ecosystem),全新視覺運算世代即將來臨。今年,黃仁勛更是直接說到:“盡管CPU過去幾年運算速度不斷提升,但進入AI時代后,以CPU為運算基礎的時代已經結束,現在大型語言模型(LLM)需要更新的解決方案。”
業界分析師估計,AI芯片市場有超過8成掌握在英偉達手里。在一篇名為《Nvidia H100 GPU:供需》文章中,深度剖析了當前科技公司們對GPU的使用情況和需求。文章推測,小型和大型云提供商的大規模H100集群容量即將耗盡,H100的需求趨勢至少會持續到2024年底。不過,目前英偉達GPU的產能受到供應鏈的限制,給英特爾和AMD反超的機會。
03 AI趨勢下,英特爾、AMD能分到一杯羹嗎?
英特爾不會放過AI發展的浪潮。今年英特爾在加州圣何塞舉辦Innovation 2023活動中,AI是貫穿始終的主旋律。
演講開篇,英特爾執行長帕特·基辛格便表示,AI正在催生全球增長的新時代,在新時代當中,算力便起到了重要的作用,開發者正迎來巨大的商業和社會機會——算力離不開芯片,如今芯片形成了規模達5740億美元的行業,驅動著全球背后約8萬億美元的技術經濟。
數據中心方面,英特爾將數據中心芯片分為兩類,包括著重效能但耗能更高的Granite Rapids芯片,以及聚焦能源效率的Sierra Forest芯片。目前英特爾新款數據中心芯片“Sierra Forest”已經預定明年上市,每瓦性能將比目前的數據中心芯片提高240%。這是英特爾首次披露這類數據,對性能的提前披露,也能看出英特爾頗為著急。
看一下Granite Rapids和Sierra Forest這兩款數據中心芯片的具體細節。Sierra Forest,它是英特爾首款用于數據中心的E核Xeon可擴展芯片,還是基于EUV的Intel 3工藝的主導產品。Granite Rapids可將AI工作負載性能提升2-3倍,實現2.8倍的更好內存帶寬,內存模組MCR DIMM帶寬可提高30-40%。
英特爾預估,在AI戰場,還需要幾年時間,應該就可以追上NVIDIA在高端AI相關的進展,除此之外,英特爾在HPC是具有高度優勢,HPC與AI未來是會匯聚,英特爾除了AI持續進展,HPC更具有優勢。
AMD也在發力。AMD也跟英特爾一樣面臨產品推出時機落后的問題,旗艦AI芯片MI300目前僅少量送樣,要到明年才會上市。AMD數據中心硬件部門主管諾羅德(Forrest Norrod)表示,ChatGPT引爆的AI熱潮是AMD始料未及的。
目前,AMD已經將人工智能作為分配資源和投資的首要領域。AMD正在增加AI相關的研發支出,并已經制定AI戰略——包括AI專用芯片和軟件的開發。
對標英偉達AI芯片H100的大模型專用芯片,AMD的MI300X號稱HBM密度高達英偉達H100的2.4倍,HBM帶寬高達H100的1.6倍,單個芯片可運行多達800億參數的模型,可以運行比H100更大的模型。
也有市場機構看好AMD,Northland資本市場分析師理查(Gus Richard)預期,AMD未來可望在AI芯片市場拿下20%市占率。他認為除了AMD芯片表現不凡之外,AMD與大型數據中心的合作關系也有利AI芯片銷售。
值得注意的是,從晶圓代工的角度來看,數據中心芯片對高級節點的需求不斷增加。AMD在最近5年中崛起,并且在PC、服務器領域能夠威脅英特爾,其2018年宣布擁抱臺積電7nm是個關鍵決定。而英偉達也一直和臺積電關系緊密,盡管部分產品因分散風險、價格考量而轉由三星代工,如先前的RTX 30系列,但面臨三星制程技術落后下,最終RTX 40系列也回歸臺積電。
不管怎么說,在英特爾和AMD最新的數據中心芯片明年大量出貨之前,英偉達的高端GPU沒有抗打的對手。
-
英特爾
+關注
關注
61文章
9974瀏覽量
171818 -
數據中心
+關注
關注
16文章
4785瀏覽量
72145 -
ChatGPT
+關注
關注
29文章
1562瀏覽量
7701
原文標題:?CPU開始淪為配角
文章出處:【微信號:IC修真院,微信公眾號:IC修真院】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論