一、芯片散熱概覽:功耗升級、散熱技術持續革新
電子設備發熱的本質原因就是工作能量轉化為熱能的過程。散熱是為解決高性能計算設備中的熱管理問題而設計的,它們通過直接在芯片或處理器表面移除熱量來優化設備性能并延長使用壽命。隨著芯片功耗的提升,散熱技術從一維熱管的線式均溫,到二維VC的平面均溫,發展到三維的一體式均溫,即3D VC技術路徑,最后發展到液冷技術。
二、主要散熱技術:從風冷到液冷,冷板到浸沒式
散熱技術包括風冷與液冷兩類。風冷技術中,熱管與VC的散熱能力較低,3D VC散熱上限擴至1000W,均需搭配風扇進行散熱,技術簡單、便宜,
適用于大多數設備。液冷技術具備更高散熱效率,包括冷板式與浸沒式兩類,其中冷板式為間接冷卻,初始投資中等,運維成本較低,相對成熟,英偉達GB200 NVL72采用冷板式液冷解決方案;浸沒式為直接冷卻,技術要求較高,運營維護成本較高,曙光數創研發“1拖2”雙相浸沒液冷結構。
三、性能+TCO多重驅動,散熱市場規模持續向上
AI大模型訓推對芯片算力提出更高要求,提升單芯片功耗。芯片溫度影響性能,當芯片工作溫度近70-80℃ 時,溫度每升高2℃,芯片性能會降低約
10%,故單芯片功耗增長進一步提升散熱需求。此外,英偉達B200功耗超1000W、接近風冷散熱上限;“雙碳”+東數西算等政策嚴格數據中心PUE要求,液冷平均PUE低于風冷;TCO方面,相比風冷,冷板液冷的初始投資成本接近風冷,并且后續運行成本更低。
1.1 芯片散熱起源:電子設備發熱的本質是工作能量轉成熱能
● 電子設備發熱的本質原因就是工作能量轉化為熱能的過程。芯片作為電子設備的核心部件,其基本工作原理是將電信號轉化為各 種功能信號,實現數據處理、存儲和傳輸等功能。而芯片在完成這些功能的過程中,會產生大量熱量,這是因為電子信號的傳輸 會伴隨電阻、電容、電感等能量損耗,這些損耗會被轉化為熱能。
● 溫度過高會影響電子設備工作性能,甚至導致電子設備損壞。據《電子芯片散熱技術的研究現狀及發展前景》,如對于穩定持續 工作的電子芯片,最高溫度不能超過85 ℃,溫度過高會導致芯片損壞。
● 散熱技術需要持續升級,來控制電子設備的運行溫度。芯片性能持續發展,這提升了芯片功耗,也對散熱技術提出了更高的要求。此外,AI大模型的訓練與推理需求,要求AI芯片的單卡算力提升,有望進一步打開先進散熱技術的成長空間。
來源:CSDN,各公司官網,國海證券研究
1.2 散熱技術原理:電子設備發熱的本質是工作能量轉成熱能
資料來源:雙鴻公告,飛榮達官網,國海證券研究所
資料來源:uanalyze,國海證券研究所
1.3 芯片散熱革新:浸沒式散熱效果好,冷板式更為成熟
根據ODCC《冷板液冷服務器設計白皮書》,綜合考量初始投資成本、可維護性、PUE 效果以及產業成熟度等 因素,冷板式和單相浸沒式相較其他液冷技術更有優勢,是當前業界的主流解決方案。
資料來源:《冷板液冷服務器設計白皮書》,國海證券研究
2.1.1 熱管:高效傳熱器件,適用大功率和空間小場景
來源:分析測試百科網,Tom's Hardware,蘭洋科技,國海證券研究
2.1.2 VC:相比熱管,具備更高的導熱效率與靈活性
VC均溫板,全稱為Vapor Chamber,即真空腔均熱板散熱技術,是一種比熱管更先進、更高效的導熱元件, 尤其在處理高密度電子設備的熱管理問題時表現出色。
相比熱管,VC的導熱效率與靈活度更強。銅的導熱系數為401W/m.k,熱管可以達到5000~8000 W/m?k,而均 熱板則可以達到20000~10000W/m?k,甚至更高。熱管是一維導熱,受其形狀顯示。而均熱板形狀則不受限制, 可以根據芯片的布局,設計任意形狀,甚至可以兼容處于不同高度的多個熱源的散熱。
2.1.2 3D VC:具備高效散熱、均勻溫度分布、減少熱點優勢
● 3D VC(三維兩相均溫技術):是利用熱管與均溫板蒸汽腔體貫通的散熱技術。
● 3D VC具有“高效散熱、均勻溫度分布、減少熱點”等解熱優勢,可滿足大功率器件解熱、高熱流密度區域均溫的瓶頸需求,也 可以保證獲得更強的超頻性能以及超頻后的系統穩定性。
● 對比熱管/均溫板間導熱,是把熱量傳遞至二次組裝的多根熱管/均溫板,存在接觸熱阻以及銅本身的熱阻;而3D VC通過三維結 構連通下,內部液體相變、熱擴散,直接、高效地將芯片熱量傳遞至齒片遠端散熱。
2.1.3 風扇:與熱管/3DVC/冷管等組合使用
2.1.4 機房空調:水冷空調相對風冷系統制冷效果好
來源:前瞻產業研究院,LEDC,制冷百科,國海證券研究所
2.1.4 機房空調:氟泵系統與間接蒸發系統較為穩定
● 氟泵系統:一種用于制冷和空調設備中的循環系統,它通過泵送氟利昂或其它制冷劑來傳遞熱量。主要優點是可以精確控制制冷 劑的流量和壓力,從而提高系統的效率和穩定性。
● 間接蒸發系統:是一種利用水蒸發吸熱原理來降低空氣溫度的空調系統,它與直接蒸發冷卻系統不同之處在于,冷卻的空氣與蒸 發的水不直接接觸。這種設計可以提供比直接蒸發冷卻更為清潔和干燥的空氣,適用于對濕度和空氣質量有特殊要求的環境。
來源:制冷百科,凱德利
2.2 液冷:冷板式與浸沒式液冷為主
● 服務器液冷分為直接冷卻和間接冷卻,直接冷卻以浸沒式為主,間接冷卻以冷板式為主。
● 冷板式液冷的冷卻液不與服務器元器件直接接觸,而是通過冷板進行換熱,所以稱之為間接液冷。依據冷卻液在 冷板中是否發生相變,分為單相冷板式液冷及兩相冷板式液冷。
● 浸沒式液冷是將整個服務器或其組件直接浸入液體冷卻劑中的冷卻方式
來源:《冷板液冷標準化及技術優化白皮書》等
2.2.1 冷板式液冷:需改造服務器,滲透率逐漸提升
2.2.1 冷板式液冷:英偉達GB200 NVL72使用冷板式液冷結構
2.2.2 浸沒式液冷:液體浸泡服務器整體,技術要求高
2.2.2 單相浸沒:實現服務器全液冷,技術難度較高
● 單相浸沒液冷機柜:是將液冷服務器內置于Tank內部,CDU與Tank之間由管道鏈接,下部管道輸送低溫冷卻介質到tank內,液 冷介質吸收了液冷服務器的熱量,溫度上升后流回CDU,熱量由CDU帶走。此種結構可實現服務器的全液冷,無風扇的設計使 功率密度更高,相比風冷PUE更低。但技術難度較高,滲透率相對較低。
● 阿里云布局浸沒式液冷系統:2016年,阿里云發布首套浸沒式液冷系統,于2017年完成浸沒式液冷集群構建;2018年,建成首 個互聯網液冷數據中心;2020年,打造中國最大規模的單相浸沒式液冷數據中心暨全國首座5A級綠色液冷數據中心。
來源:Intel官網,《綠色節能液冷數據中心白皮書》,國海證券研究
2.2.2 雙相浸沒:技術要求較高,可大幅提升系統功率密度
● 雙相浸沒液冷服務器結構(以曙光數創技術為例):
● 1)“1拖2”單元結構:由中間CDM液冷柜和左右兩側計算機柜構成。兩側機柜內服務器產生的熱量由中間CDM液冷機柜帶走。中間液冷柜內集成CDM、循環管路等系統。此種結構可以大幅度提升系統功率密度,降低數據中心建設難度。
● 2)刀片式相變浸沒腔:獨立可插拔設計,完全解耦節點與節點之間的熱循環路徑,使得每一個節點都可以進行獨立的插拔,方 便用戶對單獨的節點進行硬件升級或維護。
● 3)芯片強化沸騰散熱設計:由于服務器內主芯片功率較高,芯片表面需要進行強化沸騰處理,以增加其表面的氣化核心,增強 相變換熱效率。曙光數創的浸沒相變液冷數據中心基礎設施產品對芯片采用了強化沸騰封裝的方式,換熱區域采用高密翅片來強 化沸騰界面的沸騰換熱,最高可實現100W/c㎡以上的散熱密度。
來源:《綠色節能液冷數據中心白皮書
AI算力發展與政策PUE等驅動下,芯片級散熱將從熱管/VC轉向更高效的3DVC與冷板,芯片級散熱有望打開成長空間、迎量價齊升。
相關公司
1)芯片散熱:曙光數創、飛榮達、中航光電、立訊精密、中石科技、思泉新材;
2)數據中心散熱:英維克、高瀾股份、申菱環境、佳力圖、朗威股份、依米康、同飛股份、川潤股份、潤澤科技、科華數據、網宿科技;
3)服務器整機:浪潮信息、中科曙光、工業富聯、華勤技術、紫光股份、中興通訊、軟通動力、神州數碼、烽火通信、中國長城等。
來源:國海證券研究所
-
AI
+關注
關注
87文章
30946瀏覽量
269187 -
芯片散熱
+關注
關注
0文章
9瀏覽量
7528 -
液冷
+關注
關注
4文章
102瀏覽量
5075
發布評論請先 登錄
相關推薦
評論