半導體消耗的功率會產生熱量,必須從器件中去除熱量,但如何有效地做到這一點是一個越來越大的挑戰。
熱量是半導體的廢物。它是在設備中和電線上的功率耗散時產生的。當設備切換時會消耗電力,這意味著它依賴于活動,并且功率不斷被不完善的設備和電線浪費。設計很少是完美的,一些熱量來自執行不需要的功能的活動。但在某些時候,設計團隊必須弄清楚如何擺脫熱量,因為如果他們不這樣做,產品的使用壽命將非常短。
只有三個過程控制著熱量的傳遞——傳導、對流和輻射。簡單來說,傳導適用于固體,對流適用于液體和氣體,輻射適用于真空,這在半導體中很少。
“熱量有三個步驟,”Ansys半導體部門營銷總監Marc Swinnen說。“有生產、傳導和耗散。你產生熱量,你把它傳導到某個地方,然后消散它。功率分析告訴您熱量的產生位置。傳導和耗散是一種物理分析,包括流體學。這三者都必須包含在系統分析中,因為它們之間存在反饋。
隨著晶體管密度的增加,這變得更加困難。“大多數人都可以改變導電路徑,”Cadence 多物理場系統分析小組攝氏熱求解器產品工程師 Karthick Gopalakrishnan 說。“有可能改進材料和設計本身,通過散熱設備的傳導帶走更多的熱量。有一個挑戰,因為除非我們使用大型服務器,否則這些設備周圍的熱空間非常小。您必須考慮材料改進,智能地利用芯片、封裝或 PCB 周圍的熱空間。你真正想做的是提高你的傳導傳熱率。
如果不進行適當的分析,僅僅在設備上放置一個大散熱器就會導致額外的問題。要做到這一點,需要考慮氣流及其所在空間的機械設計,以便考慮對其他設備的影響。
即使是散熱器也有局限性。“有很多方法可以消除系統中的熱量,例如強制液體冷卻,”Synopsys EDA Group 產品管理總監 William Ruby 說。“我們看到一些更先進的封裝取得了許多進步。借助 3D-IC 設計,可以實現強制氣流和液體冷卻。有一些更新的概念,能夠通過特殊的通孔來減輕熱量,以幫助傳播熱量。
與導體和絕緣體之間存在數量級差異的電導率不同,導熱性在某種程度上受到限制。“硅的電導率為每米開爾文 (W/(m x K) 100 至 120 瓦,作為導熱材料還不錯,”Siemens Digital Industry Software 旗下 Simcenter 產品組合電子和半導體行業總監 John Parry 說。“銅只有400,而銅通常被用作經濟上最好的熱導體。
還有其他經濟考慮。“數據中心的主要成本驅動因素不是散熱方法的成本,而是管理數據中心級傳熱的運營成本,”Arm 系統集成與開發研究員兼高級總監 Javier DeLaCruz 說。“進入數據中心的電力量是有限的,這些電力在為計算系統供電和提取熱量之間共享。因此,每瓦性能必須是衡量指標,而不僅僅是性能。
熱量會對性能產生重大影響。“即使遵循最佳散熱策略,每個芯片在電路運行期間也會以不同的方式發熱,從而降低性能,”Keysight EDA 產品經理 How-Siang Yap 說。“動態溫度可以改變器件的電氣特性,如增益、阻抗和負載牽引失配,以及更高級別的波形特性,如數字調制信號射頻電路中的誤差矢量幅度(EVM)和鄰道漏電比(ACLR)。在模擬系統中,沖擊損失可能更高。
分析并不容易。Ansys的Swinnen表示:“當今的芯片非常復雜,很難定義如何創建活動來顯示最壞的情況。“當你看到由溫度引起的計時誤差時,你看到的是納秒,最多幾微秒。其次,電參數和熱參數的時間常數非常不同,至少兩個數量級。當你得到開花的熱量時,它會慢慢地通過芯片和隔壁消散,所以你會看到熱量增加,因為兩秒鐘前在隔壁街區發生的事情。
芯片
內的熱量分布 熱量傾向于向各個方向傳播。“你無法真正阻止熱量蔓延到任何地方,”西門子的帕里說。“你可以哄騙它,但它與電氣世界非常不同,在電氣世界中,導體和絕緣體之間的電導率差異可能是20、21個數量級。在電氣上,你可以讓電流流向你想要的地方,但在熱上,你真的不能。
由于熱量取決于活動,因此芯片表面的溫度不恒定、均勻分布。“你可能有一個熱點,由設計的計算密集型部分創建,比如硬件加速器,”Synopsys的Ruby說。“芯片的另一部分可能不太活躍,或者只用于特定的操作模式。芯片上的溫度梯度取決于工作負載或活動。
散熱在理論上很簡單,但在實踐中卻要困難得多。“你希望通過盡可能多地將熱量分散到任何層來最大限度地減少熱點,”Cadence 的 Gopalakrishnan 說。“你必須考慮東西放在哪里。將某些東西移動到模具的邊緣并不總是可行的,因為在那里你不會讓熱量向一個方向擴散。
雖然你可能無法控制熱量,但你可以理解它是如何傳播的。“如果你對流過芯片上電線的電流進行建模,并觀察由此產生的熱通量,那么在它們合并在一起之前,它不會走得太遠,”Parry說。“你可以看看溫度曲線,這并沒有真正顯示出走線和它們之間的絕緣體之間的差異。如果您查看溫度曲線,您將幾乎無法檢測到金屬痕跡的位置。但如果你看一下熱通量,金屬中的熱通量比絕緣體中的熱通量高出幾個數量級。
這讓事情變得容易一些。“在對很多這些東西進行建模時,它使事情變得更容易,”Parry補充道。“你可以得到相當準確的結果,而不是對芯片表面的單個導線、金屬化層進行建模,而只是使用平均的材料屬性,這是一件非常普遍的事情。”
一種有效的技術是利用熱感知的樓層規劃和單元放置。“基本思想是進行放置以最小化峰值溫度和溫度梯度,”Ruby說。“使用物理感知的 RTL 功耗分析工具,您可以分析初始布局,然后將該功耗曲線數據輸入到熱分析中。也就是說,從基于最終簽核或完成的物理實施進行分析向左移動,這可能為時已晚,無法開始更改宏觀平面圖。我們還可以查看通孔密度、凸塊密度和不同的金屬密度等因素。
對于 3D-IC,TSV 已被討論為創建熱走廊的一種方式。“更好的 TSV 放置會有所幫助,”Gopalakrishnan 說。“但這是有限度的,因為它們確實占用了寶貴的房地產。在平面規劃方面,無論是在芯片層面,還是在芯片層面,無論是在討論瓷磚、電源塊或功能單元時,還是在嘗試添加 TSV 的路由層面,都有很大的潛力。對他們來說,最大的優勢之一是,當你在靠近芯片或電源的地方工作時,你可以瞄準熱點。
但影響是有限的。“它們在某種程度上被用作熱走廊,但如果你認為它們是銅,它們的導電性只有它們所穿過的硅的四倍,”帕里說。“考慮一個 10×10 的單元,每個角落都有一個 TSV。這是 4/100。由于 TSV 的電導率僅為它們所通過的硅的四倍,因此芯片的有效電導率可能增加了 16%。它在熱上沒有太大的影響,雖然它們確實有幫助,但它不是靈丹妙藥。
另一種新興技術是背面供電。“背面電源有助于供電,但使散熱更具挑戰性,”DeLaCruz 說。“塊狀硅以前是局部散熱的絕佳機制,現在已經從大約800微米的厚度發展到只有一微米的厚度,這使得局部熱點更難管理。TSV 并沒有使熱管理更容易,它們只是讓它變得不同,因為 TSV 以一種非常局部的方式提供幫助,并且僅在垂直于晶體管的軸上提供幫助。TSV周圍的氧化物襯里也阻礙了橫向熱能耗散。
3D 增加了新的熱問題。“如果你想到模具之間的膠層,這是很常見的,它們的目的是將模具機械地固定在一起,”Parry說。“你需要一定的厚度。否則,芯片之間互連的剪切力太高,并且會出現電氣破損。不幸的是,與硅芯片相比,這些膠層是一種相對較軟的材料,并且往往具有相對較低的導熱性。您需要在熱和機械之間進行權衡。在熱學上,您希望該層盡可能薄,以使通過該層的熱傳導盡可能有效。從機械上講,你希望有一個厚層,因為這樣可以讓你承擔兩個模具之間位移的不匹配,而中間的材料剪切相對較少。
芯片
外部的熱量分布 熱量可以通過封裝頂部逸出,然后可能進入散熱器,或者通過底部和它所連接的PCB逸出。“如果你有一個塑料包覆成型的BGA,那么你將把絕大多數(80%到90%)的熱量投入到電路板中,”Parry說。“如果你有一個包裝,有一個非常好的傳導路徑到蓋子,你可能會安排80%到90%的熱量以這種方式傳播。您可以控制它,具體取決于您采取的打包方法,但不能完全控制它。有些人總是走另一條路。
您希望熱量流向何處是特定于應用的。“在服務器中,軟件包周圍有很多空間可以利用,”Gopalakrishnan說。“你傾向于用主動或被動散熱器來填充它,以及有助于散發大量熱量的風扇。PCB本身不會在散熱方面發揮重要作用。當您使用移動設備時,這不是一個解決方案,因為可能大約一半的熱量通過底部,其余一半到達頂部。在這種情況下,PCB將在將熱量從芯片上散發出來方面發揮重要作用。
當空間有限時,它變得更加困難。“根據具體市場的不同,有不同的方法可以實現這一目標,”Arm 的 DeLaCruz 說。“例如,在智能手機中,石墨或石墨烯薄膜等高導電薄膜的使用很普遍,因為系統中的體積最小且散熱有效。在基礎設施領域,使用主動和被動3D均熱板可以運行到數百瓦的功率范圍內。
液體冷卻是另一種可能性。“對流是我們最近看到很多進展的地方,”Gopalakrishnan說。“你有風扇、液體冷卻和兩相系統。我們還擁有先進的系統,例如數據中心級別的浸沒式冷卻。你會看到很多設計工程師和制造設備和系統的公司的路線圖,他們正在將液體冷卻作為路線圖的一部分。這是因為,如果您只是在設備上添加一個散熱器并期望它冷卻,那么當您的散熱量超過每平方米 1 千瓦時,它就會達到該限制。使用風扇,每平方米約 10 千瓦。但是現在我們有每平方米1兆瓦的先進服務器設備芯片。你真的必須探索這些策略。
不是每個人都認為它會很快被采用。“雖然我們預計液體冷卻將發生在超級計算集群等專業部署中,但它不太可能廣泛扎根,”Ampere Computing產品副總裁Madhu Rangarajan說。“對于芯片設計人員來說,在創造新技術時,必須考慮到實際的基礎設施限制,并與系統設計人員和數據中心設計人員合作,推動他們進行廣泛部署。我們預計,未來五年部署的大多數 CPU 仍將需要以有效的 TCO 方式進行風冷。
模型和分析
熱可能是第三方小芯片市場的絆腳石之一,因為小芯片需要熱模型。“單個小芯片實際上不能彼此孤立地設計,”Parry說。“每個人都需要了解其鄰居模具上的熱源。在開發這些高密度先進封裝設計時,需要更多的協作。這些東西的開發方式必須改變,以使設計易于處理。
創建模型并不簡單。“在芯片熱模型中,有很多事情是你真的不想透露的,”Gopalakrishnan說。“有人試圖以降階模型的形式添加自熱效應、芯片的熱阻特性,或者某種近似值,不一定涉及知道芯片中存在的每一個幾何細節的人。目前,其中一些芯片模型就是這樣生成的。
工具也需要改變。“3D-IC的世界是綜合模型的世界,需要進行基于模型的分析,”Ruby說。“你不能像我們今天那樣把所有事情都做平。在單芯片上,我們在網表級別進行時序簽核和電源簽核。在3D-IC環境中,它可能變得不切實際,因此我們需要開始研究對各種組件進行建模。
最終,它將設計和包裝結合在一起。“您需要將芯片設計工作流程與封裝設計工作流程相結合,”Parry說。“你不能把它們看作是先于另一個發生的,即芯片被交給一個封裝組,特別是在3D-IC中。但它在某種程度上適用于2.5D。挑戰在于采用我們所擁有的仿真技術類型,這種技術傳統上由封裝工程師使用,可能來自機械背景,并將其作為IC設計流程的一部分提供給進行IC驗證的人員。他們可能不習慣使用機械工程師使用的工具集。這是一個采用技術并重新包裝的案例,以便需要在設計流程中使用它的人可以使用它。
結論
許多芯片面臨熱障,解決問題并不容易。“不幸的是,熱是集成密度的限制因素,”Swinnen說。“我們可以設計和制造令人難以置信的芯片,只是它們會熔化。這不是制造限制,也不是設計限制。這是一個物理限制,我們無法獲得更多的熱量。
雖然在某些應用中可以使用異國情調的解決方案,但大多數市場必須找到事半功倍的方法,這意味著每瓦特的功能更多。與此相關的成本比過去的解決方案要大得多。
審核編輯:黃飛
-
芯片設計
+關注
關注
15文章
1023瀏覽量
54935 -
晶體管
+關注
關注
77文章
9706瀏覽量
138490 -
數據中心
+關注
關注
16文章
4810瀏覽量
72213 -
BGA
+關注
關注
5文章
546瀏覽量
46921 -
射頻電路
+關注
關注
35文章
427瀏覽量
43306
發布評論請先 登錄
相關推薦
評論