?
半導體已受到熱量的限制,好的設計可以減少它,并幫助消散它。
半導體消耗的功率會產生熱量,必須將熱量從設備中排出,但如何有效地做到這一點是一個日益嚴峻的挑戰。
熱量是半導體的廢物。當功率在設備和電線上耗散時就會產生這種現象。設備切換時會消耗電力,這意味著它取決于活動,并且不完美的設備和電線不斷地浪費電力。設計很少是完美的,一些熱量來自于執行不需要的功能的活動。但在某些時候,設計團隊必須弄清楚如何消除熱量,因為如果不這樣做,產品的使用壽命將非常短。
只有三個過程控制熱量的傳遞:傳導、對流和輻射。簡單來說,傳導適用于固體,對流適用于液體和氣體,輻射適用于真空,而這種情況在半導體中很少見。
“與熱量相關的三個步驟,” Ansys 半導體部門營銷總監 Marc Swinnen 說道。“有產生、傳導和耗散。你產生熱量,將其傳導到某個地方,然后消散。功率分析告訴您熱量產生的位置。傳導和耗散是一種包括流體學的物理分析。所有這三個都必須包含在系統分析中,因為它們之間存在反饋。”
隨著晶體管密度的增加,這變得更加困難。“大多數人都可以改變導電路徑,”Cadence 多物理場系統分析小組的攝氏度熱解算器產品工程師 Karthick Gopalakrishnan說道。“材料和設計本身有改進的潛力,可以通過散熱設備的傳導帶走更多熱量。面臨的挑戰是,除非我們使用大型服務器,否則這些設備周圍的熱空間非常小。您必須考慮材料改進、芯片、封裝或 PCB 周圍熱空間的智能利用。你真正想做的是提高傳導傳熱率。”
如果不進行正確的分析,僅僅在設備上放置一個大型散熱器就會導致其他問題。要做到這一點,需要考慮氣流及其所在空間的機械設計,以便考慮到對其他設備的影響。
即使散熱器也有局限性。“有很多方法可以消除系統中的熱量,例如強制液體冷卻,” Synopsys EDA 集團產品管理總監 William Ruby 說道。“我們看到一些更先進的封裝取得了許多進步。通過 3D-IC 設計,可以采用強制氣流和液體冷卻。有一些關于能夠通過特殊通孔減輕熱量以幫助擴散的新概念。”
與導體和絕緣體之間存在數量級差異的電導率不同,熱導率在某種程度上受到限制。“硅的電導率為 100 至 120 瓦/米開爾文 (W/(mx K)),作為導熱材料,這已經相當不錯了,”西門子數字工業軟件旗下 Simcenter 產品組合的電子與半導體行業總監 John Parry 表示。“銅的電導率只有 400,而銅通常被用作經濟經濟的最佳熱導體。”
各種大大小小的散熱器和冷板
還有其他經濟方面的考慮。Arm系統集成與開發部研究員兼高級總監 Javier DeLaCruz 表示:“數據中心的主要成本驅動因素不是散熱方法的成本,而是管理數據中心級別熱傳遞的運營成本。”“進入數據中心的電力是有限的,這些電力在為計算系統供電和提取熱量之間共享。因此,每瓦性能必須成為關注的指標,而不僅僅是性能。”
熱量會對性能產生重大影響。“即使遵循最佳散熱策略,每個芯片在電路運行期間也會不同程度地升溫,從而降低性能,” Keysight EDA產品經理 How-Siang Yap 說道。“動態溫度可以改變器件的電氣特性,例如增益、阻抗和負載牽引失配,以及更高級別的波形特性,例如數字調制信號的射頻電路中的誤差矢量幅度 (EVM) 和相鄰通道泄漏比 (ACLR)。在模擬系統中,影響懲罰可能更高。”
分析并不容易。“當今的芯片非常復雜,以至于很難定義如何創建能夠顯示最壞情況條件的活動,”Ansys 的 Swinnen 說道。“當您查看由溫度引起的計時誤差時,您看到的是納秒,最多幾微秒。其次,電參數和熱參數的時間常數非常不同,至少兩個數量級。當熱量綻放時,它會通過芯片和隔壁慢慢消散,因此您會看到熱量因兩秒鐘前在隔壁街區發生的事情而增加。”
芯片內的熱量分布
熱量傾向于向各個方向傳播。“你無法真正阻止熱量流向任何地方,”西門子的帕里說。“你可以哄它,但這與電氣世界非常不同,在電氣世界中,導體和絕緣體之間的電導率差異可能是 20、21 個數量級。從電氣角度來說,你可以讓電流流向你想要的地方,但從熱角度來說,你確實做不到。”
由于熱量取決于活動,因此芯片表面的溫度并不是恒定、均勻分布的。“您可能有一個由設計中計算量非常大的部分創建的熱點,例如硬件加速器,”Synopsys 的 Ruby 說道。“芯片的另一部分可能不太活躍,或者只在特定的操作模式下使用。芯片上的溫度梯度取決于工作負載或活動。”
散熱在理論上很簡單,但在實踐中卻困難得多。Cadence 的 Gopalakrishnan 表示:“您希望通過在任何層上盡可能多地傳播熱量來最大程度地減少熱點。”“你必須考慮東西放在哪里。將某些東西移動到芯片邊緣并不總是可能的,因為在那里熱量不會向一個方向擴散。”
雖然您可能無法控制熱量,但您可以了解它是如何傳播的。“如果你對流經芯片上電線的電流進行建模,并觀察由此產生的熱通量,那么在所有電流融合在一起之前,它不會走得太遠,”帕里說。“你可以查看溫度曲線,這并不能真正顯示出走線和絕緣體之間的差異。如果您查看溫度曲線,您將幾乎無法檢測到金屬痕跡的位置。但如果你觀察一下熱通量,就會發現金屬中的熱通量比絕緣體中的熱通量高幾個數量級。”
這讓事情變得容易一些。“對很多這樣的東西進行建模時,它會讓事情變得更容易,”帕里補充道。“通過不對芯片表面上的單根導線、金屬化層進行建模,而是僅使用平均材料屬性,您可以獲得相當準確的結果,這是一種非常常見的做法。”
一種有效的技術是利用熱感知平面圖和單元布局。“基本思想是進行布局以最小化峰值溫度和溫度梯度,”Ruby 說。“借助物理感知 RTL 功耗分析工具,您可以分析初始布局,然后將該功耗曲線數據輸入熱分析中。這是從基于最終簽核或完成的物理實施進行分析的左移,這可能為時已晚,無法開始更改宏觀平面圖。我們還可以研究通孔密度、凸塊密度和不同金屬密度等。”
對于 3D-IC,TSV 一直被認為是創建熱走廊的一種方法。“更好的 TSV 放置會有所幫助,”Gopalakrishnan 說。“但這也是有限制的,因為它們確實占用了寶貴的空間。在布局規劃方面,無論是在芯片級別(當您談論區塊、電源塊或功能單元)還是在布線級別(當您嘗試添加 TSV)時,都有很大的改變空間。對它們來說最大的優勢之一是,當您在芯片或電源附近工作時,您可以瞄準熱點。”
但影響有限。“它們在某種程度上被用作熱走廊,但如果你把它們想象成銅,它們的導電率只有它們所穿過的硅的四倍,”帕里說。“考慮一個 10×10 的單元,每個角落都有一個 TSV。這是百分之四。由于 TSV 的電導率僅為其所穿過的硅的電導率的四倍,因此您可能為芯片的有效電導率增加了 16%。它對熱量沒有太大影響,雖然它們確實有幫助,但它并不是靈丹妙藥。”
另一種新興技術是背面供電。“背面電源有助于電力傳輸,但使散熱成為更大的挑戰,”DeLaCruz 說。“體硅以前是局部散熱的重要機制,現在厚度已從約 800 微米發展到只有 1 微米,使得局部熱點更難以管理。TSV 并沒有使熱管理變得更容易,它們只是讓它變得不同,因為 TSV 以非常局部的方式提供幫助,并且僅在垂直于晶體管的軸上提供幫助。TSV 周圍的氧化物襯墊也會阻礙橫向熱能耗散。”
3D 增加了新的熱問題。“如果你想到芯片之間的膠水層,這是很常見的,它們的目的是將芯片機械地固定在一起,”帕里說。“你需要一定的厚度。否則,芯片之間的互連處的剪切力太高,并且會導致電氣損壞。不幸的是,與硅芯片相比,這些膠層是相對較軟的材料,并且還往往具有相對較低的導熱率。您需要在熱力和機械力之間進行權衡。從熱學角度來說,您希望該層盡可能薄,以使通過該層的熱傳導盡可能有效。從機械角度來說,您希望有一個厚層,因為這樣可以吸收兩個模具之間位移的不匹配,而其間材料的剪切力相對較小。”
芯片外部的熱量分布
熱量可以通過封裝頂部逸出,然后可能進入散熱器,或者通過底部及其所連接的 PCB 逸出。“如果您有塑料包覆成型 BGA,那么您將把絕大多數(80% 到 90%)的熱量傳遞到電路板上,”Parry 說。“如果你的封裝具有通往蓋子的良好傳導路徑,那么你可能可以安排 80% 到 90% 的熱量通過該路徑傳導。您可以控制它,具體取決于您所采取的打包方法,但不能完全控制。有些人總是走相反的路。”
您希望熱量流向的地方取決于具體應用。“在服務器中,包裝周圍有很多空間可以利用,”Gopalakrishnan 說。“你傾向于用主動或被動散熱器以及有助于散發大量熱量的風扇來填充它。PCB 本身不會在散熱方面發揮主要作用。當您使用移動設備時,這不是一個解決方案,因為可能大約一半的熱量通過底部,剩下的一半則到達頂部。在這種情況下,PCB 將在芯片散熱方面發揮重要作用。”
當空間有限時,事情就會變得更加困難。“根據具體市場的不同,可以通過不同的方式來實現這一目標,”Arm 的 DeLaCruz 說道。“例如,在智能手機中,由于系統體積最小且散熱有效,石墨或石墨烯薄膜等高導電薄膜的使用非常普遍。在基礎設施領域,主動和被動 3D 均熱板的使用可以實現數百瓦范圍內的運行。”
液體冷卻是另一種可能性。“我們最近在對流領域看到了很多進展,”戈帕拉克里希南說。“你有風扇、液體冷卻和兩相系統。我們還擁有數據中心級別的浸沒式冷卻等先進系統。您會看到很多設計工程師和制造設備和系統的公司的路線圖,他們將液體冷卻作為路線圖的一部分。這是因為,如果您只是在設備上添加一個散熱器并期望它能夠冷卻,那么當您的散熱量超過每平方米 1 千瓦時,它就會達到極限。如果使用風扇,每平方米的功率約為 10 千瓦。但如今,我們擁有每平方米 1 兆瓦的先進服務器設備芯片。你真的必須探索這些策略。”
并非所有人都認為它會很快被采用。安培計算公司產品副總裁 Madhu Rangarajan 表示:“雖然我們預計液體冷卻將出現在超級計算集群等專業部署中,但它不太可能廣泛扎根。”“對于芯片設計人員來說,在創建新技術時考慮實際基礎設施限制并與系統設計人員和數據中心設計人員合作以推動其廣泛部署非常重要。我們預計未來五年部署的大多數 CPU 仍需要以有效降低 TCO 的方式進行風冷。”
模型和分析
熱可能是第三方小芯片市場的絆腳石之一,因為小芯片需要熱模型。“各個小芯片實際上不能相互獨立地設計,”Parry 說。“每個芯片都需要了解其相鄰芯片上的熱源。這些高密度先進封裝設計的開發需要更多的協作。為了使設計易于處理,這些東西的開發方式必須改變。”
創建模型并不簡單。“有很多事情你確實不想在芯片熱模型中披露,”Gopalakrishnan 說。“人們正在努力以降階模型或某種近似的形式添加自熱效應、芯片的熱阻特性,而這種近似不一定需要有人了解芯片中存在的每一個幾何細節。目前,部分芯片模型就是這樣生成的。”
工具也需要改變。“3D-IC 世界是綜合模型的世界,需要進行基于模型的分析,”Ruby 說道。“你不可能像我們今天那樣把所有事情都平面化。在單個芯片上,我們在網表級別上進行時序簽核和電源簽核。在 3D-IC 背景下,這可能變得不切實際,因此我們需要開始考慮對各種組件進行建模。”
最終它將設計和包裝結合在一起。“你需要將芯片設計工作流程與封裝設計工作流程結合起來,”帕里說。“你不能將它們視為一個發生在另一個之前的事件,即芯片被提供給封裝組,特別是在 3D-IC 中。但它在某種程度上適用于 2.5D。我們面臨的挑戰是采用傳統上由封裝工程師(可能具有機械背景)使用的模擬技術類型,并將其提供給進行 IC 驗證的人員作為 IC 設計流程的一部分。他們可能不習慣使用機械工程師使用的工具集。這是采用該技術并重新包裝它的情況,以便需要在更高的設計流程中使用它的人們可以使用它。”
結論
許多芯片都面臨熱障,并且解決該問題并不容易。“不幸的事實是,熱量是集成密度的限制因素,”Swinnen 說。“我們可以設計和制造令人難以置信的芯片,但它們會融化。這不是制造限制,也不是設計限制。這是物理限制,我們無法散發更多的熱量。”
盡管在某些應用中可以使用奇特的解決方案,但大多數市場必須找到用更少的資源做更多的事情的方法,這意味著每瓦特具有更多的功能。與此相關的成本比過去的解決方案要大得多。
來源:半導體行業觀察編譯自semiengineering
-
芯片
+關注
關注
456文章
51154瀏覽量
426292 -
pcb
+關注
關注
4324文章
23159瀏覽量
399308 -
半導體
+關注
關注
334文章
27687瀏覽量
221482 -
散熱
+關注
關注
3文章
520瀏覽量
31818
發布評論請先 登錄
相關推薦
評論