今年舉辦的國際固態電路峰會(ISSCC)上,處理器部分開始于AMD的兩個演講,然后是三星和聯發科演示他們的最新5 G智能手機芯片,還包括一個來自CEA技術的概念設計的研究項目、TI的汽車SoC和IBM 的最新Z系列主機處理器。
ISSCC是半導體行業歷史最悠久的技術會議之一,每年二月在美國舊金山舉行。這次會議匯集了學術界和產業界人士,討論芯片電路設計的最新挑戰。該會議主要是一個電路設計會議,每個廠商都專注于他們的處理器中獨特電路設計的一個或多個特定方面。
今年的會議涵蓋了一系列深入主題,包括鎖相環、低功耗電路、內存、SerDes、DSP和處理器設計。處理器部分出現了領先的供應商,也有來自研究機構和學術界的項目。會議內容覆蓋了密集的芯片設計細節,下面介紹了處理器環節中有趣細節的突出部分。
AMD Zen2和EPYC芯片
兩個AMD的會議相互吻合,討論了最新的EPYC服務器處理器使用的Zen 2 CPU核心的設計,并討論了EPYC芯片架構,允許AMD在一個基板上提供64個CPU核心,而不需要大量的芯片。
AMD Zen 2演示描述了使用TSMC的7nm工藝制造第一個x86處理器的挑戰。EPYC服務器處理器的設計目標是在同一個插槽上增加一倍的CPU內核,同時不超過插槽的功率峰值。此外,在SPECint 2006基準測試上,每個CPU核心都被設計為每周期提供15%的指令性能提升。Zen 2中的許多架構更改在前面已經討論過了。在ISSCC的演講中,AMD著重討論了電路設計的挑戰。
AMD的設計非常模塊化。基本模塊是CCX(CPUComplex),包含4個CPU核心,L2和L3緩存,使用Infinity總線技術實現Fabric系統互連。通過4核模塊,AMD可以將設計從筆記本(4-8核)擴展到服務器(64核)。盡管添加了更多的L3緩存,CCX模塊從上一代的44 mm2縮減到了Zen 2的31.3 mm2。
7nm工藝需要添加更多的金屬層,因此金屬層布局布線規則發生了變化,設計從10.5個track變為6個track。更低的track帶來了挑戰(更低的高度和更低的驅動強度),但漏電變少,減少了9%的周期電容,同時硅面積也更小。
AMD使用了多種設計技術,如時鐘整形,并有五種不同的觸發器設計,這對電路時序來說十分關鍵。為了獲得更好的性能,設計者還將更多的功耗預算轉移到組合邏輯上,減少了3%。通過這些和其他電路優化,AMD可以將時鐘速度提高到4.7 GHz,并在與原始Zen core相當的時鐘速度下降低工作電壓。
第二個AMD的介紹描述了基于Zen 2的服務器產品的多種chiplet策略。AMD的主要優勢之一是,只要三種die即可以創建產品以支持多個市場。
AMD的目標是在每個插槽上提供更多的性能,第二代EPYC處理器將CPU核數增加了一倍。這使得AMD的業績每2.5年翻一番(SPECint2006),新的EPYC處理器還改善了內存延遲。使用chiplet讓AMD的服務器芯片成為可能,因為使用單片芯片是不可行,也是不經濟的,在64核下用單片芯片會有諸多限制。
AMD還通過使用更小的chiplet優化了成本結構,提高了良率。AMD使用昂貴的7納米工藝實現核心緩存芯片(CCD),并將DRAM和PCIe邏輯轉移到GlobalFoundries的12納米I/O芯片上。每個CCD由兩個CCX模塊和四個Zen 2核心以及L2和L3緩存組成,其中86%的CCX專用于CPU和L3緩存。每個CCD仍然是一個小型SoC,包括電源管理、Infinity系統互連、時鐘等。
有了所有這些要求,實現上就有了許多挑戰。由于內存控制器現在位于單獨芯片上,要用于所有CCX模塊,新的EPYC處理器在平均內存訪問延遲上有所改進,但是最佳情況下的延遲仍然需要離開CCD來訪問內存。因此,AMD的設計重點在于減少Infinity Fabricz總線延遲,最佳情況下的延遲只比預期長4納秒。
由于AMD承諾保持EPYC封裝尺寸和pin腳不變,因此需要一個緊密的硅/封裝協同設計,因為從第一代EPYC到第二代EPYC芯片數量從4個增加到9個。內部布線非常緊湊,需要在內部CCD芯片下的信號到達距離集中式I/O芯片更遠的CCD芯片。
ISSCC的許多其他演講都是關于當處理器處于高負載時補償內部壓降的電路。AMD有一個電流分流(額外電流)以對抗壓降,也可以拉伸時鐘。相同的LDO設計允許單個核心線性調節,通過調整每個核心的電壓來實現節能。
概念驗證處理器有96個核和一個有源插入器
會議中的一個非生產芯片是一個96核的處理器,也使用了chiplets策略,但是當AMD使用一個專用I/O芯片的多芯片模塊時,這個芯片使用了一個有源硅插入器,將I/O邏輯放入插入器。
該設計使用6個chiplet,從96個核中獲得220個GOPS。它由CEA-Leti設計,ST Micro制造。這里的想法是要證明這一概念使用兩種die設計:chiplet和有源插入器。雖然本設計使用同構芯片,但未來的設計可以使用異構處理元素。與AMD EPYC設計一樣,CEA的目標是添加更多的處理元素,單個die不足以交付所需的處理。其中一種應用可能是汽車自動駕駛,這將需要數百個GOPS。
使用有源插入器,可以去除許多在老的流程節點中運行的功能,包括電源管理、內存接口和I/O。在這個特殊的設計中,CEA使用了一個2D網格的分布式互連。有源插入器上的互連混合使用了短距離的無源通道和長時間的有源通道。本設計還采用了一種新穎的異步QDI邏輯與芯片上的異步網絡進行通信。
這款處理器上的chiplet采用FDSOI 28nm LPLV制造,有源插層采用了65 nm工藝。雖然這種芯片使用的是較老的工藝節點,但其目標是展示如何構建和制造它。芯片測試使用傳統的已知良好的技術,但有源插入器只在所有元素組裝后做了測試。如果完全投入生產,通過使用更高級的流程節點,生產流程可能會有所不同。
責任編輯:pj
-
半導體行業
+關注
關注
9文章
403瀏覽量
40589 -
服務器處理器
+關注
關注
0文章
13瀏覽量
12321
發布評論請先 登錄
相關推薦
評論