色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

硅光芯片如何連接到GPU?

旺材芯片 ? 來源:半導體行業觀察 ? 作者:半導體行業觀察 ? 2022-08-19 10:31 ? 次閱讀

在過去幾面,我們一直在談論硅光子學,以至于我們可能和你們中的許多人一樣,對它還沒有普及感到沮喪。但好消息是隨著電信號的進步,我們可能現在不得不轉向光芯片尋找幫助。

由于組件之間的電氣互連成本要低得多,這對價格/性能等式的價格分子部分來說是一個福音,盡管硅光子學在該等式的分母性能部分具有優勢。隨著時間的推移,隨著帶寬的增加,電信號變得越來越短,而且噪音也越來越大。這一天將不可避免地到來,我們將從電子轉向光子作為電磁信號方法,從銅轉向光纖玻璃作為信號介質。

這條曲線來自 Nvidia 首席科學家 Bill Dally 在 3 月份的光纖通信會議上發表的演講,很好地說明了這一點:

832917ee-1eea-11ed-ba43-dac502259ad0.jpg

這些曲線沒有爭議,盡管你可以用材料科學魔法稍微彎曲它們。

幾周前,英偉達與 Ayar Labs 簽署了研發合作協議,我們坐下來與這家硅光子初創公司的首席執行官 Charlie Wuischpard 進行了交談,討論了兩人將開展的工作。Nvidia 參與了 Ayar Labs 今年早些時候進行的 C 輪融資,當時它籌集了 1.3 億美元來開發其帶外激光器和硅光子互連。Hewlett Packard Enterprise也在今年 2 月與 Ayar Labs 簽署了一項協議。為了弄清楚如何將硅光子學引入 Slingshot 互連,他也是今年 4 月那輪融資的投資者。Ayar Labs 也得到了英特爾的早期支持,盡管英特爾希望將激光器嵌入芯片內部,而不是像 Ayar Labs 那樣從芯片外部泵入激光信號。(如果現在有什么是真的,那就是英特爾現在不能做錯任何事。所以英特爾用硅光子對沖它的賭注是件好事。)

在 4 月份的融資時,我們與 Wuischpard 詳細討論了硅光子學適合現代系統的地方——以及它尚不適合的地方,最近,我們得到了一些關于 Nvidia 可能專門開發的東西的提示。

我們隨后了解到 Dally 在 OFC 2022 上所做的上述演示,該演示非常具體地概述了使用密集波分復用 (DWDM:dense wave division multiplexing) 的共同封裝光學器件的目標,以及如何將硅光子學用作交叉連接機架的傳輸和機架的 GPU 計算引擎。

該演示文稿展示了一個未命名的概念機器,例如Dally 的團隊早在 2010 年開發的“Echelon”概念百億億次系統,我們在 2012 年就聽說了。該機器有特殊的數學引擎——不是 GPU——它們之間具有高基數電氣切換和 Cray “Aries” 機器機架之間的光學互連。而且那臺 Echelon 機器顯然從未商業化,而 Nvidia 取而代之的是 Dally 在 Nvidia Research 研究的 NVSwitch 內存互連,并提早將其投入生產,以制造本質上由fat多端口 InfiniBand 互連的大型iron NUMA GPU 處理器復合體代替pipes。

在最初的基于 NVSwitch 的 DGX 系統中,Nvidia 只能使用“Volta”V100 GPU 加速器在單個圖像中擴展到 16 個 GPU,而使用“Ampere”A100 GPU 加速器時,Nvidia 不得不將每個 GPU 的帶寬加倍,因此必須將 NVSwitch 的基數減少兩倍,因此只能將八個 GPU 組合成一個圖像。借助今年早些時候宣布的 NVSwitches 的leaf/spine 網絡以及將于今年晚些時候發貨的“Hopper”H100 GPU 加速器,Nvidia 可以將 256 個 GPU 組合成一個內存結構,這是一個巨大的改進因素。

但歸根結底,作為 DGX H100 SuperPOD 核心的 NVSwitch 結構本質上仍然是一種創建放大 NUMA 機器的方法,而且它絕對受到電纜布線的限制。而且 NVSwitch 的規模,即使是 Hopper 一代,也比不上超大規模生產商為運行最大的 AI 工作負載而捆綁在一起的數萬個 GPU。

“我不能談太多細節,”Wuischpard 笑著告訴The Next Platform。“你知道,我們是一個物理層解決方案,在軟件和 GPU、內存和 CPU 之間的編排方面,還有很多東西要超越它。我們不參與任何這些事情。因此,我想你可以將我們視為未來的物理支持。這是一種多階段的方法。這不僅僅是一個踢輪胎的練習。但我們必須在一些參數范圍內證明自己,我們必須達到一些里程碑。”

我們希望這能澄清這一點。

無論如何,現在讓我們轉向 Dally 在 OFC 2022 上的演講,該演講跳到了未來的 GPU 加速系統與硅光子互連的樣子。在我們開始討論之前,讓我們看看 GPU 或交換機之間的帶寬和功率限制、它們連接的印刷電路板以及它們可能被匯集到的機柜,這為硅光子互連奠定了基礎:

8332e6ac-1eea-11ed-ba43-dac502259ad0.jpg

規則很簡單,鏈路越短,帶寬就越高,移位所消耗的功耗就越低。下表列出了中介層、印刷電路板、共封裝光學器件、電纜和有源光纜的相對功率、成本、密度和每一個,所有這些都是構成現代系統不同層次的電線。

83418fea-1eea-11ed-ba43-dac502259ad0.jpg

使用 DWDM 的共同封裝光學器件的目標是具有比電纜更低的功耗,但成本相似,具有與有源電纜相當的范圍,并提供與印刷電路板相當的信號密度。

以下是 Dally 對 DWDM 信號的示意圖:

834ea57c-1eea-11ed-ba43-dac502259ad0.jpg

下面是 GPU 和 NVSwitch 如何使用光學引擎將電信號轉換為光學信號以創建 GPU 的 NVSwitch 網絡的框圖:

835df874-1eea-11ed-ba43-dac502259ad0.jpg

每個光學引擎有 24 根光纖,它們最初將以 200 Gb/秒的信號速率運行,總帶寬為 4.8 Tb/秒。每個 GPU 都有一對這樣的設備,可以為其提供進出 NVSwitch 結構的雙向帶寬。因此,具有六個光學引擎的 NVSwitch 的原始速率為 28.8 Tb/秒,去除編碼開銷后為 25.6 Tb/秒。

以下是 Nvidia 硅光子概念機中設備組件之間各種障礙的能耗如何計算:

8367c5ca-1eea-11ed-ba43-dac502259ad0.jpg

在 GPU 和交換機之間移入和移出數據的每比特 3.5 皮焦耳與 Dally 在上表中設定的目標完全一致。我們懷疑成本仍然必須降低才能使計算引擎可以接受共同封裝的光學器件,但是這里正在進行大量工作,每個人都非常積極。

當前 DGX-A100 系統上的嵌入式 NVSwitch 結構上使用的電信號傳輸范圍約為 300 厘米,并以每比特 8 皮焦耳的速度傳輸數據。目標是硅光子學以一半的能量做到這一點,并將設備之間的距離提高到 100 米。

發生這種情況時,您可以分解架構中的 GPU 和交換機——雖然 Nvidia 的概念機沒有顯示這一點,但 CPU 也可以具有光學引擎,并且它們也可以分解。

以下是帶有共同封裝光學器件的 GPU 和交換機的外觀:

8378005c-1eea-11ed-ba43-dac502259ad0.jpg

以下是具有 CPO 鏈接的 GPU 和 NVSwitch 的聚合方式:

83844628-1eea-11ed-ba43-dac502259ad0.png

外部激光源占用了大量空間,但這也意味著機架的密度可以大大降低,因為設備之間的連接可以更長。這將使冷卻更容易,并且激光器也可以更換。如果所有這些東西都運行得更冷,激光也會更好地工作。密度被高估了,并且在許多情況下,例如 DGX 系統,機器最終會變得非常熱,以至于您無論如何只能安裝一半的機架,因為功率密度和冷卻需求超出了大多數數據中心的處理能力。

您會注意到,上面的 GPU 和開關行是垂直放置的,這有助于冷卻。而且它們也沒有安裝在帶有 sockets的巨型印刷電路板上,這將有助于降低整體系統成本,以幫助支付使用光學互連的費用。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4768

    瀏覽量

    129216
  • 光學
    +關注

    關注

    3

    文章

    759

    瀏覽量

    36345
  • 硅光芯片
    +關注

    關注

    5

    文章

    47

    瀏覽量

    6080

原文標題:硅光芯片如何連接到GPU?英偉達是這樣看的!

文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    芯片的優勢/市場定位及行業痛點

    近幾年,芯片被廣為提及,從概念到產品,它的發展速度讓人驚嘆。芯片作為
    發表于 11-04 07:49

    高速數據傳輸中的高度集成引擎

    和驅動器放置在重新設計的光子芯片上,并使用標準SMT工藝在260°C的回流爐中進行連接。圖3:電子器件被“撞上”,而光子被“鍍上”然后將CWDM波長的DFB激光器以較高的溫度
    發表于 12-05 10:33

    上海布局互連芯片研發和生產

    去年,上海市政府將光子列入首批市級重大專項,投入大量經費,布局互連芯片研發和生產。而今,很多業內人士感嘆,上海真是未雨綢繆,因為
    的頭像 發表于 07-13 17:07 ?6402次閱讀

    芯片是將什么材料和器件通過特殊工藝制造的集成電路?

    芯片是將材料和器件通過特殊工藝制造的集成電路,主要由光源、調制器、探測器、無源波導器件等組成,將多種
    的頭像 發表于 06-11 09:02 ?1.8w次閱讀

    芯片是什么東西_芯片和傳統芯片區別

    芯片一般指光子芯片。研究人員將磷化銦的發光屬性和路由能力整合到單一混合芯片中。當給磷化銦
    的頭像 發表于 08-20 15:26 ?8w次閱讀

    芯片的無源封裝技術

    電學:芯片和兩個淺藍色的模擬電芯片的電信號連接內容,需要3D堆疊封裝,與高頻信號損耗有關。
    的頭像 發表于 09-01 10:44 ?5701次閱讀
    <b class='flag-5'>硅</b><b class='flag-5'>光</b><b class='flag-5'>芯片</b>的無源封裝技術

    Snap:bit:將Whistle芯片連接到Micro:bit

    電子發燒友網站提供《Snap:bit:將Whistle芯片連接到Micro:bit.zip》資料免費下載
    發表于 06-19 10:16 ?0次下載
    Snap:bit:將Whistle<b class='flag-5'>芯片</b><b class='flag-5'>連接到</b>Micro:bit

    亞毫米級別分辨率的芯片“可視化”測試設備

    芯片是通過標準半導體工藝將材料和器件集成在一起的集成路,主要由光源、調制器、探測器、無
    的頭像 發表于 07-26 09:36 ?1255次閱讀
    亞毫米級別分辨率的<b class='flag-5'>硅</b><b class='flag-5'>光</b><b class='flag-5'>芯片</b>“可視化”測試設備

    國產廠商搶占芯片的風口

    光子芯片根據基材的不同,大致可分為兩類:一種是在以InP為代表的“有源材料”上集成制作元件的芯片;另一種則是在以為代表的“無源材料”上制作的,即
    的頭像 發表于 07-20 18:27 ?1867次閱讀
    國產廠商搶占<b class='flag-5'>硅</b><b class='flag-5'>光</b><b class='flag-5'>芯片</b>的風口

    昊衡科技-OLI測試芯片耦合質量

    光纖微裂紋診斷儀(OLI)對芯片耦合質量檢測非常有優勢,以亞毫米級別的空間分辨率精準探測到鏈路中每個事件節點,具有靈敏度高、定位精準、穩定性高、簡單易用等特點,是
    的頭像 發表于 08-04 16:30 ?1125次閱讀
    昊衡科技-OLI測試<b class='flag-5'>硅</b><b class='flag-5'>光</b><b class='flag-5'>芯片</b>耦合質量

    OLI測試芯片內部裂紋

    光是以光子和電子為信息載體的基電子大規模集成技術,能夠突破傳統電子芯片的極限性能,是5G通信、大數據、人工智能、物聯網等新型產業的基礎支撐。準確測量
    的頭像 發表于 07-31 23:04 ?814次閱讀
    OLI測試<b class='flag-5'>硅</b><b class='flag-5'>光</b><b class='flag-5'>芯片</b>內部裂紋

    OLI測試芯片耦合質量

    光是以光子和電子為信息載體的基電子大規模集成技術。光纖到基耦合是芯片設計十分重要的一環,耦合質量決定著集成
    的頭像 發表于 08-05 08:21 ?1098次閱讀
    OLI測試<b class='flag-5'>硅</b><b class='flag-5'>光</b><b class='flag-5'>芯片</b>耦合質量

    使用OLI進行芯片耦合質量檢測

    集成芯片上光信號和外部信號互聯質量。耦合過程中最困難的地方在于兩者模式尺寸不匹配,
    的頭像 發表于 08-15 10:10 ?1021次閱讀
    使用OLI進行<b class='flag-5'>硅</b><b class='flag-5'>光</b><b class='flag-5'>芯片</b>耦合質量檢測

    集成芯片的用途有哪些

    集成芯片是一種基于基的光電子大規模集成技術,以光子和電子為信息載體,具有許多獨特的優勢和應用領域。
    的頭像 發表于 03-18 15:21 ?1693次閱讀

    芯片與傳統芯片的區別

    材料差異: 芯片主要使用作為材料,而傳統芯片則使用晶體。
    的頭像 發表于 07-12 09:33 ?7623次閱讀
    主站蜘蛛池模板: 在线精品视频免费观看 | 亚洲狠狠97婷婷综合久久久久 | 无码国产伦一区二区三区视频 | 男女做爽爽爽视频免费软件 | 成人免费看片又大又黄 | 午夜伦伦电影理论片大片 | 伊人热| 国产精品看高国产精品不卡 | 国产成人女人在线视频观看 | 飘雪在线观看免费高清完整版韩国 | 欧美人与善交大片 | 欧美激情视频在线观看一区二区三区 | 日本理论片和搜子同居的日子2 | 美女裸露100%奶头视频 | 亲胸摸下面激烈免费网站 | 日本人娇小hd | 国产毛A片啊久久久久久A | 色综合伊人色综合网站下载 | 自拍黄色片 | 国产无遮挡色视频免费观看性色 | 国产精品无码AV天天爽人妻蜜桃 | 97久久精品人人槡人妻人 | 精品国产99久久久久久麻豆 | 俄罗斯mm | 国产三级精品三级在线观看 | 久久久免费热线精品频 | 韩国羞羞秘密教学子开车漫书 | 老司机福利在视频在ae8 | 男人插女人逼逼 | 精品国产免费第一区二区 | 纯肉巨黄H爆粗口男男分卷阅读 | 亚洲乱亚洲乱妇在线观看 | 一品道门免费高清视频 | 无码免费视频AAAAAA片草莓 | 免费人妻无码AV不卡在线 | 日本wwwhdsex69| 中文字幕成人在线观看 | 大香网伊人久久综合网2020 | FREE性丰满HD毛多多 | 欧美老妇与zozoz0交 | 吉吉av电影|