亚洲欧美韩国日产综合在线,亚洲香蕉伊在人在线观婷婷,亚洲精品人成网在线播放影院

今年的 GTC China 黃仁勛沒有露面，但黃式定律無處不在。

從翻倍提高 TensorCore 計算效能的新技術，到下一代光通信技術，再到一行代碼為所有模型提供 GPU 加速的軟件工具，為了讓未來的 AI 算力每年能夠提升一倍，英偉達找到了不少新方向。

12 月 15 日上午，英偉達 GTC 大會中國站在線上舉行，全球最負盛名的計算機科學家之一、NVIDIA 研究院負責人 Bill Dally 在活動中發表了主題演講。

在科技領域里，很多人都知道摩爾定律：前英特爾 CEO 大衛·豪斯（David House）曾提出，人類制造出的芯片，每 18 個月計算效率就會提高一倍。這一「規律」在過去長達五十年間一直被實踐驗證，但在最近五六年中，由于晶體管尺寸越來越小，制程陷入瓶頸，摩爾定律逐漸失效。

而另一方面，人類對于計算機的算力需求是無限的，人工智能技術的發展更是加大了這種需求。近十年來，GPU正在讓人工智能算法的性能每年都在成倍提升，英偉達的研究人員通過架構的提升，正在不斷尋找進一步加快AI推理速度的芯片。

英偉達提出了以自己創始人黃仁勛名字命名的黃氏定律（Huang’s Law）對單芯片AI推理能力進行了預測，提出每 12 月其數字將翻一倍。

如果我們還需要在未來的一段時間里使用硅芯片，那么摩爾定律之后，我們還可以仰賴「黃氏定律」保持AI技術的發展速度。

在芯片本身無法快速提升的情況下，英偉達把目光轉向了計算架構的很多其他方面，Bill Dally 認為「這些方向其中的任何一個如果有效，都可以在接下來幾代的產品中幫助我們延續性能每年提升一倍的目標。」

首先是單卡計算效率。即使是英偉達目前的二代 Tensor Core，在進行推理時也無法把所有功耗用在數學運算上——效率被浪費在了數據傳輸上。英偉達設計了 MAGNet 系統，用于探索更為高效的芯片架構設計。

如果可以通過一個全局控制器，把數據從內存不同的部分移動到不同計算單元以執行計算，并針對神經網絡計算的特性在數據流中加入一個存儲層，便可以解除瓶頸，將大部分能量用于計算。在特定的單元上，英偉達尚未發布的硬件產品可以實現每瓦 100 Teraops 的推理能力，而在 2019 年達到的效率還只有 29 Teraops。

看來下一代的 Tensor Core 性能又要有巨大的提升了。

其次是多卡的數據傳輸，英偉達的 GPU 通過 NVlink 和 NVswitch 互相連接，然而基于電信號的方式目前已經接近極限了，人們預估，想要繼續讓 NVLink 中信號傳輸的帶寬每代提升一倍，將變得極其困難。目前英偉達能夠實現的數字是每線對 50Gb/s，可預見的未來大約可以實現到 100-200Gb/s。英偉達也在和英特爾等科技巨頭一樣思考如何盡快把基于光學的通信技術應用于實踐。

作為一名研究者，Bill Dally 曾牽頭研發英偉達對于光信號傳輸的愿景：光通信不僅可以大幅度提升帶寬（從幾百 Gb/s 到幾 Tb/s），提升傳輸空間（從幾十厘米到 20-100 米）并減少系統的復雜程度。

在英偉達的設計中，DGX 卡縱置排列，右側為光源，可為光線提供多種不同波長的光線，光學引擎以極高的數據速率把光轉換為信號。每根光纖都可以同時傳輸不同波長的光，而每種波長的光都可以用 25-50Gb/s 的速度傳輸信號。這樣一來，總數據速率將為 400Gb/s，而每根光纖的傳輸速率「保守估計」就可以達到數個 Tb/s，而且能耗還要比電信號要小。英偉達的研究團隊正在與哥倫比亞大學的研究人員密切合作，探討如何利用電信供應商在其核心網絡中所采用的技術，通過一條光纖來傳輸數十路信號——有了光通信，僅需一條 NVLink 就可以連接規模更大的系統。

英偉達還在嘗試一種名為「密集波分復用」的技術, 有望在僅一毫米大小的芯片上實現 Tb/s 級數據的傳輸，是如今互連密度的十倍以上。

除了更大的吞吐量，光鏈路也有助于打造更為密集型的系統。Dally 舉例展示了一個未來將搭載 160 多個 GPU 的 NVIDIA DGX 系統模型。

除了硬件方面的革新，還有軟件。今天有很多應用都在被 GPU 加速，遠超英偉達開發者們更新 CUDA 程序的速度，人們急需一種簡化的編程方式。NVIDIA 的研究人員開發了全新編程系統原型 Legate。開發者借助 Legate，即可在任何規模的系統上，運行針對單一 GPU 編寫的程序——甚至適用于諸如 Selene 等搭載數千個 GPU 的巨型超級計算機。

對于大多數人來說，使用 Legate 我們就可以無需更改代碼即讓 Python 程序無感運行在從 Jetson Nano 到 DGX SuperPOD 等所有包含英偉達 cuda 核心的設備上。開發者所做的是基于原始的 Python 代碼，將原本的「import NumPy as NP」更改為「import legate.numpy as NP」就可以了。隨后 Legate 庫會開始運行，自動完成之后的操作。

它的運行速率有多快呢？從上表中可以看到，Legate 的處理速度不僅快于目前效率最高的庫，同時在并行化時也能盡量保持住自己的優勢。

英偉達也分享了目前國內合作伙伴使用新一代芯片的情況：阿里云、百度智能云、滴滴云、騰訊云的大型數據中心正在遷移至基于英偉達 Ampere 架構的平臺。圖像識別、語音識別，以及包括計算流體動力學、計算金融學、分子動力學在內的 GPU 加速高性能計算場景的快速增長，催生了更多對云實例的需求。

在硬件方面，新華三、浪潮、聯想、寧暢等中國領先系統制造商也在將 A100 GPU 引入到自身產品中，并推出了多款針對不同應用場景的系列產品，為超大型數據中心提供基于 Ampere 架構的加速系統，進而為用戶提供兼具超強性能與靈活性的 AI 計算平臺。
編輯：hfy

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

gpu

gpu

+關注

關注
28

文章
4760

瀏覽量
129131
計算機

計算機

+關注

關注
19

文章
7523

瀏覽量
88315
AI

AI

+關注

關注
87

文章
31262

瀏覽量
269627
英偉達

英偉達

+關注

關注
22

文章
3815

瀏覽量
91492

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

2024年3月19日，[英偉達]CEO[黃仁勛]在GTC大會上公布了新一代AI芯片架構BLACKWELL，并推出基于該架構的超級芯片GB20

發表于 05-13 17:16

【AD新聞】AI時代，一美元能夠買到多強的算力？

當真正需要在嵌入式終端設備中使用AI技術時，客戶的訴求更多的集中在功耗、響應時間、成本等方面，對性能的無盡追求反而不是重點，這和很多人之前的預想并不一致。花一美元或一瓦電能買到多強的

發表于 03-23 15:27

英偉達GPU慘遭專業礦機碾壓，黃仁勛宣布砍掉加密貨幣業務！

加密貨幣專用產品上的預期營收降至1億美元，實際營收只有1800萬美元。預計未來這一業務對公司的貢獻可以忽略不計。”英偉達CEO黃仁勛也做出類

發表于 08-24 10:11

英偉達DPU的過“芯”之處

，AI硬件正成為越來越多數據中心擴容建設的關鍵所在。當超強AI算力成為數據中心的剛需，英偉達GP

發表于 03-29 14:42

英偉達嵌入式電腦可為機器人設計引入AI算力

英偉達在硅谷召開了GTC 2019主題演講，英偉達 CEO黃仁勛發表演講，正式發布了機器人開發者工具箱Jetson Nano，可以為機器人設

發表于 08-12 17:09 ?933次閱讀

英偉達正式發布NVIDIA A100,擁有比原來強大20倍的AI算力

GPU，為此前在網上盛傳的，被稱為安培（Ampere）的產品。公司創始人兼 CEO 黃仁勛介紹稱，其包含 540 億晶體管，擁有比原來強大 20 倍的 AI 算

發表于 05-15 11:34 ?6184次閱讀

英偉達:GPU讓AI的性能每年都成倍提升

英偉達首席科學家Bill Dally在一年一度的中國GPU技術大會召開前接受第一財經記者獨家專訪時表示，GPU讓人工智能（

發表于 12-15 13:37 ?2599次閱讀

英偉達官方認可“黃氏定律”，摩爾定律會失效嗎？

：摩爾定律失效后，該如何進一步提高處理器的能效？針對這個問題，一些公司已經找到了自己的答案，比如英偉達。過去幾年來，

發表于 12-18 16:27 ?3238次閱讀

英偉達的算力霸主之路 “卷王”英偉達的真面目

了臺積電4納米制程工藝，集成1800億個晶體管，浮點計算能力相比前一代A100快了三倍，被看作英偉達的新一代“核彈”。

發表于 04-05 14:11 ?2707次閱讀

角逐AI算力，比英偉達最多快10倍，光芯片能成為國產之光嗎？

中信建投指出，近年來光計算在AI領域呈現高速的發展，具有廣闊的應用前景。以Lightmatter和Lightelligence為代表的公司，推出了新型的硅光計算芯片，性能遠超目前的AI算力

發表于 07-17 14:47 ?1573次閱讀

英偉達A100的算力是多少？

，但 A100 的算力是前者的 20 倍。 A100是英偉達推出的一款強大的數據中心GPU，采用

發表于 08-08 15:28 ?3.8w次閱讀

英偉達H200算力怎么樣

英偉達H200的算力非常強大。作為新一代AI芯片，H200在性能上有了顯著的

發表于 03-07 16:15 ?2200次閱讀

英偉達最新一代AI芯片Blackwell GPU，AI算力能力較上代提升30倍！

黃仁勛說："我們已經來到了一個臨界點，因此需要一種新的計算方式來加速整個行業的發展效率。那么英偉達能夠

發表于 03-19 13:39 ?1944次閱讀

英偉達宣布每年設計一代全新AI芯片，加快其他產品線更新速度

英偉達CEO黃仁勛宣布，公司將每年推出全新AI芯片，以滿足市場需求。他表示，Blackwell后將有新款芯片問世，且

發表于 05-23 10:41 ?798次閱讀

英偉達Blackwell芯片已投產，預告未來AI芯片發展

英偉達創始人兼CEO黃仁勛近日宣布，公司旗下的Blackwell芯片已正式投入生產。這款芯片是英偉達在A

發表于 06-04 09:23 ?2007次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

英偉達「黃氏定律」讓未來的AI算力每年能夠提升一倍

評論

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

【AD新聞】AI時代，一美元能夠買到多強的算力？

英偉達GPU慘遭專業礦機碾壓，黃仁勛宣布砍掉加密貨幣業務！

英偉達DPU的過“芯”之處

英偉達嵌入式電腦可為機器人設計引入AI算力

英偉達正式發布NVIDIA A100,擁有比原來強大20倍的AI算力

英偉達:GPU讓AI的性能每年都成倍提升

英偉達官方認可“黃氏定律”，摩爾定律會失效嗎？

英偉達的算力霸主之路 “卷王”英偉達的真面目

角逐AI算力，比英偉達最多快10倍，光芯片能成為國產之光嗎？

英偉達A100的算力是多少？

英偉達H200算力怎么樣

英偉達最新一代AI芯片Blackwell GPU，AI算力能力較上代提升30倍！

英偉達宣布每年設計一代全新AI芯片，加快其他產品線更新速度

英偉達Blackwell芯片已投產，預告未來AI芯片發展