Cerebras Systems和聯邦能源部國家能源技術實驗室今天宣布,該公司的CS-1系統比圖形處理單元(GPU)快10,000倍。
換而言之,這意味著以前需要花費數月時間進行訓練的AI神經網絡,現在在Cerebras系統上僅需要進行數分鐘的訓練,就能完成。
Cerebras生產世界上最大的計算機芯片WSE。芯片制造商通常會從直徑12英寸的硅錠中切出晶圓,然后在芯片工廠中進行處理。處理完成后,將晶片切成數百個可用于電子硬件的獨立芯片。
但是由SeaMicro創始人Andrew Feldman創立的Cerebras用整個晶圓制造出了一塊巨大的芯片。芯片的每個部分都稱為核心,以復雜的方式互連到其他核心。互連設計為使所有內核保持高速運行,因此晶體管可以一起工作。
Cerebras的CS-1系統使用WSE硅片大小的芯片,該芯片具有1.2萬億個晶體管,這些基本的開關電子開關是硅芯片的基礎。英特爾1971年的第一個4004處理器具有2,300個晶體管,而昨天宣布的Nvidia A100 80GB芯片具有540億個晶體管。
Feldman在接受VentureBeat采訪時說,CS-1的速度也比Joule超級計算機快200倍,后者在全球500強超級計算機中名列第82位。
Feldman說:“它顯示了創紀錄的性能。這也表明晶圓級技術的應用范圍超出了AI。”
這些數據是總部位于加利福尼亞州的Cerebras采用激進方法得出的成果,該方法創建了具有40萬個AI核的芯片,而不是將該晶片切成單個芯片。Feldman說,這種不尋常的設計使完成任務變得容易得多,因為處理器和內存彼此靠近,并且有很多帶寬可以連接它們。該方法在不同的計算任務中適用范圍的問題仍然存在。
根據Cerebras與聯邦實驗室合作的結果發表的一篇論文說,CS-1可以提供任何數量的中央處理器(CPU)和GPU都無法達到的性能,而中央處理器和GPU都是超級計算機中常用的。(現在70%的頂級超級計算機都使用了英偉達的GPU )。Feldman補充說,“不管超級計算機有多大,這都是真的。”
Cerebras將在本周的SC20超級計算在線活動中進行演示。CS-1在計算流體動力學方面的工作量擊敗了Joule 超級計算機,它可以模擬化油器等地方的流體運動。Joule 超級計算機的建造成本為數千萬美元,其中有84,000個CPU內核分布在數十個機架上,消耗的功率為450千瓦。
根據能源實驗室主管Brian Anderson的說法,在此演示中,Joule 超級計算機使用了16,384個內核,而Cerebras計算機的速度提高了200倍。Cerebras花費數百萬美元,并使用20千瓦的功率。
“對于這些工作量,晶圓級CS-1是有史以來最快的機器,”Feldman說。“而且它比其他處理器的任何其他組合或集群都快。”
單個Cerebras CS-1的高度為26英寸,可占據三分之一的機架,并由業界唯一的晶圓級處理引擎Cerebras的WSE提供動力。它結合了內存性能與大帶寬,低延遲的處理器間通信以及針對高帶寬計算進行了優化的體系結構。
該研究由NETL機器學習和數據科學工程師Dirk Van Essendelft以及Cerebras聯合創始人兼高級技術首席架構師Michael James領導。經過幾個月的努力,結果才出現。
2019年9月,能源部宣布與Cerebras建立合作伙伴關系,其中包括與Argonne國家實驗室和Lawrence Livermore國家實驗室的部署。
Cerebras CS-1于2019年11月發布。CS-1是圍繞WSE構建的,它的體積是WSE的56倍,內核增加了54倍,片上內存增加了450倍,內存帶寬增加了5788倍,并且20,833倍Cerebras說,與領先的GPU競爭對手相比,其結構帶寬更大。
費爾德曼指出,CS-1可以比實時完成更快的計算,這意味著它可以在反應開始時啟動電廠反應堆核心的仿真,并在反應結束之前完成仿真。
“這些動態建模問題具有有趣的特征,”Feldman說。“它們在CPU和GPU內核之間的伸縮性很差。用計算科學家的語言來說,它們沒有表現出“強擴展性”。這意味著,在一定程度上,向超級計算機添加更多處理器不會帶來額外的性能提升。”
Cerebras已經籌集了4.5億美元,擁有275名員工。
責任編輯:tzh
-
處理器
+關注
關注
68文章
19404瀏覽量
230787 -
芯片
+關注
關注
456文章
51154瀏覽量
426264 -
計算機
+關注
關注
19文章
7534瀏覽量
88450 -
晶體管
+關注
關注
77文章
9744瀏覽量
138716
發布評論請先 登錄
相關推薦
評論