D1 芯片對(duì)標(biāo)英偉達(dá) A100。D1采用臺(tái)積電 7nm 制程,面積約為 645mm2,包含 500 億顆晶體管,BF16、CFP8 算力可達(dá) 362TFLOPS,F(xiàn)P32 算力可達(dá) 22.6TFLOPS。特斯拉D1芯片對(duì)標(biāo)英偉達(dá) A100,英偉達(dá) A100 同樣采用臺(tái)積電 7nm 制程,面積為 826mm2,晶體管數(shù)量達(dá) 542 億顆,F(xiàn)P32 峰值算力為 19.5TFLOPS。
D1 芯片依次組成 Tranining tile、Tray、機(jī)柜、ExaPOD。特斯拉并未將 SoC 從晶圓上切下來,而是將所有 SoC 連接。25 個(gè) D1 芯片組成了一個(gè) Training Tile 多晶片模組(MCM),每個(gè) D1 芯片功耗 400W,一個(gè) Training Tile 功耗為 15kW。此外,6 個(gè) Training Tile 組成一個(gè) tray,再由兩個(gè) Tray 組成一個(gè)機(jī)柜,10 個(gè)機(jī)柜組成 ExaPOD,BF16/CFP8 峰值算力達(dá)到 1.1EFLOPS(百億億次浮點(diǎn)運(yùn)算),并擁有 1.3TB 高速 SRAM 和 13TB 高帶寬 DRAM。
Dojo 的設(shè)計(jì)思想是通過較高的對(duì)稱性來實(shí)現(xiàn) scale out 能力。在單個(gè) Training tile 上,由于并未將芯片切下,為了提高效率和降低成本,特斯拉并未在片上集成 DRAM 等器件,這與許多通用 GPU 有所不同。集群節(jié)點(diǎn)之間以 2D mesh 連接,邊緣則通過 Interface-processors負(fù)責(zé)內(nèi)存池?cái)?shù)據(jù)搬運(yùn)。
顯而易見,D1 芯片需要高速的互聯(lián)來實(shí)現(xiàn),臺(tái)積電 SoW 封裝技術(shù)提供了這一條件。InFO_SoW 取消了襯底和 PCB 的使用,使得多個(gè)芯片陣列使解決方案獲得晶圓級(jí)優(yōu)勢(shì),以獲得低延時(shí)、高帶寬等優(yōu)勢(shì)。此外除了異構(gòu)芯片集成外,其 wafer-field 處理能力還支持基于小芯片的設(shè)計(jì),以實(shí)現(xiàn)更大的成本節(jié)約和設(shè)計(jì)靈活性。
在部分模型上,Dojo 能實(shí)現(xiàn)相對(duì) A100 更高的性能。例如在圖像分類模型 ResNet-50 上,Dojo 可以實(shí)現(xiàn)比英偉達(dá) A100 更高的幀率。而在用于預(yù)測(cè)汽車周圍物體所占空間的神經(jīng)網(wǎng)絡(luò)模型 Occupancy Networks 上,相比英偉達(dá) A100,Dojo 能實(shí)現(xiàn)性能的倍增。
特斯拉將大力投資基礎(chǔ)設(shè)施,2024 年有望達(dá) 100Exa-Flops 算力。特斯拉目前 AI 基礎(chǔ)設(shè)施較少,僅約 4000 個(gè) V100 和約 16000 個(gè) A100。而 Microsoft 和 Meta 等公司擁有超過 10萬(wàn)個(gè) GPU。據(jù)特斯拉規(guī)劃,2024 年有望達(dá) 100Exa-Flops 算力。
特斯拉擁有海量數(shù)據(jù)庫(kù),數(shù)據(jù)價(jià)值亟待挖掘。Model3 傳包含 8 個(gè)攝像頭,1 個(gè)毫米波雷達(dá),12 個(gè)超聲波雷達(dá),位置分別為:1-車牌的上方裝有一個(gè)攝像頭;2-超聲波傳感器(如果配備)位于前后保險(xiǎn)杠中;3-各門柱均裝有一個(gè)攝像頭;4-后視鏡上方的擋風(fēng)玻璃上裝有三個(gè)攝像頭;5-每塊前翼子板上裝有一個(gè)攝像頭;6-雷達(dá)(如果配備)安裝在前保險(xiǎn)杠后面。特斯拉車型銷量形勢(shì)良好,通過傳感器件建立了龐大的數(shù)據(jù)庫(kù),但受限于硬件限制,無(wú)法充分挖掘數(shù)據(jù)價(jià)值,Dojo 量產(chǎn)有望突破瓶頸。
自建 AI 基礎(chǔ)設(shè)施,AI 或賦能特斯拉快速成長(zhǎng)。特斯拉 Dojo 性能強(qiáng)大,我們認(rèn)為,除加速自身智駕進(jìn)程外,或可拓展至其他應(yīng)用領(lǐng)域,如機(jī)器人等。此外,特斯拉也可能成為一家云服務(wù)提供商,向相關(guān)廠商提供自身算力或模型服務(wù)。
-
傳感器
+關(guān)注
關(guān)注
2551文章
51134瀏覽量
753834 -
AI
+關(guān)注
關(guān)注
87文章
30946瀏覽量
269187 -
毫米波雷達(dá)
+關(guān)注
關(guān)注
107文章
1044瀏覽量
64387
原文標(biāo)題:Dojo對(duì)標(biāo)A100性能強(qiáng)勁,AI應(yīng)用場(chǎng)景拓展
文章出處:【微信號(hào):AI_Architect,微信公眾號(hào):智能計(jì)算芯世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論