之前的幾篇基本都是在講,復興的深度學習技術讓內存和計算單元之間的GAP變得更大了,這個問題已經從傳統的Memory Wall的討論打了PIM的時代。說道PIM, Porcessor in Memory, 筆者在2014年的時候參加過一個Intel的高逼格的會議,當時3DXP已經在開發,Intel的同學講,未來的CPU會坐在一個巨大的內存結構上,當時剛剛普及的NAND Flash技術只是個臨時方案。因為NAND Flash和CPU之間的連接總是有一種,茶壺倒餃子的感覺。2014年的時候,深度學習應該是剛剛開始,大家都在糾結如何把數據從CPU傳遞到GPU,(其實,現在大家還在糾結)。
之后,借著大數據和深度學習的東風,PIM一下子流行起來。其實,PIM并不是一個新概念, 每一個很靠譜的PIM的綜述文章都會講那個開始-The Berkeley IRAM Project。
和他的親兄弟RISC-V不一樣,IRAM的命運不濟,沒有走到工業化這條路上。對于這個項目,David Patterson 大神在他的《Microprocessors in 2020》都講過這個。大神就是大神,如果你現在看看這篇文章,會發現這個世界上的預言并不總像《滬市一萬點不是夢》一樣不靠譜。
文章的內容總結如下:
一句話,IRAM并沒有像大神的RISC和RAID一樣被工業屆買單,但是Intel目前對于DeepLearning的看家吃法的家伙AVX-512就是加專用向量處理器的例子。【1】
另一個比較有代表意義的就是寒武紀的大電腦了。上一節的IRAM只是加了一個向量處理器在哪里,當時主要的想法是做并行計算,但是一直到現在,并行計算依然對于廣大的程序猿來講還是比較困難的。在IRAM的指令集的角度上,對比了標量和向量實現并行的對比。
看到這個,做芯片的同學是不是想到了SPARC,"While slower then recent Intel offerings, architecturally UltraSparc remains a very interesting microprocessor with unique (and very compiler friendly) organization of registers. And as we mentioned before it is a big Endean microprocessor, which is actually the only right way to build microprocessors :-)."[2]
因此,DaDianNao的創新就在從計算機體系結構的角度,把一個NFU和內存結合。如何說IRAM是一個通用方案的話,Dadiannao就是一個專用的方案了。要知道,在2014年,大部分用戶還在忙著調整GPGPU的參數,而DaDiannao類似于一個AI加速器的開山祖師,創建了RAM+NFU的流派。
SSDFans的同學們都知道,早在1985年,Toshiba就發明了NAND Flash,最近幾年NAND Flash的大事就是蓋樓,從平面到了立體,本來大家在15nm(1Y)之后,還要接著想辦法挖溝。用了3D技術之后,一下子回到了40nm的幸福時光,每家都在大干快上,最高記錄目前是512層。[3]
其實,DRAM也在搞同樣的事情,和NAND Flash不同,NAND Flash是摩天大樓,而DRAM則是6層的板樓。
對的,HMC和HBM所用的Memory還是普通的DRAM芯片,只是用新的芯片封裝工藝和計算芯片集成。HBM的使用和DRAM的使用并沒有大的區別。這個和最新的AMD的ZEN2 Rome的CPU類似,7nm的計算die和14nm的IOdie合封。目前在hyerpscale,特別是OCP里面,一個chiplet的概念特別流行chiplet[4]. 這里不得不說一下我的老東家Avago就特立獨行。人家整了一個比V100還大的獨立片子[5],21,000,000,000的晶體管,7nm一句話,俺能賣出去,管什么良率問題。
因此,很自然,通過牛逼的工藝,把memory和計算單元合體,大家都在做,包括筆者供職的Xilinx也在搞AICore和HBM。現在的AI芯片,如果沒有HBM的配置,估計都不好意思出門了。
不知道為什么,段教授選了一個這個例子。
如果有懂行的同學可以評論一下。好了,這個段落主要是將講了在DRAM上的各種嘗試,2D和3D都有,但是基本上memory和xPU之間的界限還是明顯的,雖然在一張床上,還是沒有水乳交融。比較關心業界動態的,這一節基本上是靠譜的技術,都可以實現的。下一節應該都是腦洞了。
-
DRAM
+關注
關注
40文章
2320瀏覽量
183641 -
深度學習
+關注
關注
73文章
5508瀏覽量
121305 -
RISC-V
+關注
關注
45文章
2300瀏覽量
46268 -
存算一體
+關注
關注
0文章
102瀏覽量
4311
原文標題:存算一體化芯片簡史
文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論