AI時代的燃料—數(shù)據(jù),正在呈井噴式爆發(fā)。
據(jù)統(tǒng)計,人類每天都會產(chǎn)生2.5 quintillion bytes(10的18次方)的數(shù)據(jù),全世界數(shù)據(jù)總量的90%都是在過去兩年內(nèi)產(chǎn)生的。IDC預(yù)測,2025年全球產(chǎn)生的數(shù)據(jù)量將達(dá)到163ZB。可以說,數(shù)據(jù)存儲和處理的效率決定了企業(yè)的AI競爭力和未來。雖然有研究者利用和內(nèi)存作用相當(dāng)類似的憶阻器來打造類神經(jīng)網(wǎng)絡(luò)處理機(jī)制,用以處理深度學(xué)習(xí)方面的工作,但相關(guān)技術(shù)畢竟還不成熟,多數(shù)還是處于實驗室發(fā)展階段。
創(chuàng)業(yè)公司InnoGrit推出了一組固態(tài)硬盤(ssd)控制器Tacoma,其中一個用于數(shù)據(jù)中心,該中心嵌入了一個神經(jīng)網(wǎng)絡(luò)加速器。InnoGrit表示已經(jīng)擁有相對競爭對手的實力和性能優(yōu)勢。
隨著NAND閃存價格出現(xiàn)觸底跡象,這些芯片應(yīng)運而生。OEM和數(shù)據(jù)中心預(yù)計將利用價格較低的優(yōu)勢,繼續(xù)從筆記本電腦和服務(wù)器的硬盤存儲轉(zhuǎn)向需要性能、功率或尺寸優(yōu)勢的硬盤存儲。
在數(shù)據(jù)中心,SSD的應(yīng)用“正在快速發(fā)展,尤其是在去年價格下跌的情況下,” InnoGrit的董事長兼創(chuàng)始人吳子寧說。“當(dāng)我們與數(shù)據(jù)中心的客戶交談時,他們所有的新設(shè)計都是基于Flash的。”
吳子寧是個華人,他在Marvell工作了17年之后,于2016年時創(chuàng)立InnoGrit,過去也曾在中國媒體中露面。當(dāng)初他提過一個概念,就是過去存儲負(fù)責(zé)的工作就是存儲,而沒有參與到計算工作,如果存儲端本身就可以進(jìn)行計算,那么就可以省去很多數(shù)據(jù)搬運的工作,大幅降低系統(tǒng)的帶寬需求。
具體的概念,其實就是在把一批數(shù)據(jù)放進(jìn)硬盤中時,若計算機(jī)需要在這堆數(shù)據(jù)中找出特定的內(nèi)容,計算機(jī)自己就必須逐筆數(shù)據(jù)進(jìn)行比對,找到符合需求的才撈出來顯示或執(zhí)行。而數(shù)據(jù)在這個過程中來來回回,就會產(chǎn)生很多的帶寬消耗,如果,存儲媒體本身就可以進(jìn)行計算,那么計算機(jī)只要告訴存儲媒體找出符合特定特征的數(shù)據(jù),而其他的工作就交給具備計算功能的存儲媒體來進(jìn)行,由于搜索和比對都在本地端,不需要經(jīng)過總線進(jìn)行搬移比對,效率更高,對能耗也更節(jié)省。
在高端應(yīng)用上,InnoGrit的Tacoma使用4個PCI Gen4接口來支持16個NAND通道,在低于5W峰值功率的情況下,提供高達(dá)150萬個I/O/秒(IOPS)。它包括一個未命名的中層ARM核心,以及Nvidia的開源推理加速器NDLA來實現(xiàn)。
“有了這個組合,我們可以使用Nvidia提供的工具鏈進(jìn)行智能處理,比如數(shù)據(jù)標(biāo)簽,或者客戶可以安裝他們自己的固件,”吳子寧說。由于數(shù)據(jù)中心的客戶基本上目前開的新案子幾乎都是基于閃存的設(shè)計,這也讓他意識到,在存儲設(shè)備中嵌入AI計算的思路將會具有龐大市場價值。
不過InnoGrit的概念其實已經(jīng)被三星搶先一步,2018年秋天,三星發(fā)布了一款SSD,內(nèi)置Xilinx Zynq FPGA,可以處理各種人工智能、數(shù)據(jù)庫和視頻應(yīng)用程序。號稱可以處理各種AI,數(shù)據(jù)庫和視頻應(yīng)用的存內(nèi)計算加速。另一方面,Phison電子和Marvell也都推出功能和InnoGrit類似的控制芯片組,不過與InnoGrit不同的是,這些公司的方案并沒有強(qiáng)調(diào)內(nèi)嵌AI計算能力。
Tacoma使用64+8位數(shù)據(jù)總線,以及DDR3/4和LPDDR3/4 DRAM,并提供AES-256、SHA3和ECC安全性。中間層Rainier控制器是該設(shè)計的一個迷你版本,支持8個NAND通道和32位和16位數(shù)據(jù)總線,用于低端服務(wù)器或高端筆記本電腦。
為了達(dá)成這個技術(shù)概念,吳子寧利用臺積電的28nm,以及16/12nm FinFET制程打造了四組不同的控制器方案,支持的容量分別從2TB到最大32TB。此外,Rainier在峰值功率不足3W的情況下可提供多達(dá)100萬個IOPS。Rainier和Tacoma都支持高達(dá)7GB/s的順序讀取和6.1GB/s的順序?qū)懭搿?/p>
吳表示,這款產(chǎn)品在幾個指標(biāo)上都領(lǐng)先于競爭對手。然而,在7月初,競爭對手***日升電子(Phison Electronics)宣布推出一款8通道SSD控制器,使用4條PCIe Gen 4鏈路。
而Marvell則宣布了三個SSD控制器,它們與InnoGrit的控制器大致相似。然而,它們都只支持4個NAND通道,而且它們沒有指定任何硬件AI加速或峰值功率額定值。
在低端場景,InnoGrit的Shasta控制器是一個無DRAM的SoC,用于客戶端系統(tǒng)的28-nm節(jié)點。它使用兩個PCIe Gen3鏈路,在0.9 W峰值功率下提供高達(dá)250,000 IOPS。計劃的升級將使用四個PCIe鏈路,在峰值功率高達(dá)1.35 W時將性能提高一倍。
所有芯片都支持現(xiàn)在的2D和3D NAND,達(dá)到QLC級別。這是一款低延遲芯片,他們還支持東芝的新型XL-Flash,但不支持競爭對手三星的Z-NAND。Tacoma控制器使用XL-Flash,讀取延遲為10-μs。
這家風(fēng)投支持的初創(chuàng)公司在中國大陸、***和美國都設(shè)有辦事處,但他們聲稱與***SSD制造商InnoDisk沒有關(guān)系。該公司已經(jīng)完成了B輪融資,并包括將所有產(chǎn)品投入生產(chǎn),但吳拒絕透露投資者的姓名,也拒絕透露已獲得的融資金額。
“有很多企業(yè)都在這個領(lǐng)域追逐,”Forward Insights的首席分析師Gregory Wong說道,他調(diào)查了大約40家控制器制造商,其中許多企業(yè)都是在中國。“它們應(yīng)用于去年出貨的2.15億客戶端和3000萬服務(wù)器的SSD市場。” Wong估計,客戶端控制器的售價僅為2美元,而服務(wù)器芯片價格可以擴(kuò)展到15美元左右。“這是一個艱難的市場,”他指出,商家的目標(biāo)是效仿Sandforce,是前LSI于2011年收購的一家初創(chuàng)企業(yè)。
Objective Analysis的首席分析師Jim Handy表示:“開發(fā)控制器的成本約為5000萬美元,規(guī)模較小的固態(tài)硬盤公司負(fù)擔(dān)不起這樣的費用,但對于一家獨立公司來說,生產(chǎn)可以向許多小企業(yè)銷售的控制器非常有幫助。如果他們運氣好的話,像英特爾,美光、西部數(shù)據(jù)/ SanDisk這樣的大型SSD制造商會喜歡他們的控制器,并停止生產(chǎn)自己的控制器。” Wong表示NAND閃存的渠道價格已經(jīng)上漲,預(yù)計OEM價格將在今年年底觸底。
其實原本固態(tài)硬盤就具備相當(dāng)龐大的算力,目的是為了要保護(hù)硬盤中的數(shù)據(jù)完整性,這些計算原本就是通過CPU和DSP來進(jìn)行處理,如今額外增加神經(jīng)網(wǎng)絡(luò)計算能力其實也是相當(dāng)合理的事情。而隨著這類設(shè)計的逐漸普及,固態(tài)硬盤具備計算能力后可以創(chuàng)造出更多元的AI應(yīng)用,雖然這類應(yīng)用會先在服務(wù)器中進(jìn)行嘗試,但未來也有可能普及到一般計算環(huán)境的存儲設(shè)備中,借以加速各種AI應(yīng)用中的數(shù)據(jù)處理,并降低系統(tǒng)因子據(jù)傳輸所付出的額外功耗。
-
控制器
+關(guān)注
關(guān)注
112文章
16402瀏覽量
178588 -
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4774瀏覽量
100903 -
AI
+關(guān)注
關(guān)注
87文章
31155瀏覽量
269482
發(fā)布評論請先 登錄
相關(guān)推薦
評論