11月1日,在2023云棲大會上,阿里巴巴平頭哥發(fā)布旗下首顆為云計算場景深度定制的SSD主控芯片鎮(zhèn)岳510,正式進軍企業(yè)級SSD市場!
平頭哥這顆SSD芯片
從性能看,可以支持3400K IOPS的能力,在業(yè)界屬于第一梯隊。一枚鎮(zhèn)岳510的性能,相當于1萬塊高性能HDD的性能總和。
從能效比來說,每瓦功耗可提供420K IOPS的性能,是業(yè)界領(lǐng)先水平。
從時延角度看,實現(xiàn)了業(yè)界領(lǐng)先的超低的時延(4μs),比業(yè)界SSD降低30%以上。
從可靠性來說,誤碼率低至10^-18的UBER,相當于每讀取百億億筆數(shù)據(jù),才可能有一筆數(shù)據(jù)糾錯失敗,比業(yè)內(nèi)標桿領(lǐng)先一個數(shù)量級。
從第一款當時全球性能最強的AI專用芯片含光800,到高性能RISC-V架構(gòu)處理器玄鐵910,再到首款CPU芯片倚天710,平頭哥在給自家產(chǎn)品的取名上,就偏愛用中國上古和武俠中的“神兵利劍”來命名。而這次的鎮(zhèn)岳510,更是玄鐵所鑄的高性能、高可靠、高能效及低延時的鎮(zhèn)岳利劍!
阿里盤古遇上鎮(zhèn)岳,必將所向披靡!平頭哥SSD產(chǎn)品負責人周冠鋒透露說,鎮(zhèn)岳510馬上就要進入量產(chǎn)階段,將率先在阿里云數(shù)據(jù)中心部署。這顆取名鎮(zhèn)岳510的芯片,定位于高端大端口企業(yè)級SSD,可應用于AI、在線分析、在線交易、大數(shù)據(jù)分析、高性能數(shù)據(jù)庫等云上應用場景。
01
首顆SSD芯片是如何煉成的
為什么這個時間點推出?
算力、網(wǎng)力、存力,共同構(gòu)筑了云計算的基礎(chǔ)。在云服務和AI計算需求逐漸旺盛的背景下,芯片的布局不僅關(guān)系著云廠商的成本,更是企業(yè)生態(tài)發(fā)展的重要一步。
為了滿足云上業(yè)務的迅猛發(fā)展,網(wǎng)絡(luò)正從25GE、100GE、200GE快速演進,并將進入400GE、800GE時代。而以SSD為代表的存力,同樣面臨著新的挑戰(zhàn)和訴求。
SSD是計算機系統(tǒng)的核心存儲部件,涵蓋閃存芯片(數(shù)據(jù)的最終存儲地)、內(nèi)存芯片(用于暫存SSD內(nèi)的眾多管理表項、數(shù)據(jù)緩存)以及SSD主控芯片。SSD主控芯片是SSD的大腦,負責主機交互、協(xié)議解析與執(zhí)行、數(shù)據(jù)讀寫、數(shù)據(jù)糾錯、數(shù)據(jù)管理、后臺任務、帶外管理等。可以說,SSD的功能、性能與可靠性均由其實現(xiàn)。
SSD每隔三四年會進行一次產(chǎn)品迭代演進。之前會從PCle3.0、 PCle4.0到今天,2023年是SSD從PCle4.0到PCle5.0的一個演進節(jié)點。
周冠鋒表示:“因此,平頭哥就提前規(guī)劃了這顆PCle5.0的SSD芯片來應對市場上的這個趨勢。”
鎮(zhèn)岳510,是一顆怎樣的芯片?
鎮(zhèn)岳510采用平頭哥自研的芯片架構(gòu),內(nèi)置高性能的玄鐵910 RISC-V多核CPU,采用平頭哥自研緊耦合芯片架構(gòu),對SSD任務進行高度抽象,可固化任務硬化為加速算子以提升性能。FTL關(guān)鍵任務則運行于玄鐵910CPU以保持靈活性。
整個資源架構(gòu)里面大量的采用了硬件加速模塊,可以實現(xiàn)非常高的性能,實現(xiàn)了很高的能效比。因為獨創(chuàng)設(shè)計了創(chuàng)新的前端IO硬件自動處理機制,由專用硬件模塊自動完成,實現(xiàn)了業(yè)界領(lǐng)先的超低的時延(4μs),比業(yè)界SSD降低30%以上。不僅如此,鎮(zhèn)岳510芯片內(nèi)實現(xiàn)了IO/SYS/GC的全鏈路隔離,極大的降低這些任務之間的相互干擾,提供了既低又穩(wěn)定的時延表現(xiàn)。
此外,鎮(zhèn)岳510內(nèi)置平頭哥自研的高性能LDPC糾錯算法,編碼效率逼近香農(nóng)極限,同時ErrorFlow相比業(yè)內(nèi)SSD更優(yōu)一個數(shù)量級;同時借助平頭哥自研閃存電壓預測算法,可以在各種閃存的不同工況、壽命、溫度等條件下,準確預測閃存電壓漂移,進一步降低LDPC解碼器的輸入誤碼率。其實現(xiàn)了低至10^-18的UBER,相當于每讀取百億億筆數(shù)據(jù),才可能有一筆數(shù)據(jù)糾錯失敗。
綠色、減碳是云數(shù)據(jù)中心的一貫追求。以更低的功耗,提供更高的性能,是SSD的重要挑戰(zhàn)。鎮(zhèn)岳510每秒可處理高達340萬筆IO,一枚鎮(zhèn)岳510的性能,相當于1萬塊高性能HDD的性能總和。
此外鎮(zhèn)岳510擁有極高的能效比,每瓦功耗可提供42萬筆IO訪問。以一個部署了10萬塊SSD的數(shù)據(jù)中心為例,相比目前主流的PCIe 4.0SSD,鎮(zhèn)岳510在相同的性能下,僅主控芯片即每年節(jié)省260萬度電,按照一度電排放0.785千克二氧化碳計算,每年可減少二氧化碳排放2千噸。
平衡靈活性和高效能的關(guān)鍵:軟硬件協(xié)同發(fā)展
SSD主控芯片其實也是一種SOC, 它內(nèi)部既有硬件模塊,也有CPU核。事實上,SSD主控芯片并不是一種標準化的設(shè)計,每一家公司的設(shè)計方案都不太相同。業(yè)界SSD主控芯片的架構(gòu)設(shè)計有兩大趨勢,一種類似純SOC, 即由軟件主打的設(shè)計方案;另一類是軟硬件結(jié)合的設(shè)計方案。
鎮(zhèn)岳510屬于后者。
周冠鋒介紹說,鎮(zhèn)岳510自2021年上半年立項后,耗費了非常長的時間去反復論證芯片的架構(gòu)設(shè)計。芯片設(shè)計其實是一個權(quán)衡的過程,如果把過多的功能卸載,使用硬件加速來實現(xiàn)的話,那么這顆芯片的靈活性就會比較差。但如果把過多的功能交由CPU軟件來使用的話,它的靈活性同樣會比較差。如果既能通過硬件加速獲得高效的同時,仍能保留使用CPU來運行一些關(guān)鍵的軟件任務,這樣獲得的靈活性將會大大提高。
鎮(zhèn)岳510采用的是平頭哥自研的芯片架構(gòu)。這顆芯片支持PCle5.0的主機接口,支持DDR5.0的內(nèi)存接口,內(nèi)置了高性能的RISC-V CPU。此外,整個資源架構(gòu)里面采用了比較獨特的硬件加速模塊,在應用中進行大量的卸載加速,能實現(xiàn)高性能與低能耗。
所以鎮(zhèn)岳510可以實現(xiàn)非常高的性能。大批量的硬件加速模塊的使用,極大的提高了產(chǎn)品的能效比,達到每瓦420k IOPS性能。除此之外,鎮(zhèn)岳510還實現(xiàn)了非常低的訪問時延。這也是因為平頭哥獨創(chuàng)的設(shè)計了前端IO的硬件自動處理機制。
在EETOP特別針對RISC-V的提問中,周冠鋒最后總結(jié)說到:“RISC-V這顆CPU和它的指令集都非常精簡,運行效率也很高,同時它還是開源的,所以平頭哥SSD芯片的設(shè)計團隊最終選擇了我們認為一個最平均、最平衡的一個設(shè)計方案。”
02
鎮(zhèn)岳510,為云做了哪些定制
首先,在傳統(tǒng)的系統(tǒng)方案中,SSD與存儲系統(tǒng)分離設(shè)計。SSD負責底層閃存數(shù)據(jù)排布,但由于沒有存儲語義而無法達到最佳排布;SSD負責后臺任務,但無法判斷最佳啟停時機;而存儲系統(tǒng)有存儲語義卻無法排布閃存數(shù)據(jù),有最佳時機卻無法啟停SSD后臺任務。上下的割裂給整個存儲系統(tǒng)的性能與壽命帶來了額外消耗,這被稱為“SSD接口稅”。
解決辦法就是ZNS。它是一種標準的協(xié)議接口,2021年5月被收入NVMe2.0協(xié)議中,并得到了SPDK、Linux以及各設(shè)備商的支持。ZNS通過將盤內(nèi)FTL層上移至存儲系統(tǒng),達到了存儲系統(tǒng)與閃存特性的完美匹配,消減了“SSD接口稅”。
鎮(zhèn)岳510完美實現(xiàn)了ZNS協(xié)議,通過靈活的硬件表項加速保持了高IO性能,而Zone分區(qū)狀態(tài)則交由玄鐵910CPU維護,保留了對新協(xié)議的靈活性。此外,鎮(zhèn)岳510定制了Last Sector 隨機寫功能,實現(xiàn)了小報文的多次反復下盤,簡化了ZNS的應用難度。
其次,數(shù)據(jù)請求可以分為帶寬敏感型與時延敏感型,不同的請求應予以不同的處理策略,才能達到業(yè)務最佳SLA。NVMe規(guī)范中制定了以隊列為粒度的標準SQ調(diào)度機制,但其靈活性較差,對于業(yè)務種類復雜、追求靈活可配的云存儲系統(tǒng)來說,它并不是最佳選擇。
鎮(zhèn)岳510在支持NVMe標準的SQ調(diào)度機制的同時,額外定制了基于IO粒度的優(yōu)先級調(diào)度機制,允許系統(tǒng)按IO打標,優(yōu)先級種類多達8級,結(jié)合云存儲系統(tǒng),能夠更好的保障延遲敏感型業(yè)務的服務質(zhì)量。
此外,云存儲系統(tǒng)的完整數(shù)據(jù)鏈路,從計算端開始,通過網(wǎng)絡(luò)到存儲服務器,再通過內(nèi)部互聯(lián)到達SSD。為了保障數(shù)據(jù)的高可靠,全鏈路應采用語義一致的完整性校驗。但NVMe規(guī)范只規(guī)定了以Sector為單位按照T10 DIF/DIX的校驗機制,與存儲系統(tǒng)的語義并不相同,因此SSD的校驗與存儲系統(tǒng)的校驗產(chǎn)生了差異。
鎮(zhèn)岳510以IO為粒度,遵循上層存儲語義進行校驗,補齊了整個存儲系統(tǒng)的數(shù)據(jù)鏈路校驗的最后一環(huán)。不僅如此,鎮(zhèn)岳510還支持以存儲語義對內(nèi)部數(shù)據(jù)進行后臺巡檢,而無需再讀出至服務器,節(jié)省了寶貴的PCIe帶寬、服務器內(nèi)存帶寬與CPU算力。
周冠鋒介紹說,因為云廠商,尤其是阿里云擁有全棧的軟件的核心技術(shù)。所以在這種情況下,平頭哥有機會通過阿里云與軟件棧和底層芯片之間做配合,來實現(xiàn)更好的特性,更好的實現(xiàn)云上應用性能的提升。并且,隨著云技術(shù)進入深水區(qū),云開始與底層芯片全方位融合聯(lián)合設(shè)計,可提供更好的用戶體驗。
不過,鎮(zhèn)岳510的生命力肯定不僅僅在阿里云上止步。鎮(zhèn)岳510其實是為云上應用做優(yōu)化的,它不僅僅可以適用于阿里云。因其具備的更強存力、更高可靠等特點,可通過為云定制,帶來更優(yōu)秀的存儲體驗。
周冠鋒表示:“其實在外部的不同的云環(huán)境下都是適用的。只是,鎮(zhèn)岳510會首先在阿里云上上線使用!”
03
結(jié)束語
平頭哥的業(yè)務重心是在數(shù)據(jù)中心領(lǐng)域的芯片開發(fā)。數(shù)據(jù)中心領(lǐng)域的芯片,一類是純計算類芯片,一類是存儲類芯片。此前平頭哥推出過多款性能強勁的芯片,如含光800 AI專用推理芯片、倚天710首款通用CPU芯片等。但它們都屬于算力芯片,而這一次平頭哥實現(xiàn)對自己的突破,設(shè)計出自己的第一顆企業(yè)級SSD芯片,補齊其在存儲領(lǐng)域的空白。相信對平頭哥來說,是一次里程碑式的突破。
憶平頭哥初創(chuàng)的決心:要為國內(nèi)的芯片行業(yè)貢獻出自己的一份力量。自2019年成立以來,短短幾年時間,平頭哥一次又一次為***交上力滿意的佳作,刷新業(yè)界對平頭哥的認知,更刷新大家對中國芯片企業(yè)實力的認知!
平頭哥已經(jīng)掌握了SSD主控芯片設(shè)計的全部技術(shù)。一顆芯片要想有更強的生命力,就需要對它的應用場景有深入的理解,才能更好的用在用戶場景下。平頭哥對阿里巴巴的業(yè)務,尤其是阿里云業(yè)務有更深刻的理解。平頭哥跟阿里云聯(lián)合定制,使得這顆芯片在云上應用的時候,可以讓整個存儲系統(tǒng)的性能、能效和服務質(zhì)量更好。
對于平頭哥在SSD領(lǐng)域未來的發(fā)展,周冠鋒表示:“我們還將繼續(xù)沿著高端企業(yè)級這條路線進行演進,不過不會拓展到消費級和車規(guī)工規(guī)級。”
-
SSD
+關(guān)注
關(guān)注
21文章
2868瀏覽量
117552 -
芯片行業(yè)
+關(guān)注
關(guān)注
1文章
28瀏覽量
7905 -
平頭哥
+關(guān)注
關(guān)注
0文章
64瀏覽量
9081
原文標題:平頭哥發(fā)布首顆PCle5.0 SSD主控芯片鎮(zhèn)岳510!4μs超低時、誤碼率領(lǐng)先行業(yè)標桿一個數(shù)量級!
文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論