挑戰(zhàn)傳統(tǒng),打破限制,勇攀高峰,打破常規(guī)者們?cè)趯で箝_(kāi)創(chuàng)性解決方案的過(guò)程中重塑規(guī)則。繼SK海力士品牌短片《誰(shuí)是打破常規(guī)者》播出后,將推出一系列文章,展示公司在重塑技術(shù)、重新定義行業(yè)標(biāo)準(zhǔn)方面采取的各種“打破常規(guī)”的創(chuàng)新舉措。本系列第七篇文章將深入探討SK海力士在CXL技術(shù)領(lǐng)域的研發(fā)進(jìn)展。
當(dāng)今世界離不開(kāi)數(shù)據(jù)的運(yùn)轉(zhuǎn)——網(wǎng)絡(luò)中不斷涌動(dòng)的1和0的數(shù)據(jù)浪潮,為從流媒體服務(wù)到人工智能等各類應(yīng)用提供了源源不斷的動(dòng)力。為了應(yīng)對(duì)這場(chǎng)數(shù)據(jù)洪流,數(shù)據(jù)中心必須采用更先進(jìn)的存儲(chǔ)解決方案,以滿足日益增長(zhǎng)的性能需求。
然而,傳統(tǒng)的存儲(chǔ)器擴(kuò)展方法面臨諸多局限。處理器和存儲(chǔ)技術(shù)的限制,加之?dāng)?shù)據(jù)中心成本和能耗的不斷攀升,愈發(fā)凸顯了對(duì)革命性方法的迫切需求。因此,CXL(Compute Express Link)應(yīng)運(yùn)而生,這是一項(xiàng)具有變革意義的存儲(chǔ)器互聯(lián)技術(shù),旨在解決人工智能時(shí)代所帶來(lái)的挑戰(zhàn)。
本篇Rulebreakers’ Revolutions系列文章將介紹SK海力士在CXL解決方案領(lǐng)域的研發(fā)歷程,詳細(xì)講述公司如何克服行業(yè)規(guī)格缺失等挑戰(zhàn),并為CXL生態(tài)系統(tǒng)做出重要貢獻(xiàn),最終確立其在CXL領(lǐng)域的領(lǐng)先地位。
使命:利用新型互聯(lián)技術(shù)擴(kuò)展存儲(chǔ)容量
在人工智能時(shí)代,數(shù)據(jù)中心亟需不斷擴(kuò)展其存儲(chǔ)容量,以應(yīng)對(duì)日益增長(zhǎng)的數(shù)據(jù)量。然而,采用傳統(tǒng)方法擴(kuò)展存儲(chǔ)容量的成本過(guò)高且效率低下。例如,在單個(gè)CPU系統(tǒng)中添加太字節(jié)(TB)級(jí)存儲(chǔ)容量,將顯著增加總體擁有成本(TCO)1和功耗。試圖通過(guò)增加存儲(chǔ)通道或集成更大容量的存儲(chǔ)器來(lái)解決這一問(wèn)題,往往會(huì)導(dǎo)致能耗和熱量的大幅上升,從而增加冷卻系統(tǒng)和管理成本。這些現(xiàn)象凸顯了設(shè)計(jì)創(chuàng)新型存儲(chǔ)系統(tǒng)的必要性,這些系統(tǒng)能夠以更快、更高效和更具成本效益的方式處理數(shù)據(jù)。
1總體擁有成本(TCO, Total Cost of Ownership):購(gòu)置、安裝和維護(hù)產(chǎn)品的過(guò)程中產(chǎn)生的所有成本,其中包括了采買(mǎi)、能耗及維護(hù)費(fèi)用。
數(shù)據(jù)中心亟需增加存儲(chǔ)容量,
以滿足人工智能時(shí)代日益增長(zhǎng)的需求
過(guò)去十年間,為了滿足市場(chǎng)需求,業(yè)界持續(xù)致力于開(kāi)發(fā)新的存儲(chǔ)器互聯(lián)技術(shù)。這一技術(shù)是指處理器和存儲(chǔ)器之間交換數(shù)據(jù)的方法,在數(shù)據(jù)處理速度和效率方面起到至關(guān)重要的決定性作用。在傳統(tǒng)的存儲(chǔ)架構(gòu)中,存儲(chǔ)器與附近的單個(gè)處理器通過(guò)物理方式連接,當(dāng)應(yīng)用程序未充分使用存儲(chǔ)器時(shí),往往會(huì)導(dǎo)致存儲(chǔ)資源供應(yīng)過(guò)剩。而如CXL等的新興存儲(chǔ)器互聯(lián)技術(shù),則可以通過(guò)允許多個(gè)處理器共享存儲(chǔ)容量來(lái)提高效率,從而解決這一問(wèn)題。
這引發(fā)了業(yè)界對(duì)CXL的極大關(guān)注,然而,由于此項(xiàng)技術(shù)沒(méi)有先例可循,且初期缺乏行業(yè)制定的規(guī)格,所以其開(kāi)發(fā)過(guò)程面臨諸多挑戰(zhàn)。JEDEC固態(tài)技術(shù)協(xié)會(huì)(JEDEC Solid State Technology Association)2所制定的規(guī)格通常是為DRAM產(chǎn)品而設(shè),在缺失此類行業(yè)規(guī)格的情況下,CXL的開(kāi)發(fā)過(guò)程從根本上而言,比一般情況更為復(fù)雜。
2JEDEC固態(tài)技術(shù)協(xié)會(huì)(JEDEC Solid State Technology Association):一個(gè)擁有超過(guò)350家成員公司,負(fù)責(zé)制定全球微電子行業(yè)公開(kāi)標(biāo)準(zhǔn)的領(lǐng)導(dǎo)機(jī)構(gòu)。
在缺乏行業(yè)規(guī)格指導(dǎo)的情況下,SK海力士面臨著開(kāi)發(fā)全新CXL產(chǎn)品以突破存儲(chǔ)器擴(kuò)展壁壘的挑戰(zhàn)。為了應(yīng)對(duì)這一挑戰(zhàn),公司充分發(fā)揮其深厚的內(nèi)部專業(yè)知識(shí),并積極與行業(yè)合作伙伴攜手并進(jìn)。
探索未知:從零開(kāi)始開(kāi)發(fā)開(kāi)創(chuàng)性CXL技術(shù)
自2019年CXL問(wèn)世以來(lái),SK海力士迅速意識(shí)到該技術(shù)能夠滿足日益增長(zhǎng)的存儲(chǔ)容量擴(kuò)展需求。作為一種開(kāi)放性的行業(yè)互聯(lián)技術(shù),CXL統(tǒng)一了存儲(chǔ)器、存儲(chǔ)裝置和處理器等不同系統(tǒng)設(shè)備的接口,支持存儲(chǔ)容量共享等功能,使多個(gè)處理器能夠訪問(wèn)同一存儲(chǔ)器,從而提升數(shù)據(jù)共享效率。同時(shí),它還支持存儲(chǔ)池化(Memory Pooling),將來(lái)自共同存儲(chǔ)池的存儲(chǔ)器分配給不同處理器,以提高效率。此外,CXL還實(shí)現(xiàn)了存儲(chǔ)器切換功能,允許數(shù)百個(gè)設(shè)備(如處理器)在獨(dú)立處理數(shù)據(jù)的同時(shí)共享存儲(chǔ)資源。
除了這些創(chuàng)新功能外,SK海力士在觀察到市場(chǎng)和客戶對(duì)CXL技術(shù)認(rèn)可度不斷增加,并意識(shí)到其在解決技術(shù)和成本挑戰(zhàn)方面的潛力后,對(duì)該技術(shù)的前景愈加堅(jiān)定。然而,公司必須克服一個(gè)重大阻礙才能啟動(dòng)項(xiàng)目,即首先解決行業(yè)規(guī)格缺失的問(wèn)題。因此,在參與CXL標(biāo)準(zhǔn)化工作并與客戶合作確定規(guī)格后,SK海力士迅速著手制定了內(nèi)部基本需求文件。公司還與CXL控制器制造商合作,為規(guī)格文件制定了控制器要求。此外,SK海力士還與JEDEC固態(tài)技術(shù)協(xié)會(huì)和CXL聯(lián)盟(CXL Consortium)3合作,積極推動(dòng)業(yè)內(nèi)CXL標(biāo)準(zhǔn)中DRAM相關(guān)規(guī)范的完善。
3CXL聯(lián)盟(CXL Consortium):一個(gè)致力于制定CXL技術(shù)規(guī)格的開(kāi)放性行業(yè)標(biāo)準(zhǔn)組織。
通過(guò)擴(kuò)展系統(tǒng)存儲(chǔ)容量和帶寬,SK海力士的CXL技術(shù)客服了存儲(chǔ)器擴(kuò)展難題
在協(xié)助制定行業(yè)標(biāo)準(zhǔn)和開(kāi)發(fā)相關(guān)規(guī)格后,SK海力士加快了CXL技術(shù)的研發(fā)。在此過(guò)程中,SK海力士確定了滿足客戶需求的關(guān)鍵標(biāo)準(zhǔn),即成本效益、高容量、優(yōu)化帶寬和可靠性。
首先,成本效益在CXL研發(fā)過(guò)程中至關(guān)重要。抵消CXL控制器高昂成本的關(guān)鍵在于將模塊等存儲(chǔ)介質(zhì)的費(fèi)用降至最低。鑒于高容量對(duì)促進(jìn)大規(guī)模數(shù)據(jù)處理非常重要,公司認(rèn)為CXL存儲(chǔ)器的存儲(chǔ)容量應(yīng)達(dá)到現(xiàn)有DDR產(chǎn)品的2到4倍。此外,必須優(yōu)化帶寬設(shè)計(jì),以充分發(fā)揮CXL模塊的性能潛力。最后,可靠性和數(shù)據(jù)完整性須與主機(jī)存儲(chǔ)器的高標(biāo)準(zhǔn)相匹配,從而贏得客戶的信任。
為了滿足這些標(biāo)準(zhǔn),SK海力士的多個(gè)部門(mén)正在協(xié)同努力,致力于將TB級(jí)存儲(chǔ)器打造成更加經(jīng)濟(jì)高效的解決方案。一方面,公司開(kāi)創(chuàng)性地研發(fā)了存儲(chǔ)池化技術(shù),以實(shí)現(xiàn)多個(gè)設(shè)備之間的資源共享。另一方面,還成功開(kāi)發(fā)了近內(nèi)存處理(NMP, Near-Memory Processing)4技術(shù),從而在數(shù)據(jù)源附近進(jìn)行數(shù)據(jù)處理。這些創(chuàng)新技術(shù)有望為高性能計(jì)算(HPC)、存儲(chǔ)器內(nèi)數(shù)據(jù)庫(kù)和人工智能等領(lǐng)域帶來(lái)顯著優(yōu)勢(shì)。
4近內(nèi)存處理(NMP, Near-memory processing):一種在數(shù)據(jù)存儲(chǔ)附近執(zhí)行計(jì)算的技術(shù),能夠降低延遲并提升人工智能和高性能計(jì)算(HPC)等高帶寬任務(wù)的性能。
通過(guò)這些不懈的努力,SK海力士已成功推進(jìn)了開(kāi)創(chuàng)性CXL產(chǎn)品的研發(fā),這些產(chǎn)品將徹底顛覆存儲(chǔ)器市場(chǎng)。
SK海力士不斷壯大的產(chǎn)品陣容推動(dòng)CXL的未來(lái)發(fā)展
自2022年開(kāi)發(fā)出首款基于DDR5的CXL樣品以來(lái),SK海力士不斷加強(qiáng)其CXL產(chǎn)品陣容,其中包括創(chuàng)新型CMM-DDR5(CXL Memory Module-Double Data Rate 5)。采用第五代高速PCIe連接,CMM-DDR5可確保流暢、快速的數(shù)據(jù)處理。同時(shí),CMM-DDR5提供高達(dá)128GB的容量,可滿足當(dāng)今人工智能和高性能計(jì)算應(yīng)用對(duì)高容量的需求。此外,該模塊還具有高水平的電源效率和安全性。
真實(shí)性能測(cè)試突顯了CMM-DDR5所帶來(lái)的變革性影響。與僅搭載DDR5 DRAM的系統(tǒng)相比,該產(chǎn)品可將系統(tǒng)帶寬提升82%,容量提升100%。測(cè)試結(jié)果進(jìn)一步表明,在人工智能運(yùn)行時(shí),每秒令牌性能(Token Per Second Performance)提升高達(dá)31%。而在高性能計(jì)算領(lǐng)域,其吞吐量效率更是躍升33%。CMM-DDR5不僅展現(xiàn)出卓越的性能表現(xiàn),同時(shí)符合JEDEC固態(tài)技術(shù)協(xié)會(huì)和CXL聯(lián)盟的標(biāo)準(zhǔn)。目前,隨著CMM-DDR5產(chǎn)品逐步邁向量產(chǎn)階段,客戶正在積極開(kāi)展對(duì)其進(jìn)行驗(yàn)證和認(rèn)證的工作。
SK海力士基于CXL的CMM-DDR5,可有效提升人工智能和高性能計(jì)算的性能
SK海力士的其他CXL解決方案還包括Niagara 2.0,這是一款集成硬件和軟件的綜合性解決方案,允許多臺(tái)主機(jī)高效共享大型存儲(chǔ)池,從而最大限度地減少未利用或未被充分利用的存儲(chǔ)容量。此外,CMM-Ax(CXL Memory Module-Ax)則是一種針對(duì)計(jì)算工作負(fù)載而優(yōu)化設(shè)計(jì)的高性能內(nèi)存模塊,在提高人工智能和數(shù)據(jù)中心效率方面表現(xiàn)突出。
除了在硬件領(lǐng)域的顯著進(jìn)步,SK海力士還開(kāi)發(fā)了異構(gòu)存儲(chǔ)器軟件開(kāi)發(fā)套件(HMSDK,Heterogeneous Memory Software Development Kit),以最大限度地發(fā)揮其CXL存儲(chǔ)器的潛力。該軟件工具包已成功集成到Linux操作系統(tǒng)中,進(jìn)一步提高了其可訪問(wèn)性和實(shí)用性。硬件和軟件解決方案的協(xié)同開(kāi)發(fā)及其標(biāo)準(zhǔn)化工作,彰顯了SK海力士對(duì)致力于創(chuàng)建一個(gè)蓬勃發(fā)展的CXL生態(tài)系統(tǒng)的不懈追求。
打破常規(guī)者專訪:下一代存儲(chǔ)器與存儲(chǔ)裝置部,崔源夏(Thomas)
本文采訪了下一代存儲(chǔ)器與存儲(chǔ)裝置部門(mén)的杰出工程師(DE,Distinguished Engineer)5崔源夏(Thomas),深入探討了公司在CXL技術(shù)開(kāi)發(fā)方面取得的突破性思維。崔源夏負(fù)責(zé)JEDEC固態(tài)技術(shù)協(xié)會(huì)和CXL聯(lián)盟的標(biāo)準(zhǔn)化工作,并為CXL等下一代存儲(chǔ)器開(kāi)辟道路,采訪中他詳細(xì)闡述了CXL的發(fā)展歷程以及其未來(lái)可能帶來(lái)的影響。
5杰出工程師(DE, Distinguished Engineer):是SK海力士的資深工程師,在各自領(lǐng)域出類拔萃,負(fù)責(zé)解決技術(shù)難題并指導(dǎo)下一代人才。
Q在研發(fā)行業(yè)領(lǐng)先的CXL技術(shù)時(shí),您和您的團(tuán)隊(duì)如何展現(xiàn)出打破常規(guī)的思維?
A“在CXL研發(fā)過(guò)程中,我們秉持SK海力士VWBE6理念的工作原則,并借鑒DRAM和NAND閃存產(chǎn)品的豐富研發(fā)經(jīng)驗(yàn),主動(dòng)向客戶提出工作方法和初步的CXL需求設(shè)想。提前明確需求為我們深入探索CXL技術(shù)創(chuàng)造了更多機(jī)會(huì),最終成功研發(fā)出首款CXL存儲(chǔ)器產(chǎn)品。”
6自覺(jué)自愿地發(fā)揮才智(VWBE, Voluntarily and Willing Brain Engagement):是SK管理體系(SKMS)中強(qiáng)調(diào)的員工價(jià)值觀之一。
“對(duì)我而言,我構(gòu)想了一種將標(biāo)準(zhǔn)化和驗(yàn)證方法相結(jié)合,以融合DRAM和NAND閃存的創(chuàng)新方法論,并在CXL聯(lián)盟中獨(dú)立提出并完善了與DRAM相關(guān)的功能。通過(guò)這些努力,我深感自豪能夠?yàn)楣咀畛醯腃XL部署戰(zhàn)略貢獻(xiàn)一份力量。這表明,即便像探索CXL那樣踏入未知領(lǐng)域,我們也可以憑借自身的創(chuàng)新精神和堅(jiān)韌毅力,找到解決新問(wèn)題的答案。”
“此外,我自愿在JEDEC固態(tài)技術(shù)協(xié)會(huì)和CXL聯(lián)盟中擔(dān)任要職,以此助力公司在標(biāo)準(zhǔn)化工作領(lǐng)域的地位不斷提升。”
Q您如何看待CXL在未來(lái)人工智能生態(tài)系統(tǒng)中的發(fā)展?
A“CXL有望被構(gòu)建成一個(gè)能夠?qū)崿F(xiàn)超大存儲(chǔ)容量共享的生態(tài)系統(tǒng)。若要在人工智能時(shí)代進(jìn)一步拓展其應(yīng)用,CXL亟需支持計(jì)算節(jié)點(diǎn),以確保1TB以上的高性價(jià)比存儲(chǔ)器可以按需提供帶寬,并在存儲(chǔ)層面保持可靠性和安全性。這將有助于降低總體擁有成本,提高系統(tǒng)平臺(tái)內(nèi)的存儲(chǔ)器利用率。”
“構(gòu)建如此龐大的生態(tài)系統(tǒng),絕非SK海力士一己之力所能實(shí)現(xiàn)。這需要GPU和CPU制造商、CXL控制器和交換機(jī)供應(yīng)商,以及CXL知識(shí)產(chǎn)權(quán)(IP)公司的緊密協(xié)作。我們計(jì)劃與這些機(jī)構(gòu)攜手合作,以進(jìn)一步推動(dòng)和壯大CXL生態(tài)系統(tǒng)。”
-
處理器
+關(guān)注
關(guān)注
68文章
19404瀏覽量
230774 -
存儲(chǔ)器
+關(guān)注
關(guān)注
38文章
7528瀏覽量
164183 -
人工智能
+關(guān)注
關(guān)注
1794文章
47642瀏覽量
239630 -
SK海力士
+關(guān)注
關(guān)注
0文章
973瀏覽量
38638
原文標(biāo)題:[Rulebreakers’ Revolutions] CXL技術(shù)如何在人工智能時(shí)代擴(kuò)展數(shù)據(jù)中心存儲(chǔ)容量的極限
文章出處:【微信號(hào):SKhynixchina,微信公眾號(hào):SK海力士】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論