原文發(fā)布于 DOIT 傳媒,轉(zhuǎn)載已獲授權(quán)。
站得高才能夠看得遠(yuǎn),作為“藍(lán)色巨人”,IBM 數(shù)據(jù)存儲(chǔ)領(lǐng)域擁有足夠多的積累和榮耀,無論何時(shí)何地, IBM 對(duì)存儲(chǔ)的洞察都應(yīng)該引起我們高度關(guān)注。不僅如此,IBM 存儲(chǔ)產(chǎn)品和解決方案也總會(huì)帶來意想不到的驚喜和收獲。
2023 存儲(chǔ)峰會(huì) (FMW) 期間,存儲(chǔ)在線總編宋家雨特邀IBM 副總裁、大中華區(qū)存儲(chǔ)及中國區(qū) Power 業(yè)務(wù)總經(jīng)理候淼結(jié)合閃存技術(shù)市場的熱點(diǎn)進(jìn)行了專訪。
存儲(chǔ)在線總編宋家雨(左一)與 IBM 副總裁、大中華區(qū)存儲(chǔ)及中國區(qū) Power 業(yè)務(wù)總經(jīng)理候淼(右一)新聞會(huì)客廳訪談
宋家雨:最近 IBM 存儲(chǔ)在品牌方面有些調(diào)整,把原來 IBM Spectrum 調(diào)整為 IBM Storage,這個(gè)動(dòng)作的背后是怎樣的一個(gè)戰(zhàn)略布局?
侯淼:IBM 存儲(chǔ)剛剛調(diào)整了整個(gè)產(chǎn)品線命名,從 IBM Spectrum 調(diào)整為 IBM Storage,精簡了。IBM 存儲(chǔ)產(chǎn)品線比以前更加專注了,通過命名的改變,希望能夠使品牌更加突出,突出 IBM+Storage。因?yàn)槲覀兛吹剑瑪?shù)據(jù)增長變得越來越快,數(shù)據(jù)量越來越大,IBM Storage 業(yè)務(wù)會(huì)成為重要的業(yè)務(wù)發(fā)展領(lǐng)域。
IBM 存儲(chǔ)品牌戰(zhàn)略調(diào)整,跟 IBM 公司整體戰(zhàn)略是分不開的。
IBM 在 2019 年收購了 Red Hat,今年我們剛剛發(fā)布了 watsonx, IBM 整個(gè)公司戰(zhàn)略圍繞兩大主線來展開,一個(gè)代表混合云,一個(gè)代表人工智能。
混合云主要是圍繞紅帽 OpenShift 底座,為客戶打造一個(gè)端到端的混合云策略,上可以支持微服務(wù),對(duì)下可以支持容器,這樣把客戶的硬件、軟件資源統(tǒng)一結(jié)合起來,這是 IBM 很重要的策略。
針對(duì)人工智能,特別是今年 7 月份 IBM 剛剛推出的 watsonx,它分為 watsonx.ai、watsonx.data 和 watsonx.governance。其中,watsonx.ai 主要是作為 AI 開發(fā)平臺(tái),為客戶生成模型提供相關(guān)的底座和支持,包括模型的訓(xùn)練、驗(yàn)證、調(diào)優(yōu)和部署。watsonx.data 是湖倉一體的結(jié)構(gòu),跟存儲(chǔ)也是緊密相關(guān)的。watsonx.governance 為整個(gè)人工智能應(yīng)用提供監(jiān)管,包括管理的平臺(tái)。這三個(gè)產(chǎn)品會(huì)支撐 IBM 戰(zhàn)略的另外一個(gè)主線,也就是人工智能。
IBM 現(xiàn)在有基礎(chǔ)架構(gòu)和軟件業(yè)務(wù),還有企業(yè)咨詢服務(wù),所有這些部門的產(chǎn)品和解決方案都是圍繞以上兩個(gè)主線來展開,我們會(huì)比以前更加專注。圍繞這個(gè)主線,IBM 對(duì)存儲(chǔ)整個(gè)產(chǎn)品線進(jìn)行了調(diào)整,以前我們是以盤(閃盤)、帶(磁帶)、閃存這樣的語言進(jìn)行描述,未來我們的產(chǎn)品線會(huì)圍繞三塊: 第一塊是人工智能存儲(chǔ);第二塊是混合云存儲(chǔ);第三塊是數(shù)據(jù)保護(hù)存儲(chǔ)。我們實(shí)際上把硬件、軟件結(jié)合,首先會(huì)有一個(gè)軟件的平臺(tái)和引擎作為關(guān)鍵的組成部分;然后是相關(guān)硬件,包括盤和帶,為客戶提供針對(duì) AI 場景、混合云場景以及數(shù)據(jù)保護(hù)場景的解決方案。
宋家雨:您能否結(jié)合這兩個(gè)場景,介紹一下 IBM 存儲(chǔ)的一些獨(dú)特思考?
侯淼:如果把數(shù)據(jù)源的數(shù)據(jù)分成兩類,一類是結(jié)構(gòu)化的,一類是非結(jié)構(gòu)化的,實(shí)際上你會(huì)發(fā)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)增長是非常快的,這里包括像文件、對(duì)象、聲音、圖像等數(shù)據(jù),對(duì)此,我們投入技術(shù)、研發(fā)力量幫助客戶去尋找這種這種非結(jié)構(gòu)化數(shù)據(jù)的價(jià)值,提供相應(yīng)的管理方案。
人工智能處理的數(shù)據(jù)大部分 (80%-90%) 都是非結(jié)構(gòu)化數(shù)據(jù),針對(duì)這些數(shù)據(jù)的管理和應(yīng)用,IBM 存儲(chǔ)的一個(gè)主要解決方案就是 IBM Storage Scale 的產(chǎn)品家族,來優(yōu)化和簡化數(shù)據(jù)的訪問和存儲(chǔ)。
還有一個(gè)角度是幫助客戶去實(shí)現(xiàn)數(shù)據(jù)的云化,這里最核心的就是容器化。所以我們的混合云存儲(chǔ),特別是我們推出的閃存產(chǎn)品,針對(duì)容器化去支持紅帽 OpenShift 混合云平臺(tái),滿足客戶在混合云和私有云構(gòu)建。
現(xiàn)在混合云應(yīng)用有一個(gè)比較大的變化,就是很多客戶開始逐漸將應(yīng)用容器化,對(duì)于硬件來講,容器化的好處在于能夠大幅度地去提高硬件的利用率,因?yàn)橐郧耙粋€(gè)機(jī)器支持幾百個(gè)虛機(jī)就可以了,但是容器化能支持上千規(guī)模,使利用率能夠大幅度提高,減少客戶在硬件上的購買成本,這是它的重要價(jià)值。
隨著軟件應(yīng)用變得更加敏捷,部署也能夠越來越快,不需要花很多周期和時(shí)間。圍繞這樣一個(gè)改變,很多客戶使用容器化軟件去實(shí)現(xiàn)生產(chǎn)系統(tǒng)。對(duì)于生產(chǎn)系統(tǒng),不可避免會(huì)談到備份、容災(zāi),包括恢復(fù)的功能,而這也是 IBM 最強(qiáng)的部分。
通過我們的軟件跟 OpenShift 相結(jié)合,能夠支持客戶實(shí)現(xiàn)生產(chǎn)系統(tǒng)的容器化,然后做容災(zāi)備份一整套解決方案。換句話來講,我們是為企業(yè)客戶在做混合云時(shí),提供端到端的架構(gòu),使它能夠不單單能滿足容器化帶來的好處,而且也能滿足生產(chǎn)系統(tǒng)所具有的可靠性、穩(wěn)定性和安全性的要求。
宋家雨:圍繞 watsonx,在 AIGC 領(lǐng)域,IBM 存儲(chǔ)有哪些獨(dú)特的優(yōu)勢和思考,能不能分享一下?
侯淼:實(shí)際上人工智能這幾年是一個(gè)高潮,GPU 被大量在 AI 中使用。IBM 在人工智能方面,倡導(dǎo)從 +AI 到 AI+,就是以前是在原有系統(tǒng)上加一些人工智能的功能,今天要做的是用人工智能去替代原有的系統(tǒng),使它更加自動(dòng)化。
我們有一個(gè)基本的框架,這個(gè)框架就是數(shù)據(jù)、模型、算力和存力。針對(duì)基礎(chǔ)構(gòu)架去支持大模型,通過生成式的大模型,支持?jǐn)?shù)據(jù)的分析和提煉,其中基礎(chǔ)架構(gòu)是最主要的平臺(tái)。它有兩個(gè)關(guān)鍵支柱,一個(gè)是算力,一個(gè)是存力,我覺得這個(gè)說法可能只在中國有,因?yàn)樵趪舛冀凶?computing、Storage,中國語言則體現(xiàn)出一個(gè)“力”。
存力包括兩部分:一是要有一個(gè)存儲(chǔ)平臺(tái),是能夠進(jìn)行數(shù)據(jù)的存取;二是“力”,代表一種能力,這個(gè)能力能夠支持人工智能的模型和算力能力的發(fā)揮,所以在人工智能存力里,對(duì)存儲(chǔ)有不一樣的要求。一方面是要求高性能,因?yàn)楝F(xiàn)在 GPU 會(huì)越來越快,而且 GPU 對(duì)存儲(chǔ)的要求是吞吐量越來越大,想要數(shù)據(jù)的話能及時(shí)提供 I/O。GPU 資源越來越貴,存儲(chǔ)的價(jià)值就在于怎么能夠減少 GPU 的等待時(shí)間,減少 GPU 等待帶來的浪費(fèi),這很關(guān)鍵,所以人工智能存儲(chǔ)第一個(gè)特點(diǎn)就是要高性能。為了做到高性能,這類存儲(chǔ)要支持英偉達(dá)的 GPU 直連,通過支持 DGS 協(xié)議,使企業(yè)的數(shù)據(jù)和性能能夠提升一倍以上,這是第一個(gè)高性能。
第二個(gè)就能夠進(jìn)行線性水平擴(kuò)展,你很難能夠去預(yù)測未來的增長,所以所有這類系統(tǒng)都是分布式的。要求存儲(chǔ)也要是分布式,能夠線性擴(kuò)展,但是分布式跟線性擴(kuò)展是兩個(gè)概念。分布式是能夠擴(kuò)展到上百、上千個(gè)節(jié)點(diǎn),但是當(dāng)你擴(kuò)展到上百、上千個(gè)節(jié)點(diǎn)時(shí),它的性能是否能跟得上?IBM Storage Scale 軟件能解決分布式存儲(chǔ)擴(kuò)展時(shí)的性能問題,實(shí)現(xiàn)線性水平擴(kuò)展。
安全性、備份、可靠性則是第三個(gè)需求。我覺得這三個(gè)結(jié)合起來,這個(gè)存力就能夠支持企業(yè)在人工智能領(lǐng)域所需要的基礎(chǔ)存儲(chǔ)要求了。
宋家雨:您能不能具體介紹一下 IBM 存儲(chǔ)和英偉達(dá)算力解決方案的合作?
侯淼:IBM 跟英偉達(dá)公司的合作由來已久,就在近幾年,2018 年 IBM 和英偉達(dá)一起聯(lián)合支持美國能源部的項(xiàng)目,當(dāng)時(shí)是用 IBM 的 Power CPU,采用英偉達(dá) NVLink 總線進(jìn)行互聯(lián),英偉達(dá)選中了 Tesla GPU 加 IBM Storage Scale System(下文簡稱為 SSS,原 ESS)產(chǎn)品,這三款產(chǎn)品結(jié)合在一起。因?yàn)槿斯ぶ悄苡?jì)算跟高性能計(jì)算是類似,都需要很強(qiáng)的算法,無論是浮點(diǎn)(運(yùn)算)還是整型(運(yùn)算)。英偉達(dá)在它的一些方案,包括 DGX SuperPOD 都是采用 IBM 的 SSS 產(chǎn)品作為存儲(chǔ)的存力。
IBM 現(xiàn)在所發(fā)布的 SSS 產(chǎn)品也拿到了英偉達(dá)的官方認(rèn)證,支持 DGX SuperPOD 的 GPU 直連,而且有完整的測試,從兩個(gè)節(jié)點(diǎn),到 4~8 個(gè)節(jié)點(diǎn),我們推薦不同類型的產(chǎn)品組合。IBM 單模塊能夠去支持 125 GB/s 的帶寬傳輸能力,這是現(xiàn)在業(yè)內(nèi)最快的。同時(shí)我們能夠?qū)崿F(xiàn)上百、上千個(gè)模塊的水平線性擴(kuò)展,所以這個(gè)方案能滿足英偉達(dá) GPU 對(duì)數(shù)據(jù)存儲(chǔ)的需要。
回到剛才我談三個(gè)能力,有一個(gè)是高性能,包括剛才我談到支持 GPU 直連,包括最快速的單模塊 125 GB/s 傳輸能力。另外一個(gè)能力是線性擴(kuò)展,IBM 現(xiàn)在的一個(gè)主要解決方案是 IBM Storage Scale 存儲(chǔ)軟件,以前叫 GPFS,這個(gè)軟件是分布式文件系統(tǒng),客戶比較多,它的特點(diǎn)在于:第一,它是全域命名管理,能夠支持不同存儲(chǔ)協(xié)議的數(shù)據(jù)能夠交互,包括像云原生 S3、NFS 等,它有特殊的本地緩存的算法,能夠在你訪問遠(yuǎn)程之前提前去預(yù)測這個(gè)數(shù)據(jù)是不是在遠(yuǎn)程,能夠先拿到數(shù)據(jù)。通過這種方式,即使水平擴(kuò)展上百個(gè)節(jié)點(diǎn)、上千個(gè),它能夠通過預(yù)測提高性能,盡可能少衰減,這也是它非常大的優(yōu)勢,也是國內(nèi)包括國外很多分布式存儲(chǔ)用它作為核心數(shù)據(jù)底座的原因。
第三,很多客戶用人工智能進(jìn)行訓(xùn)練之后,特別是進(jìn)行推理和使用,數(shù)據(jù)會(huì)越增長越快。這些增長的數(shù)據(jù),要考慮歸檔和備份的問題。IBM 較其他存儲(chǔ)的廠家,我們有比較深的、完整的一個(gè)存儲(chǔ)產(chǎn)品解決方案,我們通過 IBM SSS 3500 產(chǎn)品作為一級(jí)存儲(chǔ),去跟英偉達(dá)的 DGX 服務(wù)器配合使用。
同時(shí),當(dāng)數(shù)據(jù)變得越來越多,很多數(shù)據(jù)使用頻度降低時(shí),數(shù)據(jù)開始從熱數(shù)據(jù)變成溫?cái)?shù)據(jù)和冷數(shù)據(jù),我們就開始考慮后面的歸檔,包括備份方案,這里包括文件歸檔、目標(biāo)存儲(chǔ)的歸檔,還有系統(tǒng)通過自帶歸檔,我們有一整套的方案去滿足客戶對(duì)人工智能存力的要求。
宋家雨:在未來 IBM 存儲(chǔ)的規(guī)劃之中,生成式 AI 部分會(huì)更加依賴于 Watson 嗎?
侯淼:我覺得您說了一個(gè)很好的題目,Watson 這個(gè)名稱來自 IBM 的創(chuàng)始人老沃森,后來也成為了 IBM 研發(fā)實(shí)驗(yàn)室的名稱——IBM Watson 實(shí)驗(yàn)室。今天,Watson 已經(jīng)成為 IBM 人工智能的統(tǒng)一品牌。
現(xiàn)在我們提出叫 watsonx,之所以是 X 的話,是希望我們有各種不同的場景,不同的方案,能解決客戶更多的問題。圍繞 watsonx 它的三個(gè)組成部分,第一個(gè)是支持生成式 AI 的開發(fā)平臺(tái),叫 watsonx.ai,第二個(gè)是 watsonx.data,把數(shù)據(jù)湖和數(shù)據(jù)倉庫結(jié)合起來,也就是“湖倉一體”架構(gòu)。第三個(gè)是 watsonx.governance,跟整個(gè)監(jiān)管包括合規(guī)相關(guān)的。
跟存儲(chǔ)有比較大關(guān)系的是 watsonx.data,這里牽扯到不單單是要解決人工智能對(duì)存儲(chǔ)的要求,而且也要解決數(shù)據(jù)的管理,數(shù)據(jù)的訪問,整套解決方案。圍繞這塊,用到了不單單是人工智能存儲(chǔ),也會(huì)用到云,用到數(shù)據(jù)備份、數(shù)據(jù)保護(hù)。IBM watsonx 希望針對(duì)企業(yè)級(jí)的人工智能應(yīng)用提供端到端的技術(shù)支持和行業(yè)專長。
現(xiàn)在市面上有一些工具可能只是工具,用在企業(yè)的話,會(huì)有很多問題。包括這些工具的使用,數(shù)據(jù)的產(chǎn)生,數(shù)據(jù)的保護(hù),包括維護(hù)以及監(jiān)管的要求。
IBM 的理念是,我們提供 watsonx 產(chǎn)品家族是滿足端到端的需要,特別是企業(yè)客戶,當(dāng)你不具備那么強(qiáng) AI 的研發(fā)能力,通過 IBM 產(chǎn)品組合,能夠從生成式的 AI 模型,到最后滿足監(jiān)管的要求以及數(shù)據(jù)被保護(hù)等各個(gè)方面,這是我們提出 watsonx 整個(gè)的想法。
watsonx 是 7 月初剛剛開始上市的產(chǎn)品,國內(nèi)現(xiàn)在在推廣階段,現(xiàn)在有一些國外的案例,主要是客戶通過生成式AI模型解決行業(yè)一些問題。比如:制造業(yè)生產(chǎn)線中缺陷的判別,醫(yī)療影像的識(shí)別,呼叫中心對(duì)客戶訴求的自動(dòng)化應(yīng)對(duì)和回復(fù)。我們現(xiàn)在看到針對(duì)這類行業(yè)應(yīng)用,所有模型都有它的行業(yè)特點(diǎn),發(fā)生很多交互關(guān)系,往往要跟客戶業(yè)務(wù)緊密結(jié)合,去產(chǎn)生一個(gè)合理、可落地的一個(gè)模型。
關(guān)于數(shù)據(jù),我們發(fā)現(xiàn),不單單是企業(yè)對(duì) AI 的使用要求,這些客戶本身的海量數(shù)據(jù),比如,一個(gè)銀行的呼叫中心可能也有銀行帳戶的信息,包括信用的信息,而這些信息往往存在數(shù)據(jù)庫里,所以 IBM watsonx.data 面對(duì)的數(shù)據(jù)對(duì)象不單單是非結(jié)構(gòu)化的,還有一些結(jié)構(gòu)化的,對(duì)數(shù)據(jù)的保護(hù)要求也不一樣,可能你跟客戶的通話本身是敏感的,要保護(hù)。但是跟客戶銀行帳戶的信息相比,可能這里要求的保護(hù)級(jí)別更高。怎么樣把這些結(jié)合在一起,就變得非常重要了。
我們現(xiàn)在看到 watsonx.data 對(duì)存儲(chǔ)的要求,會(huì)比單一的系統(tǒng)來得要復(fù)雜,因?yàn)槌藸砍兜侥P退a(chǎn)生的,跟 GPU 配合所需要的存儲(chǔ)結(jié)構(gòu)以外,還需要后臺(tái)其他的存儲(chǔ)連接,包括跟它的數(shù)據(jù)庫存儲(chǔ),包括怎么樣整體上為客戶去做備份,做數(shù)據(jù)保護(hù)。我們針對(duì)人工智能 AI 的核心軟件 Storage Scale,后臺(tái)既可以接閃存,也可以接對(duì)象存儲(chǔ),也可以接磁帶,這樣跟客戶整個(gè)系統(tǒng)相結(jié)合,不單單是提供 AI 存儲(chǔ)的本身,而且提供湖倉一體的存儲(chǔ)架構(gòu)。
宋家雨:最后一個(gè)問題想問一下侯總,除了目前我們講的混合云、AI 存儲(chǔ)之外,安全也是一個(gè)特別需要關(guān)注的話題。IBM Storage 也有一個(gè)產(chǎn)品叫 Defender,這樣一個(gè)產(chǎn)品是不是能夠抵御勒索病毒攻擊呢?
侯淼:IBM 有一類產(chǎn)品,我們叫它數(shù)據(jù)彈性存儲(chǔ),這里核心軟件就是 IBM Storage Defender。實(shí)際上是兩個(gè)層面的事情,一個(gè)叫做數(shù)據(jù)安全,一個(gè)叫數(shù)據(jù)保護(hù),這兩個(gè)是不一樣的。
數(shù)據(jù)安全很大程度上是主動(dòng)的,它要去防止被黑客所襲擊,怎么樣能夠進(jìn)行主動(dòng)探測,它是一個(gè)主動(dòng)行為。數(shù)據(jù)保護(hù)相對(duì)來說是被動(dòng)行為,怎樣能夠在同時(shí)情況下保護(hù)我的數(shù)據(jù),能夠盡可能減少損失。IBM 是把這兩塊結(jié)合在一起了,就是 Defender 所要解決的問題。
關(guān)于 IBM
IBM 是全球領(lǐng)先的混合云、人工智能及企業(yè)服務(wù)提供商,幫助超過 175 個(gè)國家和地區(qū)的客戶,從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡化業(yè)務(wù)流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務(wù)、電信和醫(yī)療健康等關(guān)鍵基礎(chǔ)設(shè)施領(lǐng)域的超過 4000 家政府和企業(yè)實(shí)體依靠 IBM 混合云平臺(tái)和紅帽 OpenShift 快速、高效、安全地實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型。IBM 在人工智能、量子計(jì)算、行業(yè)云解決方案和企業(yè)服務(wù)方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對(duì)企業(yè)誠信、透明治理、社會(huì)責(zé)任、包容文化和服務(wù)精神的長期承諾是 IBM 業(yè)務(wù)發(fā)展的基石。
了解更多信息,請(qǐng)?jiān)L問:https://www.ibm.com/cn-zh
→IBM:以強(qiáng)大存力與算力夯實(shí) AI 基礎(chǔ)架構(gòu),讓技術(shù)真正轉(zhuǎn)化為業(yè)務(wù)價(jià)值
→IBM 2023技術(shù)交流大會(huì)將展示 watsonx 全新升級(jí),watsonx.governance 技術(shù)預(yù)覽版及新模型等一一亮相
點(diǎn)擊“閱讀原文”,獲取更多內(nèi)容
原文標(biāo)題:媒體觀察:相信“藍(lán)色巨人”,IBM 存儲(chǔ)永遠(yuǎn)在線
文章出處:【微信公眾號(hào):IBM中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
IBM
+關(guān)注
關(guān)注
3文章
1757瀏覽量
74706
原文標(biāo)題:媒體觀察:相信“藍(lán)色巨人”,IBM 存儲(chǔ)永遠(yuǎn)在線
文章出處:【微信號(hào):IBMGCG,微信公眾號(hào):IBM中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論