【算力時(shí)代】是超云推出的系列案例分享專欄,旨在聚焦不同行業(yè)成功案例,展現(xiàn)超云研發(fā)成果,“算力”是國(guó)家信息化的基礎(chǔ),“時(shí)代”代表承上啟下、繼往開(kāi)來(lái),把握時(shí)代脈搏,為數(shù)字化的發(fā)展、智能化的升級(jí)添磚加瓦。
經(jīng)過(guò)十余年發(fā)展,超云產(chǎn)品已覆蓋智能計(jì)算、信創(chuàng)整機(jī)、私有云及云服務(wù)等領(lǐng)域,服務(wù)于教育、金融、能源、交通、互聯(lián)網(wǎng)、政企、運(yùn)營(yíng)商、醫(yī)療等八大行業(yè),為客戶提供安全、可信的軟硬件一體化解決方案,是國(guó)內(nèi)專業(yè)的數(shù)據(jù)中心產(chǎn)品及服務(wù)提供商。
2023年超云將在打造技術(shù)領(lǐng)先、安全可靠的國(guó)產(chǎn)品牌道路上砥礪前行,續(xù)寫全新算力時(shí)代。
近年來(lái),人工智能領(lǐng)域取得了迅猛發(fā)展,許多高校及科研機(jī)構(gòu)開(kāi)始利用各自學(xué)科的計(jì)算分析工具來(lái)解析實(shí)驗(yàn)數(shù)據(jù)。無(wú)論是計(jì)算分析還是人工智能領(lǐng)域的研究,都高度依賴于高質(zhì)量、大規(guī)模的算力。而這些需求投射至高等院校,往往體現(xiàn)為對(duì)高校計(jì)算中心或超算中心建設(shè)的要求上。
某雙一流大學(xué)生命科學(xué)學(xué)院作為中國(guó)乃至全球生命科學(xué)領(lǐng)域的知名學(xué)府,擁有眾多的教學(xué)和科研任務(wù),對(duì)高性能計(jì)算資源的需求日益增長(zhǎng)。在日常科研、實(shí)驗(yàn)等方面的使用中發(fā)現(xiàn),學(xué)院GPU集群算力水平已趨于飽和,亟需對(duì)現(xiàn)有設(shè)備進(jìn)行擴(kuò)容,以滿足未來(lái)教學(xué)實(shí)踐的需求,同時(shí)也將進(jìn)一步提升超算中心運(yùn)行的穩(wěn)定性與安全性。
為了滿足學(xué)院師生在基因組學(xué)、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、藥物篩選等領(lǐng)域的研究需求,學(xué)院積極推進(jìn)GPU集群建設(shè)項(xiàng)目,以提供強(qiáng)大的計(jì)算能力,支持學(xué)院內(nèi)教學(xué)和科研任務(wù)的開(kāi)展。經(jīng)過(guò)深入了解和對(duì)比,學(xué)院最終決定通過(guò)國(guó)家高新技術(shù)企業(yè)超云,定制一整套完備的GPU集群擴(kuò)容方案,以滿足學(xué)院的教學(xué)研究需要。
針對(duì)此次建設(shè)方案,學(xué)院提出多項(xiàng)需求:
高性能:需要大規(guī)模并行計(jì)算能力。
高可靠:深度學(xué)習(xí)模型訓(xùn)練不中斷。
高擴(kuò)展:后續(xù)可根據(jù)科研需求情況進(jìn)行相應(yīng)算力資源的擴(kuò)展。
高利用率:有效調(diào)度GPU資源,減少算力損耗。
響應(yīng)及時(shí):遇到問(wèn)題時(shí),廠商能夠快速響應(yīng)、解決問(wèn)題。
根據(jù)客戶需求,超云從產(chǎn)品選型、性能規(guī)劃、數(shù)據(jù)規(guī)劃、服務(wù)響應(yīng)這四個(gè)方面入手,制定如下GPU集群擴(kuò)容方案:
產(chǎn)品選型
超云利用多年高校案例部署經(jīng)驗(yàn)以及完善的GPU服務(wù)器產(chǎn)品線作為切入點(diǎn),提前與客戶深入交流,了解學(xué)院科研的業(yè)務(wù)環(huán)境,同時(shí)考慮學(xué)院當(dāng)前現(xiàn)有資源基礎(chǔ)和未來(lái)可能的擴(kuò)展需求,制定合理的硬件配置方案。最終確定超云R8428 G12作為GPU集群擴(kuò)容業(yè)務(wù)首選。
R8428 G12是超云推出的一款高性能AI服務(wù)器,作為人工智能領(lǐng)域旗艦產(chǎn)品,整機(jī)支持2顆英特爾?第三代 至強(qiáng)? 可擴(kuò)展處理器,最高主頻可達(dá)3.7 GHz;同時(shí)整機(jī)最大可支持10個(gè)雙寬高性能GPU卡,為行業(yè)客戶提供充裕AI算力。同時(shí)卓越的產(chǎn)品設(shè)計(jì)為其帶來(lái)了極致的擴(kuò)展性,具有高性能、高可靠、易維護(hù)的特點(diǎn),適用于高性能科學(xué)計(jì)算、AI訓(xùn)練及推理等應(yīng)用場(chǎng)景。
超云服務(wù)器R8428 G12
性能規(guī)劃
超云推薦每臺(tái)服務(wù)器搭載兩顆英特爾? 至強(qiáng)? 金牌6338(32C 2.0GHz)處理器,1T DDR4 3200內(nèi)存,同時(shí)搭載8塊高性能 GPU卡,可以提供高度并行的計(jì)算能力,滿足生命科學(xué)研究領(lǐng)域?qū)Ω咝阅苡?jì)算的需求。
數(shù)據(jù)規(guī)劃
本地?cái)?shù)據(jù)存儲(chǔ)在5塊3.84T大容量SSD盤中,加速數(shù)據(jù)的I/O性能,提高研究效率。
服務(wù)響應(yīng)
超云自研全內(nèi)嵌智能管理芯片可實(shí)現(xiàn)IPMI2.0遠(yuǎn)程系統(tǒng)監(jiān)控、遠(yuǎn)程運(yùn)維,顯著提高數(shù)據(jù)中心的運(yùn)維水平,同時(shí)鈦金級(jí)電源可提升能源轉(zhuǎn)換效率,保障系統(tǒng)穩(wěn)定,整機(jī)的多項(xiàng)冗余和保護(hù)技術(shù),有效提高設(shè)備整體可用性和可維護(hù)性。依托超云專業(yè)的售后服務(wù),定期進(jìn)行產(chǎn)品巡檢、專業(yè)維護(hù)、及時(shí)響應(yīng),消除客戶的后顧之憂。
該解決方案具有以下功能和優(yōu)勢(shì):
超云R8428 G12支持英特爾? 至強(qiáng)? 第三代可擴(kuò)展處理器,最高支持80個(gè)核心和16個(gè)內(nèi)存通道,同時(shí)候支持 PCIe 4.0 連接,互聯(lián)帶寬可達(dá) 64GB/s,可向下兼容 PCIe 3.0 。該解決方案通過(guò)雙層結(jié)構(gòu)設(shè)計(jì)實(shí)現(xiàn)了GPU和CPU的分層散熱,同時(shí)整機(jī)電源、風(fēng)扇等多部件都采用冗余設(shè)計(jì),確保了業(yè)務(wù)的穩(wěn)定和連續(xù)。產(chǎn)品支持Ampere 架構(gòu) GPU 加速卡,支持 MIG 多實(shí)例,稀疏矩陣,NVlink Bridge 連接等領(lǐng)先技術(shù)。
借助該方案,客戶GPU集群算力得到顯著提升,可支持適配從消費(fèi)級(jí)到數(shù)據(jù)中心級(jí)的GPU顯示核心,以滿足不同算力及應(yīng)用場(chǎng)景。同時(shí)得益于超云服務(wù)器產(chǎn)品的高效節(jié)能,客戶在前期采購(gòu)以及后期運(yùn)維成本上都有明顯降低。
當(dāng)前,國(guó)家基礎(chǔ)設(shè)施數(shù)字化、信息化的建設(shè)正在不斷加速,千行百業(yè)都在推進(jìn)算力升級(jí),以滿足未來(lái)業(yè)務(wù)發(fā)展的需要。超云十余年來(lái)始終專注于數(shù)據(jù)中心產(chǎn)品及服務(wù)領(lǐng)域的產(chǎn)業(yè)布局,通過(guò)技術(shù)升級(jí)、產(chǎn)品迭代,解決行業(yè)客戶痛點(diǎn),為千行百業(yè)提供安全、高效的一體化解決方案。
未來(lái),超云將緊跟時(shí)代發(fā)展大方向,堅(jiān)持自主創(chuàng)新、數(shù)實(shí)融合的發(fā)展路線,持續(xù)優(yōu)化解決方案,為推動(dòng)教育及其他行業(yè)的信息化、智能化建設(shè)添磚加瓦。
審核編輯 黃宇
-
gpu
+關(guān)注
關(guān)注
28文章
4767瀏覽量
129209 -
智能化
+關(guān)注
關(guān)注
15文章
4939瀏覽量
55628
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論