當前隨著冷凍電鏡、蛋白質組學、深度學習、基因測序、卷積神經網絡、高性能計算、單細胞基因、數據挖掘、數據分析、靶點發現、晶體預測、AlphaFold等技術的快速發展,生命科學開始被逐漸被人們所重視。
生命科學行業涉及研究微生物、動植物等一切生物的科學領域,也包括生命倫理學等相關領域的考量。生命科學的研究對提高人類生活質量有很大幫助。從全球范圍來看,21世紀以來,全球生命科學發展進入快車道,特別是人類基因組計劃的實施、干細胞研究的深入、克隆技術的不斷發展等因素將生命科學的發展推向了新的高度,同時相應領域的研發投入也在不斷增加。作為強烈依賴科技信息技術的典型代表,生命科學行業的藥物研發和基因測序分析領域面臨著計算資源短缺、研發周期長等問題。
生命科學領域面臨的挑戰
清華大學生命科學學院生物計算平臺主管楊濤認為:冷凍電鏡目前在科研方向的挑戰分別是:數據管理的挑戰,科研進度的挑戰和實驗風險的挑戰。
一、數據管理
源于超量數據,在最大化壓縮的前提下,每天大約會產生4TB的數據量。為了使計算設備的效率最大化,需要365天不間斷工作。一年的數據總量非常驚人,給數據管理帶來巨大的挑戰。
二、科研管理
冷凍電鏡技術已經備受認可,各科研機構都在調動資源搶占高地,所以存在時間效率的問題,哪怕比別人慢半天,都會失去首發的價值。
三、實驗風險
這是一個非常長時間的實驗流水線,任何中間環節都存在風險。一旦不能及時解決風險,整個系統的產出就會大打折扣。
客戶需求
某學院單細胞基因組研究技術中心(簡稱“該中心”)旨在建立標準化、自動化的工程技術,提高單細胞結構分析水平,高精度確定從蛋白質分子到全細胞的三維結構,并在此基礎上揭示蛋白質及其復合體功能,大規模制備蛋白/抗體,建成具有國際一流水平和綜合示范功能的蛋白質科學研究核心基地。
就生命科學研究項目而言,每個項目涉及的數據量小在上百TB。對于時間周期長、領域廣的項目,未來數據需求可能在PB級。此外,該中心需要考慮支持多種生命科學研究項目,而其中,不同應用對高性能平臺計算環境有不同的要求,如基因測序需要高I/O性能和內存大消耗,而分子動力學研究除了I/O性能外,還需要較高的網絡和并發處理能力。所有這些都對該中心構建高性能平臺提出了挑戰:
一、數據量增長10多倍,計算能力也要“跟上”
研究團隊采用的冷凍電鏡技術在近兩年取得了革命性的進展,具體來說就是相機技術實現了飛躍,采集數據的能力提高了10多倍,甚至上百倍,從而使得研究蛋白質結構的源數據呈幾何級數增長,這就需要中心在后期全面提升數據處理和計算能力。
二、亟需簡化管理保障服務品質
隨著生命科學研究項目越來越多,如何根據不同項目和研究人員個性化需求分配資源,及時回收資源,實現跨整個高性能資源池的集中統一管理,簡化維護管理,減輕運維人員負擔,是科研高性能計算平臺普遍面臨問題。
三、TCO居高不下
生命科學研究迅速成為國家戰略發展方向,導致研究項目和跨學科研究需求快速增加。傳統的分層計算存儲資源利用率低,導致新增費用快速增加。此外,能耗也成為阻礙高性能計算中心擴展的不可逾越的“高墻”。
四、網絡性能不能拖后腿
作為保證高性能集群正常運行的關鍵,高性能網絡承擔著重要的連接任務。隨著單節點計算和存儲性能的不斷提升,高性能用戶需要萬兆,四萬兆,十萬兆,InfiniBand網絡選擇以滿足不同的高性能計算需求。
解決方案特點
藍海大腦基于融合架構助力某學院單細胞基因組研究技術中心搭建了一個分布式高性能平臺,擁有250個物理計算節點,5000個計算核心,總存儲容量1.92PB,理論計算能力208Tflops。通過Lustre技術實現了跨20個融合架構的集中統一管理。
一、4.1TFLOPS/U的計算密度,4倍性能提升
可針對不同項目量身定制配置。其中,高密度計算節點支持14核英特爾?至強TM E5-2600v3處理器,在2U中擁有224個計算核心的密度,單U空間的計算性能密度達到業界領先的4.1TFLOPS,同時支持64個DIMM高密度內存,確保高性能和低延遲的性能要求。此外,還支持InfiniBand接口,非常適合要求超低延遲的工作負載。在強大計算能力的保證下,計算效率提升3-4倍,過去4-5天才能完成的計算任務,一天就能完成。
二、簡化高性能資源池監控管理
根據項目要求定制不同的系統配置,同時通過機箱管理控制器(CMC),可以集中監控和管理20個FX系統。此外,無代理生命周期管理和一對多遠程管理功能可確保BIOS和固件程序更新不會影響業務穩定性,并提高系統中計算節點生命周期管理的效率。而且在擴展服務器時,IT人員可以通過下發配置文件,使系統自動更新BIOS和固件程序,避免了重復輸入配置參數的繁瑣過程,減少了人工輸入錯誤導致的系統故障,簡化了管理運維,降低了管理費用。
三、TCO降低約20%
自動化、高密度、低能耗的集成部署、集中統一管理,可以使中心的TCO降低20%左右。其中,藍海大腦將通過主板連接服務器、存儲和1G0b網絡,通過模塊化設計形成融合一體機,同時提供散熱、供電、網絡、管理和PCIe擴展的共享插槽,降低數據中心的占地和能耗,幫助中心獲得良好的性價比。
四、高速網絡保障平臺I/O性能
藍海大腦為中心提供四萬兆高性能網絡,在保持成本優勢的基礎上,為用戶提供穩定的網絡性能,保證高性能、低延遲要求。
五、打破原有的服務器散熱方式,采用液冷散熱
藍海大腦液冷服務器系統突破傳統風冷散熱模式,采用風冷和液冷混合散熱模式——服務器內主要熱源 CPU 利用液冷冷板進行冷卻,其余熱源仍采用風冷方式進行冷卻。通過這種混合制冷方式,可大幅提升服務器散熱效率,同時,降低主要熱源 CPU 散熱所耗電能,并增強服務器可靠性。經檢測,采用液冷服務器配套基礎設施解決方案的數據中心年均 PUE 值可降低至 1.2 以下。
客戶收益
一、藍海大腦HPC高性能計算與AI平臺已成為高性能、多功能、專業的前沿計算平臺,尤其在AI深度學習方面,為校內外生物學研究提供高效的計算支持。同時為計算生物學、深度學習、基因測序等多個研究組提供計算服務。包括測序儀的離線處理、序列搜尋比對分析、分子動力學模擬、計算機輔助藥物設計和分子對接、生物網絡的計算。
二、全力支持基于深度學習的分子圖編碼和基于深度學習的中藥方劑系統的研發。研發人員可以利用HPC高性能計算和AI平臺開發基于三維分子圖譜的深度學習編碼,進行基于深度學習的中醫診斷處方。多任務分子預測模型由卷積神經網絡或遞歸神經網絡構成。交叉驗證用于調整和驗證參數,外部數據用于測試和評估模型。同時,從預測模型中挖掘關鍵信息。同時通過卷積神經網絡或遞歸神經網絡學習大量的方劑配伍信息,然后用主藥生成語義自動關聯分析得到的輔藥,從而生成新的方劑。藍海大腦HPC高性能計算和AI平臺提供了高效并行的計算資源,大大加快了模型的訓練速度,從而在有效的時間內完成最終的任務。
三、支持基于化學片段的從頭計算藥物設計,對疾病的治療和生物學功能的理解有重要的促進作用。傳統的藥物篩選過程耗時長,成本高,導致整個藥物設計和發現過程效率低下。為了加快藥物設計和發現的進程,研究人員利用這一平臺逐步發展了分子從頭設計的方法,并取得了良好的效果。研究人員通過蒙特卡洛樹搜索和神經網絡模型的結合,實現了巨大化學空間的搜索和最優結構的采樣,快速完成了完整的從頭計算藥物設計過程,并探索了蛋白質口袋表征和評分功能。
四、利用深度學習框架構建深度學習模型,加強學習模型的訓練,實現深度學習的評分函數模型的訓練和測試,并對模型進行訓練。對于模型生成的分子,通過聚類分析分子的合成、毒性和理化性質,選擇合適的分子。
審核編輯 黃昊宇
-
服務器
+關注
關注
12文章
9240瀏覽量
85702 -
深度學習
+關注
關注
73文章
5508瀏覽量
121314
發布評論請先 登錄
相關推薦
評論