因分析、基因診斷、白血病分型、指導治療、判斷預后等領域已經有了成熟應用,而其中血液學已成為了此類現代生命科學技術發展最為活躍的領域之一。
通過加強技術創新,中國血液學研究在基礎理論研究以及臨床轉化和實踐等方面已躋身世界前列。基因測序作為一種新型的基因檢測技術,在生命科學研究中扮演著十分重要的角色,隨著測序技術的飛速發展,人類發現的基因序列數目以指數級增長,對于如此數量龐大的基因進行同源性搜尋、比對、遺傳發育分析等等,往往伴隨著巨大的數據處理量和并行計算量。
江蘇省血液研究所(以下簡稱血研所) 采用浪潮分布式存儲AS13000搭建了血液病檢測平臺,支撐了前端的基因檢測業務,并依靠方案的高可靠、高可用、易擴容等特點,保障血研所業務高效運行并滿足后續業務持續增長需求。
血研所主要研究方向為血栓與止血、惡性血液病和造血干細胞移植,本次搭建的科研平臺主攻血液病的基因檢測場景,基因測序是一種新型基因檢測技術,能夠從血液或唾液中分析測定基因全序列,預測罹患多種疾病的可能性,過程中將會產生大量的數據,對存儲系統帶來了較大規模的挑戰。
血研所也是國內第一個血栓與止血研究室,需要對大量的樣品進行數據的采集、分析和計算,且對數據的持續讀取性能、安全性要求很高,隨著血液檢測的技術創新與精確度的提升,預計未來每年的數據增長量在100TB左右。
浪潮分布式存儲支撐血液病檢測平臺
結合檢測平臺數據特點及需求,血研所采用了浪潮分布式存儲AS13000系列,在基因測序過程中滿足了海量空間、高IO并發性能、業務連續性等需求,高效支持了血研所臨床與多課題組同時在線使用的業務。
面對基因測序業務增長的性能和容量需求,浪潮分布式存儲AS13000通過文件方面的智能條帶化(Stripe)技術,單個文件跨節點分布,提高前端計算節點對數據并發訪問性能。若后續規模的不斷增長,業務負載壓力變大,AS13000支持通過整合SSD資源作為高速數據緩沖區,可進一步提升系統IO性能;平臺一期建設配置300余TB可用空間,滿足血研所未來2年的數據增長需求,隨著血研所科研數據量的增加,可通過節點在線橫向擴展的模式,系統容量和性能呈線性增長,總容量可達EB級,可滿足基因測序數據每年100TB的增長量。
整個基因測序的業務是在高壓力下7*24運行,一旦出現業務中斷整個基因測序的工程就要中斷,甚至于整個的基因測序要重新進行。因此,連續性就是基因測序的根本生產力保證,因此對文件系統存儲的業務連續性保證有極高的要求。
分布式存儲在設計方面保證所有的關鍵系統服務都分布在多個硬件上,避免系統資源單點故障,消除系統瓶頸;糾刪碼策略在保障最大可達94%空間利用率時,允許集群內同時故障2個節點,數據不丟失,保障基因測序的業務連續。
江蘇省血液研究所血液病生物樣本庫經過發展,建成包括生物樣本庫、臨床數據庫和質量控制實驗室三個部門的血液病生物資源庫,涵蓋樣本及信息收集、儲存、利用全環節的生物資源管理體系。截至目前,共收集了103910例各類血液疾病患者的樣本共計578331份,樣本類型涵蓋凍存細胞、骨髓組織、骨髓細胞玻片、血漿、血清、DNA和RNA等,出庫樣本量達59522份;臨床數據庫建立造血干細胞移植患者檔案3000余例。
血液病生物資源庫現為國內規模較大的血液疾病生物資源庫之一,建立了國內最大的造血干細胞移植、骨髓增生異常綜合征和急性混合細胞白血病的生物樣本研究隊列,為血液病基礎和臨床研究提供高質量的樣本和數據支持。
江蘇省血液研究所將繼續堅持科研與臨床相結合的理念,協力發展、不斷創新,建設成為具有國際一流水平的血液病臨床診療和轉化研究中心,為血液學領域做出新的貢獻。
-
存儲
+關注
關注
13文章
4353瀏覽量
86070 -
硬件
+關注
關注
11文章
3380瀏覽量
66388 -
浪潮
+關注
關注
1文章
468瀏覽量
23920 -
數據庫
+關注
關注
7文章
3845瀏覽量
64601
發布評論請先 登錄
相關推薦
評論