由 GPU 驅動的 NVIDIA Clara Parabricks v3 的最新版本。 7 包括對種系變體調用者的更新、對 RNA 序列管道的增強支持以及基因面板的優(yōu)化工作流程。現(xiàn)在有超過 50 種工具, Clara Parabricks 為臨床和研究工作流程中的基因面板、外顯子組和基因組提供準確和加速的基因組分析。
迄今為止, Clara Parabricks 已經(jīng)證明,與基于 CPU 的環(huán)境相比,用于全基因組工作流程( 22 分鐘內(nèi)完成端到端分析)和外顯子組工作流程( 4 分鐘內(nèi)完成端到端分析)的最先進生物信息學工具的速度提高了 60 倍。大規(guī)模測序項目和其他全基因組研究能夠在單個 DGX 服務器上每天分析 60 多個基因組,同時降低了相關成本,產(chǎn)生了比以往任何時候都有用的見解。
包括 泰國國家生物銀行 、 人類基因組中心與東京大學 、 基因組學研究院 、 圣路易斯華盛頓大學 、 Regeneron 遺傳學中心和英國生物銀行 和 斯坦福大學 Euan Ashley 的實驗室 在內(nèi)的許多組織正在使用 Clara Parabricks 進行快速基因組和外顯子組分析,以用于大人口項目、危重患者以及其他癌癥和遺傳病項目。他們的工作旨在準確、快速地識別致病變異,與加速的下一代測序和加速的基因組分析保持同步。
NVIDIA Clara Parabricks v3.7 概述
通過支持獨特的分子標識符( UMIs ),也稱為分子條形碼,加快和簡化基因面板工作流程。
使用第二個基因融合調用者 Arriba 和 RNA-Seq 定量工具 Kallisto 對轉錄組工作流的 RNA-Seq 支持。
用 ExpansionHunter 檢測短串聯(lián)重復序列( STR )。
集成最新版本的生殖系調用者 DeepVariant v1 。 1 和 GATK v4 。 2 為單倍型。
一個 10 倍加速的 BAM2FASTQ 工具,用于將存儲為 BAM 或 CRAM 文件的存檔數(shù)據(jù)轉換回 FASTQ 。數(shù)據(jù)集可以根據(jù)新的和改進的引用進行更新。
圖 1:Clara Parabricks 3.7 包括用于基因面板的 UMI 工作流程、用于短串聯(lián)重復序列的 ExpansionHunter 、包含 DeepVariant 1.1 和 GATK 4.2 版本,以及用于 RNA Seq 工作流程的 Kallisto 和 Arriba 。
Clara Parabricks 3.7 加速和簡化了基因面板分析
盡管全基因組測序( WGS )由于大規(guī)模的人群計劃而不斷增長,但基因面板仍然主導著臨床基因組分析。隨著時間成為臨床護理中最重要的因素之一,加速和簡化基因小組工作流程對于臨床測序中心至關重要。通過進一步減少與基因面板相關的分析瓶頸,這些測序中心可以更快地向臨床醫(yī)生返回結果,提高患者的生活質量。
用于基因檢測的癌癥樣本通常來自實體腫瘤或患者血液(液體活組織檢查)中的無細胞 DNA 。與 WGS 的發(fā)現(xiàn)工作相比,基因小組狹隘地專注于識別已知基因中的基因變體,這些基因要么會導致疾病,要么可以通過特定療法進行靶向治療。
遺傳性疾病的基因面板通常測序覆蓋率為 100 倍,而癌癥測序的基因面板測序深度要高得多,液體活檢樣本的測序深度高達 1000 倍。檢測與癌癥相關的低頻率體細胞突變需要更高的覆蓋率。
為了提高這些基因面板的檢測極限,使用了分子條形碼或 UMI ,因為它們顯著降低了背景噪聲。這一檢測極限適用于液體活組織檢查,可以包括數(shù)以萬計的檢測范圍,并與 UMIs 相結合,以識別血液中循環(huán)的大海撈針體細胞突變。高深度基因面板測序可以在更多測序讀取所需的處理中重新引入計算瓶頸。
使用 Clara Parabricks , UMI 基因面板現(xiàn)在可以比傳統(tǒng)工作流程快 10 倍,在不到一小時的時間內(nèi)產(chǎn)生結果。
分析工作流程也得到了簡化。從 raw FASTQ 到 consensus FASTQ ,與傳統(tǒng)的 Fulcrum Genomics ( Fgbio )等價物相比,單個命令行運行多個輸入,如下面的示例所示。
圖 2:Clara Parabricks 3.7 與 Fgbio 等效物相比,簡化并加速了基因面板 UMI 工作流程。
Arriba 和 Kallisto 的 RNA Seq 支持
正如基因面板對于癌癥測序分析很重要一樣, RNA-Seq 工作流程對于轉錄組分析也很重要。除了恒星融合, Clara Parabricks v3 。 7 現(xiàn)在包括 Arriba ,一種基于恒星的融合檢測算法 RNA 序列比對器。基因融合是兩個不同的基因由于染色體的巨大改變而結合在一起,與從白血病到實體瘤等多種不同類型的癌癥有關。
Arriba 還可以檢測病毒整合位點、內(nèi)部串聯(lián)重復、整外顯子重復、環(huán)狀 RNA 、涉及免疫球蛋白/ T 細胞受體位點的增強子劫持事件以及內(nèi)含子或基因間區(qū)域的斷點。
Clara Parabricks v3 。 7 還結合了 Kallisto ,這是一種基于偽比對的快速 RNA 序列量化工具,可從批量或單細胞 RNA 序列數(shù)據(jù)集中識別轉錄物豐度(基于測序讀取計數(shù)的 aka 基因表達水平)。 RNA 序列數(shù)據(jù)的比對是 RNA 序列分析工作流程的第一步。 Clara Parabricks 3.7 提供了轉錄本定量、讀取比對和融合調用的工具,現(xiàn)在提供了一整套支持多個 RNA 序列工作流的工具。
用 ExpansionHunter 進行短串聯(lián)重復檢測
為了支持從短讀測序數(shù)據(jù)中對短串聯(lián)重復序列( STR )進行基因分型,在 Parabricks v3 中添加了 ExpansionHunter 支持。 STR ,也稱為微衛(wèi)星,在人類基因組中普遍存在。這些非編碼 DNA 區(qū)域具有類似手風琴的 DNA 延伸,包含長度在 2 到 7 個核苷酸之間的核心重復單元,串聯(lián)重復,最多幾十次。
STR 在遺傳圖譜構建、基因定位、遺傳連鎖分析、個體鑒定、親子鑒定、群體遺傳學和疾病診斷等應用中非常有用。
人類基因組中有許多區(qū)域由這些重復序列組成,它們的重復次數(shù)會增加,從而導致疾病。脆性 X 綜合征、肌萎縮側索硬化癥和亨廷頓氏病是常見的重復相關疾病。
ExpansionHunter 旨在通過對 BAM / CRAM 文件執(zhí)行有針對性的搜索來估計重復序列的大小,以便對每個 STR 中完全包含的跨、側翼和側翼讀取進行排序。
添加體細胞呼叫者并支持歸檔數(shù)據(jù)
2021 以前的版本 Clara Parabricks 帶來了一系列新的工具,最重要的是增加了五個軀體學呼叫者 MuSE 、 LoFReq 、 StRekA2 、 MutuSc2 和體細胞狙擊手,用于全面的癌癥基因組分析。
圖 3:Clara Parabricks v3 。 6.1 和 3.7 包括用于全面加速癌癥基因組分析的五位軀體來電者 Muse 、 LoFreq 、 Strelka2 、 Mutect2 和 SomaticSniper 。
此外,還添加了一些工具,以便在刪除原始 FASTQ 文件以節(jié)省存儲空間的情況下利用歸檔數(shù)據(jù)。 BAM2FASTQ 是 GATK Sam2fastq 的加速版本,它將現(xiàn)有 BAM 或 CRAM 文件轉換為 FASTQ 文件。這允許用戶將測序讀數(shù)重新調整到一個新的參考基因組,這將允許調用更多的變體,同時為研究人員提供將所有數(shù)據(jù)標準化為同一參考的能力。使用現(xiàn)有的 fq2bam 工具, Clara Parabricks 可以在不到 2 小時的時間內(nèi)將讀取從一個參照物重新排列到另一個參照物,從而獲得 30 倍的全基因組。
圖 4:Clara Parabricks v3 。 7 添加了帶有單倍型調用程序的種系變體調用程序 DeepVariant 1.1 和 GATK 4.2 的最新版本。
使用 免費提供 90 天試用評估許可證 為您的種系、癌癥和 RNA 序列分析工作流試用 GPU 加速的 NVIDIA Clara Parabricks 基因組分析工具。
通道 NVIDIA Clara 拋物面 通過 AWS Marketplace 在本地或云中進行。
關于作者
Vanessa Braunstein 在 NVIDIA 的醫(yī)療團隊從事產(chǎn)品營銷工作。此前,她在基因組學、醫(yī)學成像、制藥、化學和診斷公司從事產(chǎn)品開發(fā)和營銷。她學習分子和細胞生物學、公共衛(wèi)生和商業(yè)。
審核編輯:郭婷
-
NVIDIA
+關注
關注
14文章
5075瀏覽量
103539 -
gpu
+關注
關注
28文章
4768瀏覽量
129227
發(fā)布評論請先 登錄
相關推薦
評論