2017年12月,谷歌發布了一款新的人工智能工具,可利用基因測序數據準確地構建人類的基因組圖像。雖然科學家在約十五年前就已經首次完成人類基因組的測序工作,但在十五年后的今天,理解編碼人類生命的海量數據仍然是艱難挑戰,而這正是機器學習技術擅長解決的那類問題。
谷歌于2017年12月4日星期一發布了一款名為DeepVariant的工具。該工具使用最新的人工智能(AI)技術,通過測序數據構建更加準確的人類基因組圖像。
DeepVariant可幫助將高通量測序讀數轉換為全基因組圖像。它會自動識別測序數據中的小型插入和缺失突變,以及單堿基對突變。
高通量測序技術在二十一世紀初得到廣泛應用,讓基因組測序變得更加普遍。但使用此類系統生成的數據僅能提供有限且容易出錯的全基因組概況。對于科學家而言,將測序流程中生成的隨機錯誤與小型突變區分開來十分具有挑戰性,特別是在基因組的重復部分。這些突變可能會與癌癥等疾病直接相關。
目前存在多款可用于解讀此類讀數的工具,其中包括GATK、VarDict和FreeBayes。但是,這些軟件程序通常使用簡單的統計方法和機器學習方法,嘗試通過排除讀取錯誤來確定突變。
“其中一個挑戰在于基因組的疑難部分,每款[工具]都有其優勢和劣勢,”測試過DeepVariant早期版本的哈佛大學公共衛生學院研究科學家Brad Chapman表示。“這些疑難部分對于臨床測序工作而言日益重要,因而必須采用多種方法。”
DeepVariant由來自谷歌大腦(Google Brain)團隊(專注于開發和應用人工智能技術)和Verily(專注于生命科學領域的Alphabet[前身為谷歌]子公司)的研究人員開發。
該團隊通過Genome in a Bottle(瓶中基因組,GIAB)項目收集了數百萬高通量讀數及全測序基因組。這個項目是公立部門和私立部門聯合推動使用基因組測序工具及技術的成果。他們向深度學習系統提供數據并精心調整模型參數,直到相關模型學會以高準確度解讀測序數據。
2016年,DeepVariant在美國食品藥品監督管理局(FDA)舉辦的PrecisionFDA Truth Challenge比賽中贏得了第一名,這項比賽旨在推動更加準確地進行基因測序。
“DeepVariant的成功具有重要意義,因為它表明在基因組學領域,深度學習技術可用于自動訓練表現優于復雜手動操作系統的系統,”加拿大Deep Genomics公司的首席執行官Brendan Frey說道。
DeepVariant的發布是機器學習技術有望推動基因組學進步的最新標志。
Deep Genomics是嘗試使用人工智能方法(例如深度學習)梳理出疾病的發病基因并確定可能的藥物療法的數家公司之一。
-
人工智能
+關注
關注
1791文章
47183瀏覽量
238261
原文標題:谷歌新人工智能工具可準確構建基因組圖像
文章出處:【微信號:AI_News,微信公眾號:人工智能快報】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論