藥物發現領域正處于一個迷人的轉折點。這個問題的物理學是可以理解和計算的,然而量子力學計算太昂貴和耗時。 Eroom’s Law 觀察到,盡管技術有所進步,但藥物發現速度越來越慢,成本越來越高。
最近一篇研究 GPU 計算和深度學習在藥物發現中的轉變作用 顯示出這種趨勢可能很快逆轉的希望。
該綜述發表在 自然機器智能 上,詳細介紹了從分子模擬和蛋白質結構測定到生成性藥物設計等挑戰方面的許多進展,這些挑戰加速了計算機輔助藥物發現工作流程。在高度并行化 GPU 和支持 GPU 的算法的發展推動下,這些進步為計算化學和結構生物學開發新藥帶來了新的可能性。
研究人員在藥物發現和機器學習方面的合作,以確定 GPU 加速的深度學習工具,為這些挑戰創造了新的可能性,如果這些挑戰得到解決,將成為更快、更廉價藥物開發的關鍵。
研究作者寫道:“我們預計,越來越強大的 GPU 體系結構的日益可用性,以及先進 DL 策略和 GPU 加速算法的開發,將有助于讓世界范圍內更廣泛的科學界能夠負擔得起藥物發現,并使其易于獲得。”。
分子模擬與自由能計算
分子模擬為藥物發現中的許多重要計算提供了動力,是一種計算顯微鏡,可用于利用物理定律進行虛擬實驗。 GPU 驅動的分子動力學框架可以模擬細胞的機制,從而深入了解基本機制,并通過自由能微擾等計算計算候選藥物與其預期蛋白質靶點的結合強度。對分子模擬來說,最重要的是計算勢能面。
在重點綜述中,作者介紹了機器學習潛能是如何從根本上改變分子模擬的。機器學習勢或神經網絡勢是一種模型,用于學習能量和力,以便用量子力學的精度進行分子模擬。
作者報告說,自由能模擬從 GPU 中受益匪淺。基于神經網絡的力場,如 ANI 和 AIMNet 減少了絕對束縛自由能誤差和力場開發的人力。其他深度學習框架,如重加權自動編碼器 Bayes (RAVE) 正在推動分子模擬的邊界,采用增強的采樣方案來估計蛋白質-配體結合自由能。像 Deep Docking 這樣的方法現在正在使用 DL 模型來估計分子對接分數并加速虛擬篩選。
蛋白質結構測定進展
在過去的 10 年中,有一個 蛋白質結構數量增加 2.13 倍 是公開的。低溫結構沉積速率的增加和蛋白質組學的增殖進一步促進了結構和序列數據的豐富。
CryoEM 憑借其簡單、魯棒性和對大分子成像的能力,預計在未來幾年內將主導高分辨率大分子結構測定。它對樣品的破壞性也較小,因為它不需要結晶。
然而,數據存儲需求和計算需求是相當大的。該研究的作者詳細說明了像 DEFMap 和 DeepPicker 這樣的基于深度學習的方法是如何在 GPU 的幫助下為 CryoEM 的高通量自動化提供動力,以確定蛋白質結構的。通過 DEFMap ,可以理解局部密度數據關系的分子動力學模擬與深度學習算法相結合,以提取與隱藏原子漲落相關的動力學。
用原子精確度預測蛋白質結構的 AlphaFold-2 和 RoseTTAFold 模型的突破性發展,正迎來一個新的結構測定時代。 Mosalaganti 等人最近發表的一篇文章強調了這些模型的預測能力。它還展示了如何將蛋白質結構預測模型與 cryoelectron 層析成像( CryoET )相結合,以確定核孔復合體的結構,核孔復合體是一種由 1000 多個蛋白質組成的大規模細胞結構。 MosaLaMagniti 等人繼續對核孔復合體進行粗粒度分子動力學模擬。這讓我們對基于人工智能的蛋白質結構預測模型、 CryoEM 和 CryoET 的結合所帶來的各種模擬的未來一瞥。
生成模型和深度學習架構
藥物發現的核心挑戰之一是化學空間的巨大規模。有 10 個60因此,研究人員需要一種有組織和可搜索的化學空間表示。通過在現有分子的大基礎上進行訓練,生成模型可以學習化學規則,并在模型的潛在空間中表示化學空間。
生成模型通過隱含地學習化學規則,產生了他們以前從未見過的分子。這將導致比原始訓練數據庫中的分子具有指數級的唯一性和有效性。研究人員還可以構建數值優化算法,在模型的潛在空間中運行,以搜索最優分子。這些在潛在空間中起著梯度的作用,計算化學家可以利用這些梯度來引導分子生成朝著理想的性質發展。
作者報告稱,許多最先進的深度學習架構正在推動更強大的生成模型。圖形神經網絡、生成對抗網絡、變分編碼器和轉換器正在創建生成模型,以改變分子表征和從頭藥物設計。
卷積神經網絡,如化學感受,已被訓練用于預測化學性質,如毒性、活性和溶劑化。遞歸神經網絡具有學習化學空間潛在表示的能力,可以對多個數據集和任務進行預測。
MegaMolBART 是一種基于變壓器的生成模型,在 AI 超級計算規模上實現了 98.7% 的獨特分子生成。借助對模型并行訓練的支持, MegaMolBART 可以訓練 1B +個參數模型,以便在大型化學數據庫上進行訓練,并且可以針對廣泛的任務進行調整。
科學計算的百萬倍飛躍
今天, GPU 正在加速計算機輔助藥物發現工作流程的每一步,從目標闡明到 FDA 批準,在所有方面都顯示出了有效性。隨著計算速度的加快,科學計算正在 GPU 上大規模并行化。
超級計算機有助于將這些計算擴展到多個節點和 GPU ,利用快速通信結構將 GPU 和節點連接在一起。
關于作者
AbrahamStern )是 NVIDIA Clara Discovery 的產品經理。他的興趣在于科學計算和機器學習的交叉點,尤其是在化學和藥物發現問題上。 Abe 在南佛羅里達大學獲得了計算化學博士學位,之前是加州大學歐文分校的博士后學者。
Nate Bradford 是 NVIDIA 的醫療內容經理,分享 AI 框架和解決方案,以幫助開發人員、研究人員和創新者完成畢生的工作。從加速新療法的發現到實現醫療設備的實時傳感,人工智能正在開創醫療保健的新時代。
審核編輯:郭婷
-
變壓器
+關注
關注
159文章
7503瀏覽量
135743 -
NVIDIA
+關注
關注
14文章
5024瀏覽量
103265 -
AI
+關注
關注
87文章
31154瀏覽量
269480
發布評論請先 登錄
相關推薦
評論