由 NVIDIA 等企業(yè)賦能的一家初創(chuàng)公司推出了基于 NVIDIA GPU 模型的新型蛋白質(zhì)研究方案。
基于提示的代碼生成技術(shù)讓生成式 AI 徹底革新了軟件開發(fā)領(lǐng)域,接下來蛋白質(zhì)設(shè)計領(lǐng)域也將迎來變革。
EvolutionaryScale 于 6 月 25 日發(fā)布了第三代 ESM 模型 ESM3,該模型可同時對蛋白質(zhì)的序列、結(jié)構(gòu)和功能進(jìn)行推理,為蛋白質(zhì)研發(fā)工程師提供了一個可編程的平臺。
這家初創(chuàng)公司源自 Meta 公司的基礎(chǔ) AI 研究(FAIR)部門,最近獲得了由 Lux Capital、Nat Friedman 和 Daniel Gross 領(lǐng)投以及 NVIDIA 和亞馬遜參投的融資。
EvolutionaryScale 處于可編程生物學(xué)的最前沿,可以幫助研究人員設(shè)計蛋白質(zhì),從而幫助找到癌細(xì)胞的靶點、尋找有害塑料的替代品、推動環(huán)境保護(hù)等等。
通過 ESM3 模型的規(guī)模化開發(fā),EvolutionaryScale 開拓了可編程生物學(xué)的前沿,讓 ESM3 成為有史以來算力最高的生物基礎(chǔ)模型。980 億參數(shù)的 ESM3 模型比其前身 ESM2 多使用了大約 25 倍的浮點運算和 60 倍的數(shù)據(jù)。
EvolutionaryScale 整理了一個包含 20 多億個蛋白質(zhì)序列的數(shù)據(jù)庫用于訓(xùn)練 AI 模型,它提供的技術(shù)可以為藥物開發(fā)、疾病根除以及藥物研發(fā)人員服務(wù)。
通過 ESM3 加速計算機生物學(xué)研究
借助大量訓(xùn)練數(shù)據(jù),EvolutionaryScale 希望通過 ESM3 加速蛋白質(zhì)研發(fā)。
該模型采用了從生物體和生物群落中采樣的近 28 億個蛋白質(zhì)序列進(jìn)行訓(xùn)練,使科學(xué)家能夠提示該模型識別和驗證新的蛋白質(zhì),并不斷提升精度。
與之前的版本相比,ESM3 帶來了重大更新。這是一個原生的生成式模型,也是一個 “all to all” 模型,意味著結(jié)構(gòu)和功能注解可以作為輸入信息,而不僅僅是輸出信息。
該模型公開上線后,科學(xué)家們就可以對其進(jìn)行微調(diào),基于自己的專有數(shù)據(jù)構(gòu)建專用模型。ESM3 通過大量數(shù)據(jù)進(jìn)行大規(guī)模生成式訓(xùn)練,加強了蛋白質(zhì)設(shè)計能力,為計算機生物研究提供了一臺時光機。
通過 NVIDIA BioNeMo
推動下一個重大突破
ESM3 為生物學(xué)家和蛋白質(zhì)設(shè)計師提供了增強的生成式 AI,幫助他們更好地設(shè)計和理解蛋白質(zhì)。通過簡單的提示,它可以根據(jù)提供的蛋白質(zhì)骨架生成新的蛋白質(zhì),根據(jù)反饋自我改進(jìn)蛋白質(zhì)設(shè)計,以及根據(jù)用戶指定的功能設(shè)計蛋白質(zhì)。這些功能能夠以任意組合串聯(lián)使用,以提供思維鏈蛋白質(zhì)設(shè)計,就好像用戶在給一位“研究人員”發(fā)信息一樣,而這位“研究人員”已經(jīng)記住了人類已知的每一個蛋白質(zhì)序列的復(fù)雜三維含義,并且已經(jīng)流利地掌握了這種語言,使用戶能夠來回迭代。
EvolutionaryScale 聯(lián)合創(chuàng)始人兼工程副總裁 Tom Sercu 表示:“在我們的內(nèi)部測試中,ESM3 能夠創(chuàng)造性地響應(yīng)各種復(fù)雜提示,這給我們留下了深刻的印象。它曾解決了一個極其困難的蛋白質(zhì)設(shè)計問題,創(chuàng)造出一種新型的綠色熒光蛋白。我們希望 ESM3 幫助科學(xué)家加快工作進(jìn)展,開辟新的可能性——期待著看到它為未來的生命科學(xué)研究做出重要貢獻(xiàn)。”
EvolutionaryScale 已于 6 月 25 日開放 API 接口進(jìn)行封閉測試,提供小型 ESM3 開放版本的代碼和權(quán)重,供非商業(yè)用途使用。這個版本即將在NVIDIA BioNeMo上發(fā)布,后者是一個用于藥物發(fā)現(xiàn)的生成式 AI 平臺。完整的 ESM3 系列模型將很快以NVIDIA NIM微服務(wù)的形式提供給指定客戶,該服務(wù)在與 NVIDIA 合作下進(jìn)行了運行時優(yōu)化,并由 NVIDIA AI Enterprise 軟件許可證支持,可在 ai.nvidia.com 上進(jìn)行測試。
訓(xùn)練這些模型所需的算力呈指數(shù)級增長。ESM3 使用 Andromeda 集群進(jìn)行訓(xùn)練,該集群配備了NVIDIA Quantum-2 InfiniBand網(wǎng)絡(luò)。
ESM3 模型將在指定合作伙伴的平臺上提供,包括 Amazon Bedrock、Amazon Sagemaker、AWS HealthOMICs 和 NVIDIA BioNeMo。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5109瀏覽量
104519 -
gpu
+關(guān)注
關(guān)注
28文章
4832瀏覽量
129797 -
AI
+關(guān)注
關(guān)注
87文章
32490瀏覽量
271701 -
模型
+關(guān)注
關(guān)注
1文章
3418瀏覽量
49482
原文標(biāo)題:NVIDIA 為用于蛋白質(zhì)設(shè)計的生成式 AI 模型 ESM3 提供支持
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
華為依托昇騰AI打造蛋白結(jié)構(gòu)預(yù)測工具
Evo 2 AI模型可通過NVIDIA BioNeMo平臺使用
NVIDIA推出GeForce RTX 50系列臺式機和筆記本電腦GPU
差示掃描量熱儀在食品行業(yè)的應(yīng)用

AI先驅(qū)榮獲諾貝爾物理學(xué)獎和化學(xué)獎
《CST Studio Suite 2024 GPU加速計算指南》
Supermicro推出直接液冷優(yōu)化的NVIDIA Blackwell解決方案

AMD與NVIDIA GPU優(yōu)缺點
AI實火!諾貝爾又把化學(xué)獎頒給AI大模型
差示掃描量熱儀測試蛋白質(zhì)的應(yīng)用案例

創(chuàng)客中國AIGC專題賽冠軍天鶩科技:AI蛋白質(zhì)設(shè)計引領(lǐng)者

利用微流控探針誘導(dǎo)的化學(xué)質(zhì)膜穿孔,實現(xiàn)單細(xì)胞胞內(nèi)蛋白質(zhì)遞送

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型
洪亮團(tuán)隊在生信期刊JCIM發(fā)布最新成果,蛋白質(zhì)工程邁入通用人工智能時代

天府錦城實驗室在生物傳感與蛋白質(zhì)測序領(lǐng)域取得重要進(jìn)展

評論