據(jù)有關(guān)統(tǒng)計(jì):傳統(tǒng)藥物研發(fā)耗時(shí)耗力,一般需要超過(guò) 15 年,耗資 30 多億美元,但每年上市的原創(chuàng)新藥僅十幾種。目前,已知的 4000 多種疾病中 90% 尚無(wú)藥可治。
如何加速新藥研發(fā)?騰訊表示,為解決困難,開始做些嘗試——發(fā)布首個(gè) AI 驅(qū)動(dòng)的藥物發(fā)現(xiàn)平臺(tái) “云深智藥(iDrug)”。它致力于幫助用戶大幅度減少尋找潛在活性藥物的時(shí)間和成本。“云深”源自唐詩(shī)《尋隱者不遇》的 “只在此山中,云深不知處”,新藥的發(fā)現(xiàn)過(guò)程正是如此。
基于騰訊 AI Lab 自主研發(fā)的深度學(xué)習(xí)算法,提供數(shù)據(jù)庫(kù)和云計(jì)算支持,能覆蓋臨床前新藥研發(fā)全部流程的五大模塊。
騰訊表示,其 AI Lab 自研的預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的新思路,該算法在 2020 年起加入行業(yè)頂級(jí)評(píng)估平臺(tái) CAMEO(全球唯一的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)自動(dòng)評(píng)估平臺(tái))。
目前平臺(tái)上已經(jīng)運(yùn)行十個(gè)左右研發(fā)項(xiàng)目——包括對(duì)抗新冠病毒藥物的虛擬篩選和性質(zhì)預(yù)測(cè),目前篩選得到的化合物在實(shí)驗(yàn)驗(yàn)證中。
平臺(tái)如何為藥物研發(fā)加速助力?
疾病的形成由很多物質(zhì)組成,最終形成疾病的關(guān)鍵蛋白,我們把它設(shè)為靶點(diǎn)。
解決靶點(diǎn),就有可能解決疾病。
而解決靶點(diǎn),就需要知道它的蛋白結(jié)構(gòu),再去找到對(duì)應(yīng)的藥物破解它。
了解關(guān)鍵蛋白的結(jié)構(gòu),設(shè)計(jì)藥物分子來(lái)抑制它的功能,疾病就會(huì)解除。
過(guò)去通過(guò)實(shí)驗(yàn)尋找針對(duì)疾病靶點(diǎn)的有效藥物,往往難度大、周期長(zhǎng)、費(fèi)用高。
從進(jìn)入臨床試驗(yàn)的行業(yè)案例來(lái)看,在新藥研發(fā)中,AI 技術(shù)最快可以將新藥發(fā)現(xiàn)周期從 3-6 年縮短到 6 個(gè)月至 1 年;從技術(shù)層面看,云深智藥平臺(tái)同樣具備相似的能力。它能最快的時(shí)間,模擬鎖的結(jié)構(gòu)。
結(jié)合 AI 深度學(xué)習(xí)模型預(yù)測(cè)的蛋白質(zhì)結(jié)構(gòu)以及蛋白質(zhì)功能(蛋白質(zhì)折疊),就可以有針對(duì)性地設(shè)計(jì)藥物分子來(lái)抑制它的功能,將疾病通路阻斷。
基于自監(jiān)督學(xué)習(xí)的蛋白質(zhì)折疊方法,不依賴同源序列,而是直接從序列數(shù)據(jù)庫(kù)中通過(guò)自監(jiān)督學(xué)習(xí),學(xué)得共進(jìn)化的模式,從而能夠從無(wú)到有地產(chǎn)生出含有共進(jìn)化信息的偽同源序列,并最終讓這些蛋白能夠有效折疊。
通過(guò)一種基于深度學(xué)習(xí)的可迭代方法,有效整合模板建模與自由建模,首次提出了動(dòng)態(tài)的、可迭代的氨基酸對(duì)特異性的約束條件,顯著提高了建模的精度,從而更好的折疊蛋白。
云深智藥平臺(tái),不僅可以根據(jù)鎖的類型和形狀來(lái)設(shè)計(jì)或者選擇合適的候選鑰匙,還能吸收其他人開鎖經(jīng)驗(yàn),能極大節(jié)省人力物力。
可通過(guò) AI“遷移 ”從其他靶點(diǎn)上面學(xué)習(xí)到的知識(shí)(如分子局部結(jié)構(gòu)對(duì)靶點(diǎn)結(jié)合強(qiáng)度的影響),應(yīng)用在目標(biāo)靶點(diǎn)上來(lái)提高模型預(yù)測(cè)精度。
目前該算法在數(shù)千個(gè)實(shí)驗(yàn)數(shù)據(jù)集上預(yù)測(cè)精度(預(yù)測(cè)活性與實(shí)驗(yàn)測(cè)量活性的相關(guān)性)的中位數(shù)從目前最高記錄 0.36 提升到 0.42,且篩選可用模型的百分比從 56% 提升到 60%。
獲悉,平臺(tái)還支持 ADMET 性質(zhì)預(yù)測(cè)功能(藥物的吸收、分配、代謝、排泄和毒性),目前已經(jīng)開源。該平臺(tái)藥物小分子 ADMET 屬性預(yù)測(cè)模塊已在多個(gè)數(shù)據(jù)集上比學(xué)術(shù)界現(xiàn)有最好模型提高 3%~11%;在合作伙伴的反饋中,平臺(tái)的自研算法精度超過(guò)現(xiàn)有商業(yè)軟件 6%~37% 不等。
當(dāng)然,除了上述在算法領(lǐng)域不斷創(chuàng)新,平臺(tái)還提供算力和數(shù)據(jù)庫(kù)的一體化服務(wù)支撐。
數(shù)據(jù)方面,分子大數(shù)據(jù)是藥物研發(fā)中的基礎(chǔ)設(shè)施。
云深智藥平臺(tái)使用的分子大數(shù)據(jù),基于現(xiàn)有公開數(shù)據(jù)集,進(jìn)行了多個(gè)環(huán)節(jié)的精細(xì)清洗整理工作,得到可以用于直接構(gòu)建深度學(xué)習(xí)模型的藥物分子大數(shù)據(jù)集。
算力方面,騰訊云為云深智藥平臺(tái)提供數(shù)據(jù)庫(kù)服務(wù)。
藥企、科研機(jī)構(gòu)登錄平臺(tái)即可開展研究,不需要再自行部署計(jì)算資源,從而能盡快將 AI 能力引入現(xiàn)有的研發(fā)流程中。
責(zé)任編輯:tzh
-
AI
+關(guān)注
關(guān)注
87文章
31490瀏覽量
269915 -
騰訊
+關(guān)注
關(guān)注
7文章
1666瀏覽量
49548 -
學(xué)習(xí)算法
+關(guān)注
關(guān)注
0文章
15瀏覽量
7487
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論