鑒于許多疾病機理不明確或者發病機制涉及多條信號通路,基于靶點的藥物開發策略存在一定的局限性。因此,開發一種不依賴于靶點,可以直接預測藥效的計算模型似乎是一種解決方案,以往的研究人員已經進行了嘗試,但是建立的模型往往針對一種疾病有效,缺乏普適性。
由于大部分疾病都會表現出基因表達譜的變化,研究人員利用化合物誘導的基因表達譜變化作為中間指標進行藥效預測,開發出了一種基于基因表達譜變化直接預測藥效的計算模型,這種模型適用于多種疾病研究和相關藥物研發。
6 月 17 日,北京大學謝正偉團隊在 Nature Biotechnology 在線發表了這項研究。在這項研究中,他們詳細介紹了這種基于基因指紋和深度學習的藥效預測系統(DLEPS,中文名靈素系統),并證明了 DLEPS 是一種藥物發現和重定位的有效工具。在論文中,他們針對 3 種代謝性疾病開發了重定位和全新化合物分子。
有審稿人稱,靈素系統是一個高度原創的解決方案,也是第一個被報道用神經網絡連接化合物結構和基因表達譜的研究。
“這項工作初步完成了我的期望和設想”,謝正偉告訴生輝。
借此,生輝獨家專訪了該研究的共同通訊作者謝正偉博士。
今年是謝正偉獨立開展科研活動的第五個年頭。他現在是北京大學醫學部的副研究員以及獨立實驗室負責人,長期從事基于多學科交叉和人工智能的創新藥物算法開發,以及細胞衰老機制的研究。此前,他從事純計算的研究工作,開發過微流芯片,并與諾獎得主 Elizabeth H.Blackburn 共同合作在 Cell 發表過論文。
2018 年,他創立了億藥科技,利用 AI 和深度學習加速藥物研發。據謝正偉透露,億藥科技擁有一支多學科交叉創始團隊,具有從頭開發算法的能力,同時也有分子細胞生物學、結構生物學研究能力。目前團隊規模 20 人左右,專業涵蓋藥理學、人工智能、藥物化學、藥理驗證等。
利用 “基因指紋” 預測分子性能
多種疾病特別是年齡、代謝相關疾病的發生和發展都是由于系統失衡造成的基因表達紊亂,通過檢測 “基因指紋” 即基因表達譜可以觀察和研究疾病變化。
一方面,基因表達譜的檢測可以應用于疾病生物標記物的篩選;另一方面,基因表達譜的檢測也可以為基因功能研究提供線索,揭示疾病發生發展的分子機制。
在論文中,科研人員開發的靈素系統正是利用基因表達變化譜為中間指標建立了預測藥效的計算模型,與傳統連接圖方法相比,這種模型適用于沒有實驗數據或者未發現的藥物分子。而連接圖方法雖然采用基因表達譜變化為指標,但是這種方法往往只適用于已有實驗數據的分子,對于新分子束手無策。
在該研究中,他們首先構建了神經網絡,使用 SMILES 化學編碼輸入,將小分子在高維空間進行編碼,高維空間的坐標向量進一步預測 1000 個標記基因,然后對超過 1 萬個基因進行預測;緊接著,他們用疾病相關基因指紋來反映特定疾病的 “內在痕跡”,并且使用基因集合富集分析 (GSEA) 來評估化合物對疾病的潛在療效。
SMILES 即簡化分子線性輸入規范,這是一種用 ASCII 字符串明確描述分子結構的規范。GSEA:是一種分析基因表達信息的方法。
謝正偉團隊將這種方法和模型稱為基于深度學習的藥效預測系統 —— 靈素系統。在預測基因表達變化部分,系統可以準確預測新分子對轉錄組造成的影響,訓練集和測試集中預測的和真實的基因表達譜變化的平均相關性為 0.90 和 0.74,分布峰值分別在為 0.93 和 0.90。
這些指標說明系統成功地從已有數據中學習到深層次的分子結構 - 基因表達譜變化之間的關聯,達到了外推到虛擬分子的效果。
“靈素系統在測試集上的優異表現,使我們相信靈素系統對于新結構分子,也可以取得準確的預測結果”,謝正偉說。
接下來,研究人員深入探索了測試集的一部分分子,這些分子在訓練集中沒有非常相似的分子。
“我們發現,靈素系統可以精確預測新結構小分子誘導的基因表達譜變化(平均相關性 0.6)。同時,系統還可以準確區分結構非常相似的小分子(只差一個基團)誘導的基因表達譜差異”,謝正偉補充道。
研究人員還分析出了哪些基團傾向于保持表達譜不變或者更傾向于改變,這些分析對于后續的藥物設計至關重要。
謝正偉告訴生輝,與傳統基于靶點的方法或者單基因標記篩選方法相比,靈素系統具有三大優勢:
一是,靈素系統同時考慮多個基因指標,精度更高。靈素系統更加靈活,僅基于基因指紋就可預測候選分子,可以在復雜疾病上得到更好藥效的化合物,更快的找到工具分子。
二是,靈素系統不需要預先合成實體分子庫,大大的降低了成本和工作量,效率更高。
三是,找到小分子以后可以進一步發現疾病的新靶點,從而實現在藥效預測和靶點上開發雙管齊下、同步進行。
具有通用性,可預測多種疾病藥物分子
“第一次看到這么好的擬合效果,我驚訝得半天說不出話來。不過,系統是否真正有用還得在實踐中驗證。由于動物實驗周期長,驗證的病種多,我們光驗證就花了兩年的時間”,謝正偉說。
在實驗驗證方面,謝正偉遇到了北京大學基礎醫學部鄭瑞茂研究員,鄭瑞茂當時正在測試雷公藤素,這是一個和連接圖方法有淵源的分子。
兩人一拍即合, 一番交流之后,鄭瑞茂很快理解了靈素系統的潛在價值,并在促進脂肪褐變和減肥領域進行了嘗試。
他們利用靈素系統預測了四個化合物,其中三個化合物可降低小鼠的脂肪含量,并且誘導數十個褐變基因表達上調,使白色脂肪組織變成棕色脂肪組織,減輕了小鼠的體重,達到了減肥目的。
“這大大增強了我們的信心,然后我們繼續嘗試擴展到其他的領域”,謝正偉說。
據謝正偉透露,針對高尿酸血癥,靈素系統成功預測了天然產物紫蘇烯,其可降低血清尿酸,效果上優于四種陽性藥物,還具有抗炎和抗纖維化的優勢。
針對非酒精性脂肪性肝炎(NASH),他們發現三種可緩解 NASH 進展的 MEK-ERK 信號通路抑制劑,并首次揭示了 MEK-ERK 通路在 NASH 中的重要作用。NASH 是一種在全球范圍內十分普遍的慢性肝病,NASH 患者 10 年內肝硬化發生率高達 25%,市場需求巨大。吉利德、武田等制藥大廠紛紛重金布局該領域,然而目前全球尚無一款藥物獲批上市。
“針對 NASH 適應癥,我們發現至少需要調節七個通路才能取得良好的治療效果,而這正是靈素系統所擅長的”,謝正偉說。
SaaS 服務基礎上做自研
2016 年,謝正偉在北京大學醫學院建立獨立實驗室,立志研發抗衰老藥物。
“當時我們已經建立了一套高通量篩選系統,但是篩選效率低,無法滿足針對多種疾病篩選藥物分子的需求。我希望通過 AI 和深度學習預測化合物性能,尋找一些可以抗衰老的化合物,于是開發了這套靈素系統”,謝正偉說。
2018 年,謝正偉正式落地億藥科技,將自己的科研成果轉化為 “藥”。同年,億藥科技完成了種子輪融資。
據謝正偉介紹,論文中只提到了 3 種代謝性疾病,實際上,他們還在探索肌腱愈合、骨質疏松、長壽等領域的潛力,現在已經找到了長壽的化合物。借助于研發優勢,億藥科技還開發了一條替代 GLP-1 的 “爆款” 管線。GLP-1 是 2 型糖尿病藥物的主要作用靶點,GLP-1 類藥物是糖尿病和減肥領域最閃耀的藥物之一。
基于一系列的研究成果,億藥科技已經搭建了多條創新管線和 “老藥新用” 管線,并且申請了十幾個相關的專利。
藥物發現處于整個生物醫藥產業鏈最前端,也是產生核心專利階段。據了解,論文中涉及的小分子 - 神經網絡 - 基因表達變化 - 藥效的算法框架已經申請國內外專利。
“對我們來說,這個專利的優先權具有非常重大的意義和保護作用。因為它的出發點是一個原始創新的框架,所以保護范圍非常大,能夠幫助億藥科技建立專利壁壘和保持競爭優勢”,謝正偉說。
謝正偉告訴生輝,一家 AI 制藥公司的核心競爭力,主要體現在商業發展上,可以簡單歸結為兩個指標。第一個指標是做技術服務的能力,是否能拿到大公司的訂單;另一個指標是自研管線,是否有成為創新型研發中心以及未來成為藥企的潛力。
基于靈素系統以及搭建的人工智能平臺、藥物化學平臺、藥理驗證平臺,億藥科技最近拿到中國科學院以及一家頭部藥企的訂單合同。
“我們的商業模式可以簡單歸結為 3 種,一是提供 SaaS 平臺付費計算服務,二是提供化合物篩選等技術服務,三是自有管線的研發”,謝正偉說。
目前,億藥科技正在進行 Pre-A 輪融資,本輪融資將會用于自有管線研發、平臺建設、隊伍擴充和管線的 IND 推進。
“做藥一直是我們的初衷,我希望億藥科技成為一家 AI + 大數據驅動的科研型制藥公司。未來,我們會在提供 SaaS 服務和技術服務的基礎上,注重推動自研管線,并將這些管線推向臨床、推向市場,最終使患者受益”,謝正偉這樣描述億藥科技未來的發展規劃。
編輯:jq
-
AI
+關注
關注
87文章
31139瀏覽量
269476 -
人工智能
+關注
關注
1792文章
47432瀏覽量
238976 -
深度學習
+關注
關注
73文章
5507瀏覽量
121294
原文標題:基于基因指紋的藥效預測新模型登頂刊,這家AI制藥初創瞄準衰老代謝疾病丨專訪億藥科技
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論