細胞分析 | 分子圖譜 |IND
生物識別| 基因測序 |膜蛋白
前幾天,著名的結構生物科學家顏寧宣布將辭去美國普林斯頓大學教職,回國出任深圳醫學科學院創始院長的消息在網上刷屏,并迅速沖上了熱搜第一。
顏寧,山東章丘人,1977年11月生, 2007年受聘清華大學醫學院擔任教授和博士生導師,2012年獲得長聘教授資格,2013年成為拜耳講席教授。2017年受聘普林斯頓大學,成為首位雪莉·蒂爾曼終身講席教授。
她主要致力于跨膜運輸蛋白的結構與機理研究,在國際上首次揭示人源葡萄糖轉運蛋白、真核生物電壓門控鈉離子通道和鈣離子通道等一系列具有重要生理與病理意義跨膜蛋白的原子分辨率結構,為理解相關疾病的致病機理及藥物開發提供了分子基礎。
自2009年以來,顏寧作為通訊或者共同通訊作者發表學術研究論文近80篇,其中33篇發表于《細胞》、《自然》、《科學》。
顏寧于2005年獲得Science/AAAS和GE Healthcare “青年科學家獎”(北美地區);2012年獲得美國HHMI首屆國際青年科學家獎、“中國優秀青年女科學家獎”;2014年獲何梁何利基金科學與技術進步獎;2015年獲國際蛋白質學會青年科學家獎,賽克勒國際生物物理獎,并受聘長江講座教授(2018年終止);2016年成為戈登學術會議(Gordon Research Conference)首位來自中國大陸地區的Alexander Cruickshank報告人;2018年獲亞洲及大洋洲生物化學家和分子生物學家聯盟(FAOBMB)“卓越研究獎”;2019年獲得以色列魏斯曼研究所頒發的國際“女科學家獎”;2021年獲得國際生物物理協會頒發的Anatrace膜蛋白研究獎。
顏寧突然回國所謂何?
2014年,顏寧帶領一個平均年齡不到30歲的團隊,只用了6個月時間,首次解析了人源葡萄糖轉運蛋白GLUT1的晶體結構和工作機理,成功攻克了橫亙在全世界分子結構科學家面前長達50年的一個難題,這一成就也使得顏寧收獲了無數的榮譽。而這樣的研究成果并沒有引發網絡輿論的廣泛關注。最大的兩次爭議,一次是離開,一次是回來。顏寧此次回國最主要的爭議是:”據說她在美國已經學術破產干不下去了,因為她的工作已經被AI取代了。”很多完全不懂科學、不懂AI的鍵盤俠們抱著一種幸災樂禍的感覺吃瓜。一篇網上熱轉的文章,開頭就用極其夸張和簡單的幾句話概括了整個事件。
首先來看此次爭議中的另一個主角——“AlphaFold”是什么?又做了什么?
AlphaFold可以說是生物界的AlphaGo,它的所做出的貢獻也被該領域的科學家們稱為“劃時代的進步”。同樣出自于DeepMind公司AlphaFold,和橫掃頂尖人類圍棋職業選手的AlphaGo一樣,分別在2018年(首次參加)和2020年國際蛋白質結構預測競賽(CASP)上一舉擊敗了其余的參會選手摘得頭魁,并在生物學領域引發轟動。
在DeepMind公開了AlphaFold的源代碼之后,生物學界也掀起了一陣“AlphaFold狂熱”的研究。
AlphaFold誕生之前的50年中,科學家們需要進行大量的試錯,耗費大量的時間和精力,采用冷凍電子顯微鏡、核磁共振或 X 射線晶體學等實驗手段在實驗室中確定蛋白質的形狀。
1972年,諾貝爾化學獎得主Christian Anfinsen提出,理論上,蛋白質的氨基酸序列應該能夠完全決定它的3D結構。這一假說讓科學家們開始了基于氨基酸序列,通過計算方法預測蛋白質3D結構的探索。
然而,這樣的探索面臨著極其重大的挑戰,20世紀80、90年代用計算機預測蛋白質結構的早期嘗試并不成功。AlphaFold的出現改變了這一局面。2021年,DeepMind宣布已經用AlphaFold預測了人體內近乎所有蛋白質的結構,以及20個其他被大量研究的生物體的完整“蛋白質組”,其中包括小鼠和大腸桿菌,累計共有36.5萬個結構。
而今年,DeepMind更是計劃發布總計1億多個結構預測——相當于所有已知蛋白的近一半,是蛋白質數據銀行(PDB,Protein Data Bank)結構數據庫中經過實驗解析的蛋白數量的幾百倍之多。顏寧的成就攻克了困擾生物學界50年的一個難題,AlphaFold的成就同樣解決了困擾生物學界50年的重大挑戰。
所以就有人說:你看顏寧跟她的團隊研究那么久才搞出來一個結構,AlphaFold一下子就能預測出上億個,等于是把整個游戲都顛覆了,然后像顏寧他們這樣的人當然是下崗沒地兒去了。
這里面有幾點需要思考:
一、現在小學生都知道的無理數和虛數在歷史上花費了人們上千年的思考才出現,我們不能說之前那些數學家搞得就是小學生都懂的玩意兒。
二、AI的能力來自于前人積累的數據。AlphaFold之所以能夠做到這件事兒,恰恰是因為前面有科學家做了無數的理論和實驗的工作,它才有一個非常好的基礎。AI是站在很多個巨人的肩膀上才能達到這樣的高度的,如果沒有這些科學家之前的結果,AI和機器學習是不可能自己學會做生物學研究的。
三、科學家并不是只做這一件事,AI能做了他們就要被取代了。因為AlphaFold研究如此復雜,如果AI能解決的話,那恰恰是可以把這些科學家從大量重復且繁重的實驗中解放出來,讓他們去研究更多更有意思的課題。其實就相當于我們發明了自行車、汽車,然后它們可以幫助人類行走,這并不是意味著人類就不需要走路了,而是說人把這個時間節省下來,給人類提供了更大的自由,可以讓人去做更有意義的事情。
四、顏寧并不是在國外混不下去才要回國。顏寧這樣的頂級的科學家,發了這么多《Nature》、《Science》、《CELL》,僅靠悶頭做做重復性的實驗是不可能的。沒有發過論文的人憑空臆想以為只是努力熬夜做重復工作就可以發頂刊的論文了。
深圳醫學科學院為何可以吸引顏寧任職
據深圳發布報道,深圳醫學科學院由市政府設立,登記為市政府舉辦的事業單位,實行黨委領導下的院長負責制;不定編制,不定級別,實行社會化用人制度。理事會是深圳醫學科學院的決策機構;院長是深圳醫學科學院的法定代表人,面向全球招聘,由理事會聘任,實行任期制。
據透露,深圳醫學科學院將按照全新機制的要求,主要建設“四平臺一智庫”,力爭到本世紀中葉成為全球著名醫學研究機構。
也就是說,深圳醫學科學院是一所國家支持建設的全新機制醫學科學院。所謂“全新機制”包括兩個方面。
一、定位新
就是說,深圳醫科院不僅是一個單純的研究機構,按官方說法,它更是一個“組織科研的科研組織”。其核心功能,一要承擔醫學科技研究方面的公共管理和服務職能。另外,還要引領深圳醫學科技發展。為此,深圳市政府還設立了“深圳市醫學研究專項資金”,委托深圳醫科院進行專業化管理。
二、機制新
不定編制,不定級別,自主設崗,遵循理事會治理、學術自治原則。對包括院長在內的科研人才,實行市場化薪酬、社會化用人制度。去年9月,深圳衛健委就曾發布過一波深圳醫學科學院管理崗位人員的招聘。
三、政府政策的支持
機制新不止體現在人事方面。深圳醫科院雖然登記為深圳市政府的直屬事業單位,但本質上是一個法定機構,實行“一院一法”。具體來講,就是政府會出臺《深圳醫學科學院管理辦法》,可以不用顧及傳統事業單位的體制,依法自主辦院。
四、深圳醫學科學學院財力雄厚
首先是政府專項資助,這就是上文提到的“深圳市醫學研究專項資金”。今年5月份釋出的文件中顯示,2022年政府為其預算撥款2848萬元。同時,深圳醫科院還會設立聯合基金、接受慈善捐贈、引入風險投資,逐步探索設立“粵港澳大灣區衛生健康科技創新引導基金”。此外,醫科院的另外一大資金來源便是藥物、器械的轉化及生產,轉化而來的收益直接反哺給自己。
五、深圳醫學科學院未來發展規劃
關于深圳醫學科學院未來發展規劃,總結下來有兩點。
1)聚合資源
深圳醫學科學院就相當于一個醫學科技協同創新平臺,解決國內醫學科技資源配置分散的問題,避免資源交叉浪費,科研經費使用效率低。
2)幫助轉化科研成果
深圳將允許科研人員通過“技術入股”,在轉化項目中持有股份,直接參與科技成果的轉化過程,提高轉化積極性。
此外,深圳醫科院還將通過天使投資等形式,“入股”轉化企業,逐步從單一科技研發向科研產業混合體過渡。據深圳醫學科學院建設方案消息,深圳醫學科學院將在2025年基本建成。
顏寧也談到:
“深圳醫學科學院的一個重要使命是把研、藥、醫緊密結合在一起,打通從病床到實驗室,再到制藥公司,最后回到病床這樣端到端的順暢聯系。希望深圳醫學科學院不僅能夠產生若干原創的科研突破,還能探索一個科學合理的機制,在保障科研人員術業有專攻,專注科研的同時,可以有效地幫助大家實現科研成果的轉化。”
藍海大腦攜液冷服務器助力生命醫藥發展
某學院單細胞基因組研究技術中心(簡稱“該中心”)旨在建立標準化、自動化的工程技術,提高單細胞結構分析水平,高精度確定從蛋白質分子到全細胞的三維結構,并在此基礎上揭示蛋白質及其復合體功能,大規模制備蛋白/抗體,建成具有國際一流水平和綜合示范功能的蛋白質科學研究核心基地。
就生命科學研究項目而言,每個項目涉及的數據量小在上百TB。對于時間周期長、領域廣的項目,未來數據需求可能在PB級。此外,該中心需要考慮支持多種生命科學研究項目,而其中,不同應用對高性能平臺計算環境有不同的要求,如基因測序需要高I/O性能和內存大消耗,而分子動力學研究除了I/O性能外,還需要較高的網絡和并發處理能力。
一、當前生命科學領域面臨的挑戰
1)數據量增長10多倍,計算能力也要“跟上”
研究團隊采用的冷凍電鏡技術在近兩年取得了革命性的進展,具體來說就是相機技術實現了飛躍,采集數據的能力提高了10多倍,甚至上百倍,從而使得研究蛋白質結構的源數據呈幾何級數增長,這就需要中心在后期全面提升數據處理和計算能力。
2)亟需簡化管理保障服務品質
隨著生命科學研究項目越來越多,如何根據不同項目和研究人員個性化需求分配資源,及時回收資源,實現跨整個高性能資源池的集中統一管理,簡化維護管理,減輕運維人員負擔,是科研高性能計算平臺普遍面臨問題。
3)TCO居高不下
生命科學研究迅速成為國家戰略發展方向,導致研究項目和跨學科研究需求快速增加。傳統的分層計算存儲資源利用率低,導致新增費用快速增加。此外,能耗也成為阻礙高性能計算中心擴展的不可逾越的“高墻”。
4)網絡性能不能拖后腿
作為保證高性能集群正常運行的關鍵,高性能網絡承擔著重要的連接任務。隨著單節點計算和存儲性能的不斷提升,高性能用戶需要萬兆,四萬兆,十萬兆,InfiniBand網絡選擇以滿足不同的高性能計算需求。
二、解決方案特點
藍海大腦基于融合架構助力某學院單細胞基因組研究技術中心搭建了一個分布式高性能平臺,擁有250個物理計算節點,5000個計算核心,總存儲容量1.92PB,理論計算能力208Tflops。通過Lustre技術實現了跨20個融合架構的集中統一管理。
1)4.1TFLOPS/U的計算密度,4倍性能提升
可針對不同項目量身定制配置。其中,高密度計算節點支持14核英特爾?至強TM E5-2600v3處理器,在2U中擁有224個計算核心的密度,單U空間的計算性能密度達到業界領先的4.1TFLOPS,同時支持64個DIMM高密度內存,確保高性能和低延遲的性能要求。此外,還支持InfiniBand接口,非常適合要求超低延遲的工作負載。在強大計算能力的保證下,計算效率提升3-4倍,過去4-5天才能完成的計算任務,一天就能完成。
2)簡化高性能資源池監控管理
根據項目要求定制不同的系統配置,同時通過機箱管理控制器(CMC),可以集中監控和管理20個FX系統。此外,無代理生命周期管理和一對多遠程管理功能可確保BIOS和固件程序更新不會影響業務穩定性,并提高系統中計算節點生命周期管理的效率。而且在擴展服務器時,IT人員可以通過下發配置文件,使系統自動更新BIOS和固件程序,避免了重復輸入配置參數的繁瑣過程,減少了人工輸入錯誤導致的系統故障,簡化了管理運維,降低了管理費用。
3)TCO降低約20%
自動化、高密度、低能耗的集成部署、集中統一管理,可以使中心的TCO降低20%左右。其中,藍海大腦將通過主板連接服務器、存儲和1G0b網絡,通過模塊化設計形成融合一體機,同時提供散熱、供電、網絡、管理和PCIe擴展的共享插槽,降低數據中心的占地和能耗,幫助中心獲得良好的性價比。
4)高速網絡保障平臺I/O性能
藍海大腦為中心提供四萬兆高性能網絡,在保持成本優勢的基礎上,為用戶提供穩定的網絡性能,保證高性能、低延遲要求。
5)打破原有的服務器散熱方式,采用液冷散熱
藍海大腦液冷服務器系統突破傳統風冷散熱模式,采用風冷和液冷混合散熱模式——服務器內主要熱源 CPU 利用液冷冷板進行冷卻,其余熱源仍采用風冷方式進行冷卻。通過這種混合制冷方式,可大幅提升服務器散熱效率,同時,降低主要熱源 CPU 散熱所耗電能,并增強服務器可靠性。經檢測,采用液冷服務器配套基礎設施解決方案的數據中心年均 PUE 值可降低至 1.2 以下。
三、客戶收益
1)藍海大腦HPC高性能計算與AI平臺已成為高性能、多功能、專業的前沿計算平臺,尤其在AI深度學習方面,為校內外生物學研究提供高效的計算支持。同時為計算生物學、深度學習、基因測序等多個研究組提供計算服務。包括測序儀的離線處理、序列搜尋比對分析、分子動力學模擬、計算機輔助藥物設計和分子對接、生物網絡的計算。
2)全力支持基于深度學習的分子圖編碼和基于深度學習的中藥方劑系統的研發。研發人員可以利用HPC高性能計算和AI平臺開發基于三維分子圖譜的深度學習編碼,進行基于深度學習的中醫診斷處方。多任務分子預測模型由卷積神經網絡或遞歸神經網絡構成。交叉驗證用于調整和驗證參數,外部數據用于測試和評估模型。同時,從預測模型中挖掘關鍵信息。同時通過卷積神經網絡或遞歸神經網絡學習大量的方劑配伍信息,然后用主藥生成語義自動關聯分析得到的輔藥,從而生成新的方劑。藍海大腦HPC高性能計算和AI平臺提供了高效并行的計算資源,大大加快了模型的訓練速度,從而在有效的時間內完成最終的任務。
3)支持基于化學片段的從頭計算藥物設計,對疾病的治療和生物學功能的理解有重要的促進作用。傳統的藥物篩選過程耗時長,成本高,導致整個藥物設計和發現過程效率低下。為了加快藥物設計和發現的進程,研究人員利用這一平臺逐步發展了分子從頭設計的方法,并取得了良好的效果。研究人員通過蒙特卡洛樹搜索和神經網絡模型的結合,實現了巨大化學空間的搜索和最優結構的采樣,快速完成了完整的從頭計算藥物設計過程,并探索了蛋白質口袋表征和評分功能。
4)利用深度學習框架構建深度學習模型,加強學習模型的訓練,實現深度學習的評分函數模型的訓練和測試,并對模型進行訓練。對于模型生成的分子,通過聚類分析分子的合成、毒性和理化性質,選擇合適的分子。
審核編輯 黃昊宇
-
服務器
+關注
關注
12文章
9295瀏覽量
85882 -
AI
+關注
關注
87文章
31490瀏覽量
269914
發布評論請先 登錄
相關推薦
評論