又一次,計(jì)算機(jī)科學(xué)家和生物學(xué)者站在一起,對抗人類向內(nèi)探索的挑戰(zhàn)——用機(jī)器學(xué)習(xí)預(yù)測基因編輯 CRISPR 中的脫靶效應(yīng)。
今年年初,發(fā)表在《自然》生物工程雜志上的一篇論文描述了 Elevation 這項(xiàng)工具。該工具由微軟研究員 Nicolo Fusi、加州大學(xué)伯克利分校的 Jennifer Listgarten 和 Broad 研究所副主任 John Doench 合作研發(fā),可在 CRISPR 編輯基因時(shí)預(yù)測脫靶效應(yīng)。
那么何為“脫靶”?何為“CRISPR”?何為“基因編輯技術(shù)”?
首先,讓我們來認(rèn)識這項(xiàng)關(guān)鍵技術(shù)“CRISPR”(Clustered regularly interspaced short palindormic repeats),也被稱為“CRISPR/Cas9 基因編輯技術(shù)”。
根據(jù)維基百科上的介紹來看,CRISPR 是存在于細(xì)菌中的一種基因組,該基因組中含有曾經(jīng)攻擊過該細(xì)菌的病毒的基因片段。細(xì)菌透過這些基因片段來偵測并抵抗相同病毒的攻擊,并摧毀其 DNA 的特定部分。目前 Cas9 是首個(gè)被掌握且廣泛應(yīng)用的核酸酶。
該系統(tǒng)主要由兩部分構(gòu)成:一個(gè)負(fù)責(zé)剪切的 Cas9 蛋白,一個(gè)負(fù)責(zé)識別基因組中特定序列的“向?qū)NA”(sgRNA)。
通過該序列,科學(xué)家們可以準(zhǔn)確且有效地編輯生命體內(nèi)的部分基因(通俗來講,就是在特定基因的特定位點(diǎn)切割和改變 DNA)。該技術(shù)可能會帶來突破性應(yīng)用,如改造細(xì)胞生產(chǎn)高產(chǎn)耐寒作物,甚至還可能幫助人類大規(guī)模消除癌癥、艾滋等疾病。
機(jī)器學(xué)習(xí)預(yù)測脫靶效應(yīng)
不知大家是夠還記得 2017 年 5 月發(fā)表在《Nature Methods》雜志上的一篇題為“Unexpected mutations after CRISPR-Cas9 editing in vivo”的論文研究?盡管后續(xù)調(diào)查發(fā)現(xiàn)研究存在的實(shí)驗(yàn)漏洞導(dǎo)致了錯(cuò)誤判斷,但也側(cè)面反映出 CRISPR/Cas9 基因編輯系統(tǒng)存在的技術(shù)安全上諸多挑戰(zhàn)。
其中一個(gè)重要問題就是發(fā)生在基因組中的脫靶效應(yīng),不僅在其目標(biāo)序列切割,還對相似序列進(jìn)行切割,導(dǎo)致產(chǎn)生潛在突變及危害。這一現(xiàn)象被稱為“脫靶效應(yīng)”。
為此,研究人員現(xiàn)在有多種方法來改善這一問題。本文開頭提到的 Elevation 工具正是試圖通過機(jī)器學(xué)習(xí)手段予以預(yù)測。
首先,他們在生成的數(shù)據(jù)上訓(xùn)練出了第一層機(jī)器學(xué)習(xí)模型。這些數(shù)據(jù)報(bào)告了所有可能的靶向區(qū)域的活動,只有一個(gè)核苷酸與向?qū)?RNA 不匹配。
然后,通過團(tuán)隊(duì)哈佛醫(yī)學(xué)院和馬塞諸塞州總醫(yī)院附屬醫(yī)院給出的公開數(shù)據(jù),機(jī)器學(xué)習(xí)專家訓(xùn)練了第二層模型,該模型將第一層模型改進(jìn)并推廣到模型存在多個(gè)錯(cuò)配核苷酸的案例中。
"第二個(gè)模型非常重要,因?yàn)槊摪行?yīng)可以發(fā)生在不止一次向?qū)?RNA 與靶向 DNA 之間的錯(cuò)配",伯克利大學(xué)分校 Lisgarten 教授表示。在他看來,一些模型特征是直觀的,例如向?qū)?RNA 與核苷酸序列之間的錯(cuò)配問題。
最后,該團(tuán)隊(duì)在其他幾個(gè)公開數(shù)據(jù)集上驗(yàn)證了他們的雙層模型,這其中還包括哈佛醫(yī)學(xué)院和馬塞諸塞州總醫(yī)院附屬醫(yī)院生成的數(shù)據(jù)集。
通過計(jì)算工具,研究人員可以輸入他們想要修改的基因名稱,搜索結(jié)果將反饋出預(yù)測的脫靶效應(yīng),研究人員據(jù)此再進(jìn)行排序。研究人員面臨的首要挑戰(zhàn)是為特定的實(shí)驗(yàn)選擇何種 RNA。在每個(gè)向?qū)?RNA 上大約有 20 個(gè)核苷酸,因此在每組實(shí)驗(yàn)中,每個(gè)靶向 DNA 基因上都匹配有數(shù)百種潛在的向?qū)?RNA。
目前 Elevation 和另一篇用于預(yù)測靶向效應(yīng)的工具 Azimuth 合起來使用,現(xiàn)已開源代碼。(鏈接:https://www.crispr.ml/)
一場始料未及的風(fēng)波
實(shí)際上,“脫靶效應(yīng)”這個(gè)早就讓研究人員們“草木皆兵”的研究話題自始至終都沒有妥善的解決方案,而今卻因另一件尚未確認(rèn)的“突破性”進(jìn)展驟然掀起了世界范圍內(nèi)包括學(xué)術(shù)研究者在內(nèi)的熱議。
挑起人們興趣的來源于 11 月 26 日的一則公開消息。
“一對基因經(jīng)過修改的雙胞胎嬰兒已于 11 月健康誕生,基因編輯使她們將來可能具有天眼抵抗艾滋病的能力。這是世界首例免疫艾滋病的基因編輯嬰兒,也意味著中國在基因編輯技術(shù)用于疾病預(yù)防領(lǐng)域?qū)崿F(xiàn)歷史性突破。”
來自中國深圳的科學(xué)家賀建奎在第二屆國際人類基因組編輯峰會召開前一天表示。
圖:賀建奎
然而,這個(gè)“歷史性突破”卻未迎來掌聲,而是更多人對該起事件的譴責(zé)。就連該技術(shù)發(fā)明人 Jennifer Doudna 也緊急回應(yīng)稱:“假定今天( 26 日)的新聞得到證實(shí),這使得對基因編輯技術(shù)的使用限制更為緊迫,我們應(yīng)該限制對人類胚胎細(xì)胞的基因編輯僅僅用于確切的未被滿足的醫(yī)學(xué)需求。”
基因編輯技術(shù),無論是用在人類醫(yī)學(xué)、動植物育種還是藥物篩選領(lǐng)域,都存在技術(shù)與倫理道德層面的雙重考驗(yàn)。
那么如果在可接受的倫理道德和醫(yī)學(xué)需求范圍之內(nèi),研究人員對基因編輯技術(shù)的探索仍舊不會終止。
這不禁讓筆者想起了“進(jìn)擊的巨人”中描述的那樣:破墻而入捕食人類的巨人,實(shí)際上在數(shù)百年前是人類自己所創(chuàng)造。
目前賀建奎團(tuán)隊(duì)表示將于11 月 28 日(本周三)在香港正式發(fā)布關(guān)于此次基因編輯的全盤報(bào)告,讓我們拭目以待。
-
計(jì)算機(jī)科學(xué)
+關(guān)注
關(guān)注
1文章
144瀏覽量
11511 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8473瀏覽量
133748
原文標(biāo)題:“基因編輯嬰兒”惹爭議,你或許不知道機(jī)器學(xué)習(xí)在脫靶效應(yīng)中的作用?
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
如何用卷積神經(jīng)網(wǎng)絡(luò)方法去解決機(jī)器監(jiān)督學(xué)習(xí)下面的分類問題?
使用Bionconductor完成基因芯片預(yù)處理的流程
ApE_非常簡便快捷的基因編輯軟件
什么是機(jī)器學(xué)習(xí)?機(jī)器學(xué)習(xí)能解決什么問題?(案例分析)

CRISPR-Cas9基因編輯技術(shù)貌似再次遭遇挑戰(zhàn)
世界首例免疫艾滋病的基因編輯嬰兒誕生 基因編輯技術(shù)實(shí)現(xiàn)了歷史性突破

什么是嵌合體?基因編輯技術(shù)的最大安全性問題
如何防止科學(xué)狂人和基因編輯技術(shù)再次突破底線
最新研究 AI如何對致病基因變異實(shí)現(xiàn)精準(zhǔn)編輯
基因編輯結(jié)合石墨烯晶體管,可在幾分鐘內(nèi)檢測基因突變
單堿基基因編輯存在脫靶效應(yīng),會導(dǎo)致RNA突變

評論