在深度學(xué)習(xí)進(jìn)入瓶頸之際,醫(yī)學(xué)影像AI科研人員分為兩大派:理論派和工程派。
理論派希望解決深度學(xué)習(xí)“短缺”的部分,通過預(yù)先構(gòu)建先驗(yàn)知識(shí),在不過度依賴大數(shù)據(jù)的前提下,開發(fā)出一個(gè)可解釋的、高精度、可解決諸多長尾問題的“智能模型”。
工程派的做法則是進(jìn)一步發(fā)揮深度學(xué)習(xí)自身的優(yōu)勢(shì),利用更多標(biāo)注數(shù)據(jù),去訓(xùn)練出一個(gè)能夠?qū)W習(xí)更多維度特征的“經(jīng)驗(yàn)?zāi)P汀薄?/p>
“深度學(xué)習(xí)正走向兩極化,大部分研究深度學(xué)習(xí)的人員會(huì)偏向于工程化,包括建立更加全面、便捷、快速、可視化的深度學(xué)習(xí)平臺(tái),‘暴力’地將深度學(xué)習(xí)應(yīng)用到更加多的領(lǐng)域。小部分的深度學(xué)習(xí)研究者會(huì)偏向于理論化,解決深度學(xué)習(xí)的理論瓶頸包括可解釋性等問題。”
密歇根州立大學(xué)湯繼良教授曾如此總結(jié)到。
醫(yī)療AI熱潮,無疑離不開這波深度學(xué)習(xí)的發(fā)展,但由于深度學(xué)習(xí)的天然局限性和醫(yī)療領(lǐng)域的特殊性,使得醫(yī)療AI這一交叉的領(lǐng)域,也在進(jìn)入瓶頸期。
隨著深度學(xué)習(xí)即將觸及天花板,醫(yī)學(xué)影像分析科研人員也隨之分為兩大派別:理論派和工程派。
理論派的初衷,是解決深度學(xué)習(xí)“短缺”的部分,強(qiáng)調(diào)人工設(shè)計(jì)和數(shù)學(xué)論證,通過預(yù)先構(gòu)建先驗(yàn)知識(shí),在不過度依賴大數(shù)據(jù)的前提下,開發(fā)出一個(gè)可解釋的、高精度、可解決諸多長尾問題的“智能模型”。不少專家認(rèn)為,醫(yī)療AI中有大量Mission Critical和長尾問題,這對(duì)研究人員的整體系統(tǒng)設(shè)計(jì)能力要求非常高,因此人的作用就顯得尤為重要,而基于黑箱統(tǒng)計(jì)模型的深度學(xué)習(xí),顯然存在太多的弊病。
工程派的做法,則是進(jìn)一步發(fā)揮深度學(xué)習(xí)自身的優(yōu)勢(shì),揚(yáng)長避短,獲取更多標(biāo)注數(shù)據(jù),設(shè)置更多參數(shù),用更強(qiáng)大的算力,訓(xùn)練出一個(gè)能夠?qū)W習(xí)更多維度特征的“經(jīng)驗(yàn)?zāi)P汀薄F浔举|(zhì)是建立某種學(xué)習(xí)和搜索的Meta Method,依靠摩爾定律帶來的指數(shù)增長的算力,讓機(jī)器自行構(gòu)建復(fù)雜的知識(shí)系統(tǒng)。
前者強(qiáng)調(diào)人工設(shè)計(jì),后者依靠機(jī)器自主構(gòu)建。
后深度學(xué)習(xí)時(shí)代的醫(yī)療AI研究走向,正朝著這兩個(gè)看似極端的方向發(fā)展,工者愈工,理者愈理。
前者的難度在于理論的突破,從某種程度上取決于個(gè)別人的開創(chuàng)性研究成果;而后者在很大程度上取決于整個(gè)行業(yè)的數(shù)據(jù)標(biāo)準(zhǔn)化、開放化和監(jiān)管進(jìn)度。
二者雖殊途,但目的是同歸。
深度學(xué)習(xí)+醫(yī)學(xué)影像的瓶頸
電子科技大學(xué)教授李純明曾在接受雷鋒網(wǎng)AI掘金志采訪時(shí)談到,深度學(xué)習(xí)吸引人的地方在于,原則上它在不同的應(yīng)用中均可以使用同樣的訓(xùn)練算法框架。
只需替換訓(xùn)練數(shù)據(jù)和相應(yīng)的標(biāo)注進(jìn)行訓(xùn)練,即可得出一個(gè)具有某種輸入輸出關(guān)系的多層神經(jīng)網(wǎng)絡(luò)。
輸入一個(gè)數(shù)據(jù),系統(tǒng)就輸出一個(gè)結(jié)果,應(yīng)用過程可以做到全自動(dòng)。
但這種看起來一勞永逸的框架,在實(shí)際應(yīng)用中還有一些局限。
以醫(yī)學(xué)影像分析為例,由于醫(yī)學(xué)影像數(shù)據(jù)復(fù)雜多變,不同器械商的成像設(shè)備、不同的成像參數(shù)選擇、成像設(shè)備的更新?lián)Q代等因素,都會(huì)導(dǎo)致圖像性質(zhì)(如信噪比、分辨率和偽影等等)的變化,以及不同病人與病情的差異也會(huì)導(dǎo)致圖像特征的變化。
訓(xùn)練數(shù)據(jù)如果不夠“大而全”,一旦遇到跟訓(xùn)練數(shù)據(jù)有一定差異的數(shù)據(jù),加入一點(diǎn)噪音,神經(jīng)網(wǎng)絡(luò)輸出的結(jié)果可能就會(huì)出很大的錯(cuò)誤。
但訓(xùn)練數(shù)據(jù)要多“大”多“全”?也并未有一個(gè)客觀的量化標(biāo)準(zhǔn)。
深度學(xué)習(xí)需要用醫(yī)生手工標(biāo)注的數(shù)據(jù),還要求訓(xùn)練數(shù)據(jù)和手工標(biāo)注符合一定的標(biāo)準(zhǔn)。
但數(shù)據(jù)的標(biāo)準(zhǔn)化,還尚未提出通用的法則遵循。而在算法層,深度學(xué)習(xí)的調(diào)參也并沒有規(guī)律可循,調(diào)參難題至今未得到實(shí)質(zhì)性解決。
這些都可能會(huì)給深度學(xué)習(xí)的應(yīng)用帶來諸多不確定性,致使其在不同數(shù)據(jù)集上的性能可能會(huì)截然不同,魯棒性較差。
在醫(yī)療領(lǐng)域的應(yīng)用上,深度學(xué)習(xí)的不可解釋性也是個(gè)無法回避的問題。
醫(yī)生和病人都很難接受這種不可解釋的診斷結(jié)果和治療方案,而當(dāng)前工科會(huì)議的論文,基于不可解釋的深度學(xué)習(xí)研究成果幾乎是主流。
“數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)只是數(shù)據(jù)處理的工具之一,它在醫(yī)療領(lǐng)域離真正的落地還有相當(dāng)大的距離,還需在理論和技術(shù)上有所突破。學(xué)術(shù)界研究深度學(xué)習(xí)不應(yīng)太工程化,應(yīng)該多研究一些基礎(chǔ)性的理論問題,提出更有原創(chuàng)性的算法。”李純明談到。
“我認(rèn)為,從眼前來講,不應(yīng)該一窩蜂都用數(shù)據(jù)驅(qū)動(dòng)的深度學(xué)習(xí)。一些醫(yī)學(xué)圖像算法的開發(fā)也應(yīng)該針對(duì)不同的應(yīng)用,去設(shè)計(jì)不同的算法,開發(fā)者盡可能在算法中融入領(lǐng)域知識(shí),設(shè)計(jì)出針對(duì)特定應(yīng)用的個(gè)性化的方法,而不是對(duì)每個(gè)病種都在TensorFlow或Pytorch等開源框架上用不同的數(shù)據(jù)進(jìn)行訓(xùn)練和調(diào)參。由于深度學(xué)習(xí)這種數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)過程,是一種較少利用領(lǐng)域知識(shí)的機(jī)制,因此技術(shù)的開發(fā)也就幾乎不需要開發(fā)者與醫(yī)生的交流。醫(yī)生在技術(shù)開發(fā)的過程中只起到了對(duì)訓(xùn)練數(shù)據(jù)手工標(biāo)注的作用,也就是說醫(yī)生被當(dāng)作人工智能背后的‘標(biāo)注工人’來用。”
“從長期來講,數(shù)據(jù)為王的醫(yī)學(xué)影像AI研究方法,在未來遇到的問題將會(huì)越來越多。當(dāng)前多數(shù)學(xué)者更多停留在簡單的工程問題,缺乏在基礎(chǔ)研究上的突破性進(jìn)展,企業(yè)界的技術(shù)開發(fā)也因此遭遇瓶頸。”
與此同時(shí),現(xiàn)在的深度學(xué)習(xí)其實(shí)是一個(gè)有問題的框架,用大量標(biāo)注數(shù)據(jù)做訓(xùn)練的方法,在過去幾年很成功,但在解決醫(yī)療這類擁有諸多“非封閉”和”長尾”問題的領(lǐng)域,當(dāng)前的深度學(xué)習(xí)主流研究,并不代表是正確的方向。
現(xiàn)階段,計(jì)算機(jī)視覺系統(tǒng)是一個(gè)Training System,而不是一個(gè)Learning System,我們需要從Training System變成Learning System,讓機(jī)器主動(dòng),并結(jié)合數(shù)據(jù)的結(jié)構(gòu)、時(shí)間空間結(jié)構(gòu)去學(xué)習(xí),而不是被動(dòng)地用人工訓(xùn)練來標(biāo)注它。
目前行業(yè)走的是粗放型發(fā)展路線,是靠堆積數(shù)據(jù)和計(jì)算資源來換取高性能,這是資源而不是效率的競賽。在大家把醫(yī)學(xué)影像分析聚焦于Data Set的大環(huán)境下,雖然在工業(yè)界已有一定的成果,但理論派認(rèn)為,原創(chuàng)性技術(shù)和基礎(chǔ)研究,更值得工科人去關(guān)注和投入。
AI理論創(chuàng)新之外的解決方法
正是由于深度學(xué)習(xí)遭遇的種種問題,也促使優(yōu)秀科學(xué)家加大了對(duì)基礎(chǔ)理論的研究。
而另一方面,在部分臨床問題中,也可通過在非技術(shù)層的行業(yè)標(biāo)準(zhǔn)構(gòu)建等方法,來逐步推動(dòng)醫(yī)學(xué)影像AI輔助診斷的發(fā)展。
第一步,則需定義好要解決的問題。
上海長征醫(yī)院影像醫(yī)學(xué)與核醫(yī)學(xué)科主任劉士遠(yuǎn)在2018中國醫(yī)學(xué)人工智能大會(huì)的演講中指出,現(xiàn)在的AI醫(yī)療產(chǎn)品遇到的首個(gè)問題便是實(shí)用性差,如現(xiàn)在常見的影像AI產(chǎn)品大多是基于單病種圖像標(biāo)注形成的模型,尚未符合臨床實(shí)用場(chǎng)景的產(chǎn)品,而且大多數(shù)產(chǎn)品性能的自報(bào)數(shù)據(jù)與實(shí)際檢測(cè)數(shù)據(jù)不符,魯棒性有待提高。
AI產(chǎn)品往往只是集中在少數(shù)幾個(gè)病種,難以覆蓋全部醫(yī)學(xué)影像問題。
其次,行業(yè)現(xiàn)在普遍缺乏標(biāo)準(zhǔn)化高質(zhì)量的訓(xùn)練數(shù)據(jù),國內(nèi)外雖然有很多公開的數(shù)據(jù)庫,但是存在同質(zhì)化和人種差異等問題。
而且眾多人工智能企業(yè)和機(jī)構(gòu)采用的訓(xùn)練數(shù)據(jù)集標(biāo)準(zhǔn)多樣,系統(tǒng)偏差較大,行業(yè)缺乏醫(yī)學(xué)圖像和疾病征像的統(tǒng)一認(rèn)識(shí)。
整個(gè)行業(yè)的醫(yī)療數(shù)據(jù)保護(hù)和監(jiān)管措施也有一定的缺失,數(shù)據(jù)不能被溯源,缺乏合法性和可分享性。
同時(shí)業(yè)內(nèi)也缺乏對(duì)數(shù)據(jù)使用標(biāo)準(zhǔn)的判斷依據(jù),在現(xiàn)有的法律基礎(chǔ)上尋找合規(guī)使用和分享數(shù)據(jù)的渠道,也是迫在眉睫的一件事情。
劉士遠(yuǎn)建議到,構(gòu)建標(biāo)準(zhǔn)庫,離不開醫(yī)生的參與。
要形成與AI研發(fā)相關(guān)的標(biāo)準(zhǔn)和數(shù)據(jù),需要在圖像采集環(huán)節(jié)、標(biāo)準(zhǔn)庫構(gòu)建環(huán)節(jié)、病種的分布以及各種描述術(shù)語等層面,都要達(dá)成一定的共識(shí)。
2018年9月,國家頒布了《國家健康醫(yī)療大數(shù)據(jù)標(biāo)準(zhǔn)、安全和服務(wù)管理辦法(試行)》。此外,在肺結(jié)節(jié)領(lǐng)域,中檢院肺結(jié)節(jié)AI檢驗(yàn)數(shù)據(jù)庫標(biāo)定專家組已經(jīng)完成肺結(jié)節(jié)標(biāo)準(zhǔn)數(shù)據(jù)集建設(shè)。
這些均為標(biāo)準(zhǔn)的建設(shè),做好了鋪墊。
當(dāng)然,圖像標(biāo)注環(huán)節(jié)也存在很多問題,以肺結(jié)節(jié)標(biāo)注過程為例,其主要存在以下問題:標(biāo)注者隊(duì)伍混亂,資質(zhì)不一;圖像征象認(rèn)識(shí)不統(tǒng)一;圖像標(biāo)注方法不統(tǒng)一;圖像分割方法不統(tǒng)一;圖像量化方法不統(tǒng)一。
據(jù)了解,中檢院在構(gòu)建肺結(jié)節(jié)標(biāo)準(zhǔn)庫的過程中,從全國招了250名5年以上經(jīng)驗(yàn)的影像科醫(yī)生志愿者,對(duì)他們進(jìn)行了簡單的測(cè)試,使用了30例結(jié)節(jié),結(jié)果準(zhǔn)確率只有30%,說明如果沒有共識(shí)和基礎(chǔ)培訓(xùn),醫(yī)生的標(biāo)注準(zhǔn)確率很低,非影像科醫(yī)生甚至不是醫(yī)生的準(zhǔn)確率更難以想象。
而標(biāo)注的方式,有緊密包裹法、區(qū)域標(biāo)注法等,不同的標(biāo)注方法輸出的結(jié)果也不盡相同。
“圖像分割如果沒有統(tǒng)一的標(biāo)準(zhǔn),結(jié)論的差別也會(huì)非常巨大。
還有量化的方法,到底是測(cè)直徑,還是測(cè)體積,還是測(cè)質(zhì)量,怎么測(cè),行業(yè)都需要形成一致意見。
在醫(yī)學(xué)影像AI模型檢測(cè)階段,也會(huì)存在生產(chǎn)過程不規(guī)范,模型效果和安全性缺乏公正評(píng)價(jià),缺乏產(chǎn)品檢測(cè)標(biāo)準(zhǔn)庫和評(píng)價(jià)體系,缺乏相關(guān)法律法規(guī)、質(zhì)控檢查和管理制度等問題。
在AI模型使用階段,受歡迎程度,對(duì)醫(yī)生的影響,過多的假陽性,倫理和法規(guī),是否匹配醫(yī)院和醫(yī)生的需求等問題也尚待解決。”
另外,也需考慮其他問題:
產(chǎn)品應(yīng)游離于信息系統(tǒng)之外,還是融合于信息系統(tǒng)之內(nèi)?
年輕醫(yī)生對(duì)AI產(chǎn)品產(chǎn)生依賴之后,是否會(huì)導(dǎo)致業(yè)務(wù)能力下降?
數(shù)據(jù)的倫理和產(chǎn)品的倫理問題:數(shù)據(jù)的倫理就是數(shù)據(jù)的所有權(quán)、許可權(quán)和隱私權(quán)都需要制定規(guī)范,現(xiàn)在衛(wèi)計(jì)委已經(jīng)發(fā)布了相關(guān)標(biāo)準(zhǔn)和規(guī)范。第二個(gè)則是產(chǎn)品的倫理問題,隨著產(chǎn)品的逐漸落地,產(chǎn)品的責(zé)任和影響都需要倫理的相關(guān)準(zhǔn)則來考慮。
劉士遠(yuǎn)教授還強(qiáng)調(diào),影像診斷是全鏈條、多維度的工作,工作內(nèi)容不僅僅是圖像識(shí)別,需要充分發(fā)揮醫(yī)生在醫(yī)學(xué)影像AI研發(fā)過程中的作用。
在數(shù)據(jù)上,醫(yī)生可以建立大樣本的單病種數(shù)據(jù)庫,提高訓(xùn)練數(shù)據(jù)質(zhì)量,并在此基礎(chǔ)上規(guī)范化標(biāo)注,形成高質(zhì)量訓(xùn)練集,還要學(xué)會(huì)在法律法規(guī)下分享和使用數(shù)據(jù)。
醫(yī)生還應(yīng)當(dāng)成為質(zhì)量控制和標(biāo)準(zhǔn)的制定者和執(zhí)行者。如制定圖像采集和圖像質(zhì)量的標(biāo)準(zhǔn),制定數(shù)據(jù)庫建設(shè)的構(gòu)成比例、病種分布、病灶類型等專家共識(shí),并形成各單病種影像征象和描寫屬于以及單病種AI模型數(shù)據(jù)標(biāo)記專家共識(shí)。建立一套正確的基本倫理準(zhǔn)則來指導(dǎo)AI的設(shè)計(jì)、管理和應(yīng)用。
醫(yī)學(xué)影像AI的未來
無論是AI理論創(chuàng)新,或是非理論層的行業(yè)標(biāo)準(zhǔn)建立,其均是醫(yī)學(xué)影像AI成功的必備條件。
2019年7月13日,由中國計(jì)算機(jī)學(xué)會(huì)、雷鋒網(wǎng)、香港中文大學(xué)(深圳)聯(lián)合舉辦的CCF-GAIR全球人工智能與機(jī)器人峰會(huì),將開設(shè)“AI醫(yī)療”論壇。
評(píng)論
查看更多