深度卷積神經網絡(CNNs)已在實踐中被證明是一種可以輔助生物醫學圖像診斷的技術,并已廣泛運用于肺結節、眼底等放射影像識別。近日,病理領域的AI研究也有了新的進展。
2019年5月,將門投資企業——迪英加科技CEO楊林帶領團隊發表的論文《Pathologist-level Interpretable Whole-slide Cancer Diagnosis with Deep Learning》被《Nature Machine Intelligence》收錄,該論文提出了一項用于AI病理診斷解釋的方案。
在文章所描述的實驗之中,研究人員運用AI技術對病理切片進行分析處理,并同時給出AI分析的依據。這是全球首篇發表在自然子刊上的關于討論病理圖像分析中的人工智能可解釋性問題的專著。
通過實驗所設計的方法,人工智能開始“理解”醫生的邏輯,并嘗試模仿人類醫生,給出診斷依據。對此,動脈網采訪了論文通訊作者楊林教授,并結合論文內容,嘗試梳理出論文的邏輯及背后的深刻價值。
病理痛局推動科研發展
病理科被“現代醫學之父”威廉·奧斯勒稱為“醫學之本”,而病理醫生被認為是醫生的醫生。病理科的含金量自然不言而喻,其診斷的準確與否直接影響患者的健康和命運。
然而,據國家衛生和計劃生育委員會2015年數據顯示,全國僅有9841名有資質的病理醫生。這個數字與我國人口總量之比約為1:140000,與注冊醫師之比約為1:250。簡單的說:每個病理醫生都承擔了5-10倍的常規工作量,許多病理醫生都在超負荷地進行日趨復雜的高強度工作,誤診、漏診時有發生。
制約病理醫生資源發展的因素不僅僅是龐大的工作量、工作環境差、收入待遇低、培養周期長等因素嚴重影響了病理教學師資。病理醫師新生力量呈現“斷崖式”短缺。
AI技術的出現或許可以解決這個問題。有深度學習支撐的人工智能能夠以迅速、標準化的方式處理醫學影像,對可疑影像進行勾畫、渲染,并以結構化的語言提出建議。
這些工作精力消耗大,重復性高,而AI不受制于工作性質。實踐證明,在AI的幫助下,病理醫生不僅可以提高診斷效率、減輕工作量;還能提高工作強度,改善病理醫生工作環境,最終降低誤診、漏診率。
痛點確乎推進了科學研究的發展,但在AI輔助診斷被真正施于應用時,種種問題隨之而來。
質疑之聲中最為清晰而難以回答的便是以下兩個問題:AI是如何完成判讀?它對于切片的分析是否有依據?事實也是如此,如果這個問題得不到解決,病理醫生與CFDA監管部門難以認可AI的判讀結果——概率云并非一個合理的依據。鑒于此,楊林團隊開始了本次研究,用以解決AI病理診斷的可行性與可解釋性。
實驗條件下,AI可大幅度提升CAD準確率
為了探尋AI輔助診斷過程中的可解釋性問題,研究團隊以膀胱癌患者的病理切片為研究對象,在保證AI分析切片準確率的同時,通過構建全新網絡架構,達到令該系統能針對診斷區域自動輸出文字的效果,而這些文字可表明系統的診斷依據。
對此,研究團隊設計了一個包含掃描器網絡(s-net),診斷器網絡(d-net)和聚合器網絡(a-net)三個模塊的神經網絡系統。這三個模塊分別在系統之中起到分析圖像、文字表達、信息整合輸出的作用,共同發揮了腫瘤檢測與細胞表征提取的作用。
掃描器網絡(s-net)的核心是多模態CNN,這是一種特殊的深層的神經網絡模型,它的特殊性體現在兩個方面,一方面它的神經元的連接是非全連接的,另一方面同一層中某些神經元之間的連接的權重是共享的。它的非全連接和權值共享的網絡結構使之更類似于生物神經網絡,降低了網絡模型的復雜度,減少了權值的數量。
診斷器網絡(d-net)作用于每個勾畫ROI(感興趣區域,regionofinterest,AI框選出的需要關注的區域),分析病理特征并顯示特征感知網絡,以嘗試解釋每個ROI的勾畫原理,以及解釋診斷器網絡在描述觀察時所看到的內容,最終將分析流程及結果轉化為文字。
簡而言之,d-net的作用就是生成解釋性的內容,告訴人類AI為什么框選出這些ROI,以及AI對單個ROI如何做的判斷。
聚合器網絡(a-net)則將掃描器網絡與診斷器網絡生成的信息進行集合處理,集成所有特征,并生成與影像相匹配的診斷結果。
通過逐塊掃描病理圖片,三個模塊從圖片像素中提取與數據庫對應的有效像素并進行識別,最后轉化為可處理文本數據,再使系統建立起文本與圖像之間的直接聯系。
診斷器網絡在數據格式轉化的同時,系統將運用NLP生成包含診斷組織細胞和細胞核特征的語言描述,匹配病理學家的操作方式,其生成的表述結構符合臨床病理學報告標準。因此,這種方式可視為對人工智能診斷過程的解釋。
病理學家在實驗之中起到了重要的作用。當病理學家對病理切片進行處理時,系統將捕獲病理學家的操作過程,如點擊圖像的位置,并將操作、醫學語言與系統語言相結合,這構成了系統的運行和分析的邏輯的基礎。
最終,系統能夠通過其文本和視覺輸出明確地解釋其分析過程,并向病理學家提供直接證據(即第二意見)以供審查和目視檢查,從而幫助降低病理學家臨床決策中的主觀性差異。
本次實驗用了怎樣的樣本?
本次實驗總計采用了近千名膀胱癌患者的尿路上皮癌切片數據,整個數據集分為620個用于訓練的病理切片,193個用于驗證的病理切片和100個用于測試的病理片。
從形態上看,該數據集包括102例非侵入性低級別乳頭狀尿路上皮癌以及811例非侵入性或侵入性高級別乳頭狀尿路上皮癌。這些數據經過了多位病理學家的嚴格診斷,且去除了低質量的切片。
為了評估神經網絡系統的效果,21名泌尿生殖病理學家參與了數據注釋和診斷性能評估。經過大約近兩年的努力,病理學家使用研究人員開發的基于Web的注釋程序對數據進行了集體清理和手動注釋。
通過將該系統的測試結果與病理學家的常規檢查進行了比較,結果顯示,該系統實現了97%的曲線下面積(AUC)評分,其表現優于大多數進行比較的病理學家。
此外,當使用混淆矩陣進行比較(圖e,f)時,結果顯示系統的平均準確度為94.6%,而病理學家的平均準確度為84.3%。
實際上,統計結果還表明,病理醫生對于部分類型的前列腺癌的診斷一致率不足50%。因此僅從數據上看的話,此次論文中所提出的AI系統,在準確率和一致性上都有較好的表現。
AI可解釋性的研究
正如前文所示,該系統通過掃描器網絡、診斷器網絡、聚合器網絡,對AI輔助診斷的可解釋性進行了探索,最終會產生說明文字同ROI同步輸出。
可解釋性圖示
如上圖,a、b顯示的為全片腫瘤檢測結果,c、d、e則為生成的“特征感知注意圖”,對診斷細節進行描述。我們可以看到,針對每一張切片,系統在判讀后,除了常規地將ROI區域框選出來,還針對不同區域生成了解釋性文字。
其中,不同特征的文字被使用不同顏色加以區分,而該描述所對應的ROI,都被加以相同顏色的框表示,便于病理醫生查看時一一對應。
該系統描述了觀察到的一定數量的細胞特征以及特征感知注意圖,注意圖對網絡觀察到的視覺信息的類型給出了強有力的解釋(圖c-e)。實際上,注意圖包含了框選區域中每一個像素的權重,用以確定不同像素對于給定的特征觀察的重要程度,但輸出的內容卻并不是令人費解的數值,而是類似于病理醫生的判讀依據。
這樣專業化的文字表述加強了AI分析病理切片的可信度,當人類醫生與機器診斷結果不符時,醫生們也能夠更容易地對比自己與機器的診斷意見到底在何處有所區別,了解產生區別的原因,在很大程度上能夠提高診斷準確度。
系統網絡組件的評估
在算法結構方面,算法的各部分性能在完成后均被予以驗證。
首先,研究人員評估腫瘤和非腫瘤圖像的s-net的腫瘤檢測召回率(非腫瘤圖像表示內部沒有突出腫瘤的裁剪的滑動組織區域)。s-net達到94%的高真陽性(檢測到的腫瘤像素數/總注釋腫瘤像素)并同時維持95.3%的陰性召回率。
其次,研究人員使用了兩個評估指標驗證了生成的診斷描述的質量:雙語評估Understudy(BLEU)和基于共識的圖像描述評估(CIDEr)。而這些驗證結果顯示,該算法已經具備了一定的優越性。
此項實驗突破了AI病理三類證審批的關鍵難點
囿于其決策流程的不可解釋性,“深度學習”一直被遵循循證醫學指南的臨床醫生拒之門外,成為了制約醫學影像人工智能發展,特別是獲得三類證審批的關鍵。
而本次實驗則為人工智能的審批提供新的思路:雖然現階段的人工智能仍不具備推理能力,但我們能將醫生的推理步驟模塊化,從而模擬推理的過程。此外,本次實驗中的文字匹配過程是按照WHO標準并具有嚴格依據的,這與許多基于多樣本深度學習生成的勾畫不同,實驗的每一個步驟都可由AI提供決策依據,并非單純概率云下的黑箱運算。
楊林教授現任職于迪英加CEO,這是迪英加科技在三類證申報過程中的一步堅實工作,用于解決CFDA三類證申報中廣泛要求的可解釋行提供了關鍵的核心技術解決方案。
在采訪過程之中,楊林教授也對本次實驗的不足之處進行了總結。首先,由于時間的原因,樣本的選擇檢測本身具有一定的封閉性,隨著持續數據收集的廣度和深度的提升,論文中的工作也一定會有改進之處。
其次,推理流程的劃分是否足夠細致,以及推理過程是否存在偶然性可以進一步論證。
最后,這項研究沒有控制參與病理醫師的疲勞程度,這可能是影響AUC的獨立因素,需要進一步研究這一系統對不同疲勞水平醫生的有效性。
總的來說,無論是人工智能技術,還是本次實驗的病理本身,我們都能看到很多突破的可能。目前的人工智能影像產品仍聚集于放射科,當他們嘗試進一步進入臨床相關科室時,這項技術同樣需要新的標準對其進行驗證。
此外,AI于病理的運用也遠不局限于切片識別,機體組織樣本中內部特征的量化分析與臨床評價;細胞和動物組織樣本的量化分析與藥效關系;細胞識別與分選;特殊染色結果的量化分析和臨床治療與預后也均有AI介入研究。病理于AI是一片看不見的深海。
-
神經網絡
+關注
關注
42文章
4774瀏覽量
100900 -
人工智能
+關注
關注
1792文章
47440瀏覽量
238989 -
ai技術
+關注
關注
1文章
1281瀏覽量
24352
原文標題:將門投資企業 | 迪英加團隊工作發表在Nature子刊,提出AI病理診斷解釋方案
文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論