1100 萬人,這是國(guó)家心血管病中心發(fā)布的中國(guó)冠心病患者的最新數(shù)字。冠心病全稱冠狀動(dòng)脈性心臟病,一般是由于冠狀動(dòng)脈狹窄、血流不通暢導(dǎo)致出現(xiàn)心肌缺血現(xiàn)象,是一種比較普遍的心血管疾病。 當(dāng)冠狀動(dòng)脈較大的分支完全閉塞、形成血栓時(shí),就出現(xiàn)了冠心病最嚴(yán)重的后果——心梗。這種急性、持續(xù)性的缺血缺氧會(huì)引起心肌壞死,可能危及生命而猝死。因此,如果能夠準(zhǔn)確地預(yù)測(cè)心梗的發(fā)生,將會(huì)挽救很多生命。 近日,荷蘭格羅寧根大學(xué)醫(yī)學(xué)中心(UMCG)的實(shí)驗(yàn)心臟病學(xué)研究人員 Luis Eduardo Juarez-Orozco 等人,利用一個(gè)基于集成學(xué)習(xí) Boost 方法的機(jī)器學(xué)習(xí)模型(LogitBoost),實(shí)現(xiàn)了對(duì)冠心病人醫(yī)療數(shù)據(jù)的更充分挖掘,在判斷心梗的可能性上,超越了人類醫(yī)生。
用什么數(shù)據(jù)?
醫(yī)療 AI 領(lǐng)域所面臨的最大難題就是數(shù)據(jù)的匱乏。與常規(guī)人臉識(shí)別、物體識(shí)別等計(jì)算機(jī)視覺領(lǐng)域不同,研究人員無法使用 ImageNet 等現(xiàn)成的大型圖像數(shù)據(jù)集來訓(xùn)練他們的模型,必須想辦法組建高清的專業(yè)醫(yī)療數(shù)據(jù)集。 對(duì)于冠心病而言,這些數(shù)據(jù)便是 PET(正電子發(fā)射斷層顯像)和 CT(電子計(jì)算機(jī)斷層掃描)心肌顯像結(jié)果。PET/CT 是一種權(quán)威的輔助診斷方法,利用放射性核素標(biāo)記的顯影劑,PET 可對(duì)人體組織進(jìn)行造影,CT 則是利用X射線斷層成像。融合利用兩種技術(shù)形成的圖像可以安全、無創(chuàng)的實(shí)現(xiàn)對(duì)病變組織的定位,并快速準(zhǔn)確的排查病灶。故一些 PET/CT 指標(biāo)是冠心病的重要特征。 因此,為了建立能夠判斷冠心病人心梗可能性的模型,Luis Eduardo Juarez-Orozco 等人追蹤了 951 例冠心病人 6 年內(nèi)的一系列臨床指標(biāo)和 PET/CT 結(jié)果,組建起了冠心病的數(shù)據(jù)集。
上圖一位患有結(jié)節(jié)硬化 Hodgkin’s 病的病人的 PET 顯影和 CT 顯影圖。A 為 CT 圖,B 為 PET 顯影圖,C 為 PET 和 CT 共定位圖。這些數(shù)據(jù)具體包括 CCTA(冠狀動(dòng)脈 CT 造影)圖像數(shù)據(jù)所顯示的動(dòng)脈粥樣硬化區(qū)域、血管狹窄百分比、斑塊鈣化程度和 PET 心肌灌注所記錄的每克心肌每分鐘血流量數(shù)值。還有抽取自病人病歷的臨床指標(biāo),比如性別、年齡、煙史、糖尿病、高血壓、高血脂、家族病史、胸痛、呼吸困難、早期血管重建等記錄。用什么模型和特征?
鑒于數(shù)據(jù)集規(guī)模并不大,研究者選擇利用集成學(xué)習(xí)的Boost方法提高模型的效率。他們采用十折交叉驗(yàn)證,建立模型 LogitBoost,對(duì)病人是否發(fā)生心肌梗死或冠心病致死做出預(yù)測(cè),并利用 AUC(Area under Curve Roc,ROC 曲線下面的面積,值越靠近 1,說明二分類模型表現(xiàn)越好)和 ACC(Accuracy,準(zhǔn)確率,即正確判斷正樣本和負(fù)樣本的概率)指標(biāo)評(píng)估模型結(jié)果。 在對(duì)前期建立的數(shù)據(jù)集特征進(jìn)行層層篩選后,研究人員采取了 85 個(gè)特征,既 85 個(gè)維度,它們分別來自 10 個(gè)臨床指標(biāo)、58 個(gè) CCTA 指標(biāo)和 17 個(gè) PET 指標(biāo)。 為了驗(yàn)證各個(gè)特征的作用,研究人員選擇分批逐步進(jìn)行訓(xùn)練與測(cè)試。當(dāng)他們僅利用臨床指標(biāo)建模時(shí),模型的 AUC 為 0.65,ACC 為 90%。在引入 PET 指標(biāo)后,模型 AUC 提升至 0.69,ACC 達(dá)到 92.5%。再進(jìn)一步引入 CCTA 數(shù)據(jù)讓模型 AUC 達(dá)到驚人的 0.82,ACC 至 95.4%,遠(yuǎn)超人類醫(yī)生水平,這是對(duì)冠心病人數(shù)據(jù)的更高效利用,同時(shí)這也說明比起醫(yī)生僅憑借單純的指標(biāo)比對(duì),機(jī)器學(xué)習(xí)模型更能綜合利用檢測(cè)數(shù)據(jù)的潛在特征,達(dá)到更精準(zhǔn)的預(yù)測(cè)。展望
冠心病作為一種普遍高發(fā)的疾病,其危險(xiǎn)性不容多說,心梗過世并不罕見,并且很多時(shí)候由于沒有明顯癥狀而被人忽略。人工智能用于醫(yī)療領(lǐng)域也不是一天兩天,但能夠切實(shí)可行、廣泛用于社會(huì)、治病救人懸壺濟(jì)世,是本模型的優(yōu)秀之處。充分利用已有的醫(yī)療數(shù)據(jù),挖掘潛在信息,達(dá)到更準(zhǔn)確的預(yù)測(cè),超越人力,這正是 AI 的初衷。未來的醫(yī)療,絕不再會(huì)僅靠人類專家。
-
人工智能
+關(guān)注
關(guān)注
1791文章
47314瀏覽量
238617 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8420瀏覽量
132680
原文標(biāo)題:利用 85 個(gè)維度診斷冠心病人心梗可能性,機(jī)器學(xué)習(xí)模型超越人類醫(yī)師
文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論