色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度學習模型優于人類醫生?

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-06-30 08:40 ? 次閱讀

前幾天,德國和法國的幾位研究人員在Oxford Academic上發表了一篇名為Man against machine: diagnostic performance of a deep learning convolutional neural network for dermoscopic melanoma recognition in comparison to 58 dermatologists的文章,這個長長長長的標題告訴我們,這又是一篇讓人去跟機器比賽的故事,目的是看誰識別皮膚黑色素瘤的準確度更高。最終結果表明深度學習模型優于人類醫生。

但今天,澳大利亞的醫學博士、放射科醫生Luke Oakden-Rayner在推特上質疑論文的嚴謹性,認為結論過于草率,低估了人類表現。到底雙方哪種說法更合理呢?我們先看看這篇論文到底講了什么。

CNN vs 人類

過去幾十年,黑色素瘤成為威脅公共安全的一大主要挑戰,連續攀升的發病率以及死亡率,讓早期發現及預防成為診斷的關鍵。多項分析表明,皮膚鏡的應用大大提高了診斷準確率。然而,每位醫師接受的訓練不同,水平也參差不齊,目前黑色素瘤的平均診斷準確度還不到80%。

最近幾年,一些自動計算機圖像分析技術的出現,意在幫助提高醫療診斷準確率和效率。但這些方法都有限制,它們都使用人類規定的皮膚鏡診斷標準進行的判斷,例如是否有多色、特殊形態例如條紋狀和結節狀,或不規則血管結構。

2017年,Esteva等人發表論文,宣布他們創建了一種基于卷積神經網絡的深度學習模型,可以對圖片進行分類,其中CNN無需被人類的標準所限制,它可以將數字圖片分解成像素級水平,并最終進行診斷。這篇論文也被看作是革命性的作品。

而本次德國和法國的研究者目的是訓練、驗證并測試一個深度學習CNN,讓它對皮膚鏡成像進行診斷分類,判斷是黑色素瘤還是良性的痣,并將結果和58位皮膚科醫生相比較。

具體方法

谷歌的Inception v4 CNN架構是用皮膚鏡圖像和對應的診斷結果訓練并驗證的。在橫向的人類醫生驗證中有100張圖片組成的測試集(其中第一步只用皮膚鏡觀察,第二步會加上診斷信息和圖片)。對輸出進行測量的標準主要有敏感性(sensitivity)、特異度(specificity)和CNN對病變處的診斷分類的ROC曲線的AUC值與讀者研究中58名人類醫生的對比。

次要評估指標包括皮膚科醫生在管理決策時的診斷表現,以及在兩個不同階段上診斷的差異。除此之外,CNN的性能還會與2016年國際生物醫學成像研討會(ISBI)挑戰賽上排名前五的算法進行比較。

對比結果

在人類醫生的第一階段表現中,他們的得分較接近平均水平,在對病變的分類上,敏感性為86.6%(±9.3%),特異度為71.3%(±11.2%)。第二階段增加了更多信息后,敏感性上升至88.9%(±9.6%,P=0.19),特異度升為75.7%(±11.7%,P<0.05)。

而CNN的ROC曲線在第一階段中,特異度就高于人類醫生,為82.5%。而CNN的ROC AUC分數也比醫生的平均ROC面積要高,為0.86 vs 0.79,P<0.01。CNN的最終分數與2016 ISBI挑戰賽上前三的算法分數接近。

結論

在包括30名專家的58位皮膚科醫生團隊中,這是我們首次將CNN與人類進行對比。大多情況下,CNN的表現要優于人類醫生。研究者并不否認醫生的經驗和努力,而是認為在CNN圖像分類技術的幫助下,診斷率會更高。

AI贏了?

這篇論文發表后,獲得了許多大V轉發,其中就包括卷積網絡之父Yann LeCun。

雖然只重復了一遍對比結果,LeCun的轉發也獲得了300多點贊。

同時,華盛頓郵報、醫學網站等媒體也紛紛報道了這一結果,聲稱“AI打敗了人類”,但有人卻針對其中的統計方法提出了質疑。

論文很好,但有瑕疵

今天,放射科專家、醫學博士Luke Oakden-Rayner在推特上表示:這篇論文有瑕疵!簡單地說,他認為論文研究者低估了人類醫生的表現。論智君將具體原因編譯如下:

我認為,研究者們在對比人類和機器時用的是兩種不同的指標!對機器用的是AUC,對人類用的是“ROC區域”得出的平均敏感性和特異度。除了指標不同,“ROC區域”整體就比AUC要低。實際上,皮膚科醫生表現的越好,它就越偏離假設的AUC。

根據論文數據,我們可以也計算一下模型的“ROC區域”,結果如下,跟人類的分數一樣都是79。

在特異度方面,對比的缺陷就更不易察覺了。專家醫生分布在ROC曲線上,所以平均敏感性和特異度把醫生的平均值放在了曲線內,同時模型還是在曲線上測試的。再說一遍,人類被低估了。下面是ROC曲線的其中一個例子,粉點是平均分。

另外,我不確定研究者是否選擇了合適的操作點(OP),在CNN和醫生對比的過程中,研究人員似乎是基于測試數據進行選擇的。在它們的ROC中,一個合理選擇的OP大大降低了敏感性和特異度的值。下圖中紫色的點是他們的OP,黑色的點只是靠近OP所在區域。

注意這個ROC曲線看起來有點奇怪,因為前部支持的點很少,也就是說這個區域比上部更缺少數據支持。

最后,我不清楚他們是怎么計算p-value的。在給定操作點(平均醫生的敏感性)的情況下,研究者認為特異度在小于0.01的p-value下更好,但是在ROC數字表現在曲線上時置信區間竟然有68%!即使是圖表解釋的有問題,或者存在±2的標準差,95%的數值還是在曲線上的。我不知道這跟p-value<0.01有什么關系。

要說明的是,我并不全盤否定這篇論文,我認為這種討論很有意義。只是其中有一些我認為不嚴謹的地方,希望我的建議有用。

結語

說到最后,其實是在對比方式上存在質疑。也許論文的研究者需要考慮一下他們的統計測試是否公平,因為只對醫生們的檢測敏感性和特異度取平均值說服力還是不夠。這也給我們提了醒,在閱讀論文時不要一味地迷信,要勤于思考,在發現論文閃光點的同時還要確保邏輯上的準確。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4776

    瀏覽量

    100925
  • 深度學習
    +關注

    關注

    73

    文章

    5508

    瀏覽量

    121314

原文標題:這篇被Yann LeCun轉發的論文,被質疑了

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    labview調用深度學習tensorflow模型非常簡單,附上源碼和模型

    本帖最后由 wcl86 于 2021-9-9 10:39 編輯 `labview調用深度學習tensorflow模型非常簡單,效果如下,附上源碼和訓練過的模型:[hide][/h
    發表于 06-03 16:38

    深度學習模型是如何創建的?

    具有深度學習模型的嵌入式系統應用程序帶來了巨大的好處。深度學習嵌入式系統已經改變了各個行業的企業和組織。
    發表于 10-27 06:34

    什么是深度學習?使用FPGA進行深度學習的好處?

    什么是深度學習為了解釋深度學習,有必要了解神經網絡。神經網絡是一種模擬人腦的神經元和神經網絡的計算模型。作為具體示例,讓我們考慮一個輸入圖像
    發表于 02-17 16:56

    “人工智能醫生”會取代人類醫生嗎?

    “人工智能醫生”究竟是如何“思考”的?以慢病管理為例,看似簡單的“百分比”,背后其實有一整套算法模型。第四范式創始人戴文淵說,對于深度學習而言,慢性病的數據量相對比較小,可能只有萬級的
    的頭像 發表于 02-21 16:38 ?4237次閱讀

    如何使用深度學習實現語音聲學模型的研究

    的分析識別更是研究的重中之重。近年來深 10 度學習模型的廣泛發展和計算能力的大幅提升對語音識別技術的提升起到了關鍵作用。本文立足于語音識別與深度學習理論緊密結合,針對如何利用
    發表于 05-09 08:00 ?41次下載
    如何使用<b class='flag-5'>深度</b><b class='flag-5'>學習</b>實現語音聲學<b class='flag-5'>模型</b>的研究

    谷歌深度學習如何處理人類語言?

    具有語言能力的深度學習系統已經廣泛應用于人們的生活當中。其中一些系統使用了 Google 發布的特定深度學習模型 —— 多語言 BERT(M
    的頭像 發表于 03-01 15:31 ?1342次閱讀

    深度模型中的優化與學習課件下載

    深度模型中的優化與學習課件下載
    發表于 04-07 16:21 ?3次下載
    <b class='flag-5'>深度</b><b class='flag-5'>模型</b>中的優化與<b class='flag-5'>學習</b>課件下載

    模型為什么是深度學習的未來?

    與傳統機器學習相比,深度學習是從數據中學習,而大模型則是通過使用大量的模型來訓練數據。
    的頭像 發表于 02-16 11:32 ?2132次閱讀

    什么是深度學習算法?深度學習算法的應用

    什么是深度學習算法?深度學習算法的應用 深度學習算法被認為是人工智能的核心,它是一種模仿
    的頭像 發表于 08-17 16:03 ?2193次閱讀

    機器學習深度學習的區別

      機器學習深度學習是當今最流行的人工智能(AI)技術之一。這兩種技術都有助于在不需要人類干預的情況下讓計算機自主學習和改進預測
    發表于 08-28 17:31 ?1585次閱讀

    基于深度學習的情感語音識別模型優化策略

    情感語音識別技術是一種將人類語音轉化為情感信息的技術,其應用范圍涵蓋了人機交互、智能客服、心理健康監測等多個領域。隨著人工智能技術的不斷發展,深度學習在情感語音識別領域的應用越來越廣泛。本文將探討
    的頭像 發表于 11-09 16:34 ?755次閱讀

    深度學習模型優化與調試方法

    深度學習模型在訓練過程中,往往會遇到各種問題和挑戰,如過擬合、欠擬合、梯度消失或爆炸等。因此,對深度學習
    的頭像 發表于 07-01 11:41 ?881次閱讀

    深度學習模型訓練過程詳解

    深度學習模型訓練是一個復雜且關鍵的過程,它涉及大量的數據、計算資源和精心設計的算法。訓練一個深度學習模型
    的頭像 發表于 07-01 16:13 ?1384次閱讀

    深度學習中的模型權重

    深度學習這一充滿無限可能性的領域中,模型權重(Weights)作為其核心組成部分,扮演著至關重要的角色。它們不僅是模型學習的基石,更是
    的頭像 發表于 07-04 11:49 ?1527次閱讀

    AI大模型深度學習的關系

    AI大模型深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大
    的頭像 發表于 10-23 15:25 ?963次閱讀
    主站蜘蛛池模板: 美女打开双腿扒开屁股男生| 嫩草影院地址一地址二| 蜜桃视频一区二区| 伊人久久综合影院首页| 狠狠色狠狠色综合日日91app| 天天久久狠狠色综合| 纯肉高H放荡受BL文库| 青青草在线视频| xiao776唯美清纯| 欧美一区二区三区不卡免费| ankha成人| 人妻美妇疯狂迎合| 被吊起玩弄的女性奴| 欧美双拳极限扩张| AV天堂午夜精品蜜臀AV| 欧美日韩视频高清一区| wwwwxxxxx中国| 肉肉的各种姿势高H细文| 国产精品第一综合首页| 亚州精品视频| 久久99r66热这里有精品| 最近的2019中文字幕国语HD| 嫩小幼处在线| 第一会所欧美无码原创| 午夜神器18以下不能进免费| 国产午夜在线观看视频| 又长又大又粗又硬3p免费视频| 恋夜直播午夜秀场最新| qvod在线观看| 乡土女性网动态图解| 精品久久久久亚洲| 91久久精一区二区三区大全| 日本一区二区三区在线观看网站| 国产精品免费一区二区三区四区 | adc高清在线观看| 日韩 国产 欧美视频二区| 国产精品永久免费视频| 野花日本韩国视频免费高清观看| 老师系列高H文| 岛国大片在线观看完整版| 亚洲精品久久久久69影院|