AI技術(shù)已經(jīng)家喻戶曉。不論是移動(dòng)終端設(shè)備,還是企業(yè)系統(tǒng)平臺(tái),都開始集成AI能力,現(xiàn)階段看,AI融合到各個(gè)行業(yè)的潛力非常巨大,能夠在眾多場(chǎng)景中發(fā)揮作用,比如云計(jì)算。在今天數(shù)字化轉(zhuǎn)型的浪潮中,企業(yè)上云成為了新常態(tài),云上大量的數(shù)據(jù)、豐富的應(yīng)用通過AI技術(shù),能夠解決很多問題,因此云與AI的融合也是新常態(tài)。
因?yàn)轵v訊強(qiáng)大的社交、游戲等基因,騰訊AI有著非常豐富的實(shí)踐場(chǎng)景,在朋友圈爆款應(yīng)用、OCR識(shí)別、醫(yī)療、游戲等場(chǎng)景中都運(yùn)用了AI技術(shù),開發(fā)出了大量的新功能和能力。即便如此,AI在這些領(lǐng)域的嘗試有些還在初級(jí)階段。如何在具體業(yè)務(wù)場(chǎng)景中提供匹配的能力,利用AI把問題簡單化,釋放生產(chǎn)力,依然非常具有挑戰(zhàn)性。
因此,7月28日,騰訊云在北京舉辦云+社區(qū)沙龍,邀請(qǐng)來自騰訊與四川云檢科技的五位AI技術(shù)專家,分享他們?cè)趯I(yè)領(lǐng)域的AI開發(fā)經(jīng)驗(yàn),幫助開發(fā)者在具體行業(yè)場(chǎng)景中實(shí)踐AI技術(shù)。現(xiàn)場(chǎng)有近400位開發(fā)者參與,答疑及茶歇環(huán)節(jié)氣氛熱烈,多位開發(fā)者與講師就演講內(nèi)容展開討論,表現(xiàn)出對(duì)AI濃厚的開發(fā)興趣。最后,所有開發(fā)者們與講師們合影留念,結(jié)束了這次盛夏中的、充滿前沿知識(shí)洗禮的趣味沙龍。
朋友圈爆款背后的計(jì)算機(jī)視覺技術(shù)與應(yīng)用
在現(xiàn)階段,強(qiáng)調(diào)AI在場(chǎng)景中落地,就是希望AI走進(jìn)千家萬戶,融入整個(gè)社會(huì),而不僅僅是曲高和寡的模型,這就是AI技術(shù)產(chǎn)業(yè)化的趨勢(shì)。比如,朋友圈里像軍裝照、武士青年這種有趣的互動(dòng)活動(dòng),就是目前探索出來的計(jì)算機(jī)視覺最快能夠來到大家身邊的落地應(yīng)用。對(duì)于開發(fā)者來說,通過對(duì)具體案例流程的了解,就能夠快速的掌握開發(fā)所需要的能力,從而實(shí)現(xiàn)自主創(chuàng)新開發(fā)。
騰訊大數(shù)據(jù)與人工智能中心AI技術(shù)專家葉聰在沙龍活動(dòng)中就以朋友圈一些爆款活動(dòng)作為切入點(diǎn),幫助開發(fā)者們梳理了當(dāng)前關(guān)于計(jì)算機(jī)視覺與技術(shù)的應(yīng)用。葉聰表示,騰訊云現(xiàn)在非常講究AI場(chǎng)景化,在很多的應(yīng)用中都集成了AI能力。
五四青年節(jié)的活動(dòng)《重溫五四,你最像哪位青年?》就是騰訊首先開始做的。通過人臉檢測(cè)與分析技術(shù)、人臉檢索技術(shù),將用戶上傳的照片與特定形象進(jìn)行臉部層面的檢索對(duì)比,通過匹配分析找出數(shù)據(jù)庫中外貌特征與用戶最為相似的一張照片,這個(gè)創(chuàng)意為后續(xù)AI娛樂產(chǎn)品設(shè)計(jì)提供了參考。
相比于學(xué)術(shù)角度對(duì)計(jì)算機(jī)視覺的定義——如何讓計(jì)算機(jī)從圖像和視頻中獲取高級(jí)、抽象的信息,從工程角度來看,「使機(jī)器模仿人類的視覺能力變得自動(dòng)化」的定義則更明了。葉聰介紹,計(jì)算機(jī)視覺使機(jī)器可以部分代替人力理解圖片中的信息。計(jì)算機(jī)視覺還包含一些分支,主要包括物體識(shí)別、對(duì)象檢測(cè)、語義分割、運(yùn)動(dòng)和跟蹤、三維重建、視覺問答、動(dòng)作識(shí)別等等,同時(shí)新的分支還在不斷出現(xiàn)。
現(xiàn)在比較熱門的視覺應(yīng)用包括人臉識(shí)別、無人駕駛、語義分割等。語義分割在AI領(lǐng)域比較常見,一般指詞性的分割,或者詞的分割。而圖像分割里面的語義分割一般指的是把圖像里面的不同類型的對(duì)象進(jìn)行標(biāo)注和區(qū)分。
在機(jī)器識(shí)別領(lǐng)域,現(xiàn)在已經(jīng)有很多比較成熟的特征提取方法。比如邊緣檢測(cè)方法,圖片對(duì)象的局部對(duì)稱性,尺度不變特征,利用灰度的原理等等,這些算法都能夠?qū)崿F(xiàn)提取,但不存在最優(yōu)方案。在圖像分割和對(duì)象檢測(cè)領(lǐng)域也有一些其他算法,例如分水嶺算法,分水嶺顧名思義就是利用圖像的灰度特性把這個(gè)圖像整個(gè)灰度的曲線顯示出來。另外,對(duì)象檢測(cè)的常用算法叫主觀形狀模型,比如以人臉為標(biāo)準(zhǔn),人臉上有68個(gè)點(diǎn),對(duì)這些點(diǎn)進(jìn)行變換,再去實(shí)現(xiàn)匹配目標(biāo)。
圖像識(shí)別領(lǐng)域的發(fā)展經(jīng)歷了CNN,R-CNN,F(xiàn)aster R-CNN等幾個(gè)階段。現(xiàn)在圖像識(shí)別的流行趨勢(shì)會(huì)趨于大自然的發(fā)展邏輯,是一個(gè)大循環(huán)。那么,基于這些科學(xué)實(shí)驗(yàn)基礎(chǔ),騰訊云是如何支持AI應(yīng)用的呢?以五四青年活動(dòng)為例,它是解決圖像匹配的一個(gè)活動(dòng)。首先,從訓(xùn)練數(shù)據(jù)開始,一般是民國時(shí)候的老照片,對(duì)它進(jìn)行提取和標(biāo)注數(shù)據(jù),因?yàn)槊總€(gè)照片都有標(biāo)注,就會(huì)生成模型。當(dāng)用戶玩游戲時(shí)上傳照片測(cè)試數(shù)據(jù)時(shí),會(huì)進(jìn)行特征提取和建模,模型會(huì)返回一個(gè)分類,這個(gè)分?jǐn)?shù)不是執(zhí)行度,不完全可以參考。最后將會(huì)把一個(gè)分?jǐn)?shù)最大的值返回到前端,生成頁面,這是整個(gè)流程。
再以人臉融合類的應(yīng)用來看,比如軍裝照。它的流程首先會(huì)對(duì)圖像的人臉部分進(jìn)行關(guān)鍵點(diǎn)的定位,把人臉上的特征提取出來,然后會(huì)對(duì)圖片進(jìn)行一些旋轉(zhuǎn),把它跟模版圖進(jìn)行統(tǒng)一化。下一步會(huì)把上傳圖片的人臉部分根據(jù)特征值摳出來,它就會(huì)跟模版圖進(jìn)行融合。等融合后如果上傳照片的各種光線角度不完全一樣,再對(duì)圖片進(jìn)行優(yōu)化,把光影、曲線調(diào)得比較平緩,這樣就呈現(xiàn)了非常好的效果。
對(duì)于開發(fā)者來說,掌握了這些能力,在開發(fā)出一款有趣的應(yīng)用之后,如何實(shí)現(xiàn)商業(yè)化落地?直接把它放在網(wǎng)上就可以讓用戶下載使用嗎?實(shí)際上遠(yuǎn)沒有這么簡單。現(xiàn)在的普遍做法是,都會(huì)采用云服務(wù),盡量不在物理集上部署。為什么需要在云上部署AI應(yīng)用?因?yàn)檫@些應(yīng)用一般都會(huì)有短時(shí)間達(dá)到特別高的峰值,持續(xù)一段時(shí)間會(huì)有很快的回落。如果通過自己的IT基礎(chǔ)設(shè)施來響應(yīng)這些需求,在成本上會(huì)非常巨大,難以承擔(dān),而利用公有云,可以把一些機(jī)器的成本釋放掉,這是目前從開發(fā)應(yīng)用到實(shí)現(xiàn)收益的一整套通用商業(yè)流程。
目前,騰訊云AI目前能夠支持的領(lǐng)域比較多。包括各種人臉合成、身份證識(shí)別、智能監(jiān)控、人臉軋機(jī)還有語音合成、關(guān)鍵詞搜索等方面。同時(shí),騰訊云的機(jī)器學(xué)習(xí)的平臺(tái)可以幫助開發(fā)者們快速去實(shí)現(xiàn)模型。
最后,如何讓AI落地到具體場(chǎng)景中,除了技術(shù)層面,開發(fā)者們?nèi)绾未蚰ギa(chǎn)品讓用戶可以簡單的使用復(fù)雜的技術(shù)?通常來說,從有想法到落地是一個(gè)非常漫長的過程,它分非常多的環(huán)節(jié)。首先要有AI算法的專家,同時(shí)要有AI工程實(shí)踐經(jīng)驗(yàn)豐富的人,最后,還要有更多的產(chǎn)品開發(fā)人員把它打磨成產(chǎn)品。
OCR的應(yīng)用集錦及背后技術(shù)
OCR是近年比較火熱的領(lǐng)域。像身份證識(shí)別、車牌識(shí)別等都需要運(yùn)用到OCR技術(shù),而像身份證識(shí)別的場(chǎng)景又非常多。因此,OCR作為一項(xiàng)通用型的基礎(chǔ)技術(shù),有非常廣泛的用途及商業(yè)價(jià)值。在很多需要人力資源來完成文字識(shí)別的工作,比如快遞行業(yè)的運(yùn)單識(shí)別,保險(xiǎn)行業(yè)的資料識(shí)別,通過OCR技術(shù)的利用實(shí)現(xiàn)了較大程度的生產(chǎn)力解放。對(duì)于開發(fā)者來說,借助于OCR技術(shù)開放的API,即可完成在各種生活場(chǎng)景的應(yīng)用開發(fā)。
騰訊AI資深技術(shù)專家冀永楠介紹說,OCR的歷史最早可以追溯到上世紀(jì)六七十年代,當(dāng)時(shí)郵寄信件的郵編即是OCR服務(wù)的最早雛形。目前的OCR應(yīng)用可以分為兩個(gè)維度,一是表格式的OCR和通用的OCR;二是印刷體和手寫體OCR。現(xiàn)在的階段,表格式相對(duì)容易、通用式相對(duì)困難;印刷體相對(duì)簡單,手寫體相對(duì)困難。
騰訊云現(xiàn)在能夠提供多個(gè)場(chǎng)景中的印刷體OCR服務(wù)。在通用型的OCR場(chǎng)景中,除了證件,還能夠識(shí)別駕照、車牌、銀行卡、名片等等。另外,OCR服務(wù)要求準(zhǔn)確,以及完備,即能夠識(shí)別中英文和字符。騰訊云正在由常用語言和字符,例如中英文等往外擴(kuò)散能力,將識(shí)別范圍更加擴(kuò)大。
目前,在銀行業(yè)等對(duì)數(shù)字高敏度的行業(yè),對(duì)OCR的應(yīng)用廣泛且要求極高。騰訊不僅是第一家將手寫體應(yīng)用在實(shí)際場(chǎng)景中的,而且數(shù)字的識(shí)別率也高達(dá)90%以上,單字的識(shí)別率在15毫秒以內(nèi),復(fù)雜漢字超過80%。騰訊云的OCR服務(wù)在權(quán)威測(cè)評(píng)中表現(xiàn)也非常出眾。在國際模式識(shí)別協(xié)會(huì)(IAPR)舉辦的文檔分析與識(shí)別、模式識(shí)別領(lǐng)域世界上最權(quán)威的國際學(xué)術(shù)會(huì)議ICDAR(International Conference on Document Analysis and Recognition,即國際文檔分析與識(shí)別大會(huì))上,騰訊OCR識(shí)別在ICDAR2015 「Focused Scene Text」場(chǎng)景文字識(shí)別任務(wù)、ICDAR 2015「Robust Reading Competition」的自然場(chǎng)景文本檢測(cè)項(xiàng)目中均得到第一名。
騰訊云現(xiàn)在可提供基于各種場(chǎng)景下的OCR服務(wù)接口,開發(fā)者可以免費(fèi)使用這些服務(wù)來搭建自己的應(yīng)用。比如,開發(fā)者實(shí)際需要開發(fā)的一個(gè)具體場(chǎng)景的軟件,需要用到手寫體識(shí)別或者做一個(gè)通用的OCR識(shí)別時(shí),可以直接在騰訊云上調(diào)用對(duì)應(yīng)的服務(wù)來完成應(yīng)用開發(fā)。
騰訊云OCR的應(yīng)用場(chǎng)景很多,目前在快遞運(yùn)單識(shí)別以及保單識(shí)別上有明確的目標(biāo)客戶。類似于這種項(xiàng)目一般是定制化服務(wù),都是針對(duì)性地解決一個(gè)具體的問題。騰訊云根據(jù)具體場(chǎng)景下的問題和具體的生產(chǎn)流程來開發(fā)一套系統(tǒng),或者開發(fā)一套流程來配合實(shí)際的業(yè)務(wù),來提高生產(chǎn)效率。
以快遞運(yùn)單識(shí)別為例,快遞手寫運(yùn)單必須入庫才能進(jìn)行投遞,人工識(shí)別錄入的效率很低,在運(yùn)用騰訊云的OCR系統(tǒng)之后,每日處理量可達(dá)到一千萬單,相當(dāng)于三千多個(gè)人三班倒的工作效率。另一個(gè)案例是泰康核保,在通常的購買健康保險(xiǎn)流程中,都會(huì)對(duì)購買者病史進(jìn)行審核,審核包括購買者之前的體檢資料以及指定醫(yī)院的體驗(yàn)資料,通過這些資料分析,來判定購買者身體狀況。現(xiàn)在的解決方案是使用騰訊云的OCR,同時(shí)與泰康的醫(yī)療專家共同設(shè)計(jì)醫(yī)學(xué)知識(shí)庫加入到定制化系統(tǒng)。
除了以上兩個(gè)場(chǎng)景,騰訊云在不同的OCR應(yīng)用中還有江蘇銀行、小米等客戶。包括工商管理總局的廣告監(jiān)督局也在使用騰訊云OCR的多款服務(wù)。
智慧工地:履約考勤系統(tǒng)的應(yīng)用實(shí)踐
在目前的智慧城市、智慧工地等領(lǐng)域的建設(shè)也充分應(yīng)用了數(shù)字化技術(shù)。為響應(yīng)交通運(yùn)輸部公路品質(zhì)工程建設(shè)的號(hào)召,工程建設(shè)需要加強(qiáng)四新技術(shù)的應(yīng)用,包括新材料、新設(shè)備、新技術(shù)以及新工具的應(yīng)用。在工程項(xiàng)目相對(duì)靈活的突發(fā)的工作環(huán)境中,履約考勤系統(tǒng)往往承擔(dān)著較大的負(fù)荷,現(xiàn)在利用AI技術(shù),就可以實(shí)現(xiàn)履約考勤管理的智能化。而一般開發(fā)者也可以根據(jù)一般企業(yè)的需求利用AI技術(shù)來開發(fā)有特點(diǎn)的產(chǎn)品。
四川云檢科技發(fā)展有限公司研發(fā)總監(jiān)吳琛表示,針對(duì)智慧工地履約考勤系統(tǒng)的應(yīng)用實(shí)踐主要分為六個(gè)部分,包括前沿、產(chǎn)品分析、系統(tǒng)架構(gòu)、主要技術(shù)、功能分析、應(yīng)用展望。當(dāng)前的履約管理的作用是為項(xiàng)目建設(shè)工程、質(zhì)量保駕護(hù)航。在實(shí)際的應(yīng)用當(dāng)中,履約考勤的對(duì)象包括施工單位的項(xiàng)目經(jīng)理、總工、安全生產(chǎn)負(fù)責(zé)人、設(shè)計(jì)單位的駐地設(shè)計(jì)代表、試驗(yàn)檢測(cè)工程師等一些重要的人員,它針對(duì)的是重要的人員而不是其他一般員工。
當(dāng)前主流的考勤方案大約有7種,包括指紋考勤、ID卡考勤、紙卡鐘考勤、人臉識(shí)別考勤、虹膜識(shí)別、指靜脈識(shí)別、攝像考勤機(jī)。這些方案在實(shí)際應(yīng)用中,在兼顧效率和避免冒名頂替方面都不是很理想。而因?yàn)楣こ探ㄔO(shè)與參建方的監(jiān)督與被監(jiān)督關(guān)系,決定了管理部門對(duì)履約人員信息的真實(shí)性有更高的要求。
吳琛介紹說,通過用騰訊云的AI技術(shù),增加的云端功能非常重要。比如,在施工現(xiàn)場(chǎng)普遍存在人員變更的情況,人員變更以前需要業(yè)主或者項(xiàng)目部自行變更,現(xiàn)在有了AI技術(shù),變更的信息可自動(dòng)識(shí)別出來。目前考勤的智能化主要從六個(gè)方面考慮,第一是確保在云端;第二是基于AI;第三是基于云計(jì)算;第四是要連接大數(shù)據(jù);第五是需要是移動(dòng)應(yīng)用;第六是支持智能設(shè)備。
同時(shí),它還需要具備五個(gè)特點(diǎn):一是具備人員人臉基本信息的采集和錄入功能;二是能夠基于人員人臉信息的自動(dòng)識(shí)別、采集、比較;三是支持人員信息與人員身份證信息的核驗(yàn);四是支持考勤地點(diǎn)的設(shè)置及異常考勤位置的判斷;五是支持關(guān)鍵崗位的異常考勤信息預(yù)警以及關(guān)鍵崗位缺勤信息進(jìn)行預(yù)警,支持對(duì)履約人員信息變更進(jìn)行在線管理。具備這些能力,就能在云端對(duì)考勤的結(jié)果進(jìn)行驗(yàn)證,實(shí)現(xiàn)智能化的考勤管理。
騰訊云的智慧考勤主要包括四個(gè)主要技術(shù)方案。第一是人臉對(duì)比,騰訊云的人臉對(duì)比是根據(jù)面部特征計(jì)算兩張人臉的相似度,自動(dòng)進(jìn)行身份鑒別;第二是個(gè)人證核身的功能,騰訊云的人證核身也是人臉核身,通過用戶自拍視頻或者一張自拍照與另外一張用戶事先留存的照片進(jìn)行人臉驗(yàn)證,確認(rèn)用戶身份,主要用來幫助提升業(yè)務(wù)辦理效率,降低人力成本;第三是活體檢測(cè),騰訊云的活體檢測(cè)是通過人臉特征點(diǎn)定位跟蹤識(shí)別進(jìn)行3D人臉重建模型,判斷是否為真人,它支持多平臺(tái),包括CPU、GPU計(jì)算模式,靈活部署;第四個(gè)是基于LBS的定位服務(wù),通過電信移動(dòng)運(yùn)營商的無線電通訊網(wǎng)絡(luò),GSM,CDMA網(wǎng)獲取移動(dòng)終端用戶的位置信息,包括地理坐標(biāo)或者是大地坐標(biāo)。
吳琛介紹說,云檢智慧履約考勤系統(tǒng)目前能夠?qū)崿F(xiàn)考勤數(shù)據(jù)的動(dòng)態(tài)分析,包括對(duì)缺崗異常的數(shù)據(jù)實(shí)現(xiàn)實(shí)時(shí)預(yù)警的功能。主要有四個(gè)功能:一是人臉識(shí)別考勤機(jī),主要作用是前端數(shù)據(jù)采集,包括人員信息登記,人臉考勤以及數(shù)據(jù)上傳;二是用到移動(dòng)端的APP,主要用于人臉考勤、人證核身;三是履約考勤管理云平臺(tái),主要是針對(duì)考勤管理、審批管理、統(tǒng)計(jì)分析、系統(tǒng)設(shè)置等;四是用到API,提供移動(dòng)APP調(diào)用應(yīng)用程序的接口,主要是騰訊云技術(shù)服務(wù)以及人工智能當(dāng)中的人臉對(duì)比,人證核身的這類應(yīng)用。
除了智慧工地領(lǐng)域,人臉識(shí)別解決方案在很多場(chǎng)景中應(yīng)用非常廣泛。隨著技術(shù)的發(fā)展、市場(chǎng)擴(kuò)大,人臉識(shí)別技術(shù)在現(xiàn)實(shí)生活中發(fā)揮的價(jià)值及作用也越來越大。
游戲中的AI技術(shù)應(yīng)用
對(duì)游戲AI的理解因?yàn)樯矸莸牟町悾淠繕?biāo)各有不同。對(duì)游戲開發(fā)者而言,運(yùn)用AI是為了增進(jìn)用戶體驗(yàn),增加玩家活躍度。現(xiàn)在幾乎每款游戲都有運(yùn)用AI,比如說射擊類游戲會(huì)有地圖,如果有一個(gè)非常好的AI幫助玩家去探索地圖會(huì)非常節(jié)省時(shí)間,因此AI對(duì)于小游戲開發(fā)者來說非常重要。
騰訊高級(jí)研究員王亮介紹說,業(yè)界的游戲AI技術(shù)常用的方法一般是三種。一是行為樹;二是基于搜索方法;三是基于學(xué)習(xí)的方法。今年游戲行業(yè)最有影響的是Dota2,它在5個(gè)特定英雄等限制條件下的AI能力能夠超過90%的玩家,它就是采用強(qiáng)化學(xué)習(xí)的方法,其它的很多主流游戲都在嘗試使用強(qiáng)化學(xué)習(xí)解決。
以風(fēng)靡的王者榮耀為例,MOBA游戲AI的做法和遇到的問題有哪些?因?yàn)橥跽邩s耀是一款實(shí)時(shí)對(duì)戰(zhàn)的游戲,以競(jìng)技對(duì)戰(zhàn)為主,復(fù)雜程度表現(xiàn)在英雄角色會(huì)非常多,也會(huì)帶來很多關(guān)于AI的復(fù)雜問題。第一是MOBA類游戲操作序列及狀態(tài)空間非常大;第二是游戲包含很多知識(shí),如何去表達(dá);第三是MOBA決策問題復(fù)雜度高。
對(duì)于這些問題,解決方案方案分為三個(gè)方面。一是引入框架進(jìn)行分層,對(duì)任務(wù)分層和場(chǎng)景切分;二是引入了多模態(tài)的特征表達(dá)方式;三是采用多深度學(xué)習(xí)模型結(jié)合。
了解了基本情況后,在游戲AI開發(fā)的時(shí)候還會(huì)遇到很多坑。在游戲開發(fā)階段需要什么樣的環(huán)境?第一個(gè)需要環(huán)境是模擬器的問題。目前主要是基于這個(gè)環(huán)境來調(diào)優(yōu)。AI接入可以使用基于服務(wù)器架構(gòu),游戲引擎跟算法引擎是分開的,而它們之間是通過通信的方式來進(jìn)行處理的,它的優(yōu)點(diǎn)是游戲引擎跟模型進(jìn)行偶合,并且支持在線學(xué)習(xí),因此可以不斷強(qiáng)化和更新版本。
就整個(gè)游戲AI領(lǐng)域來說,主要是強(qiáng)化學(xué)習(xí)。與之前最顯著的變化就是——以前是基于規(guī)則,現(xiàn)在主要基于學(xué)習(xí)來開發(fā)研究。而如果是基于深度學(xué)習(xí)的方式,就至少要提供相關(guān)的環(huán)境給開發(fā)人員,以及怎么更新迭代。另外,現(xiàn)在的游戲AI還是比較有難度,但同時(shí)也充滿機(jī)會(huì)。
乳腺癌識(shí)別中運(yùn)用的AI技術(shù)
隨著時(shí)代的進(jìn)步和經(jīng)濟(jì)發(fā)展,人們康的健康意識(shí)越來越高,同時(shí)伴隨著AI技術(shù)的發(fā)展,AI醫(yī)療理所應(yīng)當(dāng)?shù)爻蔀榱嘶ヂ?lián)網(wǎng)行業(yè)內(nèi)的風(fēng)口。
騰訊覓影高級(jí)研究員江鋮表示,騰訊最近正式對(duì)外發(fā)布了AI乳腺癌癥診斷系統(tǒng)。選擇乳腺癌這個(gè)領(lǐng)域有兩個(gè)考慮,一是因?yàn)閷?duì)于女性來說乳腺癌是所有腫瘤當(dāng)中發(fā)病率最高的一種,發(fā)病率約在16%-17%之間,嚴(yán)重危害女性的健康;二是因?yàn)槿橄侔╇m然發(fā)病率很高,但是治愈率是較好。如果在較早期發(fā)現(xiàn)治愈的可能性非常高,對(duì)于美國來說目前五年的生存率是在89%,而中國只有83%。這主要是因?yàn)橹袊丝诨鶖?shù)過多,有經(jīng)驗(yàn)的看片醫(yī)生較為缺乏,而目前應(yīng)用AI技術(shù)就能夠有效緩解這個(gè)矛盾,最大限度地幫助患者和醫(yī)生。
現(xiàn)在對(duì)乳腺癌的診斷主要依賴超聲、鉬靶、核磁共振、病理和基因等,騰訊云的目標(biāo)是能夠把這些數(shù)據(jù)模態(tài)有機(jī)結(jié)合起來,形成一個(gè)完整的體系,從而提高對(duì)乳腺癌的診療技術(shù)。當(dāng)前最主流和有效的篩查診斷方式是鉬靶,騰訊的AI鉬靶乳腺癌診斷系統(tǒng)已經(jīng)發(fā)布,并已經(jīng)落地到30多家三甲醫(yī)院進(jìn)行試用。
騰訊云在乳腺鉬靶主要實(shí)現(xiàn)了三方面的功能。第一是實(shí)現(xiàn)了疑似病灶的定位;第二是提供乳房的良惡性判定;第三是能夠自動(dòng)生成影像報(bào)告。
這三方面的功能是如何實(shí)現(xiàn)的呢?主要基于一個(gè)包括三個(gè)維度的技術(shù)框架。其中架構(gòu)前端是鉬靶影像的前處理層;中間層是AI學(xué)習(xí)模型;最后是通過醫(yī)生反饋對(duì)前兩部分進(jìn)行的動(dòng)態(tài)更新。
在中間層AI學(xué)習(xí)模型上,騰訊云單獨(dú)設(shè)計(jì)的方案有四個(gè)突出優(yōu)點(diǎn)。第一是傳統(tǒng)的網(wǎng)絡(luò)輸入通常都是單圖輸入,而現(xiàn)在的方案可實(shí)現(xiàn)對(duì)左右乳進(jìn)行對(duì)比的四張圖同時(shí)輸入;第二是采用多尺度網(wǎng)絡(luò),使得圖片輸入網(wǎng)絡(luò)前無須縮放;第三是漸進(jìn)式的網(wǎng)絡(luò)構(gòu)建,這種方式類似大腦學(xué)習(xí)過程,它把疑難問題分解成若干個(gè)相對(duì)簡單的問題然后逐個(gè)解決,在構(gòu)建網(wǎng)絡(luò)時(shí)由局部到整體,由單幅圖像到多幅圖像;第四是自步學(xué)習(xí)的訓(xùn)練方式,類似于大腦由易到難的學(xué)習(xí)方式,先將訓(xùn)練的樣本按難易程度進(jìn)行分類,在訓(xùn)練過程當(dāng)中由易到難逐步把樣本加進(jìn)去,對(duì)模型進(jìn)行多輪訓(xùn)練,這可以讓模型達(dá)到最好效果。
除了基礎(chǔ)模型,根據(jù)醫(yī)生的反饋,對(duì)于新接入醫(yī)院的數(shù)據(jù)會(huì)對(duì)模型進(jìn)行遷移學(xué)習(xí),實(shí)現(xiàn)動(dòng)態(tài)更新。在模型訓(xùn)練的過程中,有一個(gè)重要發(fā)現(xiàn)=——AI見過的疑難病例的數(shù)量和種類很大程度上決定了AI系統(tǒng)的上限。為此是定期從數(shù)據(jù)庫和線上數(shù)據(jù)中挖掘有價(jià)值的疑難病例,并進(jìn)行標(biāo)注。同時(shí),其中的一部分病倒還會(huì)與三甲醫(yī)院專家討論,利用病理或者其他數(shù)據(jù)進(jìn)行交叉確認(rèn)。
現(xiàn)在,騰訊鉬靶AI模型已經(jīng)達(dá)到了非常高的精度。其中,腫塊探測(cè)方面可以達(dá)到90.2%@0.2FP;鈣化檢測(cè)精度更高,可以達(dá)到99%@0.2FP;對(duì)于良惡性分類,可以達(dá)到87%的敏感度和96%的特異度。
除了鉬靶外,對(duì)于病理方面也開展了相應(yīng)的研究。目前乳腺癌病理研究主要解決兩方面,第一個(gè)是功能組織學(xué)分級(jí),即定義惡性腫瘤惡性的程度,它包含核分裂計(jì)數(shù)、核多行性打分、腺管形成程度三項(xiàng)內(nèi)容;第二是免疫組化,使用不同染色片進(jìn)行分子分型研究。對(duì)于已經(jīng)完成的有絲分裂部分,在學(xué)術(shù)界TUPAC專業(yè)比賽上,之前的冠軍F1 score分值為0.73,現(xiàn)在騰訊的鉬靶AI系統(tǒng)可以達(dá)到0.82,提升很明顯。這個(gè)精度的提升是歸功于三方面的技術(shù)。第一點(diǎn)是使用了計(jì)算機(jī)的難例挖掘方式。經(jīng)過多輪迭代然后在每一輪次對(duì)樣本進(jìn)行整理,由專家確認(rèn)較難的標(biāo)注,再放入樣本當(dāng)中進(jìn)一步學(xué)習(xí);第二點(diǎn)是圖像的歸一化,通過使用對(duì)抗網(wǎng)絡(luò)將圖像做歸一化,達(dá)到提升;第三點(diǎn)是在速度上改進(jìn),拋棄原始計(jì)算機(jī)視覺當(dāng)中將一整幅圖切分的方式,采用共享計(jì)算和模型壓縮的效果,讓一幅病理片可以達(dá)到0.5秒級(jí)的處理速度,基本上接近于實(shí)時(shí)。
在核磁共振方面,騰訊也進(jìn)行了相應(yīng)的研究,開發(fā)了一種半自動(dòng)的高效病灶標(biāo)注工具。除此以外,騰訊還在超聲方向投入人力,拓展研究邊界,目前已經(jīng)完成了數(shù)據(jù)準(zhǔn)備工作。后期將繼續(xù)對(duì)各模態(tài)數(shù)據(jù)展開深入研究,致力于把多模態(tài)的數(shù)據(jù)有機(jī)結(jié)合起來,造福患者和醫(yī)生。
江鋮的演講之后,已經(jīng)是傍晚時(shí)刻,現(xiàn)場(chǎng)開發(fā)者參與提問和交流的熱情依然不減。此次沙龍活動(dòng),現(xiàn)場(chǎng)五位專家的演講都聚焦在AI具體場(chǎng)景的應(yīng)用案例,不僅給開發(fā)者們帶來了理念上的啟迪,同時(shí)騰訊云開放的AI能力也能夠?qū)嵸|(zhì)性地幫助開發(fā)者們實(shí)現(xiàn)便捷開發(fā),把AI技術(shù)擴(kuò)散到更多的應(yīng)用場(chǎng)景中。
-
AI
+關(guān)注
關(guān)注
87文章
31097瀏覽量
269434 -
騰訊
+關(guān)注
關(guān)注
7文章
1657瀏覽量
49482
原文標(biāo)題:大伽「趣」說AI:騰訊云在多個(gè)場(chǎng)景中的AI落地實(shí)踐
文章出處:【微信號(hào):AI_Thinker,微信公眾號(hào):人工智能頭條】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論