如何定義和評價平安集團在醫療科技層面的未來? 編者按:2020 年 8 月 7 日,全球人工智能和機器人峰會(CCF-GAIR 2020)正式開幕。CCF-GAIR 2020 峰會由中國計算機學會(CCF)主辦,雷鋒網、香港中文大學(深圳)聯合承辦,鵬城實驗室、深圳市人工智能與機器人研究院協辦。從 2016 年的學產結合,2017 年的產業落地,2018 年的垂直細分,2019 年的人工智能 40 周年,峰會一直致力于打造國內人工智能和機器人領域規模最大、規格最高、跨界最廣的學術、工業和投資平臺。 在8月9日的醫療科技專場上,來自平安集團的首席醫療科學家謝國彤先生以《用人工智能重塑醫療:平安醫療科技的實踐和探索》為題,分享了平安集團在醫療領域的深刻認知和實踐。 謝國彤博士認為,所有AI都無非四個要素:數據、算力、算法和應用。在這四個要素下面,平安共研發了2個基礎平臺和4個醫療AI算法領域,以支持醫療的各種分析和推理,目前有1.6萬家醫療機構,43萬醫生在使用。兩個基礎平臺主要是賽飛AI平臺(算力)和醫療五大庫及知識圖譜(數據)。謝國彤表示,醫療五大庫及知識圖譜,首先是從數據端出發,分四步去解決數據處理難題:第一,去掉噪音,補全數據,提升數據輸入質量;第二,結構化,通過數據和文本抽取,實現數據可用;第三,標準化,把不同來源的醫療數據名稱統一;第四,利用算法挖掘疾病的風險因子或者治療方法。 而賽飛AI平臺則主要是通過AI平臺化戰略,解決AI產品算力和落地的基礎性問題。 謝國彤說到,平臺的目的就是讓醫療數據科學家專注在自己領域內,由平臺去完成AI通用算法、智能標注、分布式訓練加速、高性能壓縮模型部署等通用問題。 在這兩大基礎平臺之上衍生的4個醫療AI算法領域,主要側重在疾病預測、智能影像、AskBob輔助診療和疾病全周期管理四個場景。 在最后的總結中,謝國彤說到,醫療人工智能是利國利民的事情,人命關天,需要AI界和醫學界的緊密合作,用AI的算法解決真實的需求,保證模型的安全性、可用性,才能對“健康中國”產生真正的價值。
以下為謝國彤的現場演講內容,雷鋒網《醫健AI掘金志》作了不改變原意的編輯及整理:
謝國彤:各位現場和線上的朋友,大家好。我叫謝國彤,負責平安的醫療科技。很高興今天有機會跟大家分享平安在醫療科技方面的進展。
在過去五年時間,平安積累了大量的醫療業務。平安醫療有三個支柱:患者端、醫院端和支付端。頂天立地還各有一橫一縱。 患者端,平安目前有全球最大的互聯網醫療平臺——平安好醫生,3億多注冊用戶,每天的問診量在80萬次以上; 醫院端,平安通過智慧醫院的解決方案,在1.6萬家醫院賦能,還有自己的檢測中心、藥品集采平臺,很多跟醫院相關的業務; 保險支付是平安的本行,平安有1億6千萬的保險客戶,平安醫保科技為兩百多個城市政府做醫保精算、核賠各種業務。 一橫一縱,上面一橫是面向政府。平安擁有的智慧城市、智慧衛健業務,在150多個城市幫助政府提供更好的公共衛生、全民信息平臺和醫共體的解決方案。 下面一縱是我負責的平安醫療科技,從每個業務中沉淀數據,把數據變成AI模型。再反哺賦能給各個業務。今天,我主要聚焦平安醫療科技的工作。 所有的AI無非是四個要素:數據、算力、算法和應用。如果把我們的工作按照四個要素來整理,是2個基礎平臺和4個算法領域。
基礎平臺:包括五大庫數據及知識圖譜平臺。這個平臺匯聚了平安各種醫療業務沉淀下來的數據,將其知識化后變成知識圖譜,支持上層的各種分析和推理。賽飛AI平臺:讓做醫療的數據科學家專注在自己的領域里,把AI的通用算法、分布式的訓練加速、高性能壓縮模型部署等通用問題交給平臺來做。五大庫及知識圖譜首先來說一下,我們的五大庫知識圖譜。
在沉淀大量數據后,我們以疾病為中心構建知識圖譜,把疾病的癥狀、檢查檢驗、用藥、關鍵的常用處方、疾病手術、疾病并發癥、疾病風險因素、疾病和基因的關系,包括哪個醫院、哪個醫生在哪個疾病領域比較擅長,發表過什么科研成果的信息都收集起來,構建出一個包含300萬的醫學概念、3300萬的關系和3000萬醫學證據的醫療知識圖譜,支持后續所有的應用。
構建這樣的圖譜,我們把它總結為“四化”的過程。拿到數據后,要經過四個關鍵步驟:第一步,去噪。去掉噪音,補全數據,提高輸入數據的質量;第二步,結構化。圖譜里有大量文本數據,要做各種實體、關系進行抽取抽取,對文本進行分類、標簽,讓數據變得可用;第三步,標準化。不同來源的醫療數據,對疾病、藥品、檢查檢驗的描述是不一樣的。我們要用大量的NLP技術,將各種醫學術語統一化、標準化,才能進行下一步的分析;第四步,挖掘。利用各種算法,從數據中挖掘疾病的風險因子或者常用的治療方法,這些信息最終會沉淀在我們的知識圖譜里。
賽飛AI算法平臺其次,我介紹一下賽飛AI平臺,這個平臺的目標要提供從模型訓練到模型部署的一整套平臺級服務,讓醫療數據科學家專注在醫療領域,不用去考慮通用的問題。 賽飛的工作很多。舉一個例子,我們在進行組織病理影像分析時,一個病理的影像大概有10億像素,如果一個醫生要很完整的把腎小球和腎小球里的內皮細胞、細膜細胞都標注完,一個小時都不能完成。 但是,所有的片子都有必要去標注嗎?不見得。我們利用主動學習的方法,挑選信息量最大的片子。后來我們發現,標注52%的訓練數據,就可以達到跟此前標注完所有數據差不多的效果。 再比如分布式加速。現在的NLP模型龐大無比,不管是現在最火的GPT-3擁有的上千億參數,還是常用的BERT,都是幾億參數的大模型。我們參加ACL比賽時,用了賽飛分布式加速能力,在20天之內訓練了281次,不停把模型的精度推到極致,最后拿到冠軍。 這就是分布式加速給模型訓練帶來的價值。 再比如模型壓縮的例子,這是非常現實的場景:很多AI模型希望跟硬件進行整合,但是模型很大,硬件存儲卻很小。我們的一個眼底OCT模型大小是6G,一個OCT設備存儲是2G,無法把這個模型放在存儲里。 最后,我們把6G的模型壓縮到原來的四分之一,精度只損失一點點,最終完成軟硬一體的計算。 當然,除了在醫療領域,賽飛還可以拓展變成更加通用的AI平臺。
現在平安有16個子公司、42個部門、300多名數據科學家在賽飛平臺上完成2.5萬次模型訓練。 同時,它是參加比賽刷榜的神器,我們拿了7個世界第一,利用這個平臺,極大地加快建模速度,也有很多相應論文的發表。 說完底層的技術,我們再看上層的四個算法領域,其中大家比較熟悉的是影像。 平安的業務很廣,如果聚焦在醫療AI的算法場景里,則是從疾病的預測、基于影像的輔助診斷、AskBob輔助診療和患者院外管理的四大場景,我們有大量的模型算法和工作。 從應用的角度來看,今年,平安所有的醫療科技服務有1.75億次的調用,服務了1.6萬家醫院,43.8萬名醫生用戶每天在使用我們的醫療科技服務。
疾病預測關鍵技術疾病預測,預測的不是人的命運,而是人的生命。比如預測重癥患者院內死亡風險、慢性病患者的并發癥風險、人群發病風險。 新冠疫情期間,平安醫療科技向國務院辦公廳、各個部委提交了130多期預測報告,預測什么時候新增發病人數會到頂,什么時候出院人數會急劇增加,最終死亡率是多少,從而幫助政府做決策。 在疾病的預測過程中,有非常多的關鍵技術:一、數據修復。拿到100條記錄,要求所有的關鍵數據都有數值,最后剩下一條就不錯了。我們在IEEE ICHI參加了Data Imputation的比賽拿了冠軍,我們利用數據所謂的橫向、縱向和斜向關系,分析數據之前、之后和相關檢測檢驗的信息,猜測缺失的數據可能是多少,均有不錯的效果。二、特征工程。很多預測是從病例中進行挖掘,這里也有挑戰:數據是多模態的,不像影像相對單純。 在這次新冠疫情里,預測有60%的ICU患者發生了不同程度的膿毒癥,膿毒癥是ICU的第一大殺手。ICU里的信號非常復雜,有心率血壓、脈搏等生命體征信息,并且時間序列是連續的。 我們利用很好的多模態數據特征工程的方法,提前6個小時預測患者發生膿毒癥的風險,精度比目前最好的方法高20%,這個工作今年發表在重癥醫學頂級期刊CCM上。三、可解釋機器學習建模。很多醫生是很難接受黑盒模型的,尤其是預測,本來就是在猜,如果怎么猜的都不知道,醫生很難接受這個模型。 我們的做法是將深度學習的方法跟醫生比較能接受的生存分析survival analysis方法結合起來,利用SHAP等可視化的方法,把因素和結局的關系可視化出來。比如右上角的圖,有一個U字形,那是一個非常典型的例子,紅色的表示當值在那個區域的時候,導致患者出現腎衰竭的風險,而綠色部分是保護性因素,值在這個區間的患者不容易發生風險,但它不是線性的。 我們利用可解釋的模型加上深度學習的方法,用算法定量、精準地把非線性的關系可視化出來,解釋給醫生,讓他們更容易接受。
做預測模型有什么用?現在有兩個面向用戶的場景在使用: 第一個場景是面向C端用戶。平安有最大的全球互聯網醫療平臺——平安好醫生。我們把常見病(高血壓、糖尿病、冠心病、腦卒中)的預測模型放在平安好醫生APP上。平安好醫生有幾億的用戶,他們會填寫數據預測,看看自己有什么風險,同時進行相應的管理。 第二個場景是針對老年人群體。我們在甘肅收集到185萬老年人數據。老年人出現高血壓、糖尿病的比例占老年人口的40%,慢性病管理的挑戰在于知曉率低,治療率低。老年人不知道自己有病,或者有病也不會主動治療。 我們跟甘肅衛健委合作,用算法把這些人挑出來,通過甘肅家庭醫生平臺,讓家庭醫生有針對性找到高危老年人,對他們進行主動管理,提高疾病的知曉率和治療率。 三是在珠海,我們利用200多萬居民的健康數據和12個疾病的預測模型,可以生成一個完整的風險評估報告。 同時,我們會把相應患者的教育,以及可訪問的健康服務跟風險因素掛在一起:哪些服務可以幫助降低哪些風險因素,讓政府在進行疾病管理的時候變得更加精準,更有針對性。基于智能影像的輔助診斷第二個場景是面向醫學影像,我們聚焦的是兩類人群(基層醫生和專家)、三個場景:
對于基層醫生,我們聚焦質控和篩查。很多基層醫生拍出來的片子位置不正、關鍵的器官不在里面、以及各種異物,這些片子拿到北京、上海的大醫院也用不了。 我們在質控領域有很長的積累,在《NEUROCOMPUTING》、《SCIENTIFIC REPORTS》上發表了一系列的文章,針對DR、CT、內窺鏡等影像,發現質量問題后提示醫生重拍,進而提高優片的比例,在內窺鏡異物比賽上獲得冠軍。
另外,平安有六個檢測中心,300多家醫院把數據傳到平安影像云上,由平安的醫生幫助他們閱片。利用質控的方法,不管是DR。還是CT,質量不好片子的比例下降了20%,讓甲級優等片的占比達到98%,提高了基層片子的質量。 第二個場景是篩查,告訴基層醫生患者的病情,在基層醫院看不了,要去大醫院就診。 我舉一個眼科OCT的例子。OCT類似于CT,是三維建模,會看OCT的醫生很少,尤其是在基層醫院,五官科的醫生往往是耳鼻喉科的醫生,不一定是眼科醫生。 我們在TVST、MICCAI等連續發表了一些文章,用算法對OCT的20多種病灶進行識別,并且做出緊迫性判斷。提示醫生患者沒問題,或是有問題但只需要隨訪,或者是問題很嚴重,需要馬上到上級醫院就診,這是我們在篩查場景里發揮的作用。 我們在上海、深圳都建立了以權威眼科三甲醫院為主、下設幾十家社康中心的模式,在社康中心進行篩查。在這兩個地方,我們發現,年齡偏高人群中有30%的人有不同程度的眼底病變,其中20%的人需要馬上治療。因此,通過平安的平臺,我們可以將他們轉到相應的三甲眼科醫院進行干預。 第三類是輔助診斷,面向專科醫生,對于很難很煩的事情,我們幫助他們加速。 這是腎臟病理的例子。一個醫生做腎臟診斷時,需要對著10億像素的片子數腎小球、有沒有硬化,腎小球里面細胞的比例。一個醫生數一個腎小球平均需要平均43秒,一個片子里有幾十到一百個腎小球。 我們利用最近發表在病理學頂級期刊上的一套模型,跟國家腎病中心的四個腎內科醫生進行了對比。結果模型的精度是92%,四個腎內科的醫生平均精度是82%,同時,模型看一個腎小球的速度是0.6秒,而醫生平均是43秒,我們把速度平均提升了70倍,精度提升了10倍。因此,讓醫生基于AI模型提供結果進行判斷,把瑣碎的事情交給計算機,這是我們對AI的定位。今年上半年,有250多個城市使用了平安醫療科技的技術,影像輔助診斷的服務就有上億次調用。 最后一個例子是宮頸癌TCT病理,我們將硬件與模型進行了整合,通過跟復旦腫瘤醫院、第三方診斷中心合作一起應用。掃描儀會在2分鐘內完成切片掃描,在40秒鐘內對切片進行陽性、陰性的判斷,同時會把三類高危的陽性切片按照高、中、低列出來,讓醫生關注陽性的切片。 即使是陰性的片子,我們會把一些高風險的區域高亮出來,幫助醫生做判斷。在6000例的數據驗證上,敏感度設到99%,排疑率是80%,減少醫生閱讀陰性片的時間。AskBob輔助診療輔助診療核心要解決的是診斷治療時如何給醫生一些輔助,我挑選兩個關鍵技術介紹。
目前,我們有2000多種疾病的輔助診斷和120多種精準治療模型。很多AI應用集中在分類,可能也會完成分割的任務。我們主要用的是深度強化學習的方法,結合短期和長期的結果做Reward function,短期是血壓、血糖達標率,長期是并發狀的發生率,用不同的結果給深度強化學習一些激勵。 利用這樣的方法,我們跟國家生命中心在BMJ子刊上發表了面向糖尿病、腎病個性化治療的模型,跟安貞醫院剛剛在AMIA上發表了房顫的治療模型。 還有一個場景是面向循證醫學。醫生要閱讀大量的文獻,我們用算法把文獻里關鍵的疾病、用藥抽取出來做分類,比如這類疾病的手術治療是哪一種,用哪種藥進行治療,我們用算法把關鍵信息抽取出來。
目前,這一套輔助診療系統在1.6萬家醫院有應用,目標對象同樣分為基層醫生和專家醫生。我們會像助手一樣,在基層醫生輸入癥狀之后,不斷提醒可能的檢查、檢驗和用藥、診斷結果。數據顯示,部署我們系統之前,地方診療規范率不到50%,部署后的規范率達到80%以上。而對于專科醫生,我們希望他們在面對復雜病例或者科研需求時,可以通過AI的方式檢索到需要的醫學證據。比如胃癌,我們會提供不同臨床治療方案的依據以及治療的效果。 同時,醫生可以查詢胃癌領域的權威在哪些領域發表了多少文章,有哪些臨床實驗,從而幫助醫生更好地進行科研。患者院外管理除了幫助醫生,我們還要關注的對象是患者,患者離開醫院后有大量管理的需求。 比如藥物是否需要調整、是否還要繼續吃,跟其他藥一起吃有沒有問題。醫生會對患者進行隨訪,但是單純依靠人的方式是不可能的。中國一年就診人次是80億,但只有300萬醫生,醫生治病之余沒有精力做后續患者隨訪。
為此,我們開發了多輪對話技術,讓AI盡可能把那些耗時耗力的工作做完,好醫生一天會產生80萬次的問題。我們分析了好醫生日志,每次15分鐘的對話里,前5分鐘都是醫生問患者的病史、診斷治療,后10分鐘患者會問醫生五花八門的話題,這些都是我們很好的訓練數據。 在ACL里,我們在醫療問答項目上拿到了冠軍。基于海量的數據,我們訓練了一個AskBob的模型,比通用的模型效果更好,可以做意圖理解、FAQ問答和知識圖譜問答,回答各種長尾的問題。 舉一個應用的例子。目前,在560多家醫院、五萬名2型糖尿病患者在我們的平臺上進行院外的管理。這有點像前面這些方案的集大成者。我們會用各種風險預測產生患者畫像,用輔助診療的模型生成一些方案、監測方案、用藥方案、飲食運動等,用對話的方式進行動態跟蹤、隨訪,包括回答各種問題。 這種方式的效果如何?
數據顯示,患者入住三個月后,評估他的HBA1C和空腹血糖,可以看到HBA1C達標率提升5倍,空腹血糖達標率提升20%。患者很積極地閱讀文章,積極地上傳自己的血糖數據,依從性提升了50%。 與此同時,成本也相應降低。因為以前主要靠人工,三個月內圍繞一名患者,護士平均要打5個電話。現在的“AI+護士”,只要打2.9個電話就可以達到更好的效果,這是院外管理一個很好的案例。 更重要的一點是,打通重點疾病的專科模式。我們跟國家腎病中心有一個合作的例子,基于病理對慢性腎病的患者進行輔助診斷,進行腎衰竭的風險預測,對高風險的人群實現精準用藥,讓他們接受免疫抑制劑的治療,降低腎衰竭的風險。
以腎病為專科案例來看,我們打通了輔助診斷、風險預測、精準治療、患者管理的四大環節,在每個環節都有醫學期刊論文發表,得到醫學界的認可。 最后,我想說的是,醫療人工智能是利國利民的事情,人命關天,需要AI界和醫學界的緊密合作,用AI的算法解決真實的需求,保證模型的安全性、可用性,才能真正地對“健康中國”產生價值。采訪問答精選提問:您剛剛在演講中提到了賽飛平臺,想請問一下為什么要投入精力去開發平臺?未來的面向對象是哪些?謝國彤:我們發現,算法工程師要完成好多通用的事情,而且環境不停地升級,算法要不斷優化,例如模型壓縮、高性能部署,這些都是一些通用需求。 我們有四個算法領域:疾病預測、醫學影像、輔助診療還有疾病管理,這四個領域的算法工程師都得學。兩年前,我們就開始從訓練環節入手,提供一些通用能力,讓算法工程師只聚焦在自己的領域。 把數據可視化、數據標注、數據增強,包括分布式加速訓練這些通用能力,還有通用算法庫,沉淀在賽飛上,不用管底層環境的事情。這樣大家都用得很爽,賽飛是一個GPU的集群,有個集群大家就可以共享,有機會用到一個比以前大10倍的GPU的力量。 我們在內部使用后,發現外部客戶也有類似需求,因為有很多算法是不局限于醫療領域的,例如NLP領域的BERT,CV領域的ResNet,這些網絡很多領域的人都在用。 因此,我們就開始讓平安的子公司來使用,現在300多個用戶里有一大半都不是做醫療的,都是平安16個子公司的用戶,在上面做NLP、CV、OCR等各種各樣的建模。所以,賽飛在持續地增長,更好地服務集團,從一個純醫療的平臺變成通用的AI平臺。提問:平安的醫療AI產品與布局,與BAT或者AI公司有哪些本質上的區別,怎么才能從這個市場中獲得優勢?謝國彤:疾病是一個很復雜的領域,有2萬到3萬種病。就以影像為例,有些聚焦于放射,細分來看,會分為DR、CT和核磁等。從病種上來看,有些會聚焦眼科,有些會聚焦病理,還會再細分還會分為宮頸癌病理、乳腺癌病理、胃癌病理等。 所以,我覺得醫療AI的空間足夠大,沒有任何一家公司能把世界上所有病的所有AI模型都搞定。 其次,大家選擇的切入點不一樣,從我的角度來看,我們更關注的是那些真正有需求的場景,如何為基層醫生賦能,如何為專科醫生減負,不是非要讓基層醫生看很難的病,或者要比專科醫生強很多。在我看來,很多場景就是為了技術而技術。 三年前,我離開IBM的時候,很多公司找過我,但是我選擇了平安。我覺得,平安的醫療生態patient、provider、payment是一個很完整的生態,有一些公司也不是沒有場景,但是領域很窄。AI是由場景業務驅動,而不是技術驅動,技術驅動是風光一時。只有基于真實的業務場景,才能真的有價值,有收入。提問:對于醫療AI的認證和落地,您有哪些看法?謝國彤:我們現在跟國家科技部和國家衛健委,在進行AI醫療領域的一個課題——AI的模型驗證評估平臺。我之前跟科技部、衛健委表達了一個觀點,他們也很認同,那就是,讓大家都拿到證才能用是不現實的。拿一個證,沒有兩三年是不會有什么結果的,這個過程中大家都在干等?這是不可能的,要鼓勵大家去嘗試。 嘗試的過程中,各個地方的衛健委和醫院院長、主任都很困惑,每一家企業來找我都是99%的準確率。但是,測試的數據集都不一樣,只要選好測試集百分之百也可以,就看怎么選。 例如眼科OCT,可能有20種病變,其中有些病變是常見,有些是罕見,但測試集里只包含了其中10種,這10種雖然識別準確了,但另外10種還沒有識別,怎么就代表模型準確了呢? 因此,我們現在跟科技部、國家衛健委合作的項目,就是由醫院、衛健委、藥監局等部門牽頭,針對特定的疾病和特定的任務,提供中立的測試集。把各家的模型拿上來測試,最后拿出一個評估報告。至少讓各家講自己性能指標的時候,有一個統一的數據集、一個統一、中立的評測標準。 我覺得,國家推動醫療AI應用中做得很好的一個步驟是,先選擇一些常見的、需求量比較大的AI場景,制定相對成熟的數據集,從需求比較大病種開始入手,當數據集越來越多,能評估的模型也越來越多。
-
醫療
+關注
關注
8文章
1835瀏覽量
58887 -
人工智能
+關注
關注
1794文章
47642瀏覽量
239673 -
AI算法
+關注
關注
0文章
252瀏覽量
12318
原文標題:平安首席醫療科學家謝國彤:兩大基礎平臺與四大算法領域,詳解金融巨頭的醫療科技版圖 | CCF-GAIR 2020
文章出處:【微信號:IoT_talk,微信公眾號:醫健AI掘金志】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論