色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

近五年來中文電子病歷的命名實體識別研究進展

深度學習自然語言處理 ? 來源:python遇見NLP ? 2020-08-27 17:56 ? 次閱讀

閱讀綜述性論文是一種能夠快速了解某一領域的方法,接下來通過今年的一篇綜述性論文來了解一下近五年來中文電子病歷的命名實體識別研究進展。

基本的,我們應該先來了解一下兩個概念:電子病歷和命名實體識別。

電子病歷(Electronic Medical Record,EMR)是指醫務人員在醫療活動過程中,使用醫療機構信息系統生成的數字化信息, 并能實現存儲、管理、傳輸和重現的醫療記錄。電子病歷中的文本內容是醫務人員按照《病歷書寫基本規范》和《電子病歷基本規范(試行)》中相關書寫規定,圍繞患者醫療需求與服務活動而記錄的描述性文本內容。

命名實體識別(Named Entity Recognition,NER)是指識別自由文本中具有特定意義的實體,如人名、地名、專有名詞等。與通用領域的命名實體不同,電子病歷中的命名實體通常有疾病、癥狀、治療等實體。

有了上述兩個概念的了解后,接下來我們就可以來了解中文電子病歷命名實體識別的任務,它包括:

①電子病歷數據的獲取與匿名化處理;

②明確命名實體種類,進行語料標注;

③構建模型進行實體識別;

④結果評價及優化。

以電子病歷中現病史章節為例,中文電子病歷命名實體識別研究任務流程如圖1所示:

從上述四個任務出發,我們繼續進行探討。

1

電子病歷數據集的獲取

中文電子病歷數據的獲取途徑通常包括:

①與醫院建立合作關系,如曲春燕等通過與某醫科大學附屬醫院建立合作關系獲取到該院35個大科室、87個小科室的992份電子病歷。同時,相關醫務人員也全程參與數據標注,為數據集的質量提供了保障。

②開放獲取的學術評測語料,如CCKS2020學術評測任務三開放了用于命名實體識別評測任務的已標注匿名化電子病歷1500份和未標注的電子病歷1000份,在電子病歷語料資源匱乏的現狀下,全國知識圖譜與語義計算大 會無疑為行業發展作出了巨大貢獻。 ③網絡發布的電子病歷資源。 當前,大多數研究采用第1種方式獲取電子病歷的研究數據,并邀請醫務人員參與語料數據的標注工作;而第2、3種獲取方式具有很大的不確定性,并且電子病歷的數據標注工作過程控制和質量控制均存在不確定性。

2

數據標注的相關工作

曲春燕等參照i2b2 2010的標注規范制定了中文電子病歷的標注規范,進而在兩名臨床醫生的全程參與下,對病歷文本分為前后共計4輪標注,并進行了一致性檢驗。楊錦鋒等在曲春燕等人的工作基礎上,對相同的病歷文本資源,進行了命名實體和實體關系的標注語料構建工作。He等在曲春燕、楊錦鋒等人的工作基礎上,新增了電子病歷文本的分詞、詞性標注、斷言、關系抽取等自然語言處理常見任務的語料標注工作,并對標注結果進行了一致性檢驗。 上述學者的延續性標注工作,對今后研究的語料標注工作具有一定的指導意義。然而,與臨床醫生長期從事語料建設和維護的難以實現。一方面,臨床醫生用于語料標注的時間有限;另一方面,邀請臨床醫生標注語料成本更高。因此,醫學數據標注團隊建設和專業人員培養的可行性值得探討。

3

主要的命名實體識別算法模型

中文命名實體識別的主要研究算法為條件隨機場(CRF)和雙向長短期記憶網絡模型條件隨機場(Bi-LSTM-CRF)。 Liu等設計不同特征模板和上下文窗口進行條件隨機場的學習訓練,進行模型實體識別效率的比對分析,以尋找最佳的電子病歷特征模板和上下文窗口。Liu等在i2b2 2010,2012和2014語料上實驗對比了Bi-LSTM-CRF與傳統的CRF實體識別算法的性能,結果表明Bi-LSTM-CRF性能較好。CCKS 2017學術評測任務二:面向電子病歷的命名實體識別,共收錄了7篇論文,研究內容和測評結果等見表1。總體上看,7篇論文均有對Bi-LSTM-CRF(或Bi-LSTM)算法模型的實現;均采用“字粒度”模型使用word2vec工具將輸入文本特征向量化表示。Zhang等利用CCKS 2017開放的電子病歷語料,分別采用CRFs和Bi-LSTM-CRF兩種統計機器學習算法從電子病歷數據集中識別疾病、身體部位和治療等信息,并對兩種方法進行了對比分析,發現后者性能較好。Qiu等為提高循環神經網絡模型的訓練速度,提出了殘差卷積神經網絡條件隨機場模型(RD-CNN-CRF)在CCKS 2017開放測試語料上獲得了較Bi-LSTM-CRF更高的訓練速度和F1值。CCKS 2018學術評測任務一:面向中文電子病歷的命名實體識別,共收錄論文2篇,分別是Yang等將詞嵌套、詞性、偏旁部首、拼音、詞典和規則特征作為條件隨機場(CRFs)的學習特征,實驗F1值為89.26%;Luo等基于多特征(如標點符號、分詞和詞典等特征)融合,整合CNN-CRF, Bi-LSTM-CRF, Bi-LSTM-CNN-CRF, Bi-LSTM+CNN-CRF和Lattice LSTM五種神經網絡模型,實驗F1值最高達到了88.63%(表1)。

4

結果評價及優化

隨著中文電子病歷命名實體識別的研究逐步深入以及相關算法框架的逐漸成熟,基于中文電子病歷的命名實體識別算法構成了臨床電子病歷系統、專病科研數據提取、臨床輔助決策系統的重要組成部分。 電子病歷命名實體識別結果評價指標說明如下圖:

袁冬生為解決出院小結文檔中普遍存在的信息不準確、無效信息、信息缺失等問題,設計開發了一套基于命名實體識別的出院小結錯誤檢測系統。李山為提高住院病歷錄入的交互性和可操作性,降低書寫的繁雜度,減輕醫生負荷,提高工作效率,使用條件隨機場算法,進行電子病歷命名實體識別,提取病歷中重要的診療信息,并將其應用在住院病歷錄入輔助中,以優化和改善病歷錄入方式。Su等則基于中文電子病歷命名實體標注規范構建了一個可用于識別心血管疾病危險因素的語料庫。

展望

.....

針對電子病歷的語義特征的量化分析與研究,對于提升算法特征工程質量有積極意義;近兩年來,針對電子病歷語料標注的成本問題,很多研究聚焦于半監督和無監督的算法來實現基于少量標注語料或完全基于非標注原始語料進行實體識別,是一個重要的研究方向。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 電子病歷
    +關注

    關注

    1

    文章

    61

    瀏覽量

    20136
  • 數字化
    +關注

    關注

    8

    文章

    8754

    瀏覽量

    61819
  • 識別
    +關注

    關注

    3

    文章

    173

    瀏覽量

    31973

原文標題:【NER綜述】近五年中文電子病歷命名實體識別研究進展

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    高能點焊電源技術在現代工業制造中的應用與研究進展

    制造中的最新研究進展。 一、高能點焊電源技術的基本原理及特點 高能點焊電源技術是一種利用高壓脈沖電流實現金屬材料瞬間熔化并完成焊接的先進工藝。其工作原理主要基于
    的頭像 發表于 11-23 08:58 ?188次閱讀
    高能點焊電源技術在現代工業制造中的應用與<b class='flag-5'>研究進展</b>

    上海光機所在多路超短脈沖時空同步測量方面取得研究進展

    圖1.超短脈沖時空同步實驗的光路圖 近日,中科院上海光機所高功率激光物理聯合實驗室在多路超短脈沖時間同步與空間疊合度測量方面取得研究進展,相關研究成果以“High-precision
    的頭像 發表于 11-11 06:25 ?179次閱讀
    上海光機所在多路超短脈沖時空同步測量方面取得<b class='flag-5'>研究進展</b>

    AI大模型的最新研究進展

    AI大模型的最新研究進展體現在多個方面,以下是對其最新進展的介紹: 一、技術創新與突破 生成式AI技術的爆發 : 生成式AI技術正在迅速發展,其強大的生成能力使得AI大模型在多個領域得到廣泛應用
    的頭像 發表于 10-23 15:19 ?454次閱讀

    導熱紙(膜)的研究進展 | 晟鵬技術突破導熱芳綸紙

    問題。紙張及薄膜具有良好的柔韌性、優異的加工性和厚度可調整性,是良好的柔性導熱材料。本文概述了近年來導熱紙(膜)的研究進展,對不同基材的導熱紙進行了歸納分類和介紹,重點
    的頭像 發表于 07-12 08:10 ?692次閱讀
    導熱紙(膜)的<b class='flag-5'>研究進展</b> | 晟鵬技術突破導熱芳綸紙

    量子計算+光伏!本源研究成果入選2023度“中國地理科學十大研究進展

    近日中國地理學會公布了2023度“中國地理科學十大研究進展”本源量子參與的“量子地理計算技術、軟件及應用”研究成果獲選系量子計算領域唯一入選單位來源:中國地理學會此次入選的“量子地理計算技術、軟件
    的頭像 發表于 05-10 08:22 ?509次閱讀
    量子計算+光伏!本源<b class='flag-5'>研究</b>成果入選2023<b class='flag-5'>年</b>度“中國地理科學十大<b class='flag-5'>研究進展</b>”

    銻化物超晶格紅外探測器研究進展與發展趨勢綜述

    銻化物超晶格紅外探測器具有均勻性好、暗電流低和量子效率較高等優點,其探測波長靈活可調,可以覆蓋短波至甚長波整個紅外譜段,是實現高均勻大面陣、長波、甚長波及雙色紅外探測器的優選技術,得到了國內外相關研究機構的關注和重視,近年來取得了突破性的
    的頭像 發表于 04-19 09:13 ?1163次閱讀
    銻化物超晶格紅外探測器<b class='flag-5'>研究進展</b>與發展趨勢綜述

    用于先進電生理記錄的有源微納協同生物電子器件研究進展綜述

    開發精確靈敏的電生理記錄平臺對心臟病學和神經科學領域的研究至關重要。近年來,有源微納生物電子器件取得了重大進展,從而促進了電生理學的研究
    的頭像 發表于 04-16 10:55 ?719次閱讀
    用于先進電生理記錄的有源微納協同生物<b class='flag-5'>電子</b>器件<b class='flag-5'>研究進展</b>綜述

    綜述:高性能銻化物中紅外半導體激光器研究進展

    據麥姆斯咨詢報道,近期,由中國科學院半導體研究所和中國科學院大學組成的科研團隊受邀在《激光技術》期刊上發表了以“高性能銻化物中紅外半導體激光器研究進展”為主題的文章。該文章第一作者為曹鈞天,通訊作者為楊成奧和牛智川研究員。
    的頭像 發表于 04-13 12:08 ?2009次閱讀
    綜述:高性能銻化物中紅外半導體激光器<b class='flag-5'>研究進展</b>

    先進封裝中銅-銅低溫鍵合技術研究進展

    用于先進封裝領域的 Cu-Cu 低溫鍵合技術進行了綜述,首先從工藝流程、連接機理、性能表征等方面較系統地總結了熱壓工藝、混合鍵合工藝實現 Cu-Cu 低溫鍵合的研究進展與存在問題,進一步地闡述了新型納米材料燒結工藝在實現低溫連接、降低工藝要求方面的優
    的頭像 發表于 03-25 08:39 ?769次閱讀
    先進封裝中銅-銅低溫鍵合技術<b class='flag-5'>研究進展</b>

    電子封裝用金屬基復合材料加工制造的研究進展

    共讀好書 蓋曉晨 成都四威高科技產業園有限公司 摘要: 在航空航天領域中,金屬封裝材料被廣泛應用,對其加工制造工藝的研究具有重要的意義。近年來,金屬基復合材料逐漸代替傳統金屬材料應用于新一代
    的頭像 發表于 03-16 08:41 ?624次閱讀
    <b class='flag-5'>電子</b>封裝用金屬基復合材料加工制造的<b class='flag-5'>研究進展</b>

    2023度中國半導體十大研究進展出爐,一項傳感器技術入榜(附全名單)

    來源:《半導體學報》? ?2月5日,《半導體學報》發布2023度“中國半導體十大研究進展”名單,其中,一項傳感技術入選。 ? 由中國科學院上海技術物理研究所紅外科學與技術重點實驗室胡偉達、苗金水
    的頭像 發表于 02-20 08:37 ?811次閱讀
    2023<b class='flag-5'>年</b>度中國半導體十大<b class='flag-5'>研究進展</b>出爐,一項傳感器技術入榜(附全名單)

    2023LLM大模型研究進展

    作為做LLM應用的副產品,我們提出了RLCD[11],通過同時使用正例和負例prompt,自動生成帶標簽的生成樣本不需人工標注,然后可以接大模型微調,或者用于訓練reward models
    發表于 01-19 13:55 ?486次閱讀

    增強光聲雙光梳光譜的研究進展

    二十年來,光學頻率梳(光頻梳)光譜已經發展成為精密光譜和計量學、光譜激光雷達、環境監測以及高光譜全息成像等眾多領域的強大工具。
    的頭像 發表于 01-15 10:12 ?991次閱讀
    增強光聲雙光梳光譜的<b class='flag-5'>研究進展</b>

    電動汽車功率電子封裝用耐高溫環氧塑封料的研究進展

    ?摘要:本文綜述了近年來國內外關于耐高溫環氧塑封料(EMC)的基礎研究與應用進展,從先進功率電子器件發展對塑封材料的性能需求、傳統EMC的高溫降解機理、EMC結構與耐熱穩定性的關系以及
    的頭像 發表于 01-04 08:09 ?3611次閱讀
    電動汽車功率<b class='flag-5'>電子</b>封裝用耐高溫環氧塑封料的<b class='flag-5'>研究進展</b>

    大幅加薪40%,七年來首次!

    16000元人民幣),均高于 300,000 日元大關。這是東京電子年來首次為新員工加薪。 日本出現了一系列與芯片相關的重
    的頭像 發表于 01-03 09:13 ?904次閱讀
    主站蜘蛛池模板: 晓雪老师我要进你里面好爽| 浪潮色诱AV久久久久久久| 国产欧洲野花A级| 热re99久久精品国99热| 970女主播电台歌曲| 久久这里只有热精品18| 亚洲一区二区三区高清网| 国产午夜a理论毛片在线影院| 日本久久精品毛片一区随边看| av视频在线免播放观看| 蜜桃AV色欲A片精品一区| 69精品国产人妻蜜桃国产毛片| 狼人无码伊人AV啪啪| 99E久热只有精品8在线直播| 蜜桃AV色欲A片精品一区| 99热在线免费观看| 日韩中文网| 国产精品一区二区在线播放| 亚洲黄色网页| 久久草这在线观看免费 | 精品水蜜桃久久久久久久| 亚洲精品成人| 久久精品综合网中文字幕| 18禁无遮挡羞羞污污污污免费| 里番acg纲手的熟蜜姬训练场| 97久久精品视频| 日本黄色www| 国产精品婷婷五月久久久久| 亚洲爆乳少妇精品无码专区| 国产亚洲综合视频| 一个人免费视频在线观看高清版| 久久视频精品3线视频在线观看| 综合亚洲桃色第一影院| 欧美freesex黑人又粗又| 国产成人精品视频| 野花香HD免费高清版6高清版| 恋夜秀场支持安卓版全部视频国产| 99日韩精品| 性奴公司 警花| 毛片免费大全| 国产99视频精品免费播放|