色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

自然語言處理的ELMO使用

電子工程師 ? 來源:工程師曾玲 ? 2019-05-02 14:32 ? 次閱讀

1、概述

word embedding 是現在自然語言處理中最常用的 word representation 的方法,常用的word embedding 是word2vec的方法,然而word2vec本質上是一個靜態模型,也就是說利用word2vec訓練完每個詞之后,詞的表示就固定了,之后使用的時候,無論新句子上下文的信息是什么,這個詞的word embedding 都不會跟隨上下文的場景發生變化,這種情況對于多義詞是非常不友好的。例如英文中的 Bank這個單詞,既有河岸的意思,又有銀行的意思,但是在利用word2vec進行word embedding 預訓練的時候會獲得一個混合多種語義的固定向量表示。即使在根據上下文的信息能明顯知道是“銀行”的情況下,它對應的word embedding的內容也不會發生改變。

ELMO的提出就是為了解決這種語境問題,動態的去更新詞的word embedding。ELMO的本質思想是:事先用語言模型在一個大的語料庫上學習好詞的word embedding,但此時的多義詞仍然無法區分,不過沒關系,我們接著用我們的訓練數據(去除標簽)來fine-tuning 預訓練好的ELMO 模型。作者將這種稱為domain transfer。這樣利用我們訓練數據的上下文信息就可以獲得詞在當前語境下的word embedding。作者給出了ELMO 和Glove的對比

自然語言處理的ELMO使用

對于Glove訓練出來的word embedding來說,多義詞play,根據他的embedding 找出的最接近的其他單詞大多數幾種在體育領域,這主要是因為訓練數據中包含play的句子大多數來源于體育領域,之后在其他語境下,play的embedding依然是和體育相關的。而使用ELMO,根據上下文動態調整后的embedding不僅能夠找出對應的“表演”相同的句子,還能保證找出的句子中的play對應的詞性也是相同的。接下來看看ELMO是怎么實現這樣的結果的。

2、模型結構

ELMO 基于語言模型的,確切的來說是一個 Bidirectional language models,也是一個 Bidirectional LSTM結構。我們要做的是給定一個含有N個tokens的序列

t1, t2, ... , tN

其前向表示為:

自然語言處理的ELMO使用

反向表示為:

自然語言處理的ELMO使用

從上面的聯合概率來看是一個典型的語言模型,前向利用上文來預測下文,后向利用下文來預測上文。假設輸入的token是自然語言處理的ELMO使用,在每一個位置 k ,每一層LSTM 上都輸出相應的context-dependent的表征自然語言處理的ELMO使用

這里 j = 1 , 2 , ... , L ,L 表示LSTM的層數。頂層的LSTM 輸出,通過softmax層來預測下一個

對數似然函數表示如下:

自然語言處理的ELMO使用

模型的結構圖如下:

自然語言處理的ELMO使用

ELMO 模型不同于之前的其他模型只用最后一層的輸出值來作為word embedding的值,而是用所有層的輸出值的線性組合來表示word embedding的值。

對于每個token,一個L層的 biLM要計算出 2L + 1 個表征:

自然語言處理的ELMO使用

在上面等于,表示的是token層的值。

在下游任務中會把 Rk壓縮成一個向量:

自然語言處理的ELMO使用

其中是softmax標準化權重,γtask?是縮放系數,允許任務模型去縮放整個ELMO向量。

ELMO的使用主要有三步:

1)在大的語料庫上預訓練 biLM 模型。模型由兩層bi-LSTM 組成,模型之間用residual connection 連接起來。而且作者認為低層的bi-LSTM層能提取語料中的句法信息,高層的bi-LSTM能提取語料中的語義信息。

2)在我們的訓練語料(去除標簽),fine-tuning 預訓練好的biLM 模型。這一步可以看作是biLM的domain transfer。

3)利用ELMO 產生的word embedding來作為任務的輸入,有時也可以即在輸入時加入,也在輸出時加入。

ELMO 在六項任務上取得了the state of the art ,包括問答,情感分析等任務。總的來說,ELMO提供了詞級別的動態表示,能有效的捕捉語境信息,解決多義詞的問題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算機
    +關注

    關注

    19

    文章

    7518

    瀏覽量

    88193
  • 人工智能
    +關注

    關注

    1792

    文章

    47410

    瀏覽量

    238925
收藏 人收藏

    評論

    相關推薦

    python自然語言

    最近,python自然語言是越來越火了,那么什么是自然語言自然語言(Natural Language )廣納了眾多技術,對自然或人類語言
    發表于 05-02 13:50

    【推薦體驗】騰訊云自然語言處理

    `相信大家對NLP自然語言處理的技術都不陌生,它是計算機科學領域和AI領域中的一個分支,它與計算機和人類之間使用自然語言進行交互密切相關,而NLP的最終目標是使計算機能夠像人類一樣理解語言
    發表于 10-09 15:28

    自然語言處理的分詞方法

    自然語言處理——75 自動分詞基本算法
    發表于 03-19 11:46

    自然語言處理語言模型

    自然語言處理——53 語言模型(數據平滑)
    發表于 04-16 11:11

    自然語言處理的詞性標注方法

    自然語言處理——78 詞性標注方法
    發表于 04-21 11:38

    自然語言處理筆記

    自然語言處理筆記9-哈工大 關毅
    發表于 06-04 16:34

    自然語言處理——總結、習題

    自然語言處理——79 總結、習題
    發表于 06-19 11:22

    什么是自然語言處理

    會識別出我們正確說的話。 我們使用免費服務將在線遇到的外語短語翻譯成英語, 有時它們可以為我們提供準確的翻譯。 盡管自然語言處理取得了長足的進步,但仍有很大的改進空間。[理...
    發表于 07-23 10:22

    什么是自然語言處理

    什么是自然語言處理自然語言處理任務有哪些?自然語言處理的方法是什么?
    發表于 09-08 06:51

    什么是自然語言處理_自然語言處理常用方法舉例說明

    自然語言處理是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理
    發表于 12-28 16:56 ?1.8w次閱讀
    什么是<b class='flag-5'>自然語言</b><b class='flag-5'>處理</b>_<b class='flag-5'>自然語言</b><b class='flag-5'>處理</b>常用方法舉例說明

    自然語言處理怎么最快入門_自然語言處理知識了解

    自然語言處理就是實現人機間自然語言通信,實現自然語言理解和自然語言生成是十分困難的,造成困難的根本原因是
    發表于 12-28 17:10 ?5315次閱讀

    自然語言處理的概念和應用 自然語言處理屬于人工智能嗎

      自然語言處理(Natural Language Processing)是一種人工智能技術,它是研究自然語言與計算機之間的交互和通信的一門學科。自然語言
    發表于 08-23 17:31 ?1672次閱讀

    自然語言處理和人工智能的概念及發展史 自然語言處理和人工智能的區別

    自然語言處理(Natural Language Processing, NLP)的定義是通過電腦軟件程序實現人們日常語言的機器自動處理。為了幫助計算機理解,掌握
    發表于 08-23 18:22 ?1071次閱讀

    自然語言處理包括哪些內容

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領域的一個重要分支,它涉及到計算機與人類語言之間的交互。NLP的目標是讓計算機能夠理解、生成和處理
    的頭像 發表于 07-03 14:15 ?991次閱讀

    自然語言處理與機器學習的關系 自然語言處理的基本概念及步驟

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能和語言學領域的一個分支,它致力于研究如何讓計算機能夠理解、解釋和生成人類語言。機器學習(Ma
    的頭像 發表于 12-05 15:21 ?534次閱讀
    主站蜘蛛池模板: 中文中幕无码亚洲在线| 国产成人精品亚洲线观看 | 久久久久久久久久综合情日本 | 国产亚洲国际精品福利| 久久精品国产96精品亚洲| 欧美激情视频在线观看一区二区三区| 日日噜噜夜夜狠狠扒开双腿| 亚洲欧洲日产国码中学| beeg日本老妇人| 国产午夜婷婷精品无码A片| 麻豆国产MV视频| 无码人妻精品国产婷婷| 最好看中文字幕国语| 国产成人永久免费视频| 久久中文字幕综合不卡一二区| 日本丝袜护士| 又色又爽又黄gif动态视频| 扒开老师大腿猛进AAA片| 交换娇妻呻吟声不停中文字幕 | 两个人的视频免费| 受被三个攻各种道具PLAY| 张开腿我尝尝你的草莓| 古装性艳史电影在线看| 老司机福利在视频在ae8| 午夜福利院电影| CHINA学生白嫩| 精品一卡2卡三卡4卡乱码精品视频 | 国产精品 中文字幕 亚洲 欧美| 久久有码中文字幕| 窝窝影院午夜看片毛片| 97视频在线播放| 黄色888| 色裕插插插影视| 52色擼99热99| 狠狠色综合久久婷婷| 日韩 亚洲 欧美 中文 高清| 中文中幕无码亚洲视频| 国产亚洲综合视频| 三级全黄的视频| 9久久免费国产精品特黄| 精品无码国产AV一区二区三区 |