色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

是什么讓BERT與眾不同?如何使用BERT?

Tensorflowers ? 來源:未知 ? 作者:李倩 ? 2018-11-08 15:46 ? 次閱讀

缺少訓練數據是自然語言處理(Natural Language Processing, NLP)面臨的最大挑戰之一。由于 NLP 是一個具備不同任務的多樣化領域,因此大多數任務特定數據集僅包含幾千或幾十萬個人類標簽的訓練樣例。然而,基于深度學習的 NLP 模型可以從更大量的數據中獲益,在數百萬或數十億的帶標簽的訓練樣例中學習得到改善。為了幫助縮小在數據方面的差距,研究人員開發了各種技術,使用網絡上無標簽的文本訓練一個通用的語言表示模型(稱為預訓練)。用預訓練模型在小數據的NLP 任務(如問答和情感分析)上進行微調,與從頭開始訓練相比,可以顯著提高準確度。

本周我們開源了一種NLP 預訓練新技術BidirectionalEncoderRepresentations fromTransformers(BERT)(https://github.com/google-research/bert)。此次發布的版本中,世界上任何人都可以在一個云 TPU上花費大約 30 分鐘,或使用單個 GPU 在幾個小時內訓練他們自己最先進的問答系統(或各種其他模型)。該版本包括在 TensorFlow之上構建的源代碼和許多預先訓練的語言表示模型。在我們的相關論文中,展示了包括斯坦福問答數據集(SQUAD v1.1)在內 11 個 NLP 任務的最新結果。

是什么讓 BERT 與眾不同?

BERT 建立在最新的預訓練與上下文相關的語言表示的工作之上 — 包括Semi-supervised Sequence Learning、Generative Pre-Training、ELMo和ULMFit。然而,與以前的模型不同,BERT 是第一個深度、雙向、無監督的語言表示模型,僅使用無標簽的文本語料庫(在本例中為維基百科)進行預訓練。

為什么這很重要?預訓練表示可以是與上下文無關的或與上下文相關的。與上下文相關的表示又可以分成單向(只跟上文或下文相關)或雙向的 (同時考慮上文和下文)。與上下文無關模型諸如word2vec或GloVe之類的對每個單詞生成一個詞嵌入表示,所以在這些模型下 “bank” 一詞在 “bank account” 和 “bank of the river” 中會具有相同的表示。而與上下文相關模型則基于句子中其他單詞來生成每個詞的表示。例如,在句子 “I accessed the bank account” 中,一個單向的上下文相關模型表示 “bank” 會基于上文 “I accessed the” 而非下文 “account”。 然而,BERT 表示 “bank” 會同時使用它的上文和下文— “I accessed the ... account” — 從深層神經網絡的最底層開始,成為雙向的表示。

與先前工作中領先的上下文預訓練方法相比,BERT 神經網絡架構的示意圖如下所示。箭頭表示從一個層到下一個層的信息流。圖示中頂部的綠色框對應每個輸入詞最終的上下文表示:

雙向的力量

如果雙向如此強大,為什么以前沒有這樣實現?在訓練單向模型時,預測詞時必須只能基于句子中上文的單詞。然而,想要直接讓模型同時根據上文和下文來預測詞是不可能的,因為這將允許被預測的單詞會隨著多層模型間接地 “看見自己”。

為了解決這個問題,我們使用直接的蒙版技術來掩蓋輸入中的一些單詞,然后模型就能同時根據上文和下文來預測被掩蓋的單詞。例如:

雖然這個想法由來已久,但是 BERT 首次把它成功應用到預訓練深度神經網絡中。

BERT 還學習如何建模句子之間的關系,通過預訓練對任何文本語料庫都可生成的一個很簡單的任務來實現:給定兩個句子 A和 B,判斷 B 是在語料庫中 A之后實際出現的下一個句子,或者只是一個隨意的句子?例如:

使用云 TPU 進行訓練

到目前為止,我們所描述的所有內容看起來都相當直觀,那么還需要什么才能使 BERT 運行得如此良好?云 TPU。云 TPU 使我們可以自由地快速試驗、調試和優化我們的模型,這對于我們超越現有的預訓練技術至關重要。由 Google 的研究人員于 2017 年開發的Transformer 模型架構也為我們提供了使 BERT 成功所需的基礎。Transformer 在我們的開源版本以及tensor2tensor 庫中實現。

注:Transformer 模型架構 鏈接

https://ai.googleblog.com/2017/08/transformer-novel-neural-network.html

開源版本 鏈接

https://github.com/google-research/bert

tensor2tensor 庫 鏈接

https://github.com/tensorflow/tensor2tensor

BERT 的結果

為了評估性能,我們將 BERT 與其他最先進的 NLP 系統進行了比較。需要注意的是,在我們的實驗中,我們幾乎沒有針對特定任務而對神經網絡架構進行更改。在SQuAD v1.1上,BERT 獲得了93.2% 的 F1 分數(一種準確度的衡量指標),超過了之前最高水準的分數 91.6% 和人類分數 91.2%:

BERT 還在極具挑戰性的GLUE 基準測試中將準確性的標準提高了 7.6%。這個基準測試包含 9 種不同的自然語言理解(NLU)任務。在這些任務中,具有人類標簽的訓練數據跨度從 2,500 個樣本到 400,000 個樣本不等。BERT 在所有任務中都大大提高了準確性。

如何使用 BERT?

我們發布的模型可以在幾個小時或更短的時間內在各種 NLP 任務上進行微調。開源版本還包括運行預訓練的代碼,我們相信大多數使用 BERT 的 NLP 研究人員永遠不需要從頭開始訓練他們自己的模型。我們最初發布的 BERT 模型主要為英語模型。基于社區反饋,在開源代碼和英語模型之后,我們發布了支持中文以及多語言的預訓練基礎模型BERT-Base,更好地幫助世界各國的研究人員和開發者解決相應的自然語言處理問題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4772

    瀏覽量

    100799
  • 自然語言處理

    關注

    1

    文章

    618

    瀏覽量

    13562

原文標題:BERT 現已開源:最先進的 NLP 預訓練技術,支持中文和更多語言

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    BERT原理詳解

    BERT原理詳解
    發表于 07-02 16:45

    串行BERT軟件安裝指南

    7G / 13.5G 串行 BERT 固化軟件和 GUI 軟件的文檔。
    發表于 09-10 11:05

    串行BERT用戶指南

    A guide on using the Serial BERT
    發表于 09-23 11:01

    串行BERT編程指南

    A guide on programming the Serial BERT
    發表于 09-24 17:15

    J-BERT N4903A高性能串行BERT手冊

    Brochure for the Keysight J-BERT N4903A High-Performance Serial BERT: 4 pages
    發表于 09-26 12:17

    回收M8040A 64 Gbaud 高性能 BERT

    回收M8040A 64 Gbaud 高性能 BERT曾S:***;Q號:3140751627;M8040A 64 Gbaud 高性能 BERTM8030A 多通道比特誤碼率測試儀M8062A
    發表于 07-03 11:08

    BERT中的嵌入層組成以及實現方式介紹

    , therefore I am第一個“I”不應該與第二個“I”具有相同的向量表示。實現BERT被設計用來處理長度為512的輸入序列。作者通過BERT學習每個位置的向量表示來包含輸入序列的順序特征。這
    發表于 11-02 15:14

    BERT模型的PyTorch實現

    BertModel是一個基本的BERT Transformer模型,包含一個summed token、位置和序列嵌入層,然后是一系列相同的self-attention blocks(BERT-base是12個blocks, BERT
    的頭像 發表于 11-13 09:12 ?1.4w次閱讀

    XLNet vs BERT,對比得明明白白!

    訓練語料庫:Wikipedia + BooksCorpus,在處理Wikipedia時使用了與BERT repo相同的工具,但出于某種原因,我們的Wiki語料庫僅有20億單詞,BERT使用了25億單詞,因此XLNet的訓練數據略少于BE
    的頭像 發表于 07-27 07:14 ?4380次閱讀
    XLNet vs <b class='flag-5'>BERT</b>,對比得明明白白!

    一篇BERT用于推薦系統的文章

    今天給大家介紹一篇BERT用于推薦系統的文章,題目是《BERT4Rec: Sequential Recommendation with Bidirectional Encoder
    的頭像 發表于 11-03 17:11 ?3053次閱讀
    一篇<b class='flag-5'>BERT</b>用于推薦系統的文章

    圖解BERT預訓練模型!

    BERT的發布是這個領域發展的最新的里程碑之一,這個事件標志著NLP 新時代的開始。BERT模型打破了基于語言處理的任務的幾個記錄。在 BERT 的論文發布后不久,這個團隊還公開了模型的代碼,并提供了模型的下載版本
    的頭像 發表于 11-24 10:08 ?3681次閱讀

    如何優雅地使用bert處理長文本

    這是今年清華大學及阿里巴巴發表在NIPS 2020上的一篇論文《CogLTX: Applying BERT to Long Texts》,介紹了如何優雅地使用bert處理長文本。作者同時開源了
    的頭像 發表于 12-26 09:17 ?8782次閱讀
    如何優雅地使用<b class='flag-5'>bert</b>處理長文本

    如何使用BERT模型進行抽取式摘要

      最近在梳理文本摘要相關內容,翻到一篇19年關于基于BERT模型進行抽取式摘要的老文「BertSum」,在這里分享給大家。該論文一開始掛在arXiv時,為《Fine-tune BERT
    的頭像 發表于 03-12 16:41 ?4831次閱讀
    如何使用<b class='flag-5'>BERT</b>模型進行抽取式摘要

    什么是BERT?為何選擇BERT

    由于絕大多數 BERT 參數專門用于創建高質量情境化詞嵌入,因此該框架非常適用于遷移學習。通過使用語言建模等自我監督任務(不需要人工標注的任務)訓練 BERT,可以利用 WikiText 和 BookCorpus 等大型無標記數據集
    的頭像 發表于 04-26 14:24 ?4328次閱讀

    總結FasterTransformer Encoder(BERT)的cuda相關優化技巧

    FasterTransformer BERT 包含優化的 BERT 模型、高效的 FasterTransformer 和 INT8 量化推理。
    的頭像 發表于 01-30 09:34 ?2282次閱讀
    總結FasterTransformer Encoder(<b class='flag-5'>BERT</b>)的cuda相關優化技巧
    主站蜘蛛池模板: 4hu四虎免费影院www| 无限资源在线观看播放| 日韩精品久久久久影院| 一级做a爰片久久毛片潮喷动漫| 成人网18免费韩国| 欧美男男网站免费观看videos| 中文字幕人妻无码系列第三区| 黄 色 网 站 免 费 涩涩屋| 午夜福利不卡片在线播放免费| 高肉黄暴NP文公交车| 日本美女色| 高h原耽肉汁动漫视频| 色狠狠色狠狠综合天天| 二色AV天堂在线| 叔叔 电影完整版免费观看韩国| 丰满的大白屁股ass| 特黄AAAAAAA片免费视频| 国产69精品久久久久无码麻豆 | 色色色999| 国产高清视频a在线大全| 污污又黄又爽免费的网站 | 亚洲第一色网站| 精品国产午夜肉伦伦影院 | 床伴在线观看免费高清完整泰剧第四集| 男生J桶进女人P又色又爽又黄| 97视频免费在线观看| 欧美zzzoooxxx| 潮 喷女王cytherea| 涩涩视频在线看| 黄色日本女人| 67194con免费福和视频| 奇米狠狠一区二区三区| 高h超辣bl文| 亚洲精品无码成人AAA片| 久久免费看少妇高潮A片2012| 5580免费午夜福利院| 人妻洗澡被强公日日澡| 国产色无码精品视频国产| 一色狗影院| 亲女乱h文小兰第一次| 国产精华av午夜在线观看|