色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

如此強大的機器翻譯架構(gòu)內(nèi)部的運行機制究竟是怎樣的?

DPVg_AI_era ? 來源:lq ? 2019-01-26 09:36 ? 次閱讀

近年來,神經(jīng)機器翻譯的突飛猛進讓越來越多的人類翻譯感到壓力山大,瑟瑟發(fā)抖,那么如此強大的機器翻譯架構(gòu)內(nèi)部的運行機制究竟是怎樣的?本文用一系列動圖帶你看個明白。

過去幾十年來,統(tǒng)計機器翻譯一直是占據(jù)主導地位的機器翻譯模型[9],直到神經(jīng)機器翻譯(NMT)誕生。神經(jīng)機器翻譯(NMT)是近幾年來新興的機器翻譯模式,該模式試圖構(gòu)建和訓練能夠讀取輸入文本,并輸出翻譯結(jié)果的單個大型神經(jīng)網(wǎng)絡

NMT的最初來自Kalchbrenner和Blunsom(2013)等人的提議。今天更為人所知的框架是從Sutskever等人提出的seq2seq框架。本文就將重點介紹seq2seq框架以及如何構(gòu)建基于seq2seq框架的注意力機制。

總體來說,注意力層的部署可以分為4步(其實是5步)

第0步:準備隱藏狀態(tài)。

首先準備第一個解碼器隱藏狀態(tài)(紅色)和所有可用的編碼器隱藏狀態(tài)(綠色)。在我們的例子中有4個編碼器隱藏狀態(tài)和當前解碼器隱藏狀態(tài)。

步驟1:獲取每個編碼器隱藏狀態(tài)的分數(shù)

通過評分函數(shù)(也稱為比對評分函數(shù)或比對模型)獲得評分(標量)。在該示例中,得分函數(shù)是解碼器和編碼器隱藏狀態(tài)之間的點積。

步驟2:通過softmax圖層運行所有分數(shù)。

我們將得分放到softmax函數(shù)層,使softmax處理后的得分(標量)之和為1。這些得分代表注意力的分布。

步驟3:將每個編碼器隱藏狀態(tài)乘以其softmax得分。

通過將每個編碼器隱藏狀態(tài)與其對應的softmax得分(標量)相乘,獲得對齊向量或注釋向量。這就是對齊的機制。

步驟4:總結(jié)對齊向量。

對齊向量的總結(jié)可以生成上下文向量。上下文向量反映的是前一步的對齊向量的聚合信息

步驟5:將上下文向量送到解碼器。

具體傳送方式取決于翻譯系統(tǒng)的架構(gòu)設計。我們將在下文示例中看到不同的架構(gòu)如何利用解碼器的上下文向量。

下面來看看幾種seq2seq模型的運行機制,為便于理解,我們采用比較直觀的描述(對于每種模型,均以德-英翻譯為例)。

seq2seq

翻譯會從頭至尾把德語文本閱讀一遍,讀完開始逐詞翻譯成英語,如果句子過長,他可能會忘了文章開始時都讀過哪些內(nèi)容。

一個簡單的seq2seq模型就是這樣了,至于面向注意力層的逐級計算,是下面要講的seq2seq+注意力模型,下面是這個模型的直觀表述。

seq2seq+ 注意力

翻譯一遍閱讀德文文本,一邊從頭至尾地記錄關鍵詞,然后開始翻譯成英語。每翻譯一個德語詞匯,都要用一次記下來的關鍵詞。

該機制下會為每個單詞分配一個得分,根據(jù)分數(shù)高低投入不同的注意力。然后根據(jù)Softmax函數(shù)處理過的分數(shù),使用編碼器隱藏狀態(tài)的加權和來聚合編碼器隱藏狀態(tài),獲得上下文向量。注意力層的實現(xiàn)可以分為4個步驟。

注意力機制的運行究竟是怎樣的?

答案是:反向傳播,沒想到吧。反向傳播將盡一切努力確保產(chǎn)出成果接近實際情況。通過改變RNN中的權重和得分函數(shù)(如果有的話)來實現(xiàn)這一目標。這些權重將影響編碼器隱藏狀態(tài)和解碼器隱藏狀態(tài),進而影響注意力得分。

帶雙向編碼器的seq2seq+注意力

這一機制相當于有兩名翻譯。翻譯A一邊閱讀德語文本,一邊記錄關鍵詞。翻譯B(比A更高級的翻譯,可以從后往前倒著閱讀然后進行翻譯)也在逐詞閱讀同樣的德語文本,同時記下關鍵詞。

這兩個翻譯會定期討論到目前為止閱讀的每一個詞。一旦閱讀完畢,翻譯B會負責根據(jù)討論結(jié)果和選擇的綜合關鍵詞,將德語的句子逐字翻譯成英語。

翻譯A就是前向RNN,翻譯B就是后向RNN。

采用雙層堆疊編碼器的seq2seq+注意力

翻譯A一邊閱讀德語文本,一邊記錄關鍵詞。翻譯B(比A更高級的翻譯,可以從后往前倒著閱讀然后進行翻譯)也在逐詞閱讀同樣的德語文本,同時記下關鍵詞。注意,初級翻譯A必須把閱讀到的每個單詞向翻譯B報告。閱讀完成后,兩位翻譯都會根據(jù)他們所選擇的綜合關鍵詞,逐字逐句地將句子翻譯成英語。

谷歌的神經(jīng)機器翻譯:帶8個堆疊編碼器的seq2seq(+雙向+剩余連接)+注意力

相當于翻譯A、B、...到H一共8位翻譯,從下到上排成一列。每位翻譯都閱讀相同的德語文本。每閱讀一個單詞,翻譯A會與翻譯B分享發(fā)現(xiàn),翻譯B對發(fā)現(xiàn)內(nèi)容進行改進,并與翻譯C分享,以此類推重復這個過程,直到翻譯H為止。此外,在閱讀德語文本時,翻譯H會根據(jù)自己的知識和收到的信息記錄下相關的關鍵詞。

在每個翻譯都閱讀過英文文本之后,命令翻譯A開始翻譯第一個單詞。首先,翻譯A試圖回憶起,然后他與譯者B分享他的答案,譯者B改進答案并與譯者C分享,以此類推重復這一過程,直到翻譯H。然后,翻譯H根據(jù)記錄的關鍵詞寫出第一個翻譯。重復這個過程,直到翻譯完成為止。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3664

    瀏覽量

    135076
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4779

    瀏覽量

    101052
  • 機器翻譯
    +關注

    關注

    0

    文章

    139

    瀏覽量

    14923

原文標題:五張動圖,看清神經(jīng)機器翻譯里的Attention!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    tas5756m使用GPIO口加內(nèi)部PLL產(chǎn)生MCLK的方法究竟是怎么樣的?

    tas5756m使用GPIO口加內(nèi)部PLL產(chǎn)生MCLK的方法究竟是怎么樣的?
    發(fā)表于 08-19 06:06

    機器翻譯三大核心技術原理 | AI知識科普

    翻譯新時代;2015年,蒙特利爾大學引入Attention機制,神經(jīng)機器翻譯達到實用階段;2016年,谷歌GNMT發(fā)布,訊飛上線NMT系統(tǒng),神經(jīng)翻譯開始大規(guī)模應用。03
    發(fā)表于 07-06 10:30

    圖解:IGBT究竟是什么?

    圖解:IGBT究竟是什么? IGBT究竟是什么?
    發(fā)表于 08-10 08:01

    神經(jīng)機器翻譯的方法有哪些?

    目前,神經(jīng)機器翻譯(NMT)已經(jīng)成為在學術界和工業(yè)界最先進的機器翻譯方法。最初的這種基于編碼器-解碼器架構(gòu)機器翻譯系統(tǒng)都針對單個語言對進行翻譯
    發(fā)表于 11-23 12:14

    S參數(shù)究竟是什么?

    S參數(shù)究竟是什么?起決定性作用的S參數(shù)將S參數(shù)擴展到多端口器件和差分器件
    發(fā)表于 03-01 11:46

    我們仿真DDR究竟是仿真什么

    我們仿真DDR究竟是仿真什么?
    發(fā)表于 03-04 07:32

    電感飽和究竟是什么

    電感飽和究竟是什么
    發(fā)表于 03-11 08:13

    真正軟件定義無線電究竟是怎樣的?

    真正軟件定義無線電究竟是怎樣的?
    發(fā)表于 05-14 06:47

    分貝究竟是什么?如何去理解它?

    分貝究竟是什么?如何去理解它?
    發(fā)表于 05-31 07:05

    一文讀懂eMMC究竟是啥?

    eMMC究竟是啥?eMMC長什么樣?eMMC用在哪?主要是干嘛用的?eMMC究竟是如何工作的呢?
    發(fā)表于 06-18 06:04

    增量式編碼器倍頻技術的M法究竟是怎樣測速的

    增量式編碼器輸出的脈沖波形信號形式常見的有哪幾種?增量式編碼器倍頻技術的M法究竟是怎樣測速的?
    發(fā)表于 11-09 07:08

    暴風電視拆機圖解 內(nèi)部結(jié)構(gòu)究竟是怎樣

    繼樂視、小米之后,國內(nèi)另一家互聯(lián)網(wǎng)公司--暴風影音也發(fā)布了旗下的智能電視產(chǎn)品,而且同樣是分體式設計。而今天我們就來看看愛玩客帶來的暴風電視的內(nèi)部結(jié)構(gòu)究竟是怎樣的。
    的頭像 發(fā)表于 09-04 14:32 ?3.1w次閱讀

    超聲波熔接原理究竟是怎樣

    超聲波熔接理論基礎不變,就會有模貝搭建原則的共通點。而超聲波熔接原理究竟是怎樣的?
    發(fā)表于 04-20 10:03 ?3293次閱讀

    S參數(shù)究竟是什么?

    S參數(shù)究竟是什么?
    發(fā)表于 11-01 08:24 ?2次下載
    S參數(shù)<b class='flag-5'>究竟是</b>什么?

    半導體內(nèi)部電荷運動的機制究竟是什么呢?

    半導體內(nèi)部電荷運動的機制究竟是什么呢? 半導體材料的內(nèi)部電荷運動機制是半導體物理學和固體物理學的重要研究領域之一。在這篇文章中,我們將詳細、
    的頭像 發(fā)表于 11-30 11:28 ?1050次閱讀
    主站蜘蛛池模板: 40岁东北老阿姨无码 | 二级毛片免费观看全程 | av天堂电影网 | 偷拍亚洲制服另类无码专区 | 亚洲精品国偷拍自产在线观看蜜臀 | 亚洲日本va中文字幕久久 | 亚洲国产日韩欧美在线a乱码 | 最近的2019中文字幕国语 | 新香蕉少妇视频网站 | 99精品国产高清自在线看超 | 潮 喷女王cytherea | 国产三级级在线电影 | 国内精品视频久久久久免费 | 无码人妻精品一区二区蜜桃在线看 | 国内久久久久影院精品 | 国精产品砖一区二区三区糖心 | 2019香蕉在线观看直播视频 | 日韩视频中文字幕精品偷拍 | 老汉老太bbbbbxxxxx | 亚洲一卡二卡三卡四卡2021麻豆 | 国产精品一久久香蕉国产线看 | 一区二区乱子伦在线播放 | 亚洲日韩成人 | 亚洲欧美日韩国产另类电影 | 伊人久久精品99热超碰 | 国产精品美女WWW爽爽爽视频 | 国产成人精品自线拍 | 国产人A片777777久久 | 女神被调教成了精盆 | 波多野结衣二区 | 黑人巨大两根一起挤进欧美 | 紧缚束缚调教丨vk | 伊人久久综在合线亚洲 | 婷婷激情综合色五月久久竹菊影视 | 中文字AV字幕在线观看 | 久久99热狠狠色一区二区 | 无人区在线日本高清免费 | 大香网伊人久久综合网2020 | 亚洲综合香蕉在线视频 | 国产亚洲精品久久孕妇呦呦你懂 | 亚洲精品久久久久AV无码林星阑 |