亚洲国产欧美另类,亚洲a图,丝袜捆绑调教丨vk

傳統的記憶架構做關系推理時有困難，DeepMind和倫敦大學學院的這篇論文提出關系推理模塊RMC，能夠在序列信息中執行關系推理，在WikiText-103, Project Gutenberg 和 GigaWord 數據集上達到了當前最佳性能。

基于記憶的神經網絡通過利用長時間記憶信息的能力來建模時序數據。然而，目前還不清楚它們是否有能力利用它們記得的信息進行復雜的關系推理。

在這篇論文中，DeepMind和倫敦大學學院的研究人員首先證實一種直覺想法，即標準的記憶架構在一些涉及關系推理的任務上很困難。然后，研究者通過使用一個新的記憶模塊——Relational Memory Core（RMC）——來改進這種缺陷，該模塊采用multi-head dot product attention來允許記憶交互。

最后，研究者在一系列任務上測試RMC，這些任務可以從跨序列信息的更強大的關系推理中獲益，并且在RL領域（例如Mini PacMan）、程序評估和語言建模中顯示出巨大的受益，在WikiText-103、Project Gutenberg和GigaWord數據集上獲得state-of-the-art的結果。

關系記憶核心RMC

人類使用復雜的記憶系統來訪問和推理重要的信息，不管這些信息最初是什么時候被感知到的。在神經網絡研究中，許多成功的序列數據建模方法也使用了記憶系統（memory systems），例如LSTM和記憶增強的神經網絡（memory-augmented neural networks）。通過增強記憶容量、隨時間的有限計算成本以及處理梯度消失的能力，這些網絡學會了跨時間關聯事件，以便熟練地存儲和檢索信息。

在這里，我們建議在考慮存儲和檢索的同時考慮記憶交互，這是卓有成效的。雖然目前的模型可以學習劃分和關聯分布式的、矢量化的記憶，但它們并不明顯地傾向于這樣做。我們假設，這樣的偏見可以讓一個模型更好地理解記憶是如何關聯的，因此可以讓它更好地進行關系推理。

首先，我們通過開發一個演示任務來強調順序信息的關系推理，證明當前的模型在這個領域中存在困難。使用新的關系記憶核心（ Relational Memory Core，RMC），利用multi-head dot product attention讓記憶彼此交互，我們解決并分析了這個問題。然后，我們將RMC應用到一系列任務中，這些任務可能會從更顯式的memory-memory 交互中獲益，因此，可能會增加隨時間推移的的關系推理能力：在Wikitext-103、Project Gutenberg和GigaWord數據集中，部分觀察到的強化學習任務、程序評估和語言建模。

關系推理（Relational reasoning）

我們認為關系推理是理解實體連接的方式的過程，并利用這種理解來實現更高階的目標。例如，考慮對各種樹與公園長椅之間的距離進行排序：將實體(樹和長椅)之間的關系(距離)進行比較，以得到解決方案；如果我們單獨考慮每個實體的屬性(位置)，則無法得到解決方案。

由于我們通常可以很流暢地定義什么構成“實體”（entity）或“關系”（relation），因此我們可以想象一系列的神經網絡誘導的偏見，可以用關系推理的語言表達出來。例如，可以用卷積核來計算一個感受野內的實體(像素)的關系(線性組合)。

在時域（temporal domain）中，關系推理可以包含在不同時間點比較和對比信息的能力。這里，注意力機制隱式地執行某種形式的關系推理；如果先前的隱藏狀態被解釋為entity，那么使用注意力來計算實體的加權和有助于消除RNN中存在的局部性偏差。

由于我們當前的架構解決復雜的時序任務，因此它們必須具備一些時間關系推理的能力。然而，目前還不清楚他們的歸納偏差是否受到限制，以及這些限制是否可以暴露在要求特定類型的時間關系推理的任務中。

模型

我們的指導設計原則是提供一個架構的主干，在這個基礎上，模型可以學習如何劃分信息，以及如何計算劃分的信息之間的交互。為了實現這一點，我們從LSTM、 memory-augmented神經網絡和non-local網絡（特別是Transformer seq2seq模型）組裝構建塊。與記憶增強架構相似，我們考慮一組固定的memory slots；但是，我們允許使用注意里機制在memory slots之間進行交互。與之前的工作相反，我們在單個時間步上在記憶之間應用注意力，而不是跨過在先前的觀察中計算出來的所有先前的表征。

圖1：Relational Memory Core

圖2：任務

我們在一組監督學習和強化學習任務中測試RMC。值得注意的是N?? Farthest的任務和語言建模。在前者中，解決方案需要顯式的關系推理，因為模型必須對向量之間的距離關系進行排序，而不是對向量本身排序。后者在大量自然數據上測試模型，并允許我們將性能與經過良好調優的模型進行比較。

實驗

這里簡要介紹應用RMC的實驗任務，具體每個任務的詳細信息以及模型的超參數設置等請閱讀原論文。

說明性監督任務

N?? Farthest

第N個最遠的任務是為了強調跨時間的關系推理能力。輸入是隨機抽樣的向量序列，目標是對形式問題的回答：“距離向量m的第n個最遠的向量是什么?”，其中向量的值、它們的ID、n和m都是每個序列隨機抽樣的。我們強調模型必須對向量之間的距離關系進行排序，而不是對向量本身。

程序評估

Learning to Execute（LTE）數據集由圖靈完整的偽代碼編程語言中的算法片段組成，可分為三類：添加、控制和完整程序。輸入是表示這些代碼片段的字母數字詞匯表上的字符序列，目標是一個數字字符序列，它是給定編程輸入的執行輸出。考慮到這些片斷涉及變量的符號操作，我們認為它可能會影響模型的關系推理能力；由于符號運算符可以被解釋為在操作數上定義一個關系，成功的學習可以反映對這個關系的理解。為了評估經典序列任務的模型性能，我們還對記憶任務進行了評估，在這些任務中，輸出只是輸入的一種排列形式，而不是來自一組操作指令的評估。

強化學習

Mini Pacman with viewport

我們遵循文獻[23]中的Mini Pacman的表述。簡而言之， agent在被ghosts追趕時在迷宮中導航以收集食物。我們用一個視圖（viewport）來實現這個任務：圍繞agent的5×5窗口，包含感知輸入。因此，任務是部分可觀察的。agent必須預測記憶中ghosts的動態，并據此計劃導航，同時也要根據被拾取的食物的記憶信息。該任務要求在記憶空間中進行關系推理。

語言建模

最后，我們調查了基于詞匯的語言建模任務。

結果

圖3：模型分析

每行描述了特定序列的每個時間步的注意力矩陣。下面的文本闡明了序列的特定任務，該序列被編碼并作為輸入提供給模型。我們用紅色標記任務中引用的矢量。

表1：測試程序評估和記憶任務的每個字符的準確性。

表2：WikiText-103、Project Gutenberg和GigaWord v5數據集上的驗證和測試困惑度

總的來說，我們的結果顯示，記憶交互的顯式建模還提高強化學習任務，以及程序評估、比較推理和語言建模的性能，這表明在遞歸神經網絡中加入關系推理能力的價值。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4793

瀏覽量
102043
數據集

數據集

+關注

關注
4

文章
1218

瀏覽量
25158
強化學習

強化學習

+關注

關注
4

文章
269

瀏覽量
11455

原文標題：DeepMind提出關系RNN：構建關系推理模塊，強化學習利器

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關注！文章轉載請注明出處。

神經網絡教程（李亞非）

記憶神經網絡　　7.1 聯想記憶基本特點　　7.2 線性聯想記憶LAM模型　　7.3 雙向聯想記憶BAM模型　　7.4

發表于 03-20 11:32

AI知識科普 | 從無人相信到萬人追捧的神經網絡

的復雜程度，通過調整內部大量節點之間相互連接的關系，從而達到處理信息的目的，并具有自學習和自適應的能力。簡單來說，就是通過大量的樣本訓練神經網絡

發表于 06-05 10:11

非局部神經網絡，打造未來神經網絡基本組件

`將非局部計算作為獲取長時記憶的通用模塊，提高神經網絡性能在深度神經網絡中，獲取長時記憶（long-range dependency）至關重要。對于序列

發表于 11-12 14:52

與記憶神經網絡的聯想記憶的實驗演示_英文版

與記憶神經網絡的聯想記憶的實驗演示_英文版

發表于 09-26 16:31 ?0次下載

基于記憶神經網絡研究

首先。根據記憶神經網絡訓練形式的不同。介紹了強監督模型和弱監督模型的結構特征和各自應用場景以及處理方式，總結了兩類主要模型的優缺點：隨后。對兩類模型的發展和應用（包括模型創新和應用創新1進行了簡要

發表于 12-25 14:16 ?1次下載

一種改進的前饋序列記憶神經網絡結構

最早提出的FSMN的模型結構如圖1（a）所示，其本質上是一個前饋全連接神經網絡，通過在隱層旁添加一些記憶模塊（memory block）來對周邊的上下文

發表于 03-19 16:26 ?7282次閱讀

長短時記憶神經網絡的算法

通過上一篇文章［人工智能之循環神經網絡（RNN）］介紹，我們知道，RNN是一類功能強大的人工神經網絡算法，RNN一個重要的優點在于，其能夠在輸入和輸出序列之間的映射過程中利用上下文相

發表于 06-29 14:44 ?4861次閱讀

基于雙向長短期記憶神經網絡的交互注意力模型

單獨建模的問題，提岀了一種基于雙向長短期記憶神經網絡（ BILSTM的交互注意力神經網絡模型（ BI-IAN）。該模型通過 BILSTM對目

發表于 03-24 17:18 ?28次下載

基于神經網絡和長短期記憶網絡的網絡入侵檢測

針對網絡入侵檢測準確率偏低而誤報率偏高的問題，提出一種融合卷積神經網絡（CNN）與雙向長短期記憶（ BILSTM）網絡的網絡入侵檢測方法。對

發表于 05-19 14:44 ?2次下載

神經網絡在數學建模中的應用

數學建模是一種利用數學方法和工具來描述和分析現實世界問題的過程。神經網絡是一種模擬人腦神經元結構和功能的計算模型，可以用于解決各種復雜問題。

發表于 07-02 11:29 ?1351次閱讀

循環神經網絡的基本原理是什么

結構具有循環，能夠將前一個時間步的信息傳遞到下一個時間步，從而實現對序列數據的建模。本文將介紹循環神經網

發表于 07-04 14:26 ?921次閱讀

rnn是遞歸神經網絡還是循環神經網絡

：循環神經網絡的基本概念循環神經網絡是一種具有時間序列特性的神經網絡，它能夠處理序列數據，具有記憶

發表于 07-05 09:52 ?823次閱讀

LSTM神經網絡的優缺點分析

長短期記憶（Long Short-Term Memory, LSTM）神經網絡是一種特殊的循環神經網絡（RNN），由Hochreiter和Schmidhuber在1997年提出。LSTM因其在處理

發表于 11-13 09:57 ?3678次閱讀

LSTM神經網絡與傳統RNN的區別

神經網絡（RNN） RNN的基本結構 RNN是一種特殊的神經網絡，它能夠處理序列數據。在RNN中，每個時間步的輸入都會通過一個循環結構傳遞到

發表于 11-13 09:58 ?834次閱讀

LSTM神經網絡的結構與工作機制

的結構與工作機制的介紹：一、LSTM神經網絡的結構 LSTM神經網絡的結構主要包括以下幾個部分：記憶單元（Memory Cell）：記憶單元是LSTM

發表于 11-13 10:05 ?1090次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

基于記憶的神經網絡通過利用長時間記憶信息的能力來建模時序數據

評論

神經網絡教程（李亞非）

AI知識科普 | 從無人相信到萬人追捧的神經網絡

非局部神經網絡，打造未來神經網絡基本組件

與記憶神經網絡的聯想記憶的實驗演示_英文版

基于記憶神經網絡研究

一種改進的前饋序列記憶神經網絡結構

長短時記憶神經網絡的算法

基于雙向長短期記憶神經網絡的交互注意力模型

基于神經網絡和長短期記憶網絡的網絡入侵檢測

神經網絡在數學建模中的應用

循環神經網絡的基本原理是什么

rnn是遞歸神經網絡還是循環神經網絡

LSTM神經網絡的優缺點分析

LSTM神經網絡與傳統RNN的區別

LSTM神經網絡的結構與工作機制