色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀

zhKF_jqr_AI ? 2018-01-10 12:41 ? 次閱讀

循環神經網絡(RNN)是用于自然語言建模的主流架構,通常,RNN按順序讀取輸入的token,再輸出每個token的分布式表示。通過利用相同的函數來循環更新隱藏狀態,RNN的計算成本將保持不變。雖然這一特點對于某些應用來說很常見,但在語言處理過程中,并不是所有token都同等重要,關鍵要學會取舍。例如,在問答題中,只對重要部分進行大量計算,不相關部分分配較少的計算才是有效的方法。

雖然有注意力模型和LSTM等方法提高計算效率或挑選重要任務,但它們的表現都不夠好。在本篇論文中,研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀,不影響讀者的主要目標。

Skim-RNN的構成

研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀

受人類快速閱讀原理的啟發,Skim-RNN的結構由兩個RNN模型構成:較大的默認RNN模型d和較小的RNN模型d’。d和d’是用戶定義的超參數,并且d’<< d。

如果當前token比較重要,Skim-RNN就會使用大的RNN;如果不重要,它就會轉向使用小的RNN。由于小RNN比大RNN需要的浮點運算次數更少,所以該模型比單獨使用大RNN所得結果更快,甚至更好。

推理過程

在每一步驟t中,Skim-RNN將輸入的Xt∈Rd和之前的隱藏狀態ht-1∈Rd作為其參數,輸出新的狀態ht。k代表每一步做出harddecision的次數。在Skim-RNN中,不論是完全閱讀或跳過,k=2。

研究人員使用多項隨機變量Qt對選擇概率分布Pt的決策過程進行建模。Pt表示為:

這里,W∈Rk×2d,b∈Rk。

接下來我們定義隨機變量Qt,通過從概率分布Pt對Qt進行采樣:

如果Qt=1,那么該模型與標準RNN模型一樣。如果Qt=2,那么模型選用了較小RNN模型以獲取較小的隱藏狀態。即:

其中f是帶有d輸出的完全RNN,而f'是帶有d'輸出的小RNN,d'<< d。

實驗結果

研究人員在七組數據集上對Skim-RNN進行測試,包括分類測試和問答題兩種形式,目的是為了檢驗模型的準確度和浮點運算減少率(Flop-R)。

研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀

文本分類

在這項任務中,輸入的是單詞序列,輸出的是分類概率的向量。最終,下表顯示出Skim-RNN模型與LSTM、LSTM-Jump的精確度和計算成本對比。

研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀

以SST、爛番茄、IMDB和AGnews四個網站為例進行本文分類,在標準LSTM、Skim-RNN、LSTM-Jump和最先進的模型(SOTA)上進行對比

研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀

改變較小隱藏狀態的尺寸的影響,以及參數γ對精確度和計算成本的影響(默認d=100,d'=10,γ=0.02)

下圖是IMDB數據集中的一個例子,其中Skim-RNN的參數為:d=200,d'=10,γ=0.01,最終將本段文字正確分類的概率為92%。

研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀

其中黑色的字被略過(用小LSTM模型,d'=10),藍色的字表示被閱讀(用較大的LSTM模型,d=200)

和預期的一樣,模型忽略了類似介詞等不重要的詞語,而注意到了非常重要的單詞,例如“喜歡”、“可怕”、“討厭的”。

回答問題

這項任務的目的是在給定段落中找到答案的位置。為了檢測Skim-RNN的準確度,研究人員建立了兩個不同的模型:LSTM+注意力和BiDAF。結果如下所示:

F1和EM值可表明Skim-RNN的準確度。最終發現,速讀(skimming)模型的F1分數比默認沒有速讀(non-skimming)的模型相同甚至更高,并且計算成本消耗得更少(大于1.4倍)。

LSTM+注意力模型中,不同層的LSTM速度率(skimming rate)隨γ的變化而變化的情況

LSTM+注意力模型的F1分數。計算成本越大,模型表現得越好。在同樣的計算成本下,Skim LSTM(紅色)比標準LSTM(藍色)的表現要好。另外,Skim-LSTM的F1分數在不同參數和計算成本下都更穩定

F1分數與Flop-R之間的關系

下圖是模型回答問題的一個例子,問題為:最大的建筑項目(construction project)也稱作什么?(正確答案:megaprojects)

模型給出的答案:megaprojects。

研究人員提出了“Skim-RNN”的概念,用很少的時間進行快速閱讀

紅色代表閱讀,白色代表略過

運行時間

上圖顯示了與標準LSTM相比,Skim-LSTM的相對速度增益的隱藏狀態有不同大小和速度速率。在這一過程中,研究人員使用的是NumPy,并在CPU的單個線程上進行推論。

可以看到,實際增益(實線)和理論增益(虛線)之間的差距無法避免。隨著隱藏狀態增大,這一差距會減小。所以對于更大的隱藏狀態,Skim-RNN的表現會更好。

結語

本次研究表明,新型循環神經網絡Skim-RNN可以根據輸入的重要性決定使用大的RNN還是小的RNN,同時計算成本比RNN更低,準確度與標準LSTM和LSTM-Jump相比類似甚至更好。由于Skim-RNN與RNN具有相同的輸入輸出接口,因此可以輕松替換現有應用中的RNN。

所以,這樣工作適用于需要更高隱藏狀態的應用,比如理解視頻,同時還可以利用小RNN做不同程度的略讀。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴

原文標題:用Skim-RNN顯著降低計算成本,實現“速讀”

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    美國普渡大學和哈佛大學的研究人員出了一項新發明 新...

    據物理學家組織網報道,美國普渡大學和哈佛大學的研究人員出了一項極為應景的新發明:一種外形如同一顆圣誕樹一樣的新型晶體管,其重要組件“門”(柵極)的長度縮減到了突破性的20納米。這個被稱為“4維
    發表于 02-03 20:30

    研究人員提出了一種柔性可拉伸擴展的多功能集成傳感器陣列

    研究人員提出了一種柔性可拉伸擴展的多功能集成傳感器陣列,成功將電子皮膚的探測能力擴展到7種,實現溫度、濕度、紫外光、磁、應變、壓力和接近等多種外界刺激的實時同步監測。
    的頭像 發表于 01-24 15:15 ?7279次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>一種柔性可拉伸擴展的多功能集成傳感器陣列

    日本研究人員利用單晶硅對可見光進行精確的顏色控制

    研究人員最近展示了使用單晶硅對可見光進行精確的顏色控制,該研究成果發表在納米快報上。
    的頭像 發表于 02-09 14:20 ?5537次閱讀

    研究人員提出了一系列新的點云處理模塊

    為了探索這些問題的解決辦法、來自倫敦大學學院的研究人員提出了一系列新的點云處理模塊,從效率、信息共享和點云卷積操作等方面進行研究,得到了更寬、更深、更快效率更高的點云處理網絡,讓更
    的頭像 發表于 08-02 14:44 ?3085次閱讀
    <b class='flag-5'>研究人員</b>們<b class='flag-5'>提出了</b>一系列新的點云處理模塊

    Facebook的研究人員提出了Mesh R-CNN模型

    這一研究的目標是通過單張圖像輸入,對圖像中的物體進行檢測、獲取不同物體的類別、掩膜和對應的三維網格,并對真實世界中的復雜模型進行有效處理。在2D深度網絡的基礎上,研究人員改進并
    的頭像 發表于 08-02 15:51 ?3920次閱讀
    Facebook的<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>Mesh R-CNN模型

    研究人員使用聲音技術來進行藥物的傳遞

    從電信技術改造而來的技術有望實現更有效的癌癥治療。墨爾本研究人員發現,藥物可以通過聲波傳遞到各個細胞中。
    發表于 03-11 09:38 ?489次閱讀

    研究人員提出了一個名為CommPlan的框架

    使用CommPlan,開發人員首先使用數據,領域專業知識和學習算法指定五個模塊-任務模型,通信功能,通信成本模型,人員響應模型和人員可選動作模型。通過對所有模塊的分析組合,得出決策模型,并且在任務執行期間,機器人使用硬件傳感器
    的頭像 發表于 04-09 14:30 ?2193次閱讀

    研究人員最新開發出了快速、微米級的電光調制器

    喬治華盛頓大學的研究人員首次開發并演示了一種硅基電光調制器,該調制器比最新技術更小,更快,更高效。
    的頭像 發表于 04-15 20:07 ?2224次閱讀

    研究人員使用AI教機器人如何將物體交給人類

    英偉達(Nvidia)研究人員在本周發表的預印研究論文中提出了一種人類到機器人交接的方法,其中機器人會在半途中遇到人類,對人類的抓握進行分類,并計劃一條從人類手中拿走物體的軌跡。
    發表于 04-28 17:16 ?1747次閱讀

    研究人員利用3D打印技術設計出了微米大小的鏡片

    波蘭華沙大學的研究人員利用激光直接書寫(DLW)3D打印技術設計出了微米大小的鏡片。這種3D打印的透鏡可以在各種材料上制作,包括易碎的石墨烯類材料。
    的頭像 發表于 05-18 23:36 ?4053次閱讀

    佐治亞理工研究人員通過仿生樹懶推出了自己的巡檢機器人

    生活的快節奏讓很多人喘不過氣,這種影響似乎也蔓延到了機器人領域。但是來自佐治亞理工學院的研究人員更看重慢速、高效和節能,最近他們通過仿生樹懶推出了自己的巡檢機器人,也許這是研究人員第一次將目光放到樹懶這種慵懶的動物身上。
    發表于 07-08 16:06 ?1221次閱讀

    AI研究人員如何應對透明AI

    許多現代的AI系統都在神經網絡上運行,而我們僅了解其基礎知識,因為算法本身很少提供解釋方式。缺乏解釋性通常被稱為AI系統的“黑匣子”。研究人員將注意力集中在神經網絡如何工作的細節上
    的頭像 發表于 07-14 16:31 ?1908次閱讀

    研究人員發現自動駕駛車輛可將交通流量速度大幅提高40%

    研究人員提出了實現有效監管的指導方針,發現即使道路上的自動駕駛車輛不到5%,自動駕駛汽車還是能夠互相配合,以顯著改善交通流量。據研究人員所說,如果在擁堵道路上出發,自動駕駛汽車能夠在不到2分鐘的
    的頭像 發表于 09-09 15:20 ?2820次閱讀

    研究人員為鋰硫電池提出一種新陰極設計概念

    研究團隊,為鋰硫電池(Li–S)提出了一種新穎的陰極設計概念,將可大幅提升此類具有發展前景的下一代電池的性能。
    發表于 12-29 10:48 ?548次閱讀

    如何使用RNN進行時間序列預測

    一種強大的替代方案,能夠學習數據中的復雜模式,并進行準確的預測。 RNN的基本原理 RNN是一種具有循環結構的神經網絡,它能夠處理序列數據。在RNN中,每個輸入序列的元素都會通過一個或
    的頭像 發表于 11-15 09:45 ?378次閱讀
    主站蜘蛛池模板: 牛牛自拍国产免费视频| 成人动漫百度影音| 97超级碰碰人妻中文字幕| 扒开女生尿口| 精品久久久无码21P发布| 男人把女人桶到爽免费看视频| 欧美熟妇互舔20p| 久久综合久久伊人| 午夜福利视频极品国产83| 中文字幕亚洲欧美日韩2019 | 国产精品无码人妻在线| 久久精品影视| 性高跟鞋xxxxhd| 打扑克床上视频不用下载免费观看 | 国产成人亚洲精品老王| 蜜桃麻豆WWW久久囤产精品免费| 亚洲第一页视频| 高清午夜福利电影在线| 欧美日韩在线成人看片a| 真实伦 乱| 精品亚洲国产熟女福利自在线| 石原莉奈rbd806中文字幕| jiucao在线观看精品| 久久视频在线视频观品15| 亚洲福利网站| 国产蜜臀AV在线一区视频| 色综合伊人色综合网站| 澳大利亚剧满足在线观看| 免费看片A级毛片免费看| 在线亚洲国产日韩欧洲专区| 花蝴蝶免费观看影视| 亚洲电影网址| 国产亚洲人成在线视频| 羞羞影院午夜男女爽爽影院网站| 国产成人综合95精品视频免费| 日韩欧美一区二区三区在线 | 久九九精品免费视频| 亚洲日本激情| 久久精品国产亚洲AV蜜臀| 永久免费在线观看视频| 精品午夜久久福利大片免费|