色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI的研究人員開發(fā)了一套基于能量的神經(jīng)網(wǎng)絡(luò)模型

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-11-10 10:34 ? 次閱讀

OpenAI的研究人員開發(fā)了一套基于能量的神經(jīng)網(wǎng)絡(luò)模型,可以快速學(xué)會(huì)識(shí)別并生成關(guān)于概念的實(shí)例,比如附近、上方、之間、最近、最遠(yuǎn)等,并將這些概念用2D點(diǎn)集來表示。模型可以僅在5次演示之后就學(xué)會(huì)這類概念,并實(shí)現(xiàn)了跨領(lǐng)域的概念遷移。

衡量是否達(dá)到人類智能,涉及由有限的經(jīng)驗(yàn),通過抽象推理和規(guī)劃、類比推理、創(chuàng)造性問題解決和語言能力的概括,從而將經(jīng)驗(yàn)整合到概念中,將概念作為理解和推理的基本架構(gòu)。

這款基于能量的新模型,讓智能體能夠從任務(wù)中學(xué)習(xí)和提取概念,并使用這些概念來解決多個(gè)領(lǐng)域中的其他任務(wù)。比如可以在2D粒子環(huán)境中應(yīng)用的學(xué)習(xí)概念,然后在基于3D的機(jī)器人環(huán)境中執(zhí)行相同的任務(wù),無需在新環(huán)境中重新訓(xùn)練。

通過基于能量的模型訓(xùn)練的模擬機(jī)器人,利用不同2D域中學(xué)習(xí)到的概念,將手臂導(dǎo)航至兩點(diǎn)之間

本研究利用能量函數(shù),讓智能體學(xué)習(xí)分類和生成簡(jiǎn)單的概念,來解決在不同環(huán)境中的兩點(diǎn)之間導(dǎo)航等任務(wù)。這些概念包括視覺概念(“紅色”、“正方形”)、空間概念(“內(nèi)部”、“在...之上”)、時(shí)間概念(“慢”、“之后”),社會(huì)概念(“積極”、“有用”)等等。

一旦智能體學(xué)會(huì)了這些概念,就會(huì)成為其理解和推理的基本模塊,最近DeepMind和 Vicarious的一些其他研究也表明了這一點(diǎn)。

能量函數(shù)讓系統(tǒng)可以生成(左)并識(shí)別(右)基本概念,比如“正方形”的概念。

構(gòu)建能量函數(shù):基于關(guān)系網(wǎng)絡(luò)體系結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)

為了創(chuàng)建能量函數(shù),需要在數(shù)學(xué)上將概念表示為能量模型。

我們根據(jù)以下要素來定義每個(gè)概念的能量函數(shù) E(x,a,w):

模型觀察到的世界狀態(tài)(x)

該狀態(tài)下該實(shí)體的注意力掩膜(a)。

作為條件的連續(xù)值向量(w),用于指定計(jì)算能量的概念

世界上的眾多狀態(tài)由多組實(shí)體及其屬性和位置組成(比如下面的點(diǎn),就具有位置和顏色屬性)。用于“識(shí)別”的注意力掩膜表示模型對(duì)某些實(shí)體集的關(guān)注。

能量模型輸出單個(gè)正數(shù),表示滿足相應(yīng)概念(零能量)或不滿足概念(高能量)。當(dāng)注意力掩模集中在表示概念的一組實(shí)體上時(shí),該概念即被滿足,這需要實(shí)體處于正確的位置(修改x、生成概念),而且注意力掩膜關(guān)注的是正確的實(shí)體(修改a、識(shí)別概念)。

我們將能量函數(shù)構(gòu)建為基于關(guān)系網(wǎng)絡(luò)體系結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),允許其將任意數(shù)量的實(shí)體作為輸入。這個(gè)能量函數(shù)的參數(shù)是由我們的訓(xùn)練程序進(jìn)行優(yōu)化的,其他函數(shù)是從能量函數(shù)中隱式導(dǎo)出的。

這樣,我們能夠使用能量函數(shù)來學(xué)習(xí)可以執(zhí)行生成和識(shí)別的單個(gè)網(wǎng)絡(luò),并可以交叉使用從生成到識(shí)別的學(xué)習(xí)概念,反之亦然。(目前已經(jīng)通過鏡像神經(jīng)元在動(dòng)物身上觀察到了這種效應(yīng)。)

單一網(wǎng)絡(luò)的訓(xùn)練

訓(xùn)練數(shù)據(jù)由(注意掩膜、狀態(tài))的軌跡組成,提前生成的軌跡用于確認(rèn)我們希望模型學(xué)習(xí)的特定概念。我們?yōu)榻o定概念集提供一組演示(通常為5次)來訓(xùn)練模型,然后將模型置于一個(gè)新的環(huán)境(X0),并要求其預(yù)測(cè)下一個(gè)狀態(tài)(X1)和下一個(gè)注意力掩膜(a)。

優(yōu)化能量函數(shù),向訓(xùn)練數(shù)據(jù)中找到的下一個(gè)狀態(tài)和下一個(gè)注意力掩模分配低能量值。與變分自動(dòng)編碼器等生成模型類似,激勵(lì)模型去學(xué)習(xí)那些對(duì)于壓縮任務(wù)方面的有用值。我們使用各種概念來訓(xùn)練模型,包括視覺,空間,遠(yuǎn)近和時(shí)間關(guān)系,以及二維粒子環(huán)境中的量化。

空間區(qū)域概念:給出2D示例點(diǎn)(左),推斷該點(diǎn)上的能量函數(shù)(中間),然后使用能量上的隨機(jī)梯度下降來生成新的點(diǎn)(右)

模型在概念生成和識(shí)別訓(xùn)練中分享經(jīng)驗(yàn),實(shí)現(xiàn)遷移學(xué)習(xí)

我們?cè)谝幌盗腥蝿?wù)中對(duì)模型進(jìn)行了評(píng)估,旨在測(cè)試單一系統(tǒng)識(shí)別和生成相同概念下的目標(biāo)的能力,我們的系統(tǒng)可以學(xué)習(xí)分類,可以生成特定的空間關(guān)系集,還可以以特定方式通過場(chǎng)景對(duì)實(shí)體進(jìn)行導(dǎo)航,或者可以對(duì)數(shù)量(比如一個(gè)、兩個(gè)、三個(gè)或三個(gè)以上)或接近度等概念進(jìn)行比較準(zhǔn)確的判斷。

數(shù)量概念:示例注意力掩膜在一個(gè)、兩個(gè)、三個(gè)或三個(gè)以上的目標(biāo)上的表現(xiàn),可推斷用于生成類似數(shù)量概念的注意力掩模

模型在學(xué)習(xí)概念的生成(通過在狀態(tài)向量x中移動(dòng)目標(biāo)實(shí)現(xiàn))和識(shí)別(通過在固定狀態(tài)向量上更改注意力掩膜實(shí)現(xiàn))之間分享經(jīng)驗(yàn)時(shí)的表現(xiàn)更好:在我們對(duì)共同執(zhí)行這兩類任務(wù)的模型進(jìn)行評(píng)估時(shí)發(fā)現(xiàn),它們的表現(xiàn)都比僅在各自執(zhí)行單一任務(wù)訓(xùn)練的模型更好。

此外,我們還發(fā)現(xiàn)了遷移學(xué)習(xí)的跡象。只在概念識(shí)別環(huán)境中訓(xùn)練過的能量函數(shù),也能很好地執(zhí)行概念生成任務(wù),即使其沒有經(jīng)過明確的訓(xùn)練。

未來方向:進(jìn)一步探索概念和語言理解的關(guān)系

我們很高興能夠在更豐富的三維環(huán)境中學(xué)到的更廣泛的概念,將概念與智能體決策策略相結(jié)合(因?yàn)榈侥壳盀橹梗覀冎皇菍⒏拍钜暈閺谋粍?dòng)體驗(yàn)中學(xué)到的東西),并探索概念和語言理解之間的聯(lián)系。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28627

    瀏覽量

    207954
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4779

    瀏覽量

    101032
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    163

    瀏覽量

    10604

原文標(biāo)題:OpenAI概念學(xué)習(xí)新模型:學(xué)會(huì)概念僅需5次示范,實(shí)現(xiàn)跨領(lǐng)域概念遷移

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    神經(jīng)網(wǎng)絡(luò)教程(李亞非)

      第1章 概述  1.1 人工神經(jīng)網(wǎng)絡(luò)研究與發(fā)展  1.2 生物神經(jīng)元  1.3 人工神經(jīng)網(wǎng)絡(luò)的構(gòu)成  第2章人工神經(jīng)網(wǎng)絡(luò)基本
    發(fā)表于 03-20 11:32

    如何構(gòu)建神經(jīng)網(wǎng)絡(luò)?

    原文鏈接:http://tecdat.cn/?p=5725 神經(jīng)網(wǎng)絡(luò)種基于現(xiàn)有數(shù)據(jù)創(chuàng)建預(yù)測(cè)的計(jì)算系統(tǒng)。如何構(gòu)建神經(jīng)網(wǎng)絡(luò)?神經(jīng)網(wǎng)絡(luò)包括:輸入層:根據(jù)現(xiàn)有數(shù)據(jù)獲取輸入的層隱藏層:使用反
    發(fā)表于 07-12 08:02

    隱藏技術(shù): 種基于前沿神經(jīng)網(wǎng)絡(luò)理論的新型人工智能處理器

    隱藏技術(shù): 種基于前沿神經(jīng)網(wǎng)絡(luò)理論的新型人工智能處理器 Copy東京理工大學(xué)的研究人員開發(fā)了種名為“ Hiddenite”的新型加速器芯
    發(fā)表于 03-17 19:15

    卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

    network,DBN)[24], 從此拉開了深度學(xué)習(xí)大幕。隨著深度學(xué)習(xí)理論的研究和發(fā)展,研究人員提 出了系列卷積神經(jīng)網(wǎng)絡(luò)模型。為了比較
    發(fā)表于 08-02 10:39

    OpenAI發(fā)布工具庫 可在GPU上建立更快、更高效、占內(nèi)存更少的神經(jīng)網(wǎng)絡(luò)

    OpenAI研究人員日前發(fā)布了個(gè)工具庫,該工具庫可以幫助研究人員在圖形處理器(graphics-processor-unit,GPU)上建立更快、更高效、占內(nèi)存更少的
    的頭像 發(fā)表于 01-27 00:34 ?4056次閱讀
    <b class='flag-5'>OpenAI</b>發(fā)布工具庫 可在GPU上建立更快、更高效、占內(nèi)存更少的<b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>

    深度神經(jīng)決策樹:深度神經(jīng)網(wǎng)絡(luò)和樹模型結(jié)合的新模型

    近日,來自愛丁堡大學(xué)的研究人員提出了種結(jié)合深度神經(jīng)網(wǎng)絡(luò)和樹模型的新型模型——深度神經(jīng)決策樹(D
    的頭像 發(fā)表于 08-19 09:14 ?1.3w次閱讀

    研究人員開發(fā)解釋多義詞的神經(jīng)網(wǎng)絡(luò)

    艾倫人工智能研究所和華盛頓大學(xué)的研究人員正在使用可以根據(jù)上下文來確定英文單詞含義的神經(jīng)網(wǎng)絡(luò)。
    的頭像 發(fā)表于 09-12 15:52 ?2230次閱讀

    研究人員開發(fā)了種新穎的機(jī)器學(xué)習(xí)管道

    研究人員通過種特殊的神經(jīng)網(wǎng)絡(luò)模型,它以“基本塊”(計(jì)算指令的基本摘要)形式訓(xùn)練標(biāo)記的數(shù)據(jù),以自動(dòng)預(yù)測(cè)其持續(xù)時(shí)間使用給定的芯片執(zhí)行以前看不見的基本塊。結(jié)果表明,這種
    的頭像 發(fā)表于 04-15 16:42 ?1868次閱讀

    基于內(nèi)存的人工智能神經(jīng)網(wǎng)絡(luò)架構(gòu)

    在過去十年左右的時(shí)間里,研究人員已經(jīng)開發(fā)了多種基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的計(jì)算模型。盡管已發(fā)現(xiàn)許多這些模型在特定任務(wù)上表現(xiàn)良好,但它們并不總
    的頭像 發(fā)表于 12-18 13:40 ?1640次閱讀

    研究人員開發(fā)“液態(tài)”神經(jīng)網(wǎng)絡(luò) 可適應(yīng)快速變化的訓(xùn)練環(huán)境

    設(shè)計(jì)出了種具有重大改進(jìn)的“液態(tài)”神經(jīng)網(wǎng)絡(luò)。其特點(diǎn)是能夠在投入訓(xùn)練階段之后,極大地?cái)U(kuò)展 AI 技術(shù)的靈活性。 通常情況下,研究人員會(huì)在訓(xùn)練階段向神經(jīng)網(wǎng)絡(luò)算法提供大量相關(guān)的目標(biāo)數(shù)據(jù),來磨
    的頭像 發(fā)表于 01-29 10:46 ?1584次閱讀

    OpenAI研究人員開發(fā)出新的機(jī)械臂

    近日,兩個(gè)由 OpenAI研究人員開發(fā)一模一樣的機(jī)械臂愛麗絲和鮑勃,可以在模擬情景中通過對(duì)弈互相學(xué)習(xí),而不需要人為輸入文本。
    的頭像 發(fā)表于 02-23 10:40 ?1924次閱讀

    cnn卷積神經(jīng)網(wǎng)絡(luò)模型 卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型 生成卷積神經(jīng)網(wǎng)絡(luò)模型

    cnn卷積神經(jīng)網(wǎng)絡(luò)模型 卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型 生成卷積神經(jīng)網(wǎng)絡(luò)模型? 卷積
    的頭像 發(fā)表于 08-21 17:11 ?1280次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)模型搭建

    卷積神經(jīng)網(wǎng)絡(luò)模型搭建 卷積神經(jīng)網(wǎng)絡(luò)模型種深度學(xué)習(xí)算法。它已經(jīng)成為了計(jì)算機(jī)視覺和自然語言處理等各種領(lǐng)域的主流算法,具有很大的應(yīng)用前景。本篇
    的頭像 發(fā)表于 08-21 17:11 ?997次閱讀

    PyTorch神經(jīng)網(wǎng)絡(luò)模型構(gòu)建過程

    PyTorch,作為個(gè)廣泛使用的開源深度學(xué)習(xí)庫,提供了豐富的工具和模塊,幫助開發(fā)者構(gòu)建、訓(xùn)練和部署神經(jīng)網(wǎng)絡(luò)模型。在神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-10 14:57 ?537次閱讀

    pytorch中有神經(jīng)網(wǎng)絡(luò)模型

    處理、語音識(shí)別等領(lǐng)域取得了顯著的成果。PyTorch是個(gè)開源的深度學(xué)習(xí)框架,由Facebook的AI研究團(tuán)隊(duì)開發(fā)。它以其易用性、靈活性和高效性而受到廣泛歡迎。在PyTorch中,有許多預(yù)訓(xùn)練的
    的頭像 發(fā)表于 07-11 09:59 ?768次閱讀
    主站蜘蛛池模板: 男人吃奶摸下挵进去啪啪| beeg日本老妇人| 伊人精品影院| 爱啪国产精品视频在线| 国产精品香蕉视频在线| 精品亚洲午夜久久久久| 欧美一区二区影院| 亚洲中文字幕无码一去台湾| 成人国产三级在线播放| 久久极品视频| 臀精插宫NP文| 欧美激情社区| 亚洲性无码av在线| 国产精品无码亚洲精品| 欧美一区二区视频在线观看| 诱受H嗯啊巨肉各种play| 国产精品亚洲精品爽爽| 欧美三级在线完整版免费| 伊人国产在线观看| 国产午夜精品久久久久九九| 日韩成人黄色| ping色堂| 欧美亚洲高清国产| 这里只有精品网| 精品无码国产AV一区二区三区| 无遮挡午夜男女XX00动态| 菠萝菠萝蜜免费播放高清| 男女性杂交内射妇女BBWXZ| 永久免费观看视频| 和尚扒开双腿蹂躏| 亚洲成 人a影院青久在线观看| 沟沟人体一区二区| 日韩精品卡1卡2三卡四卡乱码| 97视频免费在线观看| 麻豆免费高清完整版| 中文日韩亚洲欧美字幕| 久久精品热99看二| 真实的强视频免费网站| 两性色午夜视频免费国产| 中文字幕欧美日韩VA免费视频| 久久夜色精品国产亚州AV卜|