色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌大腦的“世界模型”簡述與啟發

mK5P_AItists ? 來源:lq ? 2019-01-30 09:48 ? 次閱讀

摘要:我們的視覺看到什么,部分取決于大腦預測未來會看到什么。

我們的視覺看到什么,部分取決于大腦預測未來會看到什么,例如下圖中,如果你預計要看到突出的球體,那也許你就會看到,如果讓機器也具有了這樣的能力,會帶來什么了?

18年谷歌大腦提出“世界模型”(World Models)可以在復雜的環境中通過自我學習產生相應的策略,例如玩賽車游戲。

下面是世界模型的整體架構:

整個模型分為3個組件:視覺組件(V),記憶組件(M),控制組件(C)。視覺組件V用來壓縮圖片信息到一個隱變量z上(其實只是一個VAE編碼解碼器):

記憶組件M的輸入是一幀幀的游戲圖片(論文中的一幀圖像似乎叫一個rollout),輸出是預測下一幀圖像的可能分布,其實就是比一般LSTM更高級一些的MDN-RNN:

最后控制組件C的目標,就是把前面視覺組件V和記憶組件M的輸出一起作為輸入,并輸出這個時刻智能體agent應該做出的動作(action)。

在所謂的“世界模型”,其中的組件模型幾乎沒有是谷歌大腦自己創新研制的。但世界模型會很大提高強化學習訓練穩定性和成績 從而使其與其他強化學習相比有一些明顯優勢,如下表所示;

世界模型有如下的3個特點

1. 模型拼接得足夠巧妙,這個巧妙的拼接模型做到所謂的世界想象能力,就是模型在學習時,自身對環境假想一個模擬的環境,甚至可以在沒有環境訓練的情況下,自己想象一個環境去訓練。其實就是我們人類鏡像神經元的功能。

2. 抓住了一些“強視覺”游戲的“痛點”。記憶組件M中的RNN是生成序列的能手,所以根據之前游戲圖像再“想象”一些圖像幀應該不成問題(RNN生成一些隱變量z,再根據隱變量z,由視覺組件VAE的decode生成的圖像幀即可)。所以對于“強視覺”的游戲,把RNN的記憶能力用在視覺預測和控制上是個好主意 。

3不同于我們常見的“不可生”智能算法,例如遺傳算法和進化策略只是強調了基因的“變異”與在解空間中進行搜索,神經網絡只是固定網絡結構;而生物界的基因卻可以指導蛋白質構成并且“生長”。如果基因可以構造自身個體,外部環境和個體情況也可以反過來影響基因,而我們的模型都太固定呆板了,模型結構不能隨內部隱變量改進,當然最佳的設計形式也許誰也不知道。而世界模型做到了讓在內部”幻想“的環境中產生的策略轉移到外部世界中。

最后簡單看一下世界模型的訓練過程:

world models代碼基于chainer計算框架,步驟如下:

1. 準備數據集,隨機玩游戲生成訓練幀(rollouts意思應該就是多少幀):

python random_rollouts.py--gameCarRacing-v0 --num_rollouts10000

2. 訓練視覺組件V,即前面提到的VAE:

python vision.py--gameCarRacing-v0 --z_dim32--epoch1

3. 訓練記憶組件M,即前面提到的RNN:

python model.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--epoch20

4. 訓練控制組件C,即前面提到的CMA-ES算法(其實就是支持更復雜輸入和更新的ES):

python controller.py--gameCarRacing-v0 --lambda_64--mu0.25--trials16--target_cumulative_reward900--z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1[--cluster_mode]

5. 測試訓練結果:

python test.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1--rollouts100[--record]

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6179

    瀏覽量

    105756
  • 機器
    +關注

    關注

    0

    文章

    784

    瀏覽量

    40772
  • 智能體
    +關注

    關注

    1

    文章

    163

    瀏覽量

    10603

原文標題:谷歌大腦的“世界模型”簡述與啟發

文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    谷歌發布全新AI基礎世界模型Genie

    谷歌近日宣布推出其最新研發的AI基礎世界模型——Genie。這款模型擁有驚人的110億參數,其獨特之處在于,僅需一張圖片,便能生成一個充滿活力和交互性的虛擬
    的頭像 發表于 03-04 14:02 ?800次閱讀

    谷歌模型合成工具在哪找到

    谷歌模型合成工具可以在谷歌的官方網站或相關的開發者平臺上找到。具體地,您可以嘗試訪問谷歌的AI平臺或開發者社區,以獲取有關模型合成工具的最新
    的頭像 發表于 03-01 18:13 ?1610次閱讀

    谷歌模型框架是什么軟件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌開發的用于機器學習和人工智能的軟件框架,其中最著名的是TensorFlow。TensorFlow是一個開源的機器學習框架,由谷歌的機器學習團隊開發,用于構建和
    的頭像 發表于 03-01 16:25 ?939次閱讀

    谷歌模型訓練軟件有哪些?谷歌模型訓練軟件哪個好?

    谷歌模型訓練方面提供了一些強大的軟件工具和平臺。以下是幾個常用的谷歌模型訓練軟件及其特點。
    的頭像 發表于 03-01 16:24 ?949次閱讀

    谷歌模型怎么用手機打開

    要使用手機打開谷歌模型,首先需要明確一點:谷歌模型本身是在計算機上運行的程序或算法,而不是可以直接在手機上打開的應用程序。然而,你可以通過手機訪問
    的頭像 發表于 03-01 16:23 ?659次閱讀

    谷歌模型軟件有哪些功能

    谷歌模型軟件通常指的是谷歌推出的一系列人工智能模型和軟件工具,其中最具代表性的是Google Gemini。Google Gemini是谷歌
    的頭像 發表于 03-01 16:20 ?711次閱讀

    谷歌模型合成軟件有哪些

    谷歌模型合成軟件通常指的是谷歌提供的用于創建、修改和共享3D模型的軟件。目前,谷歌推出的模型合成
    的頭像 發表于 02-29 18:20 ?1442次閱讀

    谷歌模型軟件有哪些好用的

    谷歌模型軟件的好用程度可能因個人需求和技能水平而異,但以下是一些廣受歡迎的谷歌模型軟件,它們在各自的領域內有著出色的表現。
    的頭像 發表于 02-29 18:17 ?1112次閱讀

    谷歌模型框架是什么?有哪些功能和應用?

    谷歌模型框架(Google Model Framework)并不是一個特定的框架,而是指谷歌開發的一系列軟件框架,用于支持機器學習和人工智能的應用。以下是一些與谷歌
    的頭像 發表于 02-29 18:11 ?1556次閱讀

    谷歌發布全新AI模型Genie

    谷歌近日發布了其全新的AI模型Genie,這一模型徹底改變了我們與數字世界的互動方式。Genie不僅可以接收文本提示、草圖或想法,還能將這些創意迅速轉化為一個可互動和玩耍的虛擬
    的頭像 發表于 02-28 18:25 ?1737次閱讀

    谷歌發布基礎世界模型Genie,世界模型領域競爭升溫

    繼OpenAI和Meta之后,谷歌也在世界模型領域公布了其最新進展。據谷歌官網介紹,Genie是一個基于互聯網視頻訓練的基礎世界
    的頭像 發表于 02-28 18:20 ?1463次閱讀

    谷歌發布AI基礎世界模型Genie

    谷歌近日宣布了其生成式AI的全新里程碑——全新AI基礎世界模型Genie。這一創新技術允許用戶通過單張圖像提示,生成一個可玩的、交互式的虛擬環境,從而開啟了一個全新的數字體驗時代。
    的頭像 發表于 02-28 17:41 ?871次閱讀

    谷歌發布新型AI模型Genie

    近日,谷歌推出了一款革命性的AI模型——Genie。這款模型能夠將簡單的文本提示、草圖或初步想法迅速轉化為一個可以互動和游戲的虛擬世界。這一突破性的技術無疑將改變人們創建和體驗虛擬
    的頭像 發表于 02-28 10:05 ?790次閱讀

    谷歌交互世界模型重磅發布

    谷歌模型
    北京中科同志科技股份有限公司
    發布于 :2024年02月28日 09:13:06

    谷歌開源70億參數大語言模型,全方位超越Meta Llama-2?

    基于Gemini打造的開源模型Gemma。 ? 谷歌加入AI模型開源陣營,Gemma橫空出世 ? 根據谷歌的介紹,Gemma是由谷歌Deep
    的頭像 發表于 02-23 00:15 ?3544次閱讀
    <b class='flag-5'>谷歌</b>開源70億參數大語言<b class='flag-5'>模型</b>,全方位超越Meta Llama-2?
    主站蜘蛛池模板: 國産麻豆AVMDMD0179 | 无套内射在线观看THEPORN | 在线欧美 精品 第1页 | 秋霞网韩国理伦片免费看 | 午夜人妻理论片天堂影院 | 一区二区三区四区国产 | 2019精品国产品在线不卡 | 日本G奶乳液汁 | 久久re热在线视频精69 | 99精品免费观看 | 亚洲破处女 | 99热在线免费观看 | WWW国产精品内射老师 | 亚洲精品久久久久无码AV片软件 | 2022久久精品国产色蜜蜜麻豆 | 俄罗斯xxxxxbbbbb | 亚洲精品无码国产爽快A片百度 | 美女图片131亚洲午夜 | JIZZ19学生第一次 | 嫩草影院地址一地址二 | jk制服啪啪网站 | 手机毛片免费看 | 最新黄色在线 | 成人免费一区二区无码视频 | 亚洲一卡久久4卡5卡6卡7卡 | 在线不卡日本v二区 | 亚洲精品AV一区午夜福利 | 亚洲蜜桃AV永久无码精品放毛片 | 漂亮的保姆3中文版完整版 漂亮的保姆3集电影免费观看中文 | 一个人高清在线观看日本免费 | 国产AV精品国语对白国产 | 131美女爱做视频午夜剧场 | 国内精品不卡一区二区三区 | 桃花在线观看播放 | 好大好硬好湿再深一点网站 | 欧美麻豆一精品一AV一免费 | 伊人色综合久久天天网 | 麻豆人妻无码性色AV | 精彩国产萝视频在线 | 野花韩国高清完整版在线 | 伊人久久亚洲精品一区 |