色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ai真的到了嗎,這些業界的人都看不懂的問題,你怎么看

mK5P_AItists ? 來源:未知 ? 作者:龔婷 ? 2018-03-19 10:08 ? 次閱讀

今天,OpenAI在官方博客上丟出了7個研究過程中發現的未解決問題。

OpenAI希望這些問題能夠成為新手入坑AI的一種有趣而有意義的方式,也幫助從業者提升技能。

OpenAI版AI界七大未解之謎,現在正式揭曉——

丨1. Slitherin

難度指數:☆☆

實現并解決貪吃蛇的多玩家版克隆作為Gym環境。

環境:場地很大,里面有多條蛇,蛇通過吃隨機出現的水果生長,一條蛇在與另一條蛇、自己或墻壁相撞時即死亡,當所有的蛇都死了,游戲結束。

智能體:使用自己選擇的自我對弈的RL算法解決環境問題。你需要嘗試各種方法克服自我對弈的不穩定性。

檢查學習行為:智能體是否學會了適時捕捉食物并避開其他蛇類?是否學會了攻擊、陷害、或者聯合起來對付競爭對手?

丨2. 分布式強化學習中的參數平均

難度指數:☆☆☆

這指的是探究參數平均方案對RL算法中樣本復雜度和通信量影響。一種簡單的解決方法是平均每個更新的每個worker的梯度,但也可以通過獨立地更新worker、減少平均參數節省通信帶寬。

這樣做還有一個好處:在任何給定的時間內,我們都有不同參數的智能體,可能出現更好的探測行為。另一種可能是使用EASGD這樣的算法,它可以在每次更新時將參數部分結合在一起。

丨3. 通過生成模型完成的不同游戲中的遷移學習

難度指數:☆☆☆

這個流程如下:

訓練11個Atari游戲的策略。從每個游戲的策略中,生成1萬個軌跡,每個軌跡包含1000步行動。

將一個生成模型(如論文Attention Is All You Need提出的Transformer)與10個游戲產生的軌跡相匹配。

然后,在第11場比賽中微調上述模型。

你的目標是量化10場比賽預訓練時的好處。這個模型需要什么程度的訓練才能發揮作用?當第11個游戲的數據量減少10x時,效果的大小如何變化?如果縮小100x呢?

丨4. 線性注意Transformer

難度指數:☆☆☆

Transformer模型使用的是softmax中的軟注意力(soft attention)。如果可以使用線性注意力(linear attention),我們就能將得到的模型用于強化學習。

具體來說,在復雜環境下使用Transformer部署RL不切實際,但運行一個具有快速權重(fast weight)的RNN可行。

你的目標是接受任何語言建模任務,訓練Transformer,然后找到一種在不增加參數總數情況下,用具有不同超參數的線性注意Transformer獲取每個字符/字的相同位元的方法。

先給你潑盆冷水:這可能是無法實現的。再給你一個潛在的有用提示,與使用softmax注意力相比,線性注意轉化器很可能需要更高的維度key/value向量,這能在不顯著增加參數數量的情況下完成。

丨5. 已學習數據的擴充

難度指數:☆☆☆

可以用學習過的數據VAE執行“已學習數據的擴充”。

我們首先可能需要在輸入數據上訓練一個VAE,然后將每個訓練點編碼到一個潛在的空間,之后在其中應用一個簡單(如高斯)擾動,最后解碼回到觀察的空間。用這種方法是否能得到更好的泛化,目前還是一個謎題。

這種數據擴充的一個潛在優勢是,它可能包含視角變換、場景光纖變化等很多非線性

轉換。

丨6. 強化學習中的正則化

難度指數:☆☆☆☆

這指的是實驗性研究和定性解釋不同正則化方法對RL算法的影響。

在監督學習中,正則化對于優化模型和防止過擬合具有極其重要的意義,其中包含一些效果很贊的方法,如dropout、批標準化和L2正則化等。

然而,在策略梯度和Q-learning等強化學習算法上,研究人員還沒有找到合適的正則化方法。順便說一下,人們在RL中使用的模型要比在監督學習中使用的模型小得多,因為大模型表現更差。

丨7. Olympiad Inequality問題的自動解決方案

難度指數:☆☆☆☆☆

Olympiad Inequality問題很容易表達,但解決這個問題往往需要巧妙的手法。

建立一個關于Olympiad Inequality問題的數據集,編寫一個可以解決大部分問題的程序。目前還不清楚機器學習在這里是否有用,但你可以用一個學習的策略減少分支因素。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31463

    瀏覽量

    269857
  • 人工智能
    +關注

    關注

    1794

    文章

    47622

    瀏覽量

    239581

原文標題:AI界的七大未解之謎:OpenAI丟出一組AI研究課題

文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    電磁兼容的這些問題,考慮到了嗎?(下)

    性?為了確保電子設備的電磁兼容性符合要求,需進行相關的測試。這些測試包括傳導和輻射發射測試、傳導和輻射抗擾度測試等。這些測試需在專業的電磁兼容實驗室中進行,以確保測試結
    的頭像 發表于 01-16 11:39 ?153次閱讀
    電磁兼容的<b class='flag-5'>這些</b>問題,<b class='flag-5'>你</b><b class='flag-5'>都</b>考慮<b class='flag-5'>到了嗎</b>?(下)

    快恢復二極管選型參數怎么看?常用型號有哪些?

    快恢復二極管選型參數怎么看?常用型號有哪些?
    的頭像 發表于 11-14 17:30 ?615次閱讀
    快恢復二極管選型參數<b class='flag-5'>怎么看</b>?常用型號有哪些?

    TPA3112用tina仿真后面的揚聲器怎么看發出的聲音怎么樣?

    TPA3112用tina仿真后面的揚聲器怎么看發出的聲音怎么樣啊
    發表于 11-04 07:29

    求電氣圖講解,剛接觸電氣圖,看不懂圖紙

    電氣圖講解,剛接觸電氣圖,看不懂圖紙,有無老師能簡要講解一下各部分
    發表于 10-13 21:33

    請問AD657的共模和差模輸入電容怎么看

    如題,AD657的共模和差模輸入電容怎么看??輸入阻抗是10的12次方歐姆, 輸入電容是5.2pf??
    發表于 09-06 07:07

    防雷器件有哪些?防雷器等級型號怎么看

    防雷器件有哪些?防雷器等級型號怎么看
    的頭像 發表于 07-31 15:05 ?1259次閱讀

    三星貼片電容的批次號怎么看

    三星貼片電容的批次號怎么看?在這個問題之前我們先普及一下,怎么分辨三星貼片電容是不是正品?
    的頭像 發表于 07-31 14:10 ?488次閱讀
    三星貼片電容的批次號<b class='flag-5'>怎么看</b>?

    STM32H745BIT6單片機怎么看哪個引腳配置哪個內核?

    STM32H745BIT6單片機怎么看哪個引腳配置哪個內核啊,在數
    發表于 07-03 07:38

    三星貼片電容怎么看電壓呢?電壓的方式有哪些?

    對于三星貼片電容怎么看參數呢?現在看三星貼片電容的電壓參數的方式也是比較多的,今天給大家分享兩種,三星貼片電容電壓的方式吧。其實對于懂技術的人員直接三星貼片電容的外面參數就能夠知道
    的頭像 發表于 06-19 15:29 ?589次閱讀

    車路云協同,這次它真的了嗎

    ,前些年搞得沸沸揚揚,但是最終都很難落地。想必也發現了:短短幾天時間,多地密集傳來車路云一體化布局新進展。難道它真的了嗎?北京5月31日,北京市公共資源交易服務平臺
    的頭像 發表于 06-13 08:25 ?547次閱讀
    車路云協同,這次它<b class='flag-5'>真的</b>來<b class='flag-5'>了嗎</b>?

    降價潮背后:大模型落地門檻真的了嗎

    “比起價格門檻,AI大模型的應用門檻,更難跨越。”大模型爭相降價下,AI應用的門檻真的降低了嗎?答案還真不一定。因為除了價格門檻,AI大模型
    的頭像 發表于 06-13 08:04 ?275次閱讀
    降價潮背后:大模型落地門檻<b class='flag-5'>真的</b>降<b class='flag-5'>了嗎</b>?

    求助,求大神幫忙解答下AN65974同步Slave FIFO的讀時序

    你好,在AN65974文檔中,我看不懂同步Slave FIFO的讀時序,可以給我解讀一下么? 下圖中有我標注的我不懂的問題。非常感謝你!......
    發表于 05-31 06:27

    關于超聲波水表的單片機原理圖

    大佬們求解~越詳細越好,小白真的看不懂這個原理圖啊!!
    發表于 03-20 15:10

    stm32f1如何控制SI4463?

    4463的寄存器太多了額,說明還只有英文版的,真是看不懂,不過有一個WDS軟件,便于快速配置。對于我這種菜鳥來說也比較困難。希望大神指教WDS生成出來的代碼怎么搞到KEIL中去或者給個STM32的例程也可以。謝謝了
    發表于 03-11 07:05

    請問XMC1404如何產生PWM信號?

    我只需要原理圖就行 不需要程序 只想知道接什么引腳可以讓XMC1404芯片產生PWM信號 以及信號從哪個引腳出來救救孩子的畢設英飛凌中文資料太少了我真的看不懂嗚嗚嗚
    發表于 02-18 08:51
    主站蜘蛛池模板: 亚洲男人天堂网| 亚洲精品自在在线观看| 欧美最猛黑人AAAAA片| 色小说在线| 亚洲乱码中文字幕久久| caoporn 在线视频| 久爱精品亚洲电影午夜| 色欲人妻无码AV精品一区二区| 影音先锋 av天堂| 国产噜噜噜精品免费| 青青草原国产| 999久久国产精品免费人妻| 国产精品你懂得| 成激人情在线影院920| 精品一区二区三区免费毛片| 少妇两个奶头喷出奶水了怎么办| 99日影院在线播放| 高清观看ZSHH96的视频素材| 里番acg纲手的熟蜜姬训练场| 亚洲AV中文字幕无码久久| 被高跟鞋调教丨vk| 男人J桶女人P视频无遮挡网站| 两个人看的www免费高清直播| 午夜DY888国产精品影院| 芭乐视频免费资源在线观看| 蜜桃人妻无码AV天堂三区 | 中文在线免费看视频| 国产手机精品一区二区| 少妇人妻偷人精品视蜜桃| 啊灬啊灬啊灬快高潮视频 | 色婷婷综合久久久久中文一区二区| 18黄女脱内衣| 久久夜色噜噜噜亚洲AV0000| 亚洲午夜电影| 不卡人妻无码AV中文系列APP| 久久天天躁狠狠躁夜夜躁| 伊人国产视频| 久久影院午夜理论片无码| 日本艳妓BBW高潮一19| 囯产精品久久久久久久久免费蜜桃| 欧美精品一区二区蜜臀亚洲|