色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI智能體的能力還會繼續提高嗎?

DPVg_AI_era ? 來源:lq ? 2019-06-02 09:11 ? 次閱讀

雖然人類已經無望在電子競技中打敗AI多智能體,但DeepMind的研究仍在繼續往前推進。最近他們公布了在強化學習方面的最新進展,并對未來進行了展望。AI智能體的能力還會繼續提高嗎?會有極限嗎?

是的是的我們都知道,已經沒有什么電子競技能夠讓人類抱有哪怕1%穩贏的希望了。但是!你有沒有想過,AI會不會有一個極限?它的潛力還有多少,無窮大?還是最終止步于某個境界?DeepMind的科學家也想知道。

他們最近更新了博客,以雷神之錘為例,為我們重新介紹了強化學習的最新發展、AI在《雷神之錘3·奪旗》中達到了什么樣的程度,以及未來的期望。

多智能體最大的挑戰:既要獨自打拼,還要團隊協作

掌握多人游戲中涉及到的策略、戰術、團隊配合,是AI研究的關鍵挑戰。而DeepMind的科學家已經將AI調教到了和人類相當的水平,這一點在《雷神之錘3·奪旗》體現的淋漓盡致。

AI智能體在游戲中,無論是跟同類打配合,還是跟人類組團,完全天衣無縫,表現的不像個機器人。DeepMind的科學家已經在籌劃將奪旗中的方法,應用在雷神之錘3的全部游戲模式中。

Quake III有非常多的游戲模式。自身提供4種,分別是Free For All(競技場模式)、Team Deathmatch(紅藍兩隊對戰模式)、Tournament(Duel)(單挑模式)、奪旗(紅藍兩隊奪旗模式)。其他包括MOD和以其開源游戲引擎衍生出的獨立游戲也非常多。

https://zh.wikipedia.org/wiki/%E9%9B%B7%E7%A5%9E%E4%B9%8B%E9%94%A4III%E7%AB%9E%E6%8A%80%E5%9C%BA

作為社群生物,我們幾十億人類共同生活在同一個地球上,每個人都有自己獨立的目標和行為,但仍然能夠通過團隊、組織和社會聚集在一起,展示出令人驚嘆的集體智慧。這樣的設置,我們稱之為多智能體學習:每個智能體獨立行動,同時要學會與其他智能體的互動以及合作。

參考系都是動態的,自由度非常高。想想我們人類之間團隊配合的難度,就知道設計這樣的多智能體有多難了!

多智能體克服難題的秘訣

具體到《雷神之錘3·奪旗》中,智能體面臨的挑戰是直接從原始像素中學習以產生動作。這種復雜性使得第一人稱多人游戲成為AI社區內富有成效且活躍的研究領域。

奪旗原本是一項廣受歡迎的戶外運動,被廣泛的應用于電子游戲中。在一張給定的地圖中,紅藍雙方保護自己的旗子并搶奪對方旗子,5分鐘時間內,奪旗次數最多的隊伍獲勝。在游戲中,還可以標記敵方隊員并將其送回出生點。

越是簡單的規則,越能衍生出多種多樣的玩法,在人類來說是增加了趣味性,在多智能體來講就是增加了難度。為了繼續刁難多智能體,游戲地圖被設置成每局一換,以防止多智能體靠著優于人類的記憶來獲得地利優勢。

多智能體應對時局變化的訣竅,來自基于強化學習的三個概念:

訓練一組多智能體而非只訓練單一個體,使其能夠在游戲中互相學習,提供多樣化的隊友和對手

每個智能體都學習自己的內部獎勵信號,刺激智能體產生他們自己的內在目標比如搶到旗子。然后使用雙層優化流程直接優化智能體的內部獎勵以獲勝,同時利用內部獎勵的強化學習來了解智能體的政策。

智能體以快速和慢速兩種速度運行,這提高了它們使用內存和生成一致動作序列的能力

由此產生的智能體,被稱為For The Win(獨孤求勝)智能體,學會了以非常高的水平來玩奪旗。至關重要的是,學到的智能體政策,對地圖的大小、隊友的數量以及團隊中的其他玩家都很有用。

DeepMind組織了40個人,和多智能體一起隨機組隊。最終獨孤求勝智能變得比強基線方法強大得多,超過了人類玩家的勝率。事后調查顯示,智能體相比我們人類,更善于打配合!所以阻礙人類勝利的關鍵是人類不會好好打配合咯。

智能體在訓練期間的游戲表現。我們訓練的新智能體FTW游戲模式下的Elo得分比人類玩家和自游戲+ RS、自游戲的基線方法更高,該分數反映出游戲獲勝的概率。

除了對游戲表現進行評估之外,了解這些智能體的行為和內部表示的復雜度也很重要。

為了理解智能體如何表示游戲狀態,我們來看一下在平面上表示的智能體神經網絡的激活模式。下圖中的點集群表示在游戲期間與附近表示類似激活模式的點的游戲情況。這些點按照智能體發現自己的高級CTF游戲狀態著色:在哪個房間?旗幟的狀態是什么?可以看到哪些隊友和對手?我們觀察到相同顏色的聚類,表明智能體以類似的方式表示類似的高級游戲狀態。

我們的智能體在游戲世界中的表示。在上圖中,根據神經的相似程度繪制出給定時間的神經激活模式:圖中兩點在空間中距離越近,表明它們的激活模式越相似。然后根據實時比賽情況對它們進行上色:顏色相同,表示情況相同。這些神經激活模式是有組織的,形成了顏色簇,表明智能體以刻板、有組織的方式表示出有意義的游戲玩法。訓練后的智能體甚至展示了一些人工神經元,用于直接針對游戲中的特定情形。

智能體從未被告知有關游戲規則的任何內容,但卻了解基本的游戲概念,并對CTF產生了有效的直覺。事實上,我們可以找到直接為某些最重要的游戲狀態編碼的特定神經元,例如在智能體一方的旗子被奪時激活的神經元,或者當智能體的隊友拿著旗幟時激活的神經元。本文對此提供了進一步的分析,包括了智能體對記憶和視覺注意力的應用。

超強智能體:強加反應延遲,游戲中仍然勝過人類

我們的智能體在游戲中表現如何?首先,它們的反應時間非常短。由于人類的生物信號傳導速度較慢,人類處理和作用于感官輸入的速度也就相對較慢。因此,我們的智能體在游戲中的卓越表現,可能是因為它們具備更快的視覺處理能力和運動控制的結果。

然而,在我們人為降低了智能體的瞄準精度和反應時間后,發現這其實只是其表現優秀的其中一個因素。在進一步的研究中,我們訓練了內置延遲約四分之一秒(267毫秒)的智能體,也就是說,它們在觀察世界之前存在267毫秒的延遲,這與人類游戲玩家的反應時間差不多。但這些自帶反應延時的智能體仍然在游戲中的表現仍然優于人類玩家,后者的勝率只有21%。

人類玩家面對響應延遲的智能體的勝率仍然很低,這表明,即使被加上了與人類相當的反應延時,智能體的游戲表現依然勝過人類玩家。此外,通過查看人類和相應延時的智能體的平均游戲事件數量,雙方的標記事件數量差不多,表明這些智能體在這方面沒有占據優勢。

通過無監督學習,我們建立了代理人和人類的典型行為,發現智能體實際上學習了類似人類的行為,比如跟隨隊友并在對手的基地安營扎寨等。

訓練后的智能體做出的幾種行為:防守己方基地、騷擾敵方基地、跟隨隊友。

這些行為在強化學習的訓練過程中逐步出現,智能體能夠逐漸學會以更加互補的方式進行合作。

一群獨孤求勝智能體的訓練進程。左上角:30個智能體的Elo評分,它們之間可以互相訓練和進化。右上:進化事件樹。下圖顯示了在整個智能體訓練過程中知識進展、一些內部獎勵機制和行為概率。

《星際爭霸2》并不是極限,多智能體將繼續前進

AI智能體在《雷神之錘》中的成功經驗,被DeepMind應用在更復雜的即時戰略游戲中。比如基于人口信息學的多智能體強化學習,構成了面向《星際爭霸2》的AlphaStar智能體構建的基礎。這款游戲被稱為“人類最后的尊嚴”,但最終也沒能擋住AIphaStar稱霸的腳步。

而且,《星際爭霸2》不會成為AI多智能體能力的極限,DeepMind還在不斷給多智能體加大難度,利用多智能體訓練中總結出的經驗,用于開發高魯棒性的、甚至可以與人類合作的強大智能體。

智能體在全尺寸地圖上玩《雷神之錘3》其他多人游戲模式

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    32370

    瀏覽量

    271481
  • 智能體
    +關注

    關注

    1

    文章

    192

    瀏覽量

    10710
  • 強化學習
    +關注

    關注

    4

    文章

    269

    瀏覽量

    11361

原文標題:DeepMind制霸《雷神之錘3》!碾壓人類的超級多智能體這樣訓練

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦

    全球首家!訊飛AI電話能力平臺開放合作!

    能力的機器人。科大訊飛AI電話機器人平臺使得傳統客服平臺能夠在最短的時間內,以極少成本集成訊飛AI電話機器人全部功能,為自己產品新增一個聰明的人工智能機器人。幫助平臺客戶實現業務知識自
    發表于 09-10 09:47

    能力AI為腦 · AR為眼,訊飛能力星云助你看見智能未來

    星云計劃——除了自研能力,科大訊飛還會與業內優秀的技術廠商進行合作,實現戰略互補。訊飛開放平臺經過8年的積累,現已開放近百項AI能力,賦能88萬開發者團隊。在
    發表于 09-14 10:23

    微型微控制器與強大的人工智能AI)世界有什么關系

    嵌入式應用可能的極限,嵌入式設計已經能夠提高網絡攻擊的實時響應能力和設備安全性。支持AI的MCU云計算推動了對具有AI功能的MCU的需求;它減少了數據傳輸所需的帶寬,并節省了云服務器的
    發表于 11-01 08:55

    用嵌入式AI技術提升智能硬件應用能力

    ,更有人工智能開放平臺MAGIK。X2000 建立在其圖像、視頻、互聯等各方面的強大的能力組合之上的 AI 能力,必將使其成為智能互聯時代不
    發表于 10-09 14:33

    AI 人工智能的未來在哪?

    人工智能AI智能大模型已經孵化;繁衍過程將突飛猛進,ChatGPT已經上線。 世界首富馬斯克認為AI對人類是一種威脅;谷歌前CEO施密特認為AI
    發表于 06-27 10:48

    AI智能呼叫中心

    可以自動識別和響應來電,通過分析用戶的語音、文字和情緒等信息,并給出針對性的應答,與傳統的人工處理相比,AI智能呼叫中心能夠實現24/7不間斷的服務,大幅提高了處理效率和用戶滿意度。二、個性化服務
    發表于 09-20 17:53

    AI時代到來 如何提高孩子創造未來的能力

    之前分享過創新工場人工智能工程院執行院長王詠剛的《AI時代,提高孩子創造未來的能力,陪孩子玩什么游戲?》一文。很多家長看了文章后,想知道玩這些游戲到底有什么用?
    的頭像 發表于 05-09 11:03 ?2948次閱讀

    極視角發布首款軟硬一極光 幫助客戶低成本擁有應用AI能力

    極光是一款集平臺、算法、存儲為一智能邊緣計算產品,基于極視角強大算法能力,結合高算力AI模塊,致力于幫助客戶低成本擁有應用AI
    的頭像 發表于 05-25 14:30 ?2593次閱讀

    大模型不夠用,還有“AI智能”?

    前不久,在一場活動中有人工智能專家圍繞“AI智能”的話題展開了討論,他們表示,AI智能
    的頭像 發表于 05-12 08:04 ?344次閱讀
    大模型不夠用,還有“<b class='flag-5'>AI</b><b class='flag-5'>智能</b><b class='flag-5'>體</b>”?

    智能逼近大爆發?李彥宏再談AI應用

    AI時代的未來,為什么是智能
    的頭像 發表于 06-20 16:08 ?522次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>體</b>逼近大爆發?李彥宏再談<b class='flag-5'>AI</b>應用

    長虹發布滄海智能AI TV與智匯家AI大模型

    2024年德國柏林消費電子展覽會(IFA2024)盛大啟幕,長虹集團攜全球首款滄海智能AI TV與長虹美菱智匯家AI大模型驚艷亮相。滄海智能
    的頭像 發表于 09-10 18:21 ?1011次閱讀

    使用全新NVIDIA AI Blueprint開發視覺AI智能

    提高生產力、優化流程和創造更加安全的空間,埃森哲、戴爾科技和聯想等公司正在使用全新 NVIDIA AI Blueprint 開發視覺 AI 智能
    的頭像 發表于 11-06 13:58 ?604次閱讀

    AI智能是什么_AI智能如何重塑企業業務流程

    AI技術的飛速發展令人矚目。就在企業領導者們剛開始熟悉AI助手時,AI智能Agent(國際版)已經迅速成為討論的焦點。它們之所以受到廣泛關
    的頭像 發表于 12-19 17:55 ?487次閱讀

    AI智能套件

    智能解決方案。一、應用領域AI智能套件具備自然語言處理、機器學習以及人機交互能力,可以滲入用戶的日常生活與工作環境,對傳統設備進行升級。
    發表于 02-25 16:48 ?0次下載

    AI智能包含哪些組件

    AI 智能是先進的 AI 系統,旨在根據高級目標自主進行推理,制定計劃并執行復雜任務。
    的頭像 發表于 03-04 13:45 ?119次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>智能</b><b class='flag-5'>體</b>包含哪些組件
    主站蜘蛛池模板: 99婷婷久久精品国产一区二区 | 色列少女漫画 | 久久亚洲成a人片 | 日本特黄的免费大片视频 | 日本妈妈xxxx | 东北女人一级毛片 | 4480YY旧里番在线播放 | 99re热视频这里只有精品 | 国内精品一级毛片免费看 | 在线天天看片视频免费观看 | 嘟嘟嘟WWW免费高清在线中文 | 日韩丰满少妇无码内射 | 国内精品久久 | 护士日本xx厕所 | 丰满的女友1在线观看 | 精品99久久久久成人网站 | 国产精品无码人妻99999 | 最近中文字幕高清中文字幕MV | 欧美精品华人在线 | 亲胸吻胸添奶头GIF动态图免费 | 亚洲欧美日韩另类精品一区二区三区 | 成人欧美一区二区三区白人 | 青青青国产依人精品视频 | 99久久国产综合精品网成人影院 | 噜妇插内射精品 | 久久久亚洲国产精品主播 | 亚洲精品第一页 | 成人国产免费 | 成人麻豆日韩在无码视频 | 超碰在线97久久视频观看 | 免费毛片在线播放 | 狠狠色狠狠色综合系列 | 无人区日本电影在线观看高清 | 两个人的视频日本在线观看完整 | 成人无码精品一区二区在线观看 | 亚洲综合AV色婷婷五月蜜臀 | Chineseman瘦老头77 | 91久久偷偷做嫩草影院免 | 性奴公司 警花 | 亚洲第一色网站 | 在线自拍亚洲视频欧美 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品