在线果冻传媒星空无限传媒,亚洲国语,尤物精品在线观看

最近谷歌DeepMind提出了一種新的強化學習技術，這種技術以一種全新方式來模擬人類行為。它可能會比之前發布的人工智能決策系統更強大，這對希望通過自動化提高生產率的企業來說可能是個福音。

如何解決多方零和博弈中的合作困境？

DeepMind用強化學習使AI實現利益最大化。這是一種基于對等契約機制的經濟競爭模型，該模型允許在多方博弈中結盟。這篇論文其中一位作者表示，這種結盟有單打獨斗不具有的特殊優勢。

長期以來，零和游戲以其豐富的策略選擇空間和清晰的策略評估方式指導著人工智能研究。更重要的是這種競爭廣泛存在于生物界、市場經濟甚至是AlphaZero中。

DeepMind科學家首先尋求數學定義形成聯盟的挑戰，關注聯盟形成多玩家零和游戲——也就是說，數學表示的情況下，每個參與者的收益或損失的效用是完全平衡的損失或收益的其他參與者的效用。

什么是多方零和博弈？

DeepMind將之定義為每個玩家的收益或損失完全由其余玩家的損失或收益提供。在一個對稱多方零和博弈中，每個玩家的行為模式都是一樣的，這往往會產生社會困境。（一個極簡例子是“囚徒困境”）

零和博弈引入了合作后事情變得很復雜。緊急情況下，團隊必須內部協調才能有效地在游戲中競爭。合作形成的過程本身就是一個社會困境——從直覺上看，玩家應該合作來擊敗其他人，但合作團隊內部要求個體為更廣泛的利益做出妥協，但這種犧牲未必和他們的自身利益一致。此外，決定加入或離開哪個團隊以及團隊策略都是重要問題。

DeepMind嘗試了一種“禮物游戲”，在游戲中，AI扮演的玩家從一堆標記著自己代表色的數字籌碼開始。在每個玩家的回合中，他們必須拿出自己對應顏色的籌碼并將其贈送給另一名玩家，或將其棄置。全部玩家都失去自己對應顏色的數字籌碼時游戲結束，此時擁有最多顏色籌碼的玩家獲勝，贏家平分價值為“1”的籌碼，其他玩家平分價值為“0”的籌碼。

研究發現，玩家往往表現得很自私，他們囤積籌碼以至于出現了三方平局。但事實上，如果兩名玩家交換籌碼，回報會更好。DeepMind將這種過程闡述為：盡管合作能帶來更好的結果，但人人都想從欺騙行為中獲利，也就是說服對方交換然后食言。

這也就是說，如果有一種機制能維護合作行為存在，那強化學習可以適應這種博弈。這種機制就是合同——在游戲中，每個玩家必須提交一份報價，首先選擇合作伙伴，然后為該合作伙伴提出行動建議，最后玩家承諾采取的行動。如果兩個玩家提供了相同的契約，那么這些契約就具有了約束力，也就是說環境強制執行了所承諾的操作。

這種強制性機制是合作形成的基礎。

這種模型能讓我們在更廣闊的應用環境中思考契約的作用。一個沒有強制實施機制的契約系統如果可以在多方動態博弈中持續運行將最終產生一個有價值的反饋回路，這將使得AI的應用走向社會學和經濟學。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

谷歌

谷歌

+關注

關注
27

文章
6192

瀏覽量
105991
AI

AI

+關注

關注
87

文章
31494

瀏覽量
270259

EE-19：最大化DSP-21xx系列DSP(不包括ADSP-218x)的引導內存效率

電子發燒友網站提供《EE-19：最大化DSP-21xx系列DSP(不包括ADSP-218x)的引導內存效率.pdf》資料免費下載

發表于 01-14 16:09 ?0次下載

EE-19：<b class='flag-5'>最大化</b>DSP-21xx系列DSP(不包括ADSP-218x)的引導內存效率

EE-365：在ADSP-CM40x混合信號控制處理器上實現ADC采樣速率最大化

電子發燒友網站提供《EE-365：在ADSP-CM40x混合信號控制處理器上實現ADC采樣速率最大化.pdf》資料免費下載

發表于 01-13 16:52 ?0次下載

EE-365：在ADSP-CM40x混合信號控制處理器上<b class='flag-5'>實現</b>ADC采樣速率<b class='flag-5'>最大化</b>

谷歌加速AI部門整合：AI Studio團隊并入DeepMind

近日，谷歌正緊鑼密鼓地推進其人工智能(AI)部門的整合工作。據谷歌AI Studio主管Logan Kilpatrick在領英頁面上的透露，谷歌

發表于 01-13 14:40 ?238次閱讀

光伏發電如何實現能效最大化

光伏發電實現能效最大化是一個綜合性的問題，需要從多個方面入手。以下是一些關鍵措施：一、選用優質設備太陽能板：選用具有高光電轉化效率和穩定性的太陽能板是基礎。例如，單晶硅太陽能板通常比多

發表于 12-05 11:06 ?369次閱讀

KM振動分析與動平衡服務實現工廠設備效率最大化

振動儀

KM預測性維護專家
發布于 :2024年10月16日 15:57:14

擴展塢使用技巧：如何最大化你的筆記本電腦接口能力

要最大化您的筆記本電腦接口能力，以下是一些實用的擴展塢使用技巧：了解您的需求：在購買擴展塢之前，明確您需要哪些類型的端口（如HDMI, USB-C, RJ45等）以及是否需要充電功能，以選擇最適合

發表于 10-08 10:52 ?677次閱讀

液冷充電槍線最大化提高充電效率

法法易提供的液冷充電槍線可以最大化的提升充電效率，讓大家的充電時間進一步縮短。? 液冷充電槍線使用液體循環來冷卻電纜，以避免因高溫而導致電纜損壞或充電速度減緩。而且液冷充電槍線采用銅芯導線和耐高溫、耐磨損、

發表于 09-11 14:25 ?483次閱讀

谷歌DeepMind被曝抄襲開源成果，論文還中了頂流會議

谷歌DeepMind一篇中了頂流新生代會議CoLM 2024的論文被掛了，瓜主直指其抄襲了一年前就掛在arXiv上的一項研究。開源的那種。

發表于 07-16 18:29 ?642次閱讀

谷歌DeepMind發布人工智能模型AlphaFold最新版本

谷歌DeepMind近日發布了人工智能模型AlphaFold的最新版本——AlphaFold 3，這一革命性的工具將在藥物發現和疾病治療領域發揮巨大作用。

發表于 05-10 11:26 ?633次閱讀

谷歌DeepMind推出新一代藥物研發AI模型AlphaFold 3

谷歌DeepMind公司近日重磅推出了一款名為AlphaFold 3的全新藥物研發AI模型，這一創新技術將為科學家們提供前所未有的幫助，使他們能更精確地理解疾病

發表于 05-10 09:35 ?438次閱讀

谷歌DeepMind推出SIMI通用AI智能體

近日，谷歌的DeepMind團隊發布了其最新研究成果——SIMI（Scalable Instructable Multiworld Agent），這是一個通用人工智能智能體，能夠在多種3D虛擬環境

發表于 03-18 11:39 ?1040次閱讀

數據賦能：構建數據治理與AI的協同閉環

在數字化浪潮中，數據已成為企業的新型燃料，而AI則是提煉這種燃料的精煉廠。數據治理與AI的協同作用，正在引領企業邁向更智能、更高效的未來。本文將展示企業如何通過將數據治理與AI技術相結合，實現

發表于 03-15 10:47 ?527次閱讀

谷歌計劃重新推出改進后的Gemini AI模型人像生成功能

谷歌DeepMind的首席執行官德米斯·哈薩比斯在2月26日透露，公司計劃在接下來的幾周內重新發布其備受關注的Gemini AI模型人像生成功能。此前，由于在某些歷史圖像生成描述中出現了不準確的問題，

發表于 02-28 10:17 ?654次閱讀

谷歌DeepMind推新AI模型Genie，能生成2D游戲平臺

據報道，谷歌公司的DeepMind團隊近期發布了AI模型Genie，此模型擁有多達110億個參數，能夠依據用戶提供的圖片及提示詞創建出相當完整的2D游戲場景。

發表于 02-27 14:53 ?840次閱讀

谷歌宣布Gemma大模型全球開放使用

谷歌公司近日宣布，其先進的AI大模型Gemma即日起在全球范圍內開放使用。這一新模型由谷歌DeepMind和其他團隊合作開發，并與其最大的

發表于 02-23 10:41 ?825次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

谷歌DeepMind設置強迫機制使AI實現利益最大化

評論

EE-19：最大化DSP-21xx系列DSP(不包括ADSP-218x)的引導內存效率

EE-365：在ADSP-CM40x混合信號控制處理器上實現ADC采樣速率最大化

谷歌加速AI部門整合：AI Studio團隊并入DeepMind

光伏發電如何實現能效最大化

KM振動分析與動平衡服務實現工廠設備效率最大化

擴展塢使用技巧：如何最大化你的筆記本電腦接口能力

液冷充電槍線最大化提高充電效率

谷歌DeepMind被曝抄襲開源成果，論文還中了頂流會議

谷歌DeepMind發布人工智能模型AlphaFold最新版本

谷歌DeepMind推出新一代藥物研發AI模型AlphaFold 3

谷歌DeepMind推出SIMI通用AI智能體

數據賦能：構建數據治理與AI的協同閉環

谷歌計劃重新推出改進后的Gemini AI模型人像生成功能

谷歌DeepMind推新AI模型Genie，能生成2D游戲平臺

谷歌宣布Gemma大模型全球開放使用