色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI賭神贏的背后,只是8天的訓(xùn)練

mK5P_AItists ? 來源:YXQ ? 2019-08-15 09:06 ? 次閱讀

2017年年初,Brain vs AI的德州撲克人機大戰(zhàn)在卡耐基梅隆大學(xué)(CMU)落幕,由4名人類職業(yè)玩家組成的人類大腦不敵人工智能程序Libratus。

獲勝后人類還遭到了Libratus的無情嘲諷。

但是那時候Libratus還只是個只能在1V1局里稱霸的超級玩家,要說人類最喜歡的6人局這樣的“大場面”,當(dāng)時的Libratus還沒有拿到入場券。

而就在昨天,F(xiàn)acebook與CMU學(xué)Noam Brown、Tuomas Sandholm的最新研究成果——Pluribus,就在人類最常見的無限制德州撲克6人局里,戰(zhàn)勝了人類頂尖選手。

跟還是不跟?高手之間的對決

Darren Elias(1986年11月18日出生)是一名美國職業(yè)撲克玩家,曾獲得四項世界撲克巡回賽冠軍。

在他與Pluribus的對決過程中,Darren Elias從來沒有遇到過如此不害怕的對手。

一個有經(jīng)驗的撲克玩家,當(dāng)有兩個J(一個面朝上,另一個藏起來,一手既不好也不壞)時,都會謹(jǐn)慎行事。但是Elias的對手看起來好像不知道該怎么做。即使當(dāng)Elias決定虛張聲勢(bluff),下注時看起來很有信心,而他的對手似乎在鼓勵他繼續(xù)!好像一點都沒有被嚇到。

最后,Elias的虛張聲勢沒有起作用,他輸了。

Elias

正如埃利亞斯先生意識到的,Pluribus知道什么時候該虛張聲勢,也知道別人在虛張聲勢,還知道什么時候該改變自己的行為,這樣其他玩家就無法確定自己的策略。32歲 Elias先生說: 它確實做了一些人類很難做到的事情。

贏的背后,只是8天的訓(xùn)練

之前AI和人玩游戲,要么是雙人游戲,如國際象棋、跳棋等,要么就是雙方之間的零和博弈(一方贏一方輸),AI可以在游戲中找到Nash equilibrium strategy(納什平衡)來保證自己不會輸。

關(guān)于Nash equilibrium strategy(納什平衡)屬于博弈論范疇(注:納什證明了,如果允許混合策略,那么任何一個博弈,只要參與者數(shù)量是有限的、參與者可以選擇的純策略也是有限的,那么這個博弈至少有一個納什均衡)。

以經(jīng)典的“石頭剪刀布”游戲為例,AI可以在游戲中找到對方的弱點和常出的手勢進行學(xué)習(xí),以達到最終的勝利,而多人撲克意味著玩家數(shù)量的增多,在更復(fù)雜的游戲中,AI難以確定如何與納什均衡相抗衡;采用固定策略不能很快觀察到的對手的策略傾向,而且需要監(jiān)控到多個玩家在游戲中策略的轉(zhuǎn)變,這對于AI多人撲克博弈來說,是一項挑戰(zhàn)。

鑒于多人游戲,如果學(xué)習(xí)多個玩家的出牌習(xí)慣等特征的訓(xùn)練數(shù)據(jù)集成本過大,這里Pluribus采用的策略是自己與自己博弈,不使用人類對手的數(shù)據(jù)作為模型訓(xùn)練的輸入。在開始時,隨機的選擇玩法,通過不斷的訓(xùn)練來提升自己的性能,這里采用的博弈策略是改良版本的迭代的蒙特卡洛CFR(MCCFR),通過自我博弈,左右手互博,自己制定了一個blueprint strategy(藍圖策略),最后對每個可能的狀況進行概率分布統(tǒng)計,通過搜索決策樹來決定下一步的行為,是叫牌還是出牌。

CFR是一種迭代的自我游戲算法,AI從完全隨機游戲開始,然后通過學(xué)習(xí)擊敗早期版本的自己逐漸改進。

在算法的每次迭代中,MCCFR指定一個玩家作為其當(dāng)前策略在迭代中更新的標(biāo)記。在迭代開始時,MCCFR根據(jù)當(dāng)前所有玩家的策略(最初是完全隨機的)模擬一手撲克牌。一旦模擬完成,人工智能就會回顧每一個玩家做出的決定,然后通過選擇其他可用的行動來預(yù)測這個決定的好壞程度。

Pluribus玩家博弈樹

在解決不完全信息博弈中搜索的問題,Pluribus跟蹤每一手,根據(jù)其策略達到目前狀況的可能性。不管Pluribus實際上握著的牌,它首先會計算如何使用可能的每一手,謹(jǐn)慎地平衡所有的策略,以保持對于對手的不可預(yù)測性。

Pluribus 中的實時搜索

撲克以外的事

之前在1V1局中大勝人類的Libratus后來去五角大樓上班去了,國防部認(rèn)為這種策略型人工智能或許可以幫助他們進行戰(zhàn)略的制定。

負(fù)責(zé) Pluribus 項目的 研究員Noam Brown說:“Pluribus的技術(shù)可以用于華爾街交易、拍賣、政治談判和網(wǎng)絡(luò)安全這些活動中,這些活動就像撲克一樣,涉及隱藏信息,因為你并不總是知道真實世界的狀態(tài)。”

盡管像谷歌這樣的公司,有著“Don't be evil”的信條,但是,不可避免的是這樣能夠理解人類策略的人工智能,還是會引發(fā)大眾對于人工智能的某種恐懼,或者說,如果這樣的人工智能被運用到軍事決策中,將會帶來多嚴(yán)重的后果?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31490

    瀏覽量

    269876
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8438

    瀏覽量

    132918

原文標(biāo)題:AI賭神升級!無懼bluff,6人局德?lián)渫陝偈澜绻谲姡?xùn)練只用了8天

文章出處:【微信號:AItists,微信公眾號:人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    FP8在大模型訓(xùn)練中的應(yīng)用

    越來越多的技術(shù)團隊開始使用 FP8 進行大模型訓(xùn)練,這主要因為 FP8 有很多技術(shù)優(yōu)勢。比如在新一代的 GPU 上,F(xiàn)P8 相對于 BF16 對矩陣乘算子這樣的計算密集型算子,NVID
    的頭像 發(fā)表于 01-23 09:39 ?71次閱讀
    FP<b class='flag-5'>8</b>在大模型<b class='flag-5'>訓(xùn)練</b>中的應(yīng)用

    璣 9400拿下AI性能榜冠軍,最強NPU引領(lǐng)手機AI應(yīng)用變革

    近兩年, AI手機端側(cè)AI應(yīng)用和AI體驗開始進入“超級加速”的時期,層出不窮的技術(shù)創(chuàng)新背后其實更離不開手機芯片的核心支持。在這股浪潮中,聯(lián)發(fā)科
    的頭像 發(fā)表于 12-30 20:09 ?161次閱讀
    <b class='flag-5'>天</b>璣 9400拿下<b class='flag-5'>AI</b>性能榜冠軍,最強NPU引領(lǐng)手機<b class='flag-5'>AI</b>應(yīng)用變革

    GPU是如何訓(xùn)練AI大模型的

    AI模型的訓(xùn)練過程中,大量的計算工作集中在矩陣乘法、向量加法和激活函數(shù)等運算上。這些運算正是GPU所擅長的。接下來,AI部落小編帶您了解GPU是如何訓(xùn)練
    的頭像 發(fā)表于 12-19 17:54 ?201次閱讀

    為什么ai模型訓(xùn)練要用gpu

    GPU憑借其強大的并行處理能力和高效的內(nèi)存系統(tǒng),已成為AI模型訓(xùn)練不可或缺的重要工具。
    的頭像 發(fā)表于 10-24 09:39 ?378次閱讀

    AI大模型的訓(xùn)練數(shù)據(jù)來源分析

    AI大模型的訓(xùn)練數(shù)據(jù)來源廣泛且多元化,這些數(shù)據(jù)源對于構(gòu)建和優(yōu)化AI模型至關(guān)重要。以下是對AI大模型訓(xùn)練數(shù)據(jù)來源的分析: 一、公開數(shù)據(jù)集 公開
    的頭像 發(fā)表于 10-23 15:32 ?962次閱讀

    如何訓(xùn)練自己的AI大模型

    訓(xùn)練自己的AI大模型是一個復(fù)雜且耗時的過程,涉及多個關(guān)鍵步驟。以下是一個詳細(xì)的訓(xùn)練流程: 一、明確需求和目標(biāo) 首先,需要明確自己的需求和目標(biāo)。不同的任務(wù)和應(yīng)用領(lǐng)域需要不同類型的AI模型
    的頭像 發(fā)表于 10-23 15:07 ?2507次閱讀

    如何訓(xùn)練ai大模型

    訓(xùn)練AI大模型是一個復(fù)雜且耗時的過程,涉及多個關(guān)鍵步驟和細(xì)致的考量。 一、數(shù)據(jù)準(zhǔn)備 1. 數(shù)據(jù)收集 確定數(shù)據(jù)類型 :根據(jù)模型的應(yīng)用場景,確定需要收集的數(shù)據(jù)類型,如文本、圖像、音頻等。 尋找數(shù)據(jù)源
    的頭像 發(fā)表于 10-17 18:17 ?1299次閱讀

    ai模型訓(xùn)練需要什么配置

    AI模型訓(xùn)練是一個復(fù)雜且資源密集的過程,它依賴于高性能的硬件配置來確保訓(xùn)練的效率和效果。 一、處理器(CPU) CPU是計算機的核心部件,負(fù)責(zé)處理各種計算任務(wù)。在AI模型
    的頭像 發(fā)表于 10-17 18:10 ?1699次閱讀

    璣9400首發(fā)端側(cè)AI訓(xùn)練,在手機上就把AI變聰明

    隨著AI技術(shù)的快速發(fā)展,聯(lián)發(fā)科通過天璣9400芯片進一步鞏固了其在手機端側(cè)AI市場的領(lǐng)導(dǎo)地位。作為璣系列最新的旗艦產(chǎn)品,璣9400不僅具備強大的
    的頭像 發(fā)表于 10-14 18:25 ?357次閱讀
    <b class='flag-5'>天</b>璣9400首發(fā)端側(cè)<b class='flag-5'>AI</b><b class='flag-5'>訓(xùn)練</b>,在手機上就把<b class='flag-5'>AI</b>變聰明

    首發(fā)端側(cè)LoRA訓(xùn)練璣9400保護隱私更懂你

    聯(lián)發(fā)科發(fā)布的璣9400無疑是智能手機芯片領(lǐng)域的一次重大革新。這款全大核SoC首次將生成式AI引入手機端,特別是在AI視頻生成和AI訓(xùn)練方面
    的頭像 發(fā)表于 10-14 17:32 ?516次閱讀
    首發(fā)端側(cè)LoRA<b class='flag-5'>訓(xùn)練</b>!<b class='flag-5'>天</b>璣9400保護隱私更懂你

    蘋果承認(rèn)使用谷歌芯片來訓(xùn)練AI

    蘋果公司最近在一篇技術(shù)論文中披露,其先進的人工智能系統(tǒng)Apple Intelligence背后的兩個關(guān)鍵AI模型,是在谷歌設(shè)計的云端芯片上完成預(yù)訓(xùn)練的。這一消息標(biāo)志著在尖端AI
    的頭像 發(fā)表于 07-30 17:03 ?760次閱讀

    AI訓(xùn)練的基本步驟

    AI(人工智能)訓(xùn)練是一個復(fù)雜且系統(tǒng)的過程,它涵蓋了從數(shù)據(jù)收集到模型部署的多個關(guān)鍵步驟。以下是對AI訓(xùn)練過程的詳細(xì)闡述,包括每個步驟的具體內(nèi)容,并附有相關(guān)代碼示例(以Python和sc
    的頭像 發(fā)表于 07-17 16:57 ?2521次閱讀

    ai大模型訓(xùn)練方法有哪些?

    AI大模型訓(xùn)練方法是一個復(fù)雜且不斷發(fā)展的領(lǐng)域。以下是ai大模型訓(xùn)練方法: 數(shù)據(jù)預(yù)處理和增強 數(shù)據(jù)清洗:去除噪聲和不完整的數(shù)據(jù)。 數(shù)據(jù)標(biāo)準(zhǔn)化:將數(shù)據(jù)縮放到統(tǒng)一的范圍。 數(shù)據(jù)增強:通過旋轉(zhuǎn)
    的頭像 發(fā)表于 07-16 10:11 ?1698次閱讀

    AI大模型訓(xùn)練成本飆升,未來三年或達千億美元

    在科技日新月異的今天,人工智能(AI)領(lǐng)域的發(fā)展正以前所未有的速度推進,其中,AI大模型的崛起尤為引人注目。然而,隨著模型參數(shù)的持續(xù)膨脹,其背后訓(xùn)練成本也呈現(xiàn)出驚人的增長態(tài)勢。近日,
    的頭像 發(fā)表于 07-11 15:06 ?606次閱讀

    AI訓(xùn)練,為什么需要GPU?

    隨著由ChatGPT引發(fā)的人工智能熱潮,GPU成為了AI大模型訓(xùn)練平臺的基石,甚至是決定性的算力底座。為什么GPU能力壓CPU,成為炙手可熱的主角呢?要回答這個問題,首先需要了解當(dāng)前人工智能(AI
    的頭像 發(fā)表于 04-24 08:05 ?1075次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>訓(xùn)練</b>,為什么需要GPU?
    主站蜘蛛池模板: 我与恶魔的h生活ova | 晚夜免费禁用十大亏亏 | 久久婷婷五月综合色情 | 国产精品亚洲专区在线播放 | 调教美丽的白丝袜麻麻视频 | 久久久伊人影院 | 欧美午夜a级精美理论片 | 国产午夜免费不卡精品理论片 | 香港论理午夜电影网 | 日本人奶水中文影片 | 中文字幕无线手机在线 | 黄得让人湿的片段 | 无码内射成人免费喷射 | 一本到2019线观看 | 国模大胆一区二区三区 | 老女人与小伙子露脸对白 | 国产精品搬运 | 伦理 电影在线观看百度影音 | 国产亚洲视频在线播放香蕉 | 久久婷五月综合色啪首页 | 国产午夜伦伦伦午夜伦 | 久久亚洲人成网站 | 青草在线在线d青草在线 | 国产精一品亚洲二区在线播放 | 双性h浪荡受bl | 国精产品一区一区三区有 | 调教女M屁股撅虐调教 | 久久视频在线视频观看天天看视频 | 日本高清免费一本视频在线观看 | 国产传媒18精品A片在线观看 | 青草国产超碰人人添人人碱 | 亚洲精品国产品国语在线试看 | 一个人免费视频在线观看 | 久久午夜一区二区 | 成人毛片免费在线观看 | 男男高h浪荡受h | 果冻传媒在线观看资源七夕 | 国产一卡在线观看完整版 | 四虎精品久久久久影院 | 欧美成人一区二免费视频 | 国产成人永久免费视频 |