衡阳派盒市场营销有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI棋牌應(yīng)用的現(xiàn)實意義

bzSh_drc_iite ? 來源:YXQ ? 2019-07-29 11:17 ? 次閱讀

AI在棋牌類游戲的應(yīng)用,將促進博弈決策的研究,以棋牌類AI應(yīng)用為基礎(chǔ)的相關(guān)AI博弈工具,在經(jīng)濟金融領(lǐng)域的風險預(yù)測、軍事領(lǐng)域的戰(zhàn)局預(yù)測等方向有著廣泛的應(yīng)用前景。

半個多世紀以來,棋牌類游戲一直是人工智能(AI)發(fā)展創(chuàng)新的舞臺。利用AI在被視作智力游戲的棋牌中打敗人類,也一直是AI研究所追求的目標。從1997年IBM的超級電腦“深藍”擊敗國際象棋世界冠軍卡斯帕羅夫,到2016年谷歌開發(fā)的AI機器人AlphaGo戰(zhàn)勝圍棋世界冠軍李世石,AI在棋牌類比賽中屢獲突破。2019年7月,卡耐基梅隆大學與Facebook公司共同開發(fā)的AI機器人“Pluribus”,在無限制德州撲克6人對決比賽中戰(zhàn)勝5名專家級人類玩家,AI在德州撲克戰(zhàn)場再下一城。

Pluribus概況

Pluribus與人類的比賽分為兩種模式:1個AI與5個人類玩家和5個AI與1個人類玩家,Pluribus在這兩種模式中都取得了勝利。而為了戰(zhàn)勝人類,Pluribus在策略、算法和能耗上進行了多次優(yōu)化。

Pluribus研發(fā)的核心策略是運用改進版本的蒙特卡洛遺憾最小化算法(Monte Carlo Counter factual Regret Minimization,MCCFR),通過自我博弈的方式學習。Pluribus首先隨機地選擇玩法,通過蠻力計算得到收斂的結(jié)果,并對這些行動擬合概率分布,使得其實力在不斷自我博弈中逐步變強。在整個學習過程中,AI機器人和自己進行對戰(zhàn),不使用任何人類游戲數(shù)據(jù)作為輸入。

算法上,為了解決6名玩家的額外復(fù)雜性,Pluribus整合了新的在線搜索算法,使AI能夠在游戲中向前預(yù)測并決定下一步該做什么,這種機制被稱為搜索功能。以往的棋牌類算法的每一步?jīng)Q策都需要計算到游戲結(jié)束,而在線搜索算法只需搜索前面的幾步即可。此外,Pluribus還利用了速度更快的新型self-play非完美信息游戲算法。基于上述兩種算法,使得憑借極少的處理能力和內(nèi)存來訓(xùn)練Pluribus成為可能。

能耗上,研究人員使用一個64核的服務(wù)器,利用不大于512GB的內(nèi)存,在8天時間里完成了Pluribus的自我博弈訓(xùn)練,其成本大約為150美元,同其他自我對弈的AI研究相比,成本極低。而且算法上的進步,讓研究人員可憑借較少的資源消耗實現(xiàn)極大的性能提升。

撲克AI和其他棋牌類AI的對比

撲克AI與棋類AI的基本原理相同,都采用蒙特卡洛搜索樹算法作為基本算法,不依賴人類所提供的策略,在不斷迭代的過程中實現(xiàn)自我學習。不同的是,棋類游戲中的棋子都展現(xiàn)在棋盤上,結(jié)果種類有限,所有的結(jié)果都是可推算的,這種情況被稱為“完美信息博弈”;牌類游戲中無法知道對手的底牌,含有隱藏信息,結(jié)果可能是多樣的,導(dǎo)致其計算難度和計算量大大增加,被稱為“不完美信息博弈”。

棋類AI

棋類游戲包括西洋雙陸棋、國際象棋、圍棋等,比賽中所有的信息和決策公開,并且游戲?qū)τ谕婕襾碚f只有贏或輸兩種可能的結(jié)果,從某種意義上說,這使得訓(xùn)練AI變得更容易。棋類在理論上可通過計算機模擬出每一種可能的情況,從而進行完美信息動態(tài)博弈。這類完美信息博弈中AI機器人往往使用實時搜索。例如,當模型在決定下一步該如何走時,國際象棋AI通常會考慮以后的一些移動步驟,直到算法的前瞻到達深度上限。而圍棋的棋盤變化可能性比可觀測宇宙范圍的原子總數(shù)還多,因此圍棋AI主要通過深度學習技術(shù)訓(xùn)練用于判斷結(jié)果輸贏概率的價值網(wǎng)絡(luò),來增強AI對弈能力。

麻將AI

麻將AI的策略需要更多地增加得點的期望值,盡量增大和大牌的可能性,同時盡量避免對手的大牌點炮,這一打牌策略顯然是有最優(yōu)解的。為了有更大的可能性和大牌,AI需要通過手牌和棄牌池里的牌,計算進張(摸到有效牌)和鳴牌(吃、碰、杠)使手牌有進展的概率,進而計算和牌得分的期望值。目前最強的麻將AI機器人是日本東京大學開發(fā)的“暴打”。

撲克AI

以德州撲克為例,由于在游戲中,玩家無法獲取已發(fā)生事件的全部信息(如對手的底牌等),因此這個游戲?qū)儆凇安煌昝佬畔ⅰ保↖mperfect Information)類游戲。德州撲克一直是人工智能領(lǐng)域最難以攻克的重大問題之一,因為和棋類游戲不同,撲克AI必須推理隱藏的信息,并慎重平衡自己策略。同時,相比棋類比賽,在撲克游戲中需要使用Bluff(嚇唬)等更多游戲策略。

在Pluribus之前,AI機器人曾在兩個參與者的完美信息零和博弈中取得了多次引人注目的成功,但大多數(shù)真實世界中的策略交互都涉及隱藏信息,且并非兩個參與者的零和博弈。Pluribus的成功表明,在復(fù)雜的多參與者場景中,基于自我博弈和搜索算法的AI能夠獲得很好的效果。

AI棋牌應(yīng)用的現(xiàn)實意義

Pluribus提出了在大型狀態(tài)空間、隱藏信息中有效地解決博弈論推理挑戰(zhàn)的方法,所開發(fā)出的技術(shù)很大程度上獨立于撲克領(lǐng)域,可用于大量不完美信息博弈。Pluribus處理的諸多問題,與真實世界中的通用問題相對應(yīng),“不知道對手的牌”對應(yīng)現(xiàn)實中的“不完整信息”,“下注策略和由此帶來的結(jié)果”對應(yīng)現(xiàn)實中的“風險管理”,“確認對手的模式,并進行利用”對應(yīng)現(xiàn)實中的“智能體建模”,“Bluffing(撲克中的恐嚇技巧)”對應(yīng)現(xiàn)實中的“欺騙”,“處理對手欺騙的牌”對應(yīng)現(xiàn)實中的“不可靠信息”。

事實上,棋牌類游戲的本質(zhì)是競爭和對抗,由游戲規(guī)則定義其目標(評價標準),玩家使用各種策略達成目標,其中涉及數(shù)量可觀的博弈過程。AI在棋牌類游戲的應(yīng)用,將促進博弈決策的研究。以棋牌類AI應(yīng)用為基礎(chǔ)的相關(guān)AI博弈工具,在經(jīng)濟金融領(lǐng)域的風險預(yù)測、軍事領(lǐng)域的戰(zhàn)局預(yù)測等方向有著廣泛的應(yīng)用前景。

在經(jīng)濟金融領(lǐng)域,不論對經(jīng)濟發(fā)展的總體趨勢預(yù)測,還是銀行、保險、股市等細分行業(yè)的風險模型建立,都需要依靠大量“不完美信息”來決策。AI博弈工具可通過處理不完美信息來獲得最佳決策。政府可利用AI博弈工具對社會行業(yè)的未來趨勢進行預(yù)測,判斷供需關(guān)系,合理有序引導(dǎo)行業(yè)健康發(fā)展。銀行、保險公司可利用AI工具判斷短期行業(yè)走勢,高效評估企業(yè)風險,以決定是否達成交易。

在軍事領(lǐng)域,具有自主學習功能的AI博弈工具與兵棋推演相結(jié)合,將爆發(fā)出極強的戰(zhàn)斗力,幫助軍隊獲取制勝先機。從上個世紀70年代初開始,美國陸軍就按照“全自動兵棋”概念建立起“地面作戰(zhàn)模擬系統(tǒng)”。20世紀90年代初,美軍在海灣戰(zhàn)爭爆發(fā)前就使用兵棋游戲?qū)φ麄€戰(zhàn)爭進行了推演,而戰(zhàn)爭的過程幾乎和美軍事前的推演如出一轍。隨著技術(shù)的進步,算法不斷成熟使得算力需求進一步降低,同時計算技術(shù)朝著系統(tǒng)微型化和處理高速化方向發(fā)展,具備超強自主學習和計算能力的AI系統(tǒng)與作戰(zhàn)模擬系統(tǒng)相結(jié)合,將提升對戰(zhàn)局的預(yù)測和把控。未來,AI系統(tǒng)將有希望直接與戰(zhàn)場指揮系統(tǒng)對接,其快速戰(zhàn)局推演能力、高效制定作戰(zhàn)方案的能力,將主導(dǎo)戰(zhàn)爭的勝負走向。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    211

    文章

    28642

    瀏覽量

    208424
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31521

    瀏覽量

    270339

原文標題:人工智能技術(shù)在棋牌中的應(yīng)用“Pluribus”及其現(xiàn)實意義

文章出處:【微信號:drc_iite,微信公眾號:全球技術(shù)地圖】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    醫(yī)院能耗監(jiān)測節(jié)能管理系統(tǒng)方案

    的能源監(jiān)測與節(jié)能管理有重要的現(xiàn)實意義。 醫(yī)院的主要能耗包括水、電、天然氣、暖氣等,主要來源于醫(yī)療設(shè)備、燈光照明、數(shù)據(jù)機房、動力設(shè)備以及供水用暖等民生設(shè)施。通過將這些能源數(shù)據(jù)采集起來,進行監(jiān)測和管理,能夠?qū)崿F(xiàn)
    的頭像 發(fā)表于 01-08 14:09 ?108次閱讀

    固定式雷達波在線測流系統(tǒng):保障河流防汛安全的 “流量衛(wèi)士”

    固定式雷達波在線測流系統(tǒng)作為保障河流防汛安全的 “流量衛(wèi)士”,具有重要的現(xiàn)實意義和廣泛的應(yīng)用前景。它以其高精度、實時在線、非接觸式測量等特點,為河流防汛、水資源管理、水利工程管理和生態(tài)環(huán)境保護等方面提供了有力的技術(shù)支持。
    的頭像 發(fā)表于 12-04 17:45 ?220次閱讀
    固定式雷達波在線測流系統(tǒng):保障河流防汛安全的 “流量衛(wèi)士”

    人工智能與計算產(chǎn)業(yè)生態(tài)峰會暨哈爾濱新質(zhì)生產(chǎn)力峰會圓滿落幕

    以“數(shù)智龍江·向新而行”為主題的人工智能與計算產(chǎn)業(yè)生態(tài)峰會暨哈爾濱新質(zhì)生產(chǎn)力峰會成功舉辦。新質(zhì)生產(chǎn)力是以科技創(chuàng)新為主導(dǎo)的生產(chǎn)力,對新時代新征程推動高質(zhì)量發(fā)展、推進現(xiàn)代化進程具有重大現(xiàn)實意義和深遠
    的頭像 發(fā)表于 12-04 11:18 ?325次閱讀

    一種混合顏料光譜分區(qū)間識別方法

    彩繪顏料的分析是科技考古與文物保護研究的重要內(nèi)容,對探索古代顏料技術(shù)發(fā)展和科學保護文物有著重要的學術(shù)價值和現(xiàn)實意義,傳統(tǒng)的顏料識別算法大多針對彩繪文物表面的純凈顏料,對文物表面存在混合顏料的識別準確度較差。化學分析需
    的頭像 發(fā)表于 12-02 16:22 ?143次閱讀
    一種混合顏料光譜分區(qū)間識別方法

    揭秘那些賺錢的無人自助場景!涂鴉IoT Core賦能無人棋牌房案例應(yīng)用

    隨著棋牌與臺球領(lǐng)域的深度探索與持續(xù)創(chuàng)新,科學技術(shù)的不斷突破與創(chuàng)新,雀江湖無人自助棋牌室解決方案將前沿的智能技術(shù)、人工智能算法與云計算能力深度融合,為行業(yè)樹立了新的技術(shù)標桿。涂鴉智能的云開發(fā)者平臺為
    的頭像 發(fā)表于 11-16 01:04 ?354次閱讀
    揭秘那些賺錢的無人自助場景!涂鴉IoT Core賦能無人<b class='flag-5'>棋牌</b>房案例應(yīng)用

    淺談光伏-直流智能充電樁有序充電策略與應(yīng)用效果

    光伏-直流智能充電樁的有序充電策略具有重要的現(xiàn)實意義和應(yīng)用價值。通過合理的規(guī)劃和管理,可以充分發(fā)揮其優(yōu)勢,為電動汽車用戶提供有效、便捷、環(huán)保的充電服務(wù),同時也為能源轉(zhuǎn)型和可持續(xù)發(fā)展做出貢獻。
    的頭像 發(fā)表于 11-11 13:48 ?382次閱讀
    淺談光伏-直流智能充電樁有序充電策略與應(yīng)用效果

    AI云平臺建設(shè)意義

    AI云平臺,作為AI技術(shù)與云計算深度融合的產(chǎn)物,其建設(shè)不僅標志著技術(shù)創(chuàng)新的又一高峰,更蘊含著對社會經(jīng)濟發(fā)展、產(chǎn)業(yè)升級、創(chuàng)新生態(tài)構(gòu)建等多方面的深遠意義
    的頭像 發(fā)表于 10-12 09:52 ?211次閱讀

    智慧樓宇能源監(jiān)測節(jié)能管理解決方案

    )能耗總量為19.1億tce,占全國能源消費的36.3%。因此,實現(xiàn)智慧樓宇節(jié)能管理依舊具有重要價值和現(xiàn)實意義。 傳統(tǒng)的能耗監(jiān)測手段主要依靠人工抄表和巡檢維護,集中匯總管理存在明顯的遲滯,出現(xiàn)異常故障無從得知,加上難以快速查找搜索并進行
    的頭像 發(fā)表于 09-14 10:54 ?308次閱讀

    帶你認識什么是微電網(wǎng)-企業(yè)微電網(wǎng)能效管理平臺的未來發(fā)展前景

    01 怎么來的? ? ?微電網(wǎng) 微電網(wǎng)為什么走進大家視線?眾所周知,化石能源是不可再生的,能夠利用太陽能、風能這類取之不盡的能源發(fā)電,對能源的可持續(xù)發(fā)展和環(huán)保都有著巨大的現(xiàn)實意義!然而,太陽能、風能
    的頭像 發(fā)表于 08-28 15:18 ?426次閱讀

    工業(yè)控制系統(tǒng)安全性分析與對策

    中斷、設(shè)備損壞、數(shù)據(jù)泄露等嚴重后果,甚至威脅到國家安全和公共利益。因此,對工業(yè)控制系統(tǒng)的安全性進行深入分析,并提出相應(yīng)的對策,具有重要的現(xiàn)實意義和戰(zhàn)略價值。
    的頭像 發(fā)表于 06-28 18:07 ?1297次閱讀

    基于無人機高光譜遙感的荒漠化草原地物分類研究1.0

    本研究利用無人機高光譜遙感技術(shù)采集荒漠化草原遙感數(shù)據(jù),運用人工智能圖像分類技術(shù),解決荒漠化草原地物分類與識別問題,具有自動化程度高、分類精度高等特點,是草原退化調(diào)查監(jiān)測行之有效的方法,對于荒漠化草原生態(tài)保護具有重要的現(xiàn)實意義
    的頭像 發(fā)表于 06-12 11:48 ?443次閱讀
    基于無人機高光譜遙感的荒漠化草原地物分類研究1.0

    變頻器產(chǎn)生的干擾及解決方案

    隨著工業(yè)自動化技術(shù)的飛速發(fā)展,變頻器作為現(xiàn)代電力傳動系統(tǒng)的核心設(shè)備,廣泛應(yīng)用于電機調(diào)速、節(jié)能降耗等領(lǐng)域。然而,變頻器在運行過程中會產(chǎn)生各種電磁干擾,對周圍設(shè)備、系統(tǒng)甚至整個電網(wǎng)的穩(wěn)定運行構(gòu)成威脅。因此,研究變頻器產(chǎn)生的干擾及其解決方案具有重要的現(xiàn)實意義和工程應(yīng)用價值。
    的頭像 發(fā)表于 06-11 11:43 ?2353次閱讀

    應(yīng)用DMAIC降低汽車線束開線工序質(zhì)量損失

    DMAIC(定義、測量、分析、改進、控制)方法,對汽車線束開線工序進行持續(xù)改進,降低質(zhì)量損失,提升生產(chǎn)效率,具有重要的現(xiàn)實意義。 首先,我們要明確定義問題。汽車線束開線工序中的質(zhì)量損失主要表現(xiàn)在線束切割不準確、端子壓
    的頭像 發(fā)表于 05-30 10:30 ?448次閱讀

    新能源汽車電池熱管理中陶瓷材料的應(yīng)用

    能、耐高溫性能和抗腐蝕性能,并且在電池外殼隔熱層、電池內(nèi)部的導(dǎo)熱材料、電池熱散封裝和電池熱板設(shè)計等領(lǐng)域具有廣泛的應(yīng)用。本文對于新能源汽車的可持續(xù)發(fā)展具有重要的現(xiàn)實意義
    的頭像 發(fā)表于 04-12 08:10 ?1064次閱讀
    新能源汽車電池熱管理中陶瓷材料的應(yīng)用

    淺談能耗系統(tǒng)在節(jié)能降耗的應(yīng)用

    。防止相關(guān)的資源過度使用問題。而對于相關(guān)的節(jié)能降耗工作來說。通過合理的使用用電計量方式。簡單來說在整依的使用過程中使用用電計量方式,能夠滿足其現(xiàn)實意義,對使用的相關(guān)電量都進行整體的計算,然后在按照具體規(guī)定來對電量資源進
    的頭像 發(fā)表于 02-20 15:27 ?417次閱讀
    淺談能耗系統(tǒng)在節(jié)能降耗的應(yīng)用
    金沙百家乐的玩法技巧和规则| 全讯网365| 德晋百家乐官网的玩法技巧和规则 | 百家乐官网赢钱密籍| 信誉棋牌游戏| 大发888娱乐城rfgjdf888bg| 红桃K百家乐的玩法技巧和规则 | 百家乐缆的打法| 状元百家乐官网的玩法技巧和规则 | 天博百家乐娱乐城| 网络百家乐怎样出千| 百家乐网上投注网站| 阴宅风水24山分金| 德州扑克游戏下载| 德州扑克官方下载| 百家乐博娱乐网赌百家乐的玩法技巧和规则| 线上百家乐玩法| 百家乐折桌子| 百家乐赌博机假在哪里| 百家乐之三姐妹赌博机| 玩百家乐必赢的心法| 百家乐投住系统| 百家乐的战术| 永利高官网| 济州岛百家乐的玩法技巧和规则| 现场百家乐能赢吗| 老虎机破解器| bet365.com| 皇冠网址推介| 株洲市| 百家乐官网娱乐皇冠世界杯| 现金百家乐官网攻略| 百家乐官网画哪个路单| 月亮城百家乐官网的玩法技巧和规则 | 百家乐官网可以破解吗| 风水学坐向24山| 澳门百家乐娱乐城打不开| 百家乐官网赌博怎么玩| 网上百家乐官网怎么赌能赢钱| 传奇百家乐官网的玩法技巧和规则| 克拉克百家乐下载|