爐石傳說哪個職業最imba?有人跑了一通AI模型,反正方士最弱

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

機器之心報導

機器之心編輯部

  • 論文:Evolving the Hearthstone Meta(2019 IEEE Conference on Games)

  • 論文地址:https://arxiv.org/abs/1907.01623v1

  • 在這項研究中,研究者們分析了不同策略下不同牌組之間互相攻防的勝率,然後提出對發生變換之前和之後的表現進行比較,從而提升或削弱不同的卡牌。

    之後,借助於進化算法,研究者探索牌組之間勝率同為 50% 時卡牌屬性出現哪些組合變換。因此,他們接著將使用的進化算法擴展到多目標解決方案,同時對現有卡牌做出最小程度的變換,從而盡可能不影響遊戲整體。最後,他們提出並評估了一些指標,從而得出哪些卡牌做到了預期的平衡變換。

    什麼是爐石傳說

    爐石傳說是一款由暴雪遊戲公司開發的集換式卡牌遊戲,在 2014 年公開,其中有超過 2000 張卡牌。在遊戲中,兩位玩家相互出牌,目的在於將對手的生命值減少到 0。開局前,玩家選擇 30 張牌,組成一副。這副牌是玩家在遊戲中能夠使用的牌組。在每輪抽牌的時候,牌隨機從牌組中抽取。一般來說,玩家都希望能夠抽取出一組牌的組合,這些組合能夠最大限度地獲勝。有時候,暴雪也會適當修改一些牌。這個遊戲能夠經久不衰,依然受到歡迎,無疑是因為暴雪的投入和對遊戲的調整。

    爐石傳說哪個職業最imba?有人跑了一通AI模型,反正方士最弱 遊戲 第1張

    爐石傳說的遊戲一部分界面。

    現在談談爐石卡牌的設計

    有著無數移動的組件的遊戲通常是複雜的系統。在這樣的遊戲中設計師需要提供很多遊戲目標的選擇,如牌、技能或裝備,使得玩家可以用很多方式對這些目標進行組合。

    然而,在競賽類的遊戲中,為了獲勝,玩家通常會專注於收集特定的目標組合,使其獲勝的概率最大化。在角色屬性不平衡的遊戲中,玩家會發現很多簡單而不可戰勝的策略,或者他們不再玩某種角色。這樣的遊戲會很快崩潰,使得有經驗的玩家喪失興趣。

    正是因為爐石傳說有百萬玩家,因此新卡牌的公布和已有卡牌的修改會讓玩家們很快發現角色屬性不平衡的漏洞。即使是一張不平衡的牌也會讓元遊戲(metagame)——即受歡迎的牌組和對其他牌組的勝率,發生很大改變。

    一個平衡的元遊戲則能夠讓很多有競爭力的牌組相互對抗。雖然暴雪已經使用了結合深度領域知識、內部遊戲測試和元遊戲數值可視化的方法,但是在一個有著 2000 張卡牌的遊戲中,他們依然需要計算工具進行輔助。本文便提出了相關研究。

    AI 告訴你怎麼設計爐石

    那麼機器學習該怎樣幫助設計卡牌遊戲呢?這篇論文探索了一些方法以計算集換式卡牌遊戲的角色平衡,其主要關注的是《爐石傳說》。這篇論文採用的方法當然同樣也能應用於其它卡牌遊戲,即玩家能從一大堆遊戲物體中選擇一些以構建自己的角色。

    這篇論文討論的遊戲角色平衡主要分為三個方向。其中第一個方法基於簡化假設,即一副牌組應該近似等價於其它牌組。對於第一個實驗,研究者通過進化算法將一組卡牌的變換編碼為獨立的個體(進化算法中的 individual),其中好的變換表示兩組牌有相等的勝率。這是一種單目標最優化問題,其中個體的適應度依賴於每組牌到底與 50% 的勝率有多近。

    雖然在遊戲發行後,我們為了達到角色平衡需要對複雜的遊戲做一些改變,但即使卡牌有很小的改變都會對元遊戲產生比較大的影響。此外,卡牌的這些改變通常要求玩家重新思考之前的策略,在《爐石傳說》中,他們還需要獲取尚未收集到的卡牌。

    實驗 2 是一個多目標最優化問題,它基本的思路與實驗 1 是一樣的,然而實驗 2 會添加一個額外的目標函數以最小化卡牌角色的改變。最後實驗 3 探索了針對特定紙牌的角色平衡效果,它關注單組卡牌,並首先排序卡牌以決定如果玩家打這副牌會有多大的勝率。

    最後,在這篇論文中,研究者考慮的角色平衡主要有以下幾個屬性,算法會對其中一個或多個卡牌的屬性進行增加或降低。

    • 消耗:打每張牌所需的魔法值;

    • 攻擊:攻擊是隨從卡與武器卡的屬性,它展示了每次攻擊造成的傷害;

    • 生命:生命值是隨從卡的屬性,它展示了仆從在被摧毀前能承受多少傷害;

    • 耐久度:它是武器卡的屬性,展示了武器能用的次數。

    一般而言,魔法消耗的增加或攻擊與生命值的降低是削弱,而魔法消耗的降低或攻擊與生命值的增加是增強。一張卡牌有這些及其它一些屬性定義,它們總體上遵循角色平衡的策略。如果算法能自動構建角色平衡的各種屬性組合,那不就能幫助設計遊戲了嗎?

    實驗結果

    雖然之前的一些方法探索了可能出現的牌組空間,並創建了有競爭力的牌組,本文研究了卡牌屬性的微小變化對牌組元性能的影響,其中元性能是通過相對於其他進化牌組的平均勝率來衡量。

    • 實驗 1 旨在通過進化搜尋來最大化元遊戲中角色的平衡,其中基因序列以整數向量的方式來表示卡牌的屬性變化;

    • 由於遊戲中玩家保持卡牌的一致性非常重要,實驗 2 探索了保持元遊戲中角色平衡的最小變化;

    • 實驗 3 進一步將卡牌空間與需要削弱或加強的目標卡牌隔離開來,從而在保持元遊戲角色平衡的同時使得變化最小。

    此前,Fontaine 等人總結出了獵人、聖騎士、術士等職業的 12 個牌組,並在兩個不同牌組的對決進化中運用到了攻擊和控制策略。進化後的牌組可以使用基本級和經典卡牌。

    然後,研究者決定評估 12 個牌組彼此之間的性能,以兩兩對決的形式衡量。如下表 1 所示,每組對決進行了 10000 次。有意思的是,啟發式的遊戲玩法對牌組性能具有重大影響:當利用了控制啟發式(control heuristic)時,所有牌組表現更好。

    爐石傳說哪個職業最imba?有人跑了一通AI模型,反正方士最弱 遊戲 第2張

    12 個牌組在一萬場對決中的比賽結果。

    上表展示了僅考慮彼此對決時三個卡組的勝率。研究人員將這種由三個套牌或在隨後實驗中演變出的套牌進行比賽的方式稱為「小自對弈」。原始的 12 個牌組被稱為「原始元」。

    爐石傳說哪個職業最imba?有人跑了一通AI模型,反正方士最弱 遊戲 第3張

    表 2:在小自對弈中每個牌組的勝率。

    爐石傳說哪個職業最imba?有人跑了一通AI模型,反正方士最弱 遊戲 第4張

    進化算法對於爐石傳說的理解似乎和目前大家理解的水平非常接近。這一研究的論文《Evolving the Hearthstone Meta》前一陣也在IEEE遊戲會議(CoG 2019)上進行了宣講。不知未來的爐石傳說中,術士能否擺脫墊底的命運?

    本屆 NeurIPS,機器之心為讀者們精心策劃了NeurIPS 2019 專題,包括線上分享、論文解讀、現場報導等內容。這是機器之心 NeurIPS 2019 線上分享的第一期,我們邀請到了清華博士後黃文炳為我們介紹他們被大會接收的一篇 Spotlight 論文。

    爐石傳說哪個職業最imba?有人跑了一通AI模型,反正方士最弱 遊戲 第5張

    About 尋夢園
    尋夢園是台灣最大的聊天室及交友社群網站。 致力於發展能夠讓會員們彼此互動、盡情分享自我的平台。 擁有數百間不同的聊天室 ,讓您隨時隨地都能找到志同道合的好友!