英國人工智慧公司Deepmind開發了一款名為「AlphaStar」的人工智慧軟體,於2019年1月,在暴雪娛樂遊戲公司(Blizzard Entertainment)旗下的即時戰略遊戲《星海爭霸2》(StarCraft II)中,與職業戰隊「Liquid」的明星選手「TLO」和「MaNa」對戰,並取得10:1的壓倒性勝利;《星海爭霸2》10日時在官方網站與推特(Twitter)同步公開,表示歐洲區的玩家將有機會在天梯(暴雪排名對戰系統)上遇到AlphaStar,並與之對戰。
StarCraft update! As part of ongoing scientific research into artificial intelligence, players can now opt-in for the chance to be matched against experimental versions of DeepMind's StarCraft II agent, AlphaStar, on the competitive ladder.
— StarCraft (@StarCraft) July 10, 2019
Learn more: https://t.co/xgW1RLaBCZ pic.twitter.com/ac6YzPkMEH
根據暴雪的官方公告,AlphaStar將進入歐洲伺服器的1對1天梯,測試是否有其他缺陷以及提升性能,這項開發能在日後幫助提升遊戲中電腦玩家的強度,甚至能讓電腦戰隊擔任教練或其他練習位置,這也是Google團隊所有AI實驗中重要的一項測試。
公告內容顯示,玩家可以在遊戲頁面自由選擇要不要與AlphaStar進行對戰,而AlphaStar將會匿名進入天梯排位,與AlphaStar的對戰勝負會正常影響玩家積分,玩家也無從知道和自己對陣的是否是AlphaStar。本次測試中AlphaStar將會隨機使用遊戲中的人類(Terran)、蟲族(Zerg)、神族(Protoss)三個種族,而不是像年初時只支援PvP對戰。
有些玩家可能開始擔心,就連TLO和MaNa兩位高手都被AlphaStar狂電,一般業餘玩家要怎麼與之對抗,對此,暴雪也提到,AlphaStar本身已經經過了足夠的測試比賽,因此不會再從天梯對戰中學習,所以至少AlphaStar不會在這波測試中繼續變強了;系統同時也會將AlphaStar的每分鐘操作數(APM)和視野範圍限制在正常人類玩家的標準內。
Deepmind,在2014年開發出人工智慧圍棋軟體「AlphaGo」,擊敗多名世界知名職業棋士,還獲得中國與韓國棋院授予九段段位,聲名大噪。2018年又開發出「AlphaZero」,將演算法自圍棋延伸到將棋與西洋棋。2019年發表「AlphaStar」以10:1的比數戰勝世界頂尖的職業《星海》玩家。
AlphaStar是深度強化學習系統的一種應用,把遊戲視為長串列建模學習工作的強化學習AI,經過神經網路計算後再匯出遊戲執行指令;AlphaStar以模仿學習的模型快速學習高級玩家的策略和微操(Micro Control),再重複進行自我對戰,不斷提升水準。