《星際爭(zhēng)霸II》作為游戲玩家心目中即時(shí)戰(zhàn)略游戲的經(jīng)典之作,它的“即時(shí)”和“戰(zhàn)略”特性,使其成為深度強(qiáng)化學(xué)習(xí)和博弈決策智能算法研究的重要平臺(tái)。通過游戲研究AGI技術(shù),英國有DeepMind,美國有OpenAI,那么中國呢?
“二十年后,伴你遨游太空、探索星際的是人?還是AI?
或許是這位星際指揮官。”
《星際爭(zhēng)霸II》作為游戲玩家心目中即時(shí)戰(zhàn)略游戲的經(jīng)典之作,它的“即時(shí)”和“戰(zhàn)略”特性,使其成為深度強(qiáng)化學(xué)習(xí)和博弈決策智能算法研究的重要平臺(tái)。
包括DeepMind在內(nèi)的世界頂尖AI團(tuán)隊(duì)也在攻堅(jiān)《星際爭(zhēng)霸II》。其背后擁有一個(gè)共同的終極目標(biāo)——進(jìn)一步拓展AI邊界,并為最終達(dá)到通用人工智能(AGI)探索道路。
AI打星際有多“硬核”?
星際是有史以來電子競(jìng)技領(lǐng)域最經(jīng)典的游戲之一,也被認(rèn)為是最有挑戰(zhàn)的即時(shí)戰(zhàn)略(RTS)游戲。今天,之所以成為AI研究的主要平臺(tái)和工具,是因?yàn)槠涮N(yùn)含了下述多方面的挑戰(zhàn),一旦取得技術(shù)突破,將擁有廣泛的應(yīng)用場(chǎng)景。
那么,用AI打星際有多“硬核”?難點(diǎn)和挑戰(zhàn)在哪?
挑戰(zhàn)一:層次化的體系博弈
星際實(shí)質(zhì)上蘊(yùn)含了一套層次化的博弈體系,它包括宏觀經(jīng)濟(jì)實(shí)力的比拼、科技與兵種的相互克制、戰(zhàn)役戰(zhàn)術(shù)上的指揮對(duì)戰(zhàn)、各編隊(duì)單位的微觀操控等。如何能讓AI學(xué)會(huì)并進(jìn)行上述多層次的決策,而不是在某一層級(jí)上進(jìn)行學(xué)習(xí),是個(gè)非常大的挑戰(zhàn)。
挑戰(zhàn)二:決策空間復(fù)雜度巨大
圍棋的決策動(dòng)作空間不超過361,而星際的決策動(dòng)作空間是10的26次方,由決策時(shí)機(jī)、決策指令、決策主體、決策目標(biāo)等多維度的決策因素組合而成。
挑戰(zhàn)三:非完全信息動(dòng)態(tài)博弈
對(duì)比圍棋或者象棋等完全信息下的博弈,星際擁有“戰(zhàn)爭(zhēng)迷霧”機(jī)制,你無法在任意時(shí)刻得知對(duì)手完整的信息,必須通過主動(dòng)偵察和對(duì)手建模來推測(cè)對(duì)手策略。相對(duì)于德?lián)涞姆峭耆畔⒉┺模请H又體現(xiàn)了動(dòng)態(tài)性,上一時(shí)刻偵察所獲取的信息,下一時(shí)刻又可能變化了。
挑戰(zhàn)四:大規(guī)模多單位協(xié)作
星際的戰(zhàn)斗部分需要指揮多兵種、上百個(gè)單位進(jìn)行協(xié)作配合。相對(duì)來講,《DOTA2》、《王者榮耀》游戲AI只需要5個(gè)單位進(jìn)行協(xié)作配合。
挑戰(zhàn)五:毫秒級(jí)實(shí)時(shí)決策
星際作為即時(shí)戰(zhàn)略游戲,要和職業(yè)選手(平均每分鐘300次操作)進(jìn)行對(duì)抗,要求AI能夠在一秒鐘之內(nèi)做出多次快速?zèng)Q策,這對(duì)AI算法模型的性能、工程實(shí)現(xiàn)的效率帶來非常大的挑戰(zhàn)。
中國的“星際之王”是誰?
通過游戲研究AGI技術(shù),英國有DeepMind,美國有OpenAI,中國呢?
啟元世界希望是一個(gè)答案。
啟元世界自2017年成立,便開始基于《星際爭(zhēng)霸II》研究決策智能、開發(fā)智能體,探索AGI之路。
繼2018年5月在北大ACM總決賽期間發(fā)布基于星際的人機(jī)協(xié)作對(duì)抗賽、11月在加拿大AIIDE策略博弈研討會(huì)展示自學(xué)習(xí)戰(zhàn)術(shù)指揮官、12月獲得NeurIPS多智能體競(jìng)賽Learning組冠軍之后,2019年以來啟元星際指揮官又實(shí)現(xiàn)了重要突破。
目前啟元“星際指揮官”(簡(jiǎn)稱“星指”),已能夠在全場(chǎng)游戲(full game)中與業(yè)余高手過招較量,從宏觀到微觀博弈上展現(xiàn)出若干智能行為:如因地制宜地發(fā)展經(jīng)濟(jì)與科技、有條不紊地安排建造與布局、審時(shí)度勢(shì)地進(jìn)行偵察和攻擊、指揮上百個(gè)單位進(jìn)行協(xié)同作戰(zhàn)等。
啟元與星際指揮官成長歷程
“星指”要挑戰(zhàn)職業(yè)玩家,你敢不敢來?
實(shí)現(xiàn)高水平的《星際爭(zhēng)霸II》對(duì)弈,代表了AI在復(fù)雜電子游戲中取得的重大突破。但對(duì)于啟元世界來說,星際AI的作用遠(yuǎn)不止于打打游戲如此簡(jiǎn)單,最終的目標(biāo)是將其中研發(fā)的技術(shù)應(yīng)用到現(xiàn)實(shí)世界,從博弈決策到網(wǎng)絡(luò)調(diào)度,從數(shù)字娛樂到機(jī)器人控制,都不乏應(yīng)用場(chǎng)景。
啟元“星際指揮官”今年9月正式在北京亮相,開始挑戰(zhàn)職業(yè)玩家!屆時(shí)將舉辦一系列線下比賽和線上直播,現(xiàn)場(chǎng)抽取星際發(fā)燒友與"星指"面對(duì)面切磋,感受AI智能體的激情與魅力,感興趣的朋友可以點(diǎn)擊閱讀原文報(bào)名哦~
-
AI
+關(guān)注
關(guān)注
87文章
30171瀏覽量
268428 -
強(qiáng)化學(xué)習(xí)
+關(guān)注
關(guān)注
4文章
266瀏覽量
11216 -
DeepMind
+關(guān)注
關(guān)注
0文章
129瀏覽量
10819
原文標(biāo)題:硬核!繼DeepMind之后,首個(gè)中國AI挑戰(zhàn)《星際爭(zhēng)霸II》
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論