「最終,比賽結(jié)束的哨聲響起,各位觀眾,來自中國的WeKick足球團(tuán)隊(duì),獲得了本次挑戰(zhàn)賽的冠軍,讓我們恭喜他們。」
恩等一下,中國足球隊(duì)?奪冠?你沒看錯,在AI世界里,來自中國的足球團(tuán)隊(duì)WeKick,這次沖出了亞洲,在世界的舞臺上,大放異彩。
他們獲得冠軍的這次賽事由Google Research和英超曼城足球俱樂部聯(lián)合舉辦,是信息學(xué)國際性挑戰(zhàn)賽舉辦平臺Kaggle上的一項(xiàng)AI足球挑戰(zhàn)賽,全球一共有1138只隊(duì)伍參加。
經(jīng)過激烈的角逐,最終,WeKick的賽事積分達(dá)到了1785.8分,這一優(yōu)異成績讓他們在獲得冠軍的同時,也將其他競爭者遠(yuǎn)遠(yuǎn)地甩在了身后。
尤其值得一提的是,WeKick足球隊(duì)的戰(zhàn)斗表現(xiàn)和戰(zhàn)斗精神都可圈可點(diǎn),最后一場比賽中,在落后兩球的不利情況下,他們連進(jìn)三球,最終實(shí)現(xiàn)了大逆轉(zhuǎn)。
接下來,就讓我們看看這場比賽,以及AI足球隊(duì)是如何踢球的。
連進(jìn)三球,成功逆轉(zhuǎn)
這場「AI操控足球的對抗」,是借助Google Research Football的平臺進(jìn)行的。這個平臺,其實(shí)就是足球控制類游戲。
不過,在AI眼中的對抗,就樸實(shí)無華了許多,數(shù)據(jù)的堆疊和展示,變成了這個樣子:
比賽中,我國的WeKick是紅色一方,對手SaltyFish是藍(lán)色一方,他們背后的數(shù)字,代表的是控制球員的球衣號碼,而足球,則是那個白色字母B。
好的,比賽開始,讓我們回到比賽現(xiàn)場。
對陣的雙方,分別是WeKick和SaltyFish 。在派出的隊(duì)員上,對陣的雙方數(shù)值一樣,是無差別的。此外,雙方也都沒有替補(bǔ)隊(duì)員。
開場第一次進(jìn)攻,SaltyFish通過三腳「傳球」,便攻破了WeKick的球門。這進(jìn)球,來得也太快了。
之后,SaltyFish在另外一次進(jìn)攻中,雖然第一次射門被「撲出」,但是,比分還是進(jìn)一步擴(kuò)大了。
情況似乎有些糟糕,因?yàn)閃eKick目前已經(jīng)0比2落后了。
不過,倒也不用擔(dān)心,在一次「角球」中,WeKick扳回了一分。
在中場結(jié)束前,WeKick也通過一次精彩的「團(tuán)隊(duì)配合」,成功將比分扳平。
最后,在70分鐘左右,WeKick利用一腳遠(yuǎn)射,成功反超了比分。最終,比賽也以這個比分結(jié)束了。
「傳球」、「撲救」、「團(tuán)隊(duì)配合」、「遠(yuǎn)射」等等。這些正常足球場上會發(fā)生的操作,AI在游戲中操作起來也是嫻熟無比。
這種操作技術(shù)和配合,要換做我啊,那肯定是隨隨便便......也辦不到的啊。
那么,問題來了,這個如此強(qiáng)大的WeKick,又是何方神圣?
這個WeKick,究竟是個啥?
實(shí)不相瞞,這個WeKick的真面目,其實(shí)就是:「絕悟」。是的,不用懷疑,就是王者榮耀里面的那個AI絕悟。
簡單理解的話,「絕悟」,是AI的一種底層架構(gòu)與方法。
在王者榮耀的數(shù)據(jù)去訓(xùn)練的話,就是王者榮耀里的那個全英雄池的「絕悟完全體」,而如果用足球的數(shù)據(jù)去訓(xùn)練,就是這次比賽的「WeKick」。
在賽后總結(jié)中,「絕悟」的研究團(tuán)隊(duì)向大家揭秘了這個AI背后的秘密。它的出現(xiàn),一共可以分為三步:
首先,是通過強(qiáng)化學(xué)習(xí)和自博弈(Self-Play),從零開始訓(xùn)練模型。
利用這個方法進(jìn)行模型訓(xùn)練,是很常見的操作,本屆比賽中的多數(shù)參賽球隊(duì),都采取了這個方法。
不過,對于足球運(yùn)動,如果只由進(jìn)球與否來決定成敗的話,其實(shí)并不利于模型的訓(xùn)練。于是,「絕悟」的研究團(tuán)隊(duì)在價值估計(獎勵模式)上,進(jìn)一步進(jìn)行細(xì)化。
比如:將攔截、出界、越位、過人、控球、傳球等各方面都納入考量,當(dāng)然,進(jìn)球這個最重要的評價標(biāo)準(zhǔn)也在其中。
評價標(biāo)準(zhǔn)多樣化之后,AI在訓(xùn)練過程中能更快得到反饋,然后進(jìn)行下一步操作。
簡單來說,類似于將一整份試卷細(xì)分成了不同的試題,然后制定了一套評審標(biāo)準(zhǔn)。AI,也需要先從基礎(chǔ)題型學(xué)起。
除了將獎勵細(xì)分化,由于足球是一項(xiàng)團(tuán)體配合的運(yùn)動,所以「絕悟」的研究團(tuán)隊(duì)還使用了一種名為「生成對抗模擬學(xué)習(xí)」(GAIL)的技術(shù)來進(jìn)行自博弈訓(xùn)練。
這項(xiàng)技術(shù),可以模擬一些難以細(xì)化定量描述的戰(zhàn)術(shù),比如足球比賽中常見的「長傳反擊」、「控球滲透」等等。
通過模擬出不同戰(zhàn)術(shù)風(fēng)格的對手,然后讓AI與其對抗,進(jìn)行訓(xùn)練和學(xué)習(xí)。
簡單理解的話,就是將不同題型依據(jù)不同的試卷風(fēng)格進(jìn)行排布組合,然后讓AI進(jìn)行「模擬考」,在實(shí)戰(zhàn)中進(jìn)一步學(xué)習(xí)。
在考試中,你是不是遇到過這樣一些奇怪的考題,然后是這種狀態(tài):「啊,這種題型我沒見過啊,這是什么鬼」? AI也有類似的問題。自博弈訓(xùn)練后,得出的結(jié)果往往是單一的,對應(yīng)在考試中,就是形成既定的解題思維。
最后,研究人員使用「基于 League 的多風(fēng)格強(qiáng)化學(xué)習(xí)」這個方法進(jìn)行補(bǔ)充訓(xùn)練,防止在賽場上見到一些奇怪的戰(zhàn)術(shù),會讓AI一時間手足無措,自己先亂起來了。
這其實(shí)也是咱們普通人應(yīng)付考試的時候,老師們經(jīng)常會給出一些奇奇怪怪模擬試卷的原因。
研究者認(rèn)為:基于 League 的多風(fēng)格強(qiáng)化學(xué)習(xí)和基于 GAIL 的風(fēng)格學(xué)習(xí)方法,是保證 WeKick 最終獲勝的兩大關(guān)鍵秘籍。 總而言之,這個來自中國的AI足球隊(duì),奪得了世界挑戰(zhàn)賽的冠軍,這一消息讓關(guān)注中國足球的各路網(wǎng)友沸騰了。真人不行AI來湊,對此,國足表示,已退出直播間。
原文標(biāo)題:中國的足球隊(duì)奪得世界冠軍!AI足球隊(duì):沒錯,正是在下
文章出處:【微信公眾號:中科院半導(dǎo)體所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
責(zé)任編輯:haq
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
6892瀏覽量
88828 -
AI
+關(guān)注
關(guān)注
87文章
30146瀏覽量
268417
原文標(biāo)題:中國的足球隊(duì)奪得世界冠軍!AI足球隊(duì):沒錯,正是在下
文章出處:【微信號:bdtdsj,微信公眾號:中科院半導(dǎo)體所】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論