今天,一則《Deepmind公布星際爭霸2結果:AlphaStar以10:1戰勝職業高手》一文,引發熱議,但是其實在兩年前,AI就與人類選手進行過星際爭霸比賽。
2017年,世界首屆人類與星際爭霸AI對抗賽上,在接連兩位學生選手敗在AI手上后,韓國著名星際爭霸選手、星際四皇“司令”Stork通過四場連勝將AI打敗。他打敗的AI包括了Facebook開發的CherryPi和來自澳大利亞、挪威和韓國的AI。
而在兩年后的今天凌晨,DeepMind公布了其錄制的AI在星際爭霸2中與兩位職業選手的比賽,AlphaStar以5:0的成績戰勝了2018年WSC奧斯汀站的亞軍MaNa。除了此前比賽錄像的展示外,AlphaStar還與MaNa現場對戰一局,不過這局AlphaStar輸給了人類選手。
DeepMind的研究聯合負責人David Silver在賽后表示,“人工智能的歷史被打上了許多重大的標桿性勝利的印記。我希望,未來的人們可能會回顧今天,或許會認為這是人工智能系統所能做的又向前邁進了一步。”
2013年,當時名不見經傳的在DeepMind發表了一篇論文,內容是他們自己開發的AI游戲系統。論文中描述的計算網絡并不是為了游戲而服務,反而是讓一個AI系統自己去玩游戲。神奇的是,DeepMind的游戲系統可以在完全沒有接觸的前提下,通過對游戲的自我學習,自動的玩一系列初級電視游戲。
這個系統可以通過屏幕上面的圖像和游戲中的分數是否上升下降,從而做出選擇性的動作。雖然這個行為對人來來說難度不大,但對于機器學習來說卻意義驚人。因為它涉及架設任務、建立人工精神網絡、建立深度學習模型和完善學習過程幾個關鍵部分,并且需要大量的圖形處理單來輔助。
星際爭霸2這樣的游戲其實比棋盤類游戲更難玩。在電子游戲中,人工智能無法通過觀察每一塊棋子的移動來計算下一步棋,它們必須實時做出反應。星際爭霸2的不可預測性遠大于圍棋,玩家可以在同一時間會有300種基本動作可選擇,即使在一個84x84像素的屏幕中,也會產生大約1億個不同的動作,因此DeepMind要收集大量玩家的數據進行分析。
目前DeepMind要做的是讓AI預測人類玩家下一步會做什么,AI在比賽之前僅僅數天的訓練量,相當于職業選手訓練200年之長,同時在對游戲單位的操作上,AI可以避免人類選手的微操失誤,同時對未知地形進行勘探,在應對突發狀況時,AI的會選擇最好的處理方式。還有當人類玩家做了這些操作后要如何應對,通過局勢判斷下一步要干什么。暴雪已經承諾會從星際2的天梯中收集數十萬個匿名錄像幫助DeepMind訓練,這樣可以讓AI做到序列預測和長期記憶。
AI的學習遠遠超過了我們的想象,無數企業也在不斷加碼人工智能,BAT、曠視科技、商湯科技、極鏈科技Video++、依圖科技這些深耕人工智能領域的企業,也都在不斷進行人工智能各方面的深度學習。不得不感嘆于AI在電子競技項目進步的速度,人工智能下一步的目標,或許就是想向更多的專業游戲選手發出挑戰。從人工智能首次被提出來,到現在逐漸進入我們的生活,未來的某一天,AI對于人類也將不再是一項觸碰不到的技術。
-
人工智能
+關注
關注
1791文章
46872瀏覽量
237593
發布評論請先 登錄
相關推薦
評論