魔方可謂20世紀80年代的標志性智力玩具,如今它正在被用作連接深度學習與高等數學之間的橋梁。
計算機科學教授Pierre Baldi是加州大學歐文分校(UCI)研究團隊從事此項工作的負責人,他認為深度學習與高等數學之間的“鴻溝”是當今人工智能所面臨的最大難題。
“大家會抱怨深度學習是一個黑盒子,他們不知道這個網絡在做些什么。”Baldi說道,“而我們可以看到該網絡正在學習數學。”
自從匈牙利雕塑家兼建筑學教授Ern? Rubik于1974年發明了魔方之后,這種各個面色彩不一的立方體就開始讓人們為之著迷和困惑。
研究團隊發現,深度學習模型可以用于教會機器如何做數學題(這里是一種被稱為“群論”的代數概念),這就是Baldi所說的“AI 重大挑戰中的一小步”。
無心插柳
研究人員最初的目標是構建一個深度學習模型,可在無需任何人工協助的情況下解開魔方,就像早期的模型掌握了國際象棋的游戲方式一樣。
為了實現這一目標,他們像教小孩子一樣引導模型學習如何還原魔方。
從已還原的魔方開始,模型首先向后倒退一步,然后還原魔方。接著向后倒退兩步并還原魔方,隨后再向后倒退三步,如此類推。這會讓算法在每一次嘗試中逐漸學習。Baldi將這一過程比作學習高爾夫球,首先從近距離推桿進球開始,然后隨著精確度的提升而逐漸遠離球洞。
該研究團隊最近發表了一篇論文,詳細介紹了他們的工作。該團隊為其開發出的增強學習算法起了一個名字:“自學迭代(autodidactic iteration)”。該算法可在平均30步之內完全還原被打亂的魔方,也可以實現人類玩家所能達到的最快速度。
研究人員在訓練該模型時使用了搭載NVIDA GPU的機器,同時還使用了CUDA編程模型、TensorFlow機器學習框架和Keras神經網絡API。
據Baldi估計,GPU將工作速度加快了5到10倍,并且其團隊可以無限制地將更多GPU投入使用,進一步推動深度學習研究。
“我們對GPU求之若渴,”他說道,“它們對于這項工作來說必不可少。”
充滿無限可能的一次進步
Baldi表示,魔方展現了一個獨特的深度學習挑戰:魔方的正確解法只有一種,但錯誤的組合形式卻有數百億億之多。這里用的還只是傳統的三階魔方,每個面各有9個方塊。
解開更高階的魔方是該團隊的下一個奮斗目標。他們想知道將這種“自學迭代”的方式應用于四階和五階魔方的效果如何。但首先,團隊必須對該方法進行調整,以應對大幅提高的復雜度。
“如果將速度降至原來的二分之一,則不會出現什么問題。”Baldi說道,“但如果將速度減慢到與大陸漂移的速度一樣,那么問題就來了。”
同時Baldi發現,也可以利用這種方式教會自學迭代模型掌握其他游戲的玩法。
他認為這項工作在其他數學領域也具有潛在的應用機會,尤其是高中水平以上的數學內容。他表示,AI一直在努力實現這一點。
而Baldi的團隊對此的看法則是這種難題很快就會成為明日黃花。同時,解開更復雜、更困難的問題才是其奮斗目標。
-
AI
+關注
關注
87文章
30239瀏覽量
268478 -
深度學習
+關注
關注
73文章
5493瀏覽量
120999
原文標題:通過魔方有望實現AI領域的重大突破
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論