斯坦福張首晟團隊創造了一個人工智能程序Atom2Vec,只用幾個小時就重新得出了元素周期表。這項研究更宏大的目標是設計出替代作為機器智能標準的圖靈檢驗的新標準。張首晟教授在接受新智元采訪時認為,實驗是檢驗規律的唯一標準,人類可以通過實驗來認證人工智能做出的理論預言。
元素周期表可以說是化學歷史上最重要的科學成就,人類科學家們經過將近一個世紀的摸索和嘗試來把元素周期表整理成當前的形式; 而一個來自斯坦福的物理學家們的人工智能程序只需要幾個小時。
這個程序叫Atom2Vec(從原子到矢量)。它能夠分析從網絡數據庫得到的不同元素組合而成的化合物名稱來學習區分不同的原子,整個過程是獨立無監督的,并沒有人類智能的參與。這個程序的開發借用了自然語言處理中的簡單概念:一個詞語的特性是可以從它周圍出現的其他單詞來得出的;把化學元素根據它們所出的化學環境聚類。
項目的負責斯坦福人文與科學學院J.G. Jackson and C.J. Wood
教授張首晟說:“我們想知道是否一個人工智能可以智慧到獨立發現元素周期表,我們的團隊證明了這一點。”
借鑒NLP概念搭配化合物中的原子,Atom2Vec將來可用于發現和設計新材料
張教授和他的團隊對于Atom2Vec的開發基于谷歌工程師們分析自然語言使用的Word2Vec。這是一個可以把單詞濃縮成為電腦中有限的幾個數字(矢量)。通過分析這些矢量,這個人工智能程序可以估計在這個單詞周圍可能出現哪些其他單詞,他們的概率是多少,之間的組合關系如何。
例如,單詞“國王”經常和“王后”出現在一起,而“男人”經常和“女人”出現在一起。因此,Word2Vec分析出的代表“國王”的矢量可以跟代表“王后”,“男人”和“女人”的矢量有如下簡單的關系:“國王”=“王后”-“女人”+“男人”。
張教授指出,“我們可以把類似的想法用到原子上,就像輸入給谷歌的Word2Vec很多文本里不同單詞組成的句子,我們可以輸入給我們的Atom2Vec不同原子組成的化合物,就像NaCl(氯化鈉), KCl(氯化鉀), H2O(水) 等等。”
從這些數據的分析中,人工智能程序可以發現鉀和鈉有著類似的性質,因為它們都可以跟鹵素結合成化合物,張教授說,“就像國王和王后很類似一樣,鉀和鈉也是類似的。”
Atom2Vec工作流學習材料數據庫中的原子。對材料數據庫中的每一種化合物生成原子-環境對,在此基礎上構造原子-環境矩陣。這里使用一個包含7個化合物的小數據集作為示例。原子-環境矩陣的條目表示原子-環境對的數量。插圖顯示化合物的單元中和對應于目標原子Bi和環境(2)Se3的條目。只考慮成分信息,而忽略結構信息。Atom2Vec學習算法從原子環境矩陣中提取原子的知識,并對原子向量中學習的屬性進行編碼。
張教授希望在未來,科學家們可以使用Atom2Vec的知識來發現和設計新材料,“在這個項目里,我們的程序是無監督的,但是你可以給它一個特定的目標去優化,例如,找到最有效率轉換太陽能的材料。”
張教授的團隊已經開始團隊人工智能程序2.0版本的研究,集中攻克一個生物醫學上很困難的問題:設計出正確可以攻擊抗原的抗體,通常來講,抗體是由免疫機制生成的。這對于癌癥的研究極其重要,當前最有前景的治療癌癥方案之一——免疫治療,就試圖找到并且控制能夠攻擊癌細胞抗原的抗體。
然而人類身體可以創造超過1000萬種不同的抗體,每一種都是大約50個基因的一種不同組合,“如果我們可以把這些基因數據里的信息濃縮到一個數學矢量里去,像排列元素周期表一樣排列它們,那么,如果我們發現其中一種抗體對一個抗原有效然而有毒,我們可以從我們的表中接著尋找它同類的但毒性更小的抗體。”
更宏大的目標:設計出替代圖靈檢驗的新標準
張首晟表示,這項發表于6月25日美國國家科學院院刊的研究將是實現更宏大的目標之前的重要的第一步。更宏大的目標是設計出替代作為機器智能標準的圖靈檢驗的新標準。
圖靈檢驗里面,一個機器如果可以和人類一樣回復檢驗者的問題,讓檢驗者無法區分其是否是人類,就可以通過檢驗。但張教授認為,這種檢驗是有瑕疵的,主觀的,“人類是一個漫長進化的結果,人類的心智里充滿了種種不理性的因素,如果一個人工智能要通過圖靈檢驗,它需要能夠重復這些人類復雜的非理性的一面,這是非常困難而瑣碎的,因此并不能夠有效利用程序設計者的時間創造價值。”
張教授提出,對于一個機器智能可以有另一種標準,“我們想試試我們是否可以設計出在發現自然規律上可以擊敗人類的人工智能,但是在此之前,我們要先測試我們的人工智能是否可以重復人類已經完成的一些偉大發現。而Atom2Vec獨立發現元素周期表就是后者的一個成果”。
新智元向張首晟教授提問:如果AI發現了自然規律,我們怎么知道那就是事實呢?張首晟教授認為,實驗是檢驗規律的唯一標準,人類可以通過實驗來認證人工智能做出的理論預言。
張首晟教授還認為,純理性的標準才是客觀的,人機競智的標準一定要客觀才行。
此外,這個項目中其他的參與者有,斯坦福的博士生周權和劉慎修,博士后湯沛哲等。
-
人工智能
+關注
關注
1791文章
46859瀏覽量
237579 -
圖靈
+關注
關注
1文章
39瀏覽量
9688 -
自然語言處理
+關注
關注
1文章
612瀏覽量
13506
原文標題:斯坦福AI幾小時發現元素周期表,張首晟團隊將設計替代圖靈測試的新標準
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論