國外一項研究認為,在未來的幾十年間,美國47%的現(xiàn)有工作崗位將面臨被AI(人工智能)和自動化取代的風險。雖然不少專家質(zhì)疑了這一算法,但是AI的威脅確實越來越近了。我們現(xiàn)在聊以自慰的就是,手動的或者重復(fù)性的工作可能會被AI搶走,但是創(chuàng)意性的工作則相對安全。事實真的如此嗎?其實AI早就對人類創(chuàng)意工作虎視耽耽,并且有了長足的進步。
AI自畫像技驚四座
紐約時報的編輯找到IBM研究院,希望他們能夠通過AI的方式畫一幅畫,以便作為一期AI專輯的封面。這個請求看起來簡單,其實暗藏了很大的挑戰(zhàn)。已有的AI技術(shù),比如汽車智能駕駛、翻譯、玩游戲,甚至制作電影的預(yù)告片等等,這些任務(wù)不需要AI創(chuàng)建新材料,只需分析手頭已有的信息并根據(jù)訓(xùn)練做出選擇即可。而現(xiàn)在要讓AI跳出已有資料,以“自我思考”的方式創(chuàng)造出全新的藝術(shù)作品,難度可想而知。最終,IBM的AI還是交出了令人驚訝的作業(yè)(圖1)。
圖1 AI自畫像——AI與人類創(chuàng)造力手牽手(圖源:IBM Research)
像人類一樣提煉作品主題
上述AI作品的產(chǎn)生,它的算法可以分為三大部分,有點類似于藝術(shù)家的創(chuàng)作過程,下面我們就來一一解說。
首先是確定作品的核心概念,也就是作品的主題。主題作為藝術(shù)作品的核心思想,在以往的AI創(chuàng)作中(比如寫詩),基本上都是由人事先指定好關(guān)鍵詞,AI是被動的。而此次的AI創(chuàng)作,研究員們決定由AI自行確定。
研究員們首先匯集了紐約時報上大約3000篇左右的AI相關(guān)文章,然后通過自然語言處理軟件分析這些文章,找出和AI高度關(guān)聯(lián)的語義概念,比如“機器人”、“自動駕駛”和“計算”等,共選擇了30項。
因為這些詞語本身并不包含“AI”字樣,所以軟件通過簡單的關(guān)鍵詞搜索是不可能將它們提取出來的,軟件只有像人一樣智能地“理解”了詞語的意義,才能精確完成篩選任務(wù),其中自然語言處理技術(shù)起著重要作用(圖2)。
圖2 自然語言理解的實現(xiàn)模型之一(想要理解語言,電腦必須要理解這個世界)
文字概念需要圖形化,AI通過上述篩選出來的30項概念,訓(xùn)練一個用于視覺識別的神經(jīng)網(wǎng)絡(luò)(圖3),以便從紐約時報紛繁復(fù)雜的文章圖片中,挑選出含有AI意義的所有圖片,并按與AI的密切程度對圖片打分。在評分前十的圖像里,項目參與人員最終選定一張人和機器人握手的圖像(還是不能完全排除人類干預(yù),需要與人類攜手合作)。
圖3 視覺識別神經(jīng)網(wǎng)絡(luò)模型之一
從學習模仿開始的原創(chuàng)圖像
主題概念確定之后,AI接下來正式進入創(chuàng)作過程。人類畫家,開始學畫時大都經(jīng)歷過一個學習模仿的過程,AI畫畫也是如此,只是它的方法更為獨特些。研究員們首先收集到1000多個機器人及人的手的圖片,作為AI的學習訓(xùn)練數(shù)據(jù)集(圖4)。
圖4 機器人和人的手圖片示例
AI的學習模型大致分兩類,一類是判別模型(Discriminative Model),一類是生成模型(Generative Model)。假設(shè)給定一張圖,要求判斷圖里面是什么動物,貓還是狗,這就是判別模型。假設(shè)給定的是多個貓的圖集,然后生成一張不在此圖集中的新的貓圖,那么這就是生成模型。
本文所述的AI采用的則是深度學習模型生成式對抗網(wǎng)絡(luò)(GAN, Generative Adversarial Networks ),它同時包括了判別模型(D)和生成模型(G)。G不斷生成新的機器人和人的手的圖片,盡可能貼近原有數(shù)據(jù)集中的圖,以欺騙D;D不斷識別G所生成的圖片是不是真實的,將假的圖排除。這兩個學習模塊不斷博弈的過程,最終的結(jié)果就是產(chǎn)生一個足以亂真的牽手的圖片,并且是與原來數(shù)據(jù)集中的圖不同的新作品(圖5)。
圖5 生成式對抗網(wǎng)絡(luò)的工作原理模型
錦上添花的作品包裝
既然是為特定報刊定制的作品,當然要盡可能符合原有報刊的一貫風格。這對AI來說已經(jīng)不是什么難事,將紐約時報以往的封面圖片匯集成數(shù)據(jù)集,訓(xùn)練出風格轉(zhuǎn)換神經(jīng)網(wǎng)絡(luò),對上面新創(chuàng)作的人與機器牽手的圖片進行自動風格轉(zhuǎn)換,生成多幅作品,從中挑選出最滿意的就可以了,效果便是本文開篇的那樣圖了。
更多的拓展應(yīng)用
IBM的AI自畫像技術(shù),其獨到之處就是可以由AI自動確定主題概念,再以此概念生成全新的藝術(shù)作品,并且還可以根據(jù)要求定制不同的藝術(shù)風格。這可以應(yīng)用到很多領(lǐng)域。比如作家可以通過它設(shè)計新書的封面,影視可以通過它設(shè)計海報,音樂家通過它設(shè)置專輯封面等等。
-
機器人
+關(guān)注
關(guān)注
210文章
28212瀏覽量
206566 -
人工智能
+關(guān)注
關(guān)注
1791文章
46872瀏覽量
237608 -
智能駕駛
+關(guān)注
關(guān)注
3文章
2457瀏覽量
48654
發(fā)布評論請先 登錄
相關(guān)推薦
評論