制作表情包還能獲得研究生學分?如果使用深度學習技術來實現的話,是有可能的。
23歲的Lawrence Peirson正在攻讀斯坦福大學的理論天體物理學博士學位,但今年卻決定進修幾門AI課程。在一個班級項目中,他和自己的同班同學E.Meltem Tolunay開發了一個神經網絡,可為表情包生成說明文字。他們發布了一份關于該網絡的白皮書,其標題十分貼切:“Dank Learning”(“Dank”是“Cool”的同義詞)。
雖然現在已經存在很多訓練深度學習模型為圖片生成文字說明的例子。例如,準確地為一張圖片生成說明性文字“踏著沖浪板的男人”或“拿著蛋卷冰淇淋的孩子”。但對于表情包,Peirson想挑戰一下神經網絡能否突破字面解釋,創造出具有幽默感的文字說明。
盡管一開始Peirson對所生成表情包的趣味性持懷疑態度,但最終他發現深度學習模型確實可以生成“一些非常有趣的原創幽默內容”。
獲得“深度表情包”
該神經網絡為一類流行的動物表情包生成說明文字。為了收集用于訓練該深度學習模型所需的數據,Peirson從memegenerator.net網站上搜集了大約40萬個由用戶生成的表情包。該網站提供各類表情包模板,并允許用戶自己搭配文字說明。
該數據集包含大約3000個基本圖像,每個圖像都配有多種不同的文字說明。由于輸入數據均來自用戶,深度學習模型所處理的表情包文字說明的質量良莠不齊。
“我們使用了40萬個表情包,其中的大部分沒有那么有趣,但是至少它們能夠教會系統表情包是什么,以及什么樣的笑話才是與圖片內容相關的,”他說道。
互聯網表情包在網絡上早已流傳多年,Reddit、Facebook、9GAG和Quick Meme等網站是它們的大本營。最火爆的表情包可能會配有超過200萬種原創文字說明。
表情包引用的通常是流行文化、時事或某個特定的互聯網亞文化群體才明白的“梗”。(Peirson創建了一個名為“The specific heat capacity of europium at standard temperature and pressure”的表情包頁面。)
這些表情包同時汲取了數字文化的精華與糟粕。其論文指出,訓練數據中大多是關于咒罵、種族主義和性別歧視的表情包。Peirson覺得需要在未來訓練中過濾掉這些內容,但他指出這一問題并不是表情包所獨有的,“這在自然語言處理中是一個普遍存在的大問題”。
該深度學習模型利用CUDA語言編寫,使用了一塊NVIDIA GPU。Peirson和Tolunay同時嘗試了使用無標記的數據和標有表情包標題的數據(例如,成功小子或暴走漫畫),但并沒有發現表情包的質量有任何顯著差異。
“這些表情包非常有趣,不過是‘也還說得過去,但其實并不是那么搞笑’這種程度,” Peirson說道,“表情包就是借用了這種幽默感。
該神經網絡為此類動物表情包生成了說明文字。
讓表情包變酷可不容易
為了評估深度學習模型成功與否,兩人開發了一個“困惑指數”(perplexity score),用其檢查神經網絡是否可以明確識別出數據的模式。他們針對幾百張帶有預設格式的表情包計算出了“困惑指數”。如Boromir(電影《魔戒》中的角色)表情包,該表情包的文字說明始終都帶有“one does not simply”的字樣。
但對于表情包的真正考驗在于其是否搞笑。
在一項定性調查中,Peirson與其白皮書的共同作者同時向受訪者展示了人類創作的表情包和深度學習模型生成的表情包。他們向受訪者提出了兩個問題:“表情包是由人類創作的還是由計算機創作的?”,以及“如何評價表情包的幽默程度?”。
Peirson表示,訪問結果顯示深度學習模型創作的表情包“與人類創作的表情包幾乎無法區分”。
他們還研究了其神經網絡如何為訓練數據集之外的表情包生成文字說明。在這種情況下,算法會基于其在訓練數據中看到的內容推理未知圖像的模式。為了測試這一點,Peirson甚至向深度學習系統展示了他自己的照片,生成的文字也相當有趣。
Peirson在深度學習模型中輸入了自己的照片,模型生成了這張表情圖。
表情包通常會進行病毒式傳播,并成為“網紅”,而以表情包為主題的白皮書也受到了歡迎。當該項目獲得媒體報道并受到關注時,Peirson表示自己“倍感震驚”。一款名為Dank Learning的移動應用也即將登陸App Store。
他說,這個項目讓他打開了新的視角:原來表情包的影響力如此巨大。每天,全球有數百萬用戶在社交媒體網站上傳播表情包。
在Peirson看來,強大的AI有潛力根據時事“突發奇想”,生成表情包,從而影響公眾認知。而廣告主也可以使用表情包提升品牌知名度:“讓表情包進行病毒式傳播是一種絕妙的營銷方式。”
-
AI
+關注
關注
87文章
28902瀏覽量
266276 -
深度學習
+關注
關注
73文章
5422瀏覽量
120598
原文標題:表情包生產基地:AI像人類一樣為圖像生成搞笑文字說明
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論