標識設計是一個費時費力的過程。而最近生成式模型領域進展飛速,這就讓人好奇AI可不可以用來設計標識?生成對抗網絡(GAN)據說能夠學習模擬任何數據分布,已經取得了廣泛的應用,但目前很少有人研究如何用GAN來設計標識。年底召開的ICMLA 2018上有一篇論文,馬斯特里赫特大學的Ajkel Mino和Gerasimos Spanakis,提出了根據顏色自動生成標識的LoGAN模型,可以說是這一方向上的初步探索。
LoGAN架構
GAN
在介紹LoGAN架構之前,先溫習下GAN網絡。
GAN由生成器和判別器兩個神經網絡組成,以對抗的形式同時訓練。
GAN是出名的難訓練,飽受訓練不穩定、無法收斂、模式崩塌之苦。近年來有不少研究都試圖改進GAN的訓練過程,例如在GAN中引入深度卷積層(DCGAN),修改目標函數(LSGAN和WGAN)。
條件GAN
如前所述,LoGAN是根據顏色自動生成標識,換句話說,是以顏色為條件。能夠基于標簽數據生成特定分類的圖像的GAN架構,主要有兩種:
CGAN,生成器和判別器都額外接受一個類別標簽數據。
AC-GAN,判別器不僅需要識別圖像的真偽,還需要判斷圖像的類別(不論真偽)。
GAN、CGAN、AC-GAN架構對比
LoGAN即基于AC-GAN改造得到。
AC-WGAN-GP
在AC-GAN架構中(參見上圖),判別器同時優化真偽誤差和類別誤差:
不過,考慮到WGAN-GP更穩定,所以LoGAN用WGAN-GP的損失函數替換了AC-GAN的損失函數:
但是這就造成了一個問題,類別損失沒有了。所以,LoGAN在AC-GAN的基礎上額外增加了一個分類器Q,輔助判別器進行分類。也就是說,和AC-GAN不同,LoGAN由三個網絡組成:生成器G、判別器D、分類器Q。
經過改造的AC-GAN
分類器Q的損失函數定義如下:
為了避免訓練不穩和模式崩塌,LoGAN的訓練借鑒了一些最新研究成果,采取了以下措施:
判別器每迭代5次,分別迭代一次生成器和分類器。
z取樣自高斯分布。
應用了批歸一化。
試驗
數據集
LoGAN基于LLD-icons數據集訓練,該數據集包含486377張32×32像素的圖標。
使用了K均值聚類(k = 3)從圖像中提取主要色彩,然后分為黑、藍、棕等12類:
訓練
下為判別器、生成器、分類器的訓練損失圖像。
從圖中我們可以看到,判別器和生成器的損失圖像有下降趨勢,沒有收斂。不過這并不意味著訓練有問題,因為WGAN和WGAN-GP都不保證收斂。另一方面,分類器收斂至接近1的損失值。實際上,生成圖像的分類損失收斂至零,這意味著生成圖像都能被正確分類。
結果
400個epoch的訓練后,每個分類生成了64個標識:
由于是在32×32像素的圖標上訓練的,所以生成的標識有點模糊。生成的標識大多為圓形或方形,但也有不規則形狀,如心形和X形。
各個分類主要顏色的準確率、召回、F1數據如下表所示:
有些分類的評分偏低,這是因為很多圖標周圍使用白色作為背景,同理,灰色作為中性色,也有很多圖標使用。
各分類主要顏色分布
改進方向
盡管取得了很有潛力的結果,LoGAN目前還是有不少限制:
對抗生成網絡的常見問題,生成的標識很模糊。使用分辨率更高的訓練圖像應該能緩解這一問題。
僅僅使用顏色作為關鍵詞局限性太大。未來考慮加入形狀、公司的重心等其他關鍵詞。
-
GaN
+關注
關注
19文章
1918瀏覽量
72980 -
生成器
+關注
關注
7文章
313瀏覽量
20976
原文標題:LoGAN:根據顏色自動生成標識
文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論