電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)生成式AI是指利用現(xiàn)有文本、音頻文件或圖像等創(chuàng)建新內(nèi)容的技術(shù)。生成式AI可從其數(shù)據(jù)中學(xué)習(xí)內(nèi)容或?qū)ο螅⑦\(yùn)用數(shù)據(jù)生成全新的、完全原創(chuàng)的、逼真的工件,留下與訓(xùn)練數(shù)據(jù)相似的特征,不是簡單的重復(fù)。
生成式AI的關(guān)鍵技術(shù)是生成式對抗網(wǎng)絡(luò)(GANs, Generative Adversarial Networks ),其本質(zhì)是一種深度學(xué)習(xí)模型,是近年來復(fù)雜分布上無監(jiān)督學(xué)習(xí)最具前景的方法之一。
在原理上,生成式對抗網(wǎng)絡(luò)使用兩個(gè)神經(jīng)網(wǎng)絡(luò)相互對立,一個(gè)生成器和一個(gè)判別器。生成器或生成網(wǎng)絡(luò),負(fù)責(zé)生成類似于源數(shù)據(jù)的新數(shù)據(jù)或內(nèi)容,判別器或判別網(wǎng)絡(luò)則負(fù)責(zé)區(qū)分源數(shù)據(jù)和生成數(shù)據(jù)。經(jīng)過交替周期訓(xùn)練,生成器不斷學(xué)習(xí)生成更逼真的數(shù)據(jù),判別器則更善于區(qū)分假數(shù)據(jù)和真實(shí)數(shù)據(jù)。漸漸地,雙方在對抗中不斷完善。
AI作畫是生成式AI的典型應(yīng)用案例。今年9月15日,一位國外游戲設(shè)計(jì)師的作品《太空歌劇院》奪得美國科羅拉多州博覽會(huì)藝術(shù)比賽數(shù)字類別的一等獎(jiǎng)。這幅畫作完全由AI繪圖軟件根據(jù)文字指令生成。
近年來市面上涌現(xiàn)出了多款A(yù)I繪畫工具。比如由谷歌推出的Disco Diffusion,這是一款最早流行起來的AI繪圖工具。使用這個(gè)AI繪畫工具,僅僅通過文字輸入,就能輸出相應(yīng)的圖片。
還有Midjourney,這家公司名稱也是Midjourney,創(chuàng)始人是David Holz,Midjourney 是一款輸入文字就可以生成高質(zhì)量圖像的AI畫畫軟件,速度達(dá)到1分鐘出4張圖。很多藝術(shù)家會(huì)使用Midjourney生成自己想要圖像作為創(chuàng)作靈感參考。
還有由OpenAI開發(fā)DALL·E2,這款A(yù)I繪畫工具,幾分鐘就能創(chuàng)建高度逼真的圖像。OpenAI稱,該工具可用于創(chuàng)建插圖、設(shè)計(jì)產(chǎn)品。OpenAI是在美國成立的一家人工智能研究公司。OpenAI由伊隆·馬斯克(Elon Musk)和薩姆·奧特曼(Sam Altman,現(xiàn)任OpenAI CEO)于2015年共同創(chuàng)立,后馬斯克在2019年離開了OpenAI。
前不久國內(nèi)也上線了一個(gè)微信小程序——盜夢師,這是一個(gè)能根據(jù)輸入文本生成圖片的AI平臺(tái),由藍(lán)振忠博士帶領(lǐng)的西湖大學(xué)深度學(xué)習(xí)實(shí)驗(yàn)室和西湖心辰科技有限公司共同推出。
據(jù)介紹,用戶輸入文字描述后,盜夢師便可生成1:1、9:16和16:9三種比例的圖片,還有24種繪畫風(fēng)格可以選擇,除了基礎(chǔ)的油畫、水彩、素描等繪畫種類,還包括賽博朋克、蒸汽波、像素藝術(shù)、吉卜力和CG渲染等特別風(fēng)格。
除了AI作畫,生成式AI的應(yīng)用案例還包括生成音頻、生成視頻、生成文本、醫(yī)療保健等,行業(yè)分析師預(yù)計(jì),這種技術(shù)將被廣泛用于各行各業(yè),并產(chǎn)生數(shù)萬億美元的經(jīng)濟(jì)價(jià)值。Gartner發(fā)布的2022年AI技術(shù)成熟度曲線顯示:生成式AI、AI大模型等技術(shù)在萌芽2年多后已快速步入期望膨脹階段。
生成式AI的發(fā)展可能會(huì)使云服務(wù)商和芯片廠商受益。生成式AI是計(jì)算密集型技術(shù),據(jù)了解,Meta和谷歌已經(jīng)聘請?jiān)擃I(lǐng)域諸多杰出人才,希望將這種先進(jìn)技術(shù)整合到公司的產(chǎn)品中。
今年9月,Meta公司首次推出Make-A-Video。Make-A-Video是Meta內(nèi)部開發(fā)的人工智能系統(tǒng),可以以利用給定的幾個(gè)詞或幾行文字生成一個(gè)幾秒鐘的短視頻。最近,谷歌也發(fā)布了名為Phenaki的程序代碼,可以將文本轉(zhuǎn)換為時(shí)長幾分鐘的視頻。
生成式AI需要英偉達(dá)、AMD、英特爾等的芯片支持,進(jìn)行AI模型訓(xùn)練和部署。英偉達(dá)首席執(zhí)行官黃仁勛在日前的會(huì)議上談到,生成式AI是公司最新芯片的關(guān)鍵用途。
不過生成式AI也面臨一些挑戰(zhàn),比如AI繪畫的原創(chuàng)性和所有權(quán)的問題,今年8月29日,一個(gè)名叫mimic的AI繪畫網(wǎng)站上線了測試版,允許用戶上傳15至100張圖像讓AI進(jìn)行學(xué)習(xí),然后輸出相同畫風(fēng)的AI畫作。然而一些未經(jīng)授權(quán)的畫作也被上傳學(xué)習(xí),把AI生成的畫作當(dāng)做自己的創(chuàng)作進(jìn)行售賣。AI作畫需要利用大量現(xiàn)有圖像進(jìn)行培訓(xùn),現(xiàn)如今,原始圖像的創(chuàng)建者是否對原創(chuàng)風(fēng)格生成的圖像擁有版權(quán)仍在爭論中。
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
6892瀏覽量
88828 -
AI
+關(guān)注
關(guān)注
87文章
30146瀏覽量
268414 -
音頻文件
+關(guān)注
關(guān)注
0文章
7瀏覽量
7223 -
生成式AI
+關(guān)注
關(guān)注
0文章
488瀏覽量
459
原文標(biāo)題:AI作畫大受追捧,生成式AI技術(shù)的機(jī)會(huì)與挑戰(zhàn)!
文章出處:【微信號(hào):elecfans,微信公眾號(hào):電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評(píng)論請先 登錄
相關(guān)推薦
評(píng)論