火熱的芯片市場又迎來了一個新玩家。12月,OPPO在主題為“致善·前行”的OPPO 2021年度未來科技大會(OPPO INNO DAY 2021)上正式發(fā)布了其首款影像專用NPU——馬里亞納 MariSilicon X芯片。該芯片采用了DSA架構(gòu)和臺積電的6nm工藝,算力和能效比十分均衡,同時還融合了OPPO積累多年的影像處理技術(shù),將計算影像推向了4K+20bit RAW+AI+Ultra HDR的新極限。
據(jù)悉,在新NPU的支持下,夜景視頻將會有新的突破,搭載馬里亞納 MariSilicon X的手機將可以在4K AI HDR視頻中實現(xiàn)超清夜景照片的清晰畫質(zhì),讓視頻的每一幀都是一張好照片。那么,MariSilicon X是如何實現(xiàn)夜景視頻的優(yōu)秀性能的呢?讓我們看看這顆芯片到底有何過人之處。
MariSilicon X芯片的主要架構(gòu)和核心參數(shù)
馬里亞納 MariSilicon X采用的是DSA(Domain Specific Architecture)新黃金架構(gòu)理念,里面包括了兩大核心IP:MariNeuro AI計算單元和MariLumi影像處理單元。還有專為MariNeuro AI計算單元配置的雙層存儲架構(gòu),包括萬億比特每秒(Tb/s)讀寫速度的片上內(nèi)存子系統(tǒng),以及8.5GB/s的獨立DDR帶寬,為AI的高效運算提供充足的內(nèi)存讀寫支持。
所謂的DSA架構(gòu),就是一種更加以應(yīng)用場景為中心的設(shè)計思路,通過特殊的計算架構(gòu),為解決特定領(lǐng)域的問題提供強大且高效的性能。DSA架構(gòu)尤其適用于AI領(lǐng)域。通俗地講,就是專芯專用,設(shè)計出來的芯片不是解決所有問題,而是解決特定的一類問題,從而滿足對效率的需求。
也就是說,馬里亞納 MariSilicon X就是一顆專為影像而生的NPU芯片,它只做一件事,那就是把影像做到極致。它的具體核心配置可以參考表1。
專芯專用,跨越算力鴻溝
OPPO芯片產(chǎn)品高級總監(jiān)姜波表示,基于DSA的設(shè)計理念,OPPO將專用的AI算法進(jìn)行了芯片化,在芯片的底層硬件中,直接嵌入了適合這一算法的算子。MariNeuro AI計算單元就是專門用來實現(xiàn)像素級圖像處理的,它的有效算力高達(dá)18TOPS,每秒可以進(jìn)行18萬億次的運算。
眾所周知,算力是一切計算的基礎(chǔ),而在手機影像的應(yīng)用中,算力一般分為四個等級,分別是場景感知、場景重構(gòu)、像素級處理和多維度立體圖像處理。AI在影像領(lǐng)域的不同的應(yīng)用場景中,對算力有著不同的需求。
傳統(tǒng)的計算攝影由于算力的限制,只能做到場景重構(gòu)這一層級,比如大部分手機目前對于人像處理時采用的人臉檢測和美顏的計算。想要更進(jìn)一步,逐個像素對圖像進(jìn)行處理,乃至未來對AR/VR的三維圖像進(jìn)行實時處理,高算力是必不可少的。“根據(jù)OPPO的測試經(jīng)驗,實現(xiàn)像素級的圖像處理至少需要10-50TOPS級別的算力。”姜波表示。
他同時強調(diào),堆砌算力并非重點。算力往往可以通過提升計算主頻或者增加計算核心數(shù)量來粗暴地實現(xiàn),而更具挑戰(zhàn)的是在手機的功耗發(fā)熱約束之下依然能夠?qū)崿F(xiàn)高算力,這就是能效比的重要性。
馬里亞納 MariSilicon X 的能效比就達(dá)到了11.6 TOPS/W,這也是手機AI能效罕見地實現(xiàn)了雙位數(shù)的每瓦性能,是手機NPU芯片AI能效新的里程碑。
在OPPO的實際測試中,采用了OPPO自研的AI降噪算法(這一算法目前已經(jīng)應(yīng)用在了Find X3 Pro的夜景拍照中)。在實際的測試中,這樣的算法加載在Find X3 Pro上,AI的性能只能做到2fps,而功耗則接近1.7W;這樣的幀率,完全不夠視頻最低的30fps的要求。而1.7W的功耗,也遠(yuǎn)遠(yuǎn)超出了手機對視頻處理的最高功耗要求。
而同樣的模型加載在馬里亞納 MariSilicon X的時候,可以做到40fps的運行速度,同時功耗只有不到0.8W,這樣的性能是20倍的提升,功耗則不到之前的一半。“越專用,越高效,在這組實測數(shù)據(jù)中得到了最好的體現(xiàn)。”姜波分享說。
除了算力,AI神經(jīng)網(wǎng)絡(luò)的處理速度還受限于內(nèi)存的容量和讀寫速度,也就是行業(yè)常說的馮·諾依曼“內(nèi)存墻”瓶頸。計算單元的運算速度和傳輸速度就像一個木桶中的不同木板,最短的那個限制了計算單元的能力。
為了更好地發(fā)揮馬里亞納 MariSilicon X的運算能力,OPPO非常奢侈地集成了雙層存儲架構(gòu),包括萬億比特每秒(Tb/s)級讀寫速度的片上內(nèi)存子系統(tǒng),以及8.5GB/s的獨立DDR帶寬,為AI的高效運算提供充足的內(nèi)存讀寫支持。
片上內(nèi)存子系統(tǒng)集成在AI計算單元MariNeuro上,只服務(wù)于與AI運算相關(guān)的數(shù)據(jù)吞吐,最高可以提供數(shù)十倍于目前手機中最先進(jìn)的LPDDR5的數(shù)據(jù)傳輸速度,極大程度地降低數(shù)據(jù)在存儲與計算兩個單元的繁復(fù)讀寫,讓AI數(shù)據(jù)在計算的時候不需要離開AI計算單元,這就能大幅降低計算時的功耗。
不僅如此,馬里亞納 MariSilicon X獨立的DDR帶寬專門為芯片內(nèi)的各個IP提供獨立帶寬,也在SoC的基礎(chǔ)上,增加了17%的系統(tǒng)總帶寬。
此外,OPPO還為內(nèi)存子系統(tǒng)和獨立DDR帶寬設(shè)計了分層結(jié)構(gòu)與多行并行流程,保證圖像數(shù)據(jù)在MariLumi影像處理單元與MariNeuro AI計算單元間的輸入與輸出可以實現(xiàn)最低的時延,降低因反復(fù)讀寫數(shù)據(jù)造成的功耗,令視頻處理更快更高效。
AI降噪算法前置,帶來更優(yōu)畫質(zhì)
馬里亞納 MariSilicon X里面另外一個重要的自研IP——MariLumi 影像處理單元,它針對視頻流趨勢進(jìn)行了獨特設(shè)計,能夠流暢地面向4K規(guī)格的視頻數(shù)據(jù)量進(jìn)行計算。像素級的處理速度也讓智能HDR融合算法可以在這顆單元的前端運行,最終令畫面動態(tài)范圍達(dá)到了20bit 120db(20 stops),相比Find X3 Pro提升4倍,達(dá)到20bit Ultra HDR超級動態(tài)范圍。20bit-120dB意味著對于一張圖片而言,最暗和最亮的部分相差100萬倍。
姜波指出,OPPO通過該芯片的HDR能力,可以將原來只屬于白天的動態(tài)范圍,首次拓展到在夜間視頻上。相比Find X3的方案來看,馬里亞納 MariSilicon X處理后的視頻畫面更自然,動態(tài)范圍達(dá)到人眼可分辨的極限。
其實,從鏡頭到最終存儲的影像,是一個數(shù)據(jù)不斷壓縮的過程。具體來看,影像處理過程中涉及3個空間,RAW-RGB-YUV,數(shù)據(jù)每經(jīng)過一次轉(zhuǎn)換,就會受到一定損失。
RAW是原始數(shù)據(jù)的空間,這里承接的是從傳感器光電轉(zhuǎn)換得來的所有無損數(shù)據(jù),有著更豐富的信息量和更大的數(shù)據(jù)量。但RAW域的圖像信息是無法直接觀看的,必須在RGB域“上色”,再輸出到Y(jié)UV域進(jìn)行格式轉(zhuǎn)化,最后生成JPEG/HEIF等可在屏幕上觀看的格式。
RAW有一個好處就是它的線性度、色彩比較好,有更原始的信息,所以在RAW上處理,可以得到更好的處理效果。但算法復(fù)雜度、實際相應(yīng)的硬件投入都會更多。因此,傳統(tǒng)的HDR都選擇在YUV里合成。
而馬里亞納 MariSilicon X將傳統(tǒng)在后端的處理前置到了RAW域,并且因為強大的算力,最高可以支持20bit位寬的RAW數(shù)據(jù)處理。而且是基于更先進(jìn)的AI算法和20bit HDR融合的計算,對每個像素做實時的計算。
通過算法前置,MariSilicon X能夠為整個鏈路帶來最多8dB的信噪比提升,這意味著在YUV等待計算的通用平臺,拿到的也是更優(yōu)質(zhì)的圖像信息,就能夠在后處理,比如色調(diào)映射、3A校準(zhǔn)等基礎(chǔ)計算實現(xiàn)更高質(zhì)量的表現(xiàn)。
打破影像的不可能三角
人工智能的三要素是數(shù)據(jù)、算力和算法,對應(yīng)到計算影像上來說就是傳感器、芯片和AI算法,這三者環(huán)環(huán)相扣,缺一不可。但行業(yè)主要面臨的問題,就是傳感器、芯片和算法的技術(shù)發(fā)展不同步。一般來說,芯片的開發(fā)周期基本需要兩年以上,傳感器則是一年一代更新迭代,而算法開發(fā)和訓(xùn)練所需的時間則更短,這就意味著很難有廠商可以將三者在一個時間節(jié)點上完美調(diào)優(yōu)。
此外,在傳統(tǒng)的技術(shù)生態(tài)中,傳感器、芯片和影像算法會由產(chǎn)業(yè)鏈中不同領(lǐng)域的公司負(fù)責(zé)。假設(shè)有企業(yè)要做一顆芯片,通常的做法是去找專業(yè)的算法公司來購買算法,再找一個前端公司做芯片的邏輯設(shè)計,很少有公司會負(fù)責(zé)所有部分。這樣做在公司運營和成本方面好處有很多,但也帶來了用戶體驗上的問題——無法耦合各個模塊,也就無法將指標(biāo)做到最優(yōu)。
完美打通算法、芯片和傳感器是行業(yè)中長期以來都無法解決的問題,“我們稱之為手機影像的「不可能三角」。”姜波解釋稱。
如今,OPPO通過自己在影像領(lǐng)域的技術(shù)和算法積累,再加上近年來逐步建構(gòu)起的芯片設(shè)計能力,通過自研芯片和自研算法的整合,自研芯片和深度定制傳感器的配合,以及自研芯片和通用平臺的打通,打破手機影像的不可能三角。
RGBW Pro模式就是打破手機影像的不可能三角最好的例證。通過雙通路設(shè)計,馬里亞納 MariSilicon X實現(xiàn)了對RGB和W像素的分隔處理,最大化利用每一種像素特性,釋放出RGBW陣列的全部潛力。馬里亞納 MariSilicon X的RGBW Pro模式帶來了8.6dB的信噪比提升,以及1.7倍的解析力提升,在傳感器尺寸規(guī)格都沒有變化的前提下實現(xiàn)大幅的影像效果增強。
四項能力突破,解決夜景視頻畫質(zhì)問題
得益于前面提到的技術(shù),馬里亞納 MariSilicon X獲得了四項關(guān)鍵的技術(shù)能力,即(1)強大的AI計算能效;(2)領(lǐng)先行業(yè)的Ultra HDR;(3)無損的實時RAW計算;(4)最大化傳感器能力的RGBW Pro。而這思想能力的突破,讓OPPO可以解決手機影像長期尚未解決的難題——夜景視頻畫質(zhì)的問題。
在全新標(biāo)準(zhǔn)之下,安卓影像第一次有能力同時支持4K + 20bit RAW + AI + Ultra HDR的極限規(guī)格。最終的結(jié)果,就是夜景視頻的畫質(zhì)得到了質(zhì)的提升。
從1080P到4K:傳統(tǒng)弱光下的視頻拍攝,只要打開AI視頻增強,由于算力所限,畫質(zhì)被限制在1080P。馬里亞納 MariSilicon X超強AI性能將分辨率提升了4倍,首次讓AI計算夜景視頻達(dá)到4K規(guī)格。
從有損到無損:相較于傳統(tǒng)計算影像都發(fā)生在YUV域的有損后處理,馬里亞納 MariSilicon X將復(fù)雜的計算前置在RAW域,為整體影像鏈路輸出更高質(zhì)量的原始圖像信息。
從AI拍照到AI視頻:馬里亞納 MariSilicon X也讓原本只能用于拍照的AI降噪算法,首次拓展到了視頻應(yīng)用,為視頻的每一幀帶來極高的純凈度。
從18bit HDR到20bit Ultra HDR:馬里亞納 MariSilicon X支持的畫面動態(tài)范圍達(dá)到了20bit Ultra HDR,是目前主流平臺18bit的4倍(2的20次方與2的18次方相比),信噪比達(dá)到120db,讓視頻的每一幀都擁有和人眼一致的動態(tài)范圍。
結(jié)語
總的來說,馬里亞納 MariSilicon X是一顆極致功耗的NPU,結(jié)合20bit的HDR,RAW處理、以及RGBW傳感器的耦合,加上OPPO多年來在影像技術(shù)方面的探索和影像算法方面的積累,將視頻拍攝推向了一個新的高度。
以前,手機上只能做YUV的1080p的AI降噪處理,有了馬里亞納 MariSilicon X的助力后,4K的AI在RAW上實現(xiàn)了可能,讓用戶體驗有了4倍的提升。也就是說,有了馬里亞納 MariSilicon X后,不論是拍照,還是錄視頻;也不論是拍夜景,還是錄夜景視頻,用戶都將得心應(yīng)手。
一般來說,消費類電子產(chǎn)品使用的芯片是一年一升級,明年的馬里亞納 MariSilicon X是否會推出其第二代產(chǎn)品呢?姜波回應(yīng)稱,對于下一代產(chǎn)品,目前已經(jīng)在探索中了。
最后,姜波透露說,馬里亞納 MariSilicon X芯片將會首先搭載在Find X系列手機上,預(yù)計明年一季度就可以與廣大用戶見面,請大家拭目以待。
原文標(biāo)題:OPPO造芯,首推6nm影像專用NPU芯片劍指夜景視頻
文章出處:【微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
芯片
+關(guān)注
關(guān)注
454文章
50460瀏覽量
421971 -
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
6909瀏覽量
88849 -
OPPO
+關(guān)注
關(guān)注
20文章
5224瀏覽量
78763
原文標(biāo)題:OPPO造芯,首推6nm影像專用NPU芯片劍指夜景視頻
文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論