精品亚洲国产成AV人片传媒_最新精品国产免费_精品无码专区在线_中文国产成人精品少久久_国产精品免费无码二区

Seam Carving一種很強(qiáng)的圖像縮放算法

簡介

我們在排版的時候可能會遇到一些尷尬的情況。一張圖片原本是豎著的，而你希望把它當(dāng)作一張寬屏圖片，于是你只好對它進(jìn)行拉伸：

撫子的形狀瞬間變得不可描述起來。有沒有什么辦法，能不改變前景撫子的形象，只是拉伸背景的天空呢？也許你會想到萬能的神經(jīng)網(wǎng)絡(luò)。但早在神經(jīng)網(wǎng)絡(luò)火遍大江南北之前，就有一種方法流行于世間：Seam Carving。它可以做到這樣：

完美符合我們的要求！那么這個仿佛魔法一樣的Seam Carving是如何工作的呢？

什么是圖像

我們這里將所談?wù)摰降膱D像限定為二維的像素圖象，而不是矢量圖象或者三維的體素組成的“圖像”之類的東西。對于一幅圖像，它的每個像素?fù)碛幸粋€整數(shù)坐標(biāo)，同時擁有一個顏色，后者以 RGB 的形式表現(xiàn)。

當(dāng)人看到圖像的時候，主要是通過識別圖像當(dāng)中的邊緣來分辨圖像中的物體的，這提示我們邊緣的信息對于尋找圖像中的主要物體有著重要的作用。如果我們在圖像縮放的時候能夠盡量不影響到這些像素，那么就有可能做到在保證圖像中主要物體的比例不變的情況下拉伸背景。就像這樣

| 原圖像

| 縮放后

由此我們可以得出結(jié)論：通過依次刪除圖像中若干條自上而下和自左而右的像素通路，就可以達(dá)到“縮放”的目的。就自上而下的像素通路來說，這樣的通路寬度為 1，從圖像的第一行連接到圖像的最后一行，在每一行中只占據(jù)一個像素，相鄰行的像素的水平坐標(biāo)相差在 -1 到 1 之間。刪除這樣的自上而下的像素保證了圖像的寬度減一的同時不會出現(xiàn)寬度不同的行；自左而右的像素通路也是同理。

圖中的紅線分別是一條垂直通路和水平通路。如何找到這樣的像素通路，穿過盡可能少的重要物體？為此，我們引入了一個概念：“能量”。

能量，又是能量

能量在這里起到的作用是表征像素的重要程度。先從圖像的基本元素的能量——像素的能量說起。對于單個像素，我們可以定義其能量形式為：

其中，字母I表示像素灰度值，第一個偏導(dǎo)項就表示了色彩在這個像素變化的劇烈程度。如果我們將 RGB 顏色的像素的顏色看作一個三維向量，那么其能量形式也會是一個三維向量，這對于算法的后續(xù)實現(xiàn)是不利的。在實現(xiàn)中，我們可以用灰度標(biāo)量代替 RGB 三維向量參與運(yùn)算，因為人眼對灰度的敏感度遠(yuǎn)高于色彩。公式看起來不太直觀，來看一個例子：

與人物有關(guān)的部分，細(xì)節(jié)比較多，對應(yīng)的顏色變化也更明顯，能量也就越高。相比之下，背景部分比如天空的顏色變化不太明顯，能量普遍比較低。對應(yīng)到上圖中，可能找到的垂直能量通路就是左側(cè)的天空，刪除之后并不會影響魚和人物的部分。

對于任意的一條自上而下的像素通路，該通路的能量就是該通路中所有像素的能量的和。

利用能量進(jìn)行分割

前文說到，像素的能量表征了像素的重要程度，那么像素通路的能量就表征了像素通路中所有像素的總體重要程度，也就表征了該通路穿過的重要物體的多寡，也就表征了刪除這條像素通路對圖像中重要物體的影響程度的大小。刪除一條能量最小的像素通路對圖像中重要物體的影響是最小的。

對于這樣一張圖像，如果對其進(jìn)行縮放，我們希望保留不同顏色間的分界線，使其形狀和比例盡可能地不改變。即這幾條分界線的重要性應(yīng)該盡可能地高。根據(jù)我們關(guān)于能量的定義，分界線附近的像素的能量顯著地高于色塊中的像素。如果要被刪去的像素通路主要通過色塊區(qū)域，那么分界線的形狀就可以得到保留了。

那么現(xiàn)在的問題就變成了如何尋找一條能量最小的像素通路，這里以自上而下的像素通路說明尋找這樣的像素通路的方式。這就轉(zhuǎn)換為了一個經(jīng)典的動態(tài)規(guī)劃問題，形式化的轉(zhuǎn)移方程如下：

我們記 dpi 為從圖像的第一行到第 i 行的第 j 個像素的通路中能量最小的通路的能量 e 以及該像素在該通路上的前驅(qū) p。第 i 行的第 j 個像素的能量為 e(i,j)。那么

這個公式可能還是有點太過抽象了。由于通路一定是連通的，也就是某一個像素只可能與三個像素位于同一條通路內(nèi)，分別是它的左上、正上和右上。

如果我們分別知道它左上、正上和右上的三個像素所在的通路的最低能量，只需要選出能量最低的一條并加上自己的能量，就構(gòu)成了當(dāng)前像素的最短能量通路。換言之，這其實是一種歸納法：

·第一行每個像素的累積能量是自己的能量值

·除此之外每一行每個像素的累計能量是上一行的三個相鄰像素中最低的累積能量加上自己的能量值

·最后一行的累計能量最低的就代表了一條能量最短的通路

當(dāng)然，這里還有一個小小的擴(kuò)展：現(xiàn)在有一個希望縮減的圖像，其寬高分別需要縮減 dw 和 dh 個像素。這就意味著這張圖象需要刪去 dw 和 dh 條能量最小的自上而下的通路和自左而右的通路。我們可以選擇先刪除自左而右的通路，再刪除自上而下的通路，反之亦可。但是為了追求刪除通路的總能量和最小——這樣全部刪除掉的像素對重要物體的影響最小，我們還可以優(yōu)化這個刪除順序。

這個問題也可以用動態(tài)規(guī)劃的方法解決。不妨記 dq[i] [j] 為原圖像在水平縮減 i 個像素長度、垂直縮減 j 個像素長度的過程中所有刪去的像素通路的能量值和的最小值，由于寬高分別為 x 和 y 的圖像在這種縮放方式下只有可能通過寬高為 (x+1,y) 或 (x,y+1) 的圖像縮減而來，所以有

有了上面的經(jīng)驗，讀者能否自己理解這個轉(zhuǎn)移方程的含義呢？

最后再來看一個利用Seam Carving方法處理的例子：

| 原圖像

| 縮減后

很多細(xì)節(jié)得到了保留，比起直接拉伸來說要好太多了。

結(jié)語

本文介紹的這種Seam Carving方法由Avidan等人發(fā)明，并發(fā)表在2007年的Siggraph中，目前已經(jīng)有非常廣泛的應(yīng)用，在Photoshop等軟件中都可以找到它的身影。比起目前主流的神經(jīng)網(wǎng)絡(luò)方法來說，它要簡單的多，并且有很大的改良余地，最終效果也不遑多讓。有興趣的同學(xué)也可以進(jìn)一步的研究或者和我討論。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4765

瀏覽量
100561
算法

算法

+關(guān)注

關(guān)注
23

文章
4601

瀏覽量
92670
圖像

圖像

+關(guān)注

關(guān)注
2

文章
1083

瀏覽量
40418

原文標(biāo)題：Seam Carving - 一種很強(qiáng)的圖像縮放算法

文章出處：【微信號：vision263com，微信公眾號：新機(jī)器視覺】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

EPS格式圖像的最佳使用場景

EPS（Encapsulated PostScript）是一種廣泛使用的矢量圖形文件格式，最初由Adobe公司開發(fā)。它以其高兼容性、可縮放性和高質(zhì)量的圖像輸出而受到設(shè)計師和出版業(yè)的青睞。 1. 專業(yè)

發(fā)表于 11-19 10:33 ?163次閱讀

tft屏幕屬于lcd屏幕的一種嗎

TFT屏幕確實屬于LCD（液晶顯示器）屏幕的一種。LCD屏幕是一種廣泛使用的顯示技術(shù)，它通過液晶分子的排列變化來控制光線的通過，從而實現(xiàn)圖像的顯示。TFT（Thin Film Transistor

發(fā)表于 10-12 10:31 ?577次閱讀

晶振封裝秘籍：滾邊焊(SEAM)技術(shù)大揭秘!

晶振滾邊焊(SEAM)是一種焊接技術(shù)，主要用于晶體振蕩器的封裝過程中。它涉及到在氮氣環(huán)境中使用高溫將晶振的蓋板與基座焊接在一起完成封裝。使得外殼邊緣熔化并形成牢固的焊縫。這樣的焊接方式可以提高封裝

發(fā)表于 07-22 09:29 ?1218次閱讀

晶振封裝秘籍：滾邊焊(<b class='flag-5'>SEAM</b>)技術(shù)大揭秘!

圖像識別算法都有哪些方法

圖像識別算法是計算機(jī)視覺領(lǐng)域的核心任務(wù)之一，它涉及到從圖像中提取特征并進(jìn)行分類、識別和分析的過程。隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展，圖像識別

發(fā)表于 07-16 11:14 ?5164次閱讀

圖像識別算法的提升有哪些

方法。數(shù)據(jù)增強(qiáng) 數(shù)據(jù)增強(qiáng)是提高圖像識別算法性能的一種有效方法。通過對訓(xùn)練數(shù)據(jù)進(jìn)行變換和擴(kuò)展，可以增加數(shù)據(jù)的多樣性，提高模型的泛化能力。常見的數(shù)據(jù)增強(qiáng)方法包括： 2.1 旋轉(zhuǎn)、縮放、平

發(fā)表于 07-16 11:12 ?599次閱讀

圖像識別算法的優(yōu)缺點有哪些

圖像識別算法是一種利用計算機(jī)視覺技術(shù)對圖像進(jìn)行分析和理解的方法，它在許多領(lǐng)域都有廣泛的應(yīng)用，如自動駕駛、醫(yī)療診斷、安全監(jiān)控等。然而，圖像識別

發(fā)表于 07-16 11:09 ?1371次閱讀

圖像識別算法的核心技術(shù)是什么

圖像識別算法是計算機(jī)視覺領(lǐng)域的一個重要研究方向，其目標(biāo)是使計算機(jī)能夠像人類一樣理解和識別圖像中的內(nèi)容。圖

發(fā)表于 07-16 11:02 ?574次閱讀

opencv圖像識別有什么算法

OpenCV（Open Source Computer Vision Library）是一個開源的計算機(jī)視覺和機(jī)器學(xué)習(xí)軟件庫，提供了大量的圖像處理和計算機(jī)視覺相關(guān)的算法。以下是一些常見

發(fā)表于 07-16 10:40 ?864次閱讀

DSP C6000教學(xué)實驗箱操作教程_數(shù)字圖像處理：5-3 圖像縮放

一、實驗?zāi)康?學(xué)習(xí)圖像縮放的原理，掌握圖像的讀取方法，并實現(xiàn)圖像縮放。二、實驗原理

發(fā)表于 06-20 11:28

基于FPGA的常見的圖像算法模塊總結(jié)

意在給大家補(bǔ)充一下基于FPGA的圖像算法基礎(chǔ)，于是講解了一下常見的圖像算法模塊，經(jīng)過個人的總結(jié)，

發(fā)表于 04-28 11:45 ?549次閱讀

FPGA圖像處理之CLAHE算法

在FPGA圖像處理--CLAHE算法(一)中介紹了為啥要用CLAHE算法來做圖像增強(qiáng)。

發(fā)表于 01-04 12:23 ?2416次閱讀

FPGA圖像處理-CLAHE算法介紹(一)

在介紹CLAHE算法之前必須要先提一下直方圖均衡化，直方圖均衡化算法是一種常見的圖像增強(qiáng)算法，可

發(fā)表于 01-02 13:32 ?1691次閱讀

Vivado HLS的圖像傳感器FPN噪聲去除算法設(shè)計

，表現(xiàn)為明暗不均勻的條帶噪聲。同時，為了滿足圖像傳感器的實時攝像要求，算法的處理延時要低[3]。基于以上原因，本設(shè)計提出一種適用于圖像傳感器的 FPN 噪聲去除

發(fā)表于 01-02 11:10 ?1533次閱讀

OpenCV邊緣模板匹配算法原理詳解

，悲喜交加，充分感受到了理想與現(xiàn)實的距離，不過沒關(guān)系，這里介紹一種新的模板匹配算法，主要是基于圖像邊緣梯度，它對圖像光照與像素遷移都有很強(qiáng)的

發(fā)表于 12-07 10:56 ?1332次閱讀

一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng)

提出了一種基于RGB-D圖像序列的協(xié)同隱式神經(jīng)同步定位與建圖(SLAM)系統(tǒng)，該系統(tǒng)由完整的前端和后端模塊組成，包括里程計、回環(huán)檢測、子圖融合和全局優(yōu)化。

發(fā)表于 11-29 10:35 ?579次閱讀