本文總結了使用Python進行機器視覺(圖像處理)編程時常用的數據結構,主要包括以下內容:
數據結構
序列操作:索引(indexing)、分片(slicing)、加(adding)、乘(multipying)等
列表:創建、list函數、基本操作:賦值、刪除、分片賦值、插入、排序等
元組:創建、tuple函數、基本操作
NumPy數組:創建數組、創建圖像、獲取形狀、維度、元素個數、元素類型、訪問像素、通道分離、使用mask
1. 數據結構
數據結構是通過某種方式(例如對元素進行編號)組織在一起的數據元素的集合,這些數據元素可以是數字或者字符,甚至可以是其他數據結構。在Python中最基本的數據結構是序列(sequence)。序列中每個元素被分配一個序號——即元素的位置,也稱為索引(index),第一個元素的索引是0,第二個是1,以此類推。
python包含6種內建序列,最常用的兩種類型是:列表和元組。列表和元組的主要區別在于列表可以修改,元組不可以修改。而用于處理圖像的基本數據結構是數組,由于Python標準庫中的內建數組只能處理一維數組并且提供的功能較少,因此做編程時常使用NumPy模塊的array()數組表示圖像,并進行各類處理。
2. 通用序列操作
所有序列都可以進行某些特定操作,包括:索引(indexing)、分片(slicing)、加(adding)、乘(multipying)以及檢查某個元素是否屬于序列成員(成員資格),除此之外,python還有計算序列長度、找出最大元素和最小元素的內建函數。
(1)索引
序列中所有元素的編號都是從0開始遞增。
>>>greeting = 'Hello'
>>>greeting[0]
'H'
>>>greeting[1]
'e'
所有序列都可以通過這種方式獲取元素。最后一個元素的編號是-1
>>>greeting[-1]
'o'
如果一個函數調用返回一個序列,則可以直接對返回序列進行索引操作
>>>fourth = raw_input('Year: ')[3]
Year: 2016
>>>fourth
6
(2)分片
使用分片操作來方位一定范圍內的元素。分片通過冒號隔開兩個索引來實現。
>>>tag='Python web site'
>>>tag[9:30]
'"http://www.python.org '
>>>numbers=[1,2,3,4,5,6,7,8,9,10]
>>>numbers[3:6]
[4,5,6]
>>>numbers[0:1]
[1]
注意索引邊界:第1個索引的元素包含在分片內,第2個索引的元素不在分片內,如果要索引最后一個元素
>>>numbers[-3:]
[8,9,10]
>>>print numbers[-1:]
[10]
這種方法同樣適用于序列開始的元素:
>>>numbers[:3]
[1,2,3]
如果需要復制整個序列,可以將兩個索引都置空:
>>>numbers[:]
[1,2,3,4,5,6,7,8,9,10]
我們還可以使用第三個參數設置分片的步長,下面代碼為從numbers序列中選出從0到10,步長為2的元素
>>>numbers[0:10:2]
[1,3,5,7,9]
如果要將每4個元素中的第1個提取出來可以這樣寫
>>>numbers[::4]
[1,5,9]
步長為負數將向左提取元素,當使用負數作為步長時開始的點的索引必須大于結束點的索引
>>>number[8:3:-1]
[9,8,7,6,5]
>>>numbers[10:0:-2]
[10, 8, 6, 4, 2]
(3)序列相加
使用+運算符可以進行序列的連接操作:
>>>[1,2,3] + [4,5,6]
[1,2,3,4,5,6]
>>>'Hello, ' + 'world!'
'Hello, world!'
注意同種類型的序列才能連接到一起,列表和字符串是無法連接的。
(4)乘法
數字x乘以序列會生成新的序列。新序列中,原來的序列將被重復x次
>>>'pyhton' * 5
'pyhtonpyhtonpyhtonpyhtonpyhton'
>>>[42]*10
[42,42,42,42,42,42,42,42,42,42]
(5)None空列表和初始化
空列表可以通過兩個中括號中間什么都不寫表示[]
如果想創建一個占用 10個元素空間,卻不包括任何有用內容的列表,可以用:
>>>[0]*10
None是一個Python的內建值,它的確切含義是這里什么都沒有。
>>>[None]*10
(6)成員資格in
為了檢查一個值是否在列表中,可以使用in運算符,返回布爾值真或假:
>>>permission = 'rw'
>>>'w' in permission
True
>>>'x' in permission
False
下面的例子,檢查用戶名和PIN碼:
database = [
['albert', '1234'],
['dilbert','4242'],
['smith', '7524'],
['jones', '9843']
]
username = raw_input('User name: ')
pin = raw_input('PIN code: ')
if [username,pin] in database:
print 'Access granted'
運行結果:
User name: jones
PIN code: 9843
Access granted
(7)長度、最小值和最大值
內建函數len,min,max
>>>numbers[100,34,678]
>>>len(numbers)
3
>>>max(numbers)
678
>>>min(numbers)
34
>>>max(2,3)
3
>>>min(2,3,4,5)
2
3. 列表
(1)list函數
因為字符串不能像列表一樣修改,所以有時候根據字符串創建列表很有用
>>>list('Hello')
['H','e','l','l','o']
list適用于所有類型的序列,而不只是列表。
(2)列表基本操作
元素賦值
>>>x=[1,1,1]
>>>x[1]=2
>>>x
[1,2,1]
刪除元素
>>>x=[1,2,3]
>>>del x[1]
>>>x
[1,3]
del也可刪除其他元素,甚至是變量。
分片賦值
>>>name=list('Perl')
>>>name
['P','e','r','l']
>>>name[2:]=list('ar')
>>>name
['P','e','a','r']
通過分片賦值插入元素和刪除元素
>>>numbers=[1,5]
>>>numbers[1:1]=[2,3,4]
>>>numbers
[1,2,3,4,5]
>>>numbers[1:4]=[]
>>>numbers
[1,5]
(3)列表方法
列表方法的使用:對象.方法(參數)
append 在列表末尾追加
>>>a = [1,2,3]
>>>a.append['4']
>>>a
[1,2,3,4]
count 統計某個元素在列表中出現的次數
>>>['to','go','will','be','to','not'].count('to')
2
extend 在列表末尾一次性追加另一個序列中的多個值
>>>a = [1,2,3]
>>>b = [4,5,6]
>>>a.extend(b)
>>>a
[1,2,3,4,5,6]
>>>c = [1,2,3]
>>>d = [4,5,6]
>>>c+d
[1,2,3,4,5,6]
>>>c
[1,2,3]
index 從列表中找出某個值第一個匹配項的索引位置
>>>slogen= ['we', 'are', 'the', 'champion']
>>>slogen.index('are')
1
>>> slogen[1]
'are'
insert 將對象插入到列表中
>>>numbers=[1,2,3,4,6]
>>>numbers.insert(4,'five')
>>>numbers
[1, 2, 3, 4, 'five', 6]
第1個參數為插入的位置,在此索引前插入;
第2個參數為插入的元素內容
insert方法的操作也可用分片的方法實現元素插入
>>>numbers=[1,2,3,4,6]
>>>numbers[4:4]=['five']
>>>numbers
[1, 2, 3, 4, 'five', 6]
pop 移除列表中的一個元素
pop方法可實現一個常見的數據結構——棧。棧的原理就像堆盤子,只能在頂部放一個盤子,同樣也只能從頂部拿走一個盤子。最后被放入堆棧的元素最先被移除。(此原則稱為后進先出,LIFO)。
pop()方法默認移除列表中的最后一個元素,并返回該元素的值
>>>numbers=[1,2,3,4,5]
>>>numbers.pop()
5
>>> numbers
[1, 2, 3, 4]
如果想要移除列表中的第一個元素,可以用pop(0)
>>>numbers=[1,2,3,4,5]
>>>numbers.pop(0)
1
>>> numbers
[2, 3, 4, 5]
Python沒有入棧操作,可以用append方法代替。
如果想要實現一個先進先出(FIFO)隊列,可以使用insert(0,...)來替代append方法。或者也可以使用append方法,但必須用pop(0)替代pop()。也可使用collection模塊中的deque對象。
remove 移除列表中的某個值的第一個匹配項
>>>x=['to','go','will','be','to','not']
>>>x.remove('to')
>>>x
['go','will','be','to','not']
reverse 將列表中的元素反向存放
>>>x=[1,2,3]
>>>x.reverse()
>>>x
[3,2,1]
sort 在原始位置對列表進行排序
在原始位置排序將改變原來的列表,從而讓其中的元素能按一定的順序重新排列,而不是簡單的返回一個排序的列表副本。
>>>x=[3,1,2,6,4,5,7,9,8]
>>>x.sort()
>>>x
[1,2,3,4,5,6,7,8,9]
注意:sort方法只改變原始列表的排序,并沒有返回值。如果需要一個重新排序的列表副本,應該如下操作:
>>>x=[3,1,2,6,4,5,7,9,8]
>>>y=x[:] #不能直接y=x
>>>y.sort()
>>>y
[1,2,3,4,5,6,7,8,9]
>>>x
[3,1,2,6,4,5,7,9,8]
注意:y=x只是讓y和x指向同一個列表,而y=x[:]是復制整個x列表給y。
sorted 獲取排序列表的副本
>>>x=[3,1,2,6,4,5,7,9,8]
>>>y=sorted(x)
>>>y
[1,2,3,4,5,6,7,8,9]
>>>x
[3,1,2,6,4,5,7,9,8]
sort方法的高級排序
希望列表元素能按照特定的方式排序(而不是sort函數默認的方式,即根據Python默認排序規則按升序排列元素),可以通過compare(x,y)的形式自定義比較函數。compare(x,y)函數會在xy時返回正數,如果x=y則返回0(根據自己定義)。定義好該函數后,可以提供給sort方法作為參數。內建函數cmp提供了比較函數的默認實現方式:
>>>cmp(16,12)
1
>>>cmp(10,12)
-1
>>>cmp(10,10)
0
>>>numbers=[1,4,2,9]
>>>numbers.sort(cmp)
>>>numbers
[1,2,4,9]
sort方法還有另外兩個參數可選,可以通過某個名字來指定該參數(關鍵字參數):
參數:key
提供一個在排序中使用的函數,該函數不是直接確定對象的大小,而是為每個元素創建一個鍵,然后所有元素根據鍵來排序。
>>>x=['nor','break','if','then','present']
>>>x.sort(key=len) # 按字符串長度排序
>>>x
['if', 'nor', 'then', 'break', 'present']
參數:reverse
另一個關鍵字參數reverse是簡單的布爾值,用于指明是否要進行反向排序
>>> x=[3,1,2,6,4,5,7,9,8]
>>> x.sort(reverse=True)
>>>x
[9, 8, 7, 6, 5, 4, 3, 2, 1]
注意:cmp,key,reverse參數都可用于sorted函數。
4. 元組
元組與列表一樣,也是一種序列,但元組是不可變列表,元組不能修改。
元組的作用
體現在映射(和集合的成員)中當做鍵使用——列表不行
元組在很多內建函數的返回值存在,也就是說我們必須對元組進行處理
(1)創建元組
創建一個元組
>>>1,2,3
(1,2,3)
元組大部時候通過圓括號括起來
>>>x=(1,2,3)
>>>x
(1,2,3)
創建一個空元組
空元組可以用沒有內容的空括號括起來
>>>()
()
創建一個包含一個元素的元組
>>>(10,)
(10,)
是的,一個元素也需要用逗號。逗號很重要,看下面的例子
>>>2*(3+2)
10
>>>2*(3+2,)
(5, 5)
不加逗號為數字,加逗號就是元組。
(2)tuple函數
tuple函數以一個序列作為參數并轉換為元組,如果參數本身就是元組,則不發生變化。
>>>tuple([1,2,3])
(1,2,3)
>>>tuple(['a','b','c'])
('a','b','c')
>>>tuple((1,2,3))
(1,2,3)
(3)元組基本操作
元組除了創建和訪問其元素外,沒有太多其他操作,元組操作與操作其他序列類似。
>>>x=1,2,3
>>>x[1]
2
>>>x[0:2]
(1,2)
5. NumPy的array(數組)對象
NumPy模塊用于python計算機視覺編程時的向量、矩陣的表示與操作,是opencv for python的主要數據結構模塊。NumPy中的數組對象array是多維的,可以用來表示向量、矩陣和圖像。一個數組對象很像一個列表(或者是列表的列表),但數組中的元素必須具有相同的數據類型。除非創建數組對象時指定數據類型,否則數據類型會按照數據的類型自動確定。
本節代碼假定已經以如下形式導入OpenCV和NumPy兩個庫
import cv2
import numpy as np
(1)np.array()創建數組
>>> a = np.array([1, 2, 3, 4])
>>> b = np.array((5, 6, 7, 8))
>>> c = np.array([[1, 2, 3, 4],[4, 5, 6, 7], [7, 8, 9, 10]])
>>> b
array([5, 6, 7, 8])
>>> c
array([[1, 2, 3, 4],
[4, 5, 6, 7],
[7, 8, 9, 10]])
>>> d = np.arange(15).reshape(3, 5)
>>> d
array([[ 0, 1, 2, 3, 4],
[ 5, 6, 7, 8, 9],
[10, 11, 12, 13, 14]])
(2)np.array()創建黑白圖像
使用np.zeros()創建一幅圖像,dtype為元素數據類型,下文有具體分析,8位灰度圖像為uint8型。接著用np.ones()創建一幅圖像,通過賦值稱為一幅白色圖像。
img1 = np.ones((100,200),dtype=np.uint8)
img2 = np.ones((100,200),dtype=np.uint8)
img2[:]=255;
cv2.imshow('img1',img1)
cv2.imshow('img2',img2)
cv2.waitKey(0)
?
彩色圖像的創建需要指定一個3維數組,具體方法請看下文。
(3)ndarray.shape屬性獲得/修改數組形狀
獲取數組 shape 屬性
數組的形狀可以通過其shape 屬性獲得,它是一個描述數組各個軸長度的元組(tuple),看看上文定義的a,c數組的shape屬性:
>>> a.shape
(4,)
>>> c.shape
(3, 4)
數組a的shape 屬性只有一個元素,因此它是一維數組。而數組c的shape屬性有兩個元素,因此它是二維數組,其中第0軸的長度為3,第1軸的長度為4。
獲取圖像的寬高
圖像本質是矩陣,因此可以使用shape屬性獲取圖像矩陣的行、列和通道數,如果圖像是灰度圖,則沒有第3個參數。我們也可以用ndim方法判斷圖像通道數:
img = cv2.imread('f:/images/cow.jpg')
rows,cols,channels = img.shape
print 'rows,cols,channels = ',rows,cols,channels
print 'demension = ',img.ndim
cv2.imshow('test',img)
cv2.waitKey(0)
運行結果:
rows,cols,channels = 400 600 3
demension = 3
修改數組 shape 屬性
可以通過修改數組的shape 屬性,在保持數組元素個數不變的情況下,改變數組每個軸的長度。下面的例子將數組c的shape 屬性改為(4,3),注意:從(3,4)改為(4,3)并不是對數組進行轉置,而只是改變每個軸的大小,數組元素在內存中的位置并沒有改變。
>>> c = np.array([[1, 2, 3, 4],[4, 5, 6, 7], [7, 8, 9, 10]])
>>> c.shape = 4,3
>>> c
array([[ 1, 2, 3],
[ 4, 4, 5],
[ 6, 7, 7],
[ 8, 9, 10]])
當設置某個軸的元素個數為-1 時,將自動計算此軸的長度。由于數組c 中有12 個元素,因此下面的程序將數組c 的shape 屬性改為了(2,6):
>>> c.shape = 2,-1
>>> c
array([[ 1, 2, 3, 4, 4, 5],
[ 6, 7, 7, 8, 9, 10]])
使用數組的reshape()方法,可以創建指定形狀的新數組,而原數組的形狀保持不變
>>> a = np.array([1, 2, 3, 4])
>>> e = a.reshape((2,2)) # 也可以用a.reshape(2,2)
>>> e
array([[1, 2],
[3, 4]])
>>> a
array([1, 2, 3, 4])
注意:數組a 和e 其實共享數據存儲空間,因此修改其中任意一個數組的元素都會同時修改另外一個數組的內容:
>>> a[1] = 100 # 將數組a 的第一個元素改為100
>>> e # 注意數組d 中的2 也被改為了100
array([[ 1, 100],
[3, 4]])
(4)ndarray.ndim屬性:數組維度
返回數組的軸數量,即維度。在Python中維度稱為rank
(5)ndarray.dtype屬性:數組元素類型
數組的元素類型可以通過dtype 屬性獲得。前面例子中,創建數組所用序列的元素都是整數,因此所創建的數組的元素類型是整型,并且是32bit 的長整型:
>>> c.dtype
dtype('int32')
>>>print img1.dtype
uint8
NumPy 中的數據類型都有幾種字符串表示方式,字符串和類型之間的對應關系都存儲在typeDict 字典中,例如'd'、'double'、'float64'都表示雙精度浮點類型:
>>> np.typeDict["d"]
>>> np.typeDict["double"]
>>> np.typeDict["float64"]
完整的類型列表可以通過下面的語句得到,它將typeDict字典中所有的值轉換為一個集合,從而去除其中的重復項:
>>> print set(np.typeDict.values())
set([, ,
, ,
, ,
, ,
, ,
, ,
, ,
, ,
, ,
, ,
, ,
, ])
(6)ndarray.size屬性:數組元素個數
數組中所有元素的個數。這個參數等于shape屬性返回的參數的乘積。
>>>print img1.shape
(100,200)
>>>print img1.size
20000
(7)ndarray.itemsize屬性:單個數組元素所占字節數
數組單個元素所占的字節數。例如,數組元素為float64型時,其itemsize=8 (=64/8)。如果是復數complex32類型,則itemsize 4 (=32/8)。
>>>print img1.itemsize
1
(8)ndarray.data屬性:實際數組元素的緩存
通常用不到這個屬性,因為可以通過下標方位數組元素。
(9)訪問像素/訪問多維數組元素
NumPy的array數組對象與Python中的序列一樣,可以通過下標、切片的方式訪問。
多維數組的存取和一維數組類似,因為多維數組有多個軸,因此它的下標需要用多個值表示。NumPy 采用元組(tuple)作為數組的下標,元組中的每個元素和數組的每個軸對應。下圖顯示了一個形狀為(6,6)的數組a,圖中用不同顏色和線型標識出各個下標對應的選擇區域。
>>> a = np.arange(0, 60, 10).reshape(-1, 1) + np.arange(0, 6)
>>> a
array([[ 0, 1, 2, 3, 4, 5],
[10, 11, 12, 13, 14, 15],
[20, 21, 22, 23, 24, 25],
[30, 31, 32, 33, 34, 35],
[40, 41, 42, 43, 44, 45],
[50, 51, 52, 53, 54, 55]])
?
Python 的下標語法(用[]存取序列中的元素)本身并不支持多維,但是由于可以使用任何對象作為下標,因此NumPy 使用元組作為下標存取數組中的元素,使用元組可以很方便地表示多個軸的下標。雖然在Python 程序中,經常用圓括號將元組的元素括起來,但其實元組的語法只需要用逗號隔開元素即可,例如“x,y=y,x”就是用元組交換變量值的一個例子。因此a[1,2]和a[(1,2)]完全相同,都是使用元組(1,2)作為數組a 的下標。
(10)np.array()創建彩色圖像
下面的例子通過創建一個3維數組作為3通道彩色圖像,并給不同通道賦值,創建兩幅不同的色彩圖像:
import cv2
import numpy as np
import random
# create a blue image
img3 = np.zeros((100,200,3),dtype=np.uint8)
img3[:,:,0]=255 # blue channel
# create a random color image
img4 = np.zeros((100,200,3),dtype=np.uint8)
seq = xrange(0,255)
ch0 = random.sample(seq,200)
ch1 = random.sample(seq,200)
ch2 = random.sample(seq,200)
img4[0:200,:,0] = ch0
img4[0:200,:,1] = ch1
img4[0:200,:,2] = ch2
# display image
cv2.imshow('img3',img3)
cv2.imshow('img4',img4)
cv2.waitKey(0)
cv2.destroyAllWindows()
?
(11)通道分離
下面的代碼實現BGR通道分離:
img = cv2.imread('f:/images/Lena.jpg')
b = np.zeros((img.shape[0],img.shape[1]), dtype=img.dtype)
g = np.zeros((img.shape[0],img.shape[1]), dtype=img.dtype)
r = np.zeros((img.shape[0],img.shape[1]), dtype=img.dtype)
b[:,:] = img[:,:,0]
g[:,:] = img[:,:,1]
r[:,:] = img[:,:,2]
cv2.imshow("Blue", r)
cv2.imshow("Red", g)
cv2.imshow("Green", b)
cv2.waitKey(0)
cv2.destroyAllWindows()
?
(12)設置mask屏蔽不感興趣區域
img = cv2.imread('f:/images/Lena.jpg',0)
mask = np.zeros((img.shape[0],img.shape[1]),dtype=img.dtype)
mask[img.shape[0]/4:3*img.shape[0]/4,img.shape[1]/4:3*img.shape[1]/4] = 255
img_mask = img.copy()
img_mask[mask==0]=0
cv2.imshow('mask',mask)
cv2.imshow('Lena_mask',img_mask)
cv2.imshow('Lena',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
讀取彩色或黑白圖像都可已使用上述代碼。讀取彩色圖像cv2.imread()的可選標志為置1。
評論
查看更多