圖像識別,是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術(shù)。
圖像識別是人工智能的一個重要領(lǐng)域。為了編制模擬人類圖像識別活動的計算機程序,人們提出了不同的圖像識別模型。例如模板匹配模型,這種模型認為,識別某個圖像,必須在過去的經(jīng)驗中有這個圖像的記憶模式,又叫模板。當前的刺激如果能與大腦中的模板相匹配,這個圖像也就被識別了。但是,人能識別的圖像是大量的,不可能做到所識別的每一個圖像在腦中都有一個相應(yīng)的模板。于是,格式塔心理學家又提出了一個原型匹配模型,這種模型認為,在長時記憶中存儲的并不是所要識別的無數(shù)個模板,而是圖像的某些“相似性”。從圖像中抽象出來的“相似性”就可作為原型,拿它來檢驗所要識別的圖像。這種模型從神經(jīng)上和記憶探尋的過程上來看,都比模板匹配模型更適宜,但是,這種模型沒有說明人是怎樣對相似的刺激進行辨別和加工的,也難以在計算機程序中得到實現(xiàn)。因此又有人提出了一個更復雜的模型,即“泛魔”識別模型。
圖像識別的發(fā)展經(jīng)歷了三個階段:文字識別、數(shù)字圖像處理與識別、物體識別。
文字識別的研究是從 1950年開始的,一般是識別字母、數(shù)字和符號,從印刷文字識別到手寫文字識別, 應(yīng)用非常廣泛。
數(shù)字圖像處理和識別的研究開始于1965年。數(shù)字圖像與模擬圖像相比具有存儲、傳輸方便可壓縮、傳輸過程中不易失真、處理方便等巨大優(yōu)勢,這些都為圖像識別技術(shù)的發(fā)展提供了強大的動力。
物體的識別主要指的是對三維世界的客體及環(huán)境的感知和認識,屬于高級的計算機視覺范疇。它是以數(shù)字圖像處理與識別為基礎(chǔ)的結(jié)合人工智能、系統(tǒng)學等學科的研究方向,其研究成果被廣泛應(yīng)用在各種工業(yè)及探測機器人上?,F(xiàn)代圖像識別技術(shù)的一個不足就是自適應(yīng)性能差,一旦目標圖像被較強的噪聲污染或是目標圖像有較大殘缺往往就得不出理想的結(jié)果。
-
圖像識別
+關(guān)注
關(guān)注
9文章
519瀏覽量
38240 -
人工智能
+關(guān)注
關(guān)注
1791文章
46896瀏覽量
237669
原文標題:AI|探尋圖像識別背后的原理
文章出處:【微信號:THundersoft,微信公眾號:ThunderSoft中科創(chuàng)達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論