亚洲精品无码专区在线播放_极品白嫩无套视频在线播放_少妇人妻无码专区在线视频_国产精品无卡毛片视频

一片欣欣向榮背后，深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的瓶頸已至。

提出這個(gè)觀點(diǎn)的，不是外人，正是計(jì)算機(jī)視覺奠基者之一，約翰霍普金斯大學(xué)教授Alan Yuille，他還是霍金的弟子。

他說，現(xiàn)在做AI不提神經(jīng)網(wǎng)絡(luò)，成果都很難發(fā)表了，這不是個(gè)好勢(shì)頭。

如果人們只追神經(jīng)網(wǎng)絡(luò)的潮流，拋棄所有老方法；如果人們只會(huì)刷榜，不去想怎樣應(yīng)對(duì)深度網(wǎng)絡(luò)的局限性，這個(gè)領(lǐng)域可能很難有更好的發(fā)展。

面對(duì)深度學(xué)習(xí)的三大瓶頸，Yuille教授給出兩條應(yīng)對(duì)之道：靠組合模型培養(yǎng)泛化能力，用組合數(shù)據(jù)測(cè)試潛在的故障。

觀點(diǎn)發(fā)表之后，引發(fā)不少的共鳴。Reddit話題熱度快速超過200，學(xué)界業(yè)界的AI科學(xué)家們也紛紛在Twitter上轉(zhuǎn)發(fā)。

Reddit網(wǎng)友評(píng)論道，以Yuille教授的背景，他比別人更清楚在深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域現(xiàn)狀如何，為什么出現(xiàn)瓶頸。

深度學(xué)習(xí)的三大瓶頸

Yuille指出，深度學(xué)習(xí)雖然優(yōu)于其他技術(shù)，但它不是通用的，經(jīng)過數(shù)年的發(fā)展，它的瓶頸已經(jīng)凸顯出來，主要有三個(gè)：

需要大量標(biāo)注數(shù)據(jù)

深度學(xué)習(xí)能夠?qū)崿F(xiàn)的前提是大量經(jīng)過標(biāo)注的數(shù)據(jù)，這使得計(jì)算機(jī)視覺領(lǐng)域的研究人員傾向于在數(shù)據(jù)資源豐富的領(lǐng)域搞研究，而不是去重要的領(lǐng)域搞研究。

雖然有一些方法可以減少對(duì)數(shù)據(jù)的依賴，比如遷移學(xué)習(xí)、少樣本學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和弱監(jiān)督學(xué)習(xí)。但是到目前為止，它們的性能還沒法與監(jiān)督學(xué)習(xí)相比。

過度擬合基準(zhǔn)數(shù)據(jù)

深度神經(jīng)網(wǎng)絡(luò)在基準(zhǔn)數(shù)據(jù)集上表現(xiàn)很好，但在數(shù)據(jù)集之外的真實(shí)世界圖像上，效果就差強(qiáng)人意了。比如下圖就是一個(gè)失敗案例。

一個(gè)用ImageNet訓(xùn)練來識(shí)別沙發(fā)的深度神經(jīng)網(wǎng)絡(luò)，如果沙發(fā)擺放角度特殊一點(diǎn)，就認(rèn)不出來了。這是因?yàn)椋行┙嵌仍贗mageNet數(shù)據(jù)集里很少見。

在實(shí)際的應(yīng)用中，如果深度網(wǎng)絡(luò)有偏差，將會(huì)帶來非常嚴(yán)重的后果。

要知道，用來訓(xùn)練自動(dòng)駕駛系統(tǒng)的數(shù)據(jù)集中，基本上從來沒有坐在路中間的嬰兒。

對(duì)圖像變化過度敏感

深度神經(jīng)網(wǎng)絡(luò)對(duì)標(biāo)準(zhǔn)的對(duì)抗性攻擊很敏感，這些攻擊會(huì)對(duì)圖像造成人類難以察覺的變化，但可能會(huì)改變神經(jīng)網(wǎng)絡(luò)對(duì)一個(gè)物體的認(rèn)知。

而且，神經(jīng)網(wǎng)絡(luò)對(duì)場(chǎng)景的變化也過于敏感。比如下面的這張圖，在猴子圖片上放了吉他等物體，神經(jīng)網(wǎng)絡(luò)就將猴子識(shí)別成了人類，吉他識(shí)別成了鳥類。

背后的原因是，與猴子相比，人類更有可能攜帶吉他，與吉他相比，鳥類更容易出現(xiàn)在叢林中。

這種對(duì)場(chǎng)景的過度敏感，原因在于數(shù)據(jù)集的限制。

對(duì)于任何一個(gè)目標(biāo)對(duì)象，數(shù)據(jù)集中只有有限數(shù)量的場(chǎng)景。在實(shí)際的應(yīng)用中，神經(jīng)網(wǎng)絡(luò)會(huì)明顯偏向這些場(chǎng)景。

對(duì)于像深度神經(jīng)網(wǎng)絡(luò)這樣數(shù)據(jù)驅(qū)動(dòng)的方法來說，很難捕捉到各種各樣的場(chǎng)景，以及各種各樣的干擾因素。

想讓深度神經(jīng)網(wǎng)絡(luò)處理所有的問題，似乎需要一個(gè)無窮大的數(shù)據(jù)集，這就給訓(xùn)練和測(cè)試數(shù)據(jù)集帶來了巨大的挑戰(zhàn)。

為什么數(shù)據(jù)集會(huì)不夠大？

這三大問題，還殺不死深度學(xué)習(xí)，但它們都是需要警惕的信號(hào)。

Yuille說，瓶頸背后的原因，就是一個(gè)叫做“組合爆炸”的概念：

就說視覺領(lǐng)域，真實(shí)世界的圖像，從組合學(xué)觀點(diǎn)來看太大量了。任何一個(gè)數(shù)據(jù)集，不管多大，都很難表達(dá)出現(xiàn)實(shí)的復(fù)雜程度。

那么，組合學(xué)意義上的大，是個(gè)什么概念？

大家想象一下，現(xiàn)在要搭建一個(gè)視覺場(chǎng)景：你有一本物體字典，要從字典里選出各種各樣的物體，把它們放到不同的位置上。

說起來容易，但每個(gè)人選擇物體、擺放物體的方法都不一樣，搭出的場(chǎng)景數(shù)量是可以指數(shù)增長的。

就算只有一個(gè)物體，場(chǎng)景還是能指數(shù)增長。因?yàn)?，它可以用千奇百怪的方式被遮擋；物體所在的背景也有無窮多種。

人類的話，能夠自然而然適應(yīng)背景的變化；但深度神經(jīng)網(wǎng)絡(luò)對(duì)變化就比較敏感了，也更容易出錯(cuò)：

△是的，前面出現(xiàn)過了

也不是所有視覺任務(wù)都會(huì)發(fā)生組合爆炸(Combinatorial Explosion) 。

比如，醫(yī)學(xué)影像就很適合用深度網(wǎng)絡(luò)來處理，因?yàn)楸尘吧儆凶兓罕热纾认偻ǔ６紩?huì)靠近十二指腸。

但這樣的應(yīng)用并不常見，復(fù)雜多變的情況在現(xiàn)實(shí)中更普遍。如果沒有指數(shù)意義上的大數(shù)據(jù)集，就很難模擬真實(shí)情況。

而在有限的數(shù)據(jù)集上訓(xùn)練/測(cè)試出來的模型，會(huì)缺乏現(xiàn)實(shí)意義：因?yàn)閿?shù)據(jù)集不夠大，代表不了真實(shí)的數(shù)據(jù)分布。

那么，就有兩個(gè)新問題需要重視：

1、怎樣在有限的數(shù)據(jù)集里訓(xùn)練，才能讓AI在復(fù)雜的真實(shí)世界里也有很好的表現(xiàn)？

2、怎樣在有限的數(shù)據(jù)集里，高效地給算法做測(cè)試，才能保證它們承受得了現(xiàn)實(shí)里大量數(shù)據(jù)的考驗(yàn)？

組合爆炸如何應(yīng)對(duì)？

數(shù)據(jù)集是不會(huì)指數(shù)型長大的，所以要試試從別的地方突破。

可以訓(xùn)練一個(gè)組合模型，培養(yǎng)泛化能力。也可以用組合數(shù)據(jù)來測(cè)試模型，找出容易發(fā)生的故障。

總之，組合是關(guān)鍵。

訓(xùn)練組合模型

組合性 (Compositionality) 是指，一個(gè)復(fù)雜的表達(dá)，它的意義可以通過各個(gè)組成部分的意義來決定。

這里，一個(gè)重要的假設(shè)就是，一個(gè)結(jié)構(gòu)是由許多更加基本的子結(jié)構(gòu)，分層組成的；背后有一些語法規(guī)則。

這就表示，AI可以從有限的數(shù)據(jù)里，學(xué)會(huì)那些子結(jié)構(gòu)和語法，再泛化到各種各樣的情景里。

與深度網(wǎng)絡(luò)不同，組合模型 (Compositional Models) 需要結(jié)構(gòu)化的表示方式，才能讓結(jié)構(gòu)和子結(jié)構(gòu)更明確。

組合模型的推斷能力，可以延伸到AI見過的數(shù)據(jù)之外：推理、干預(yù)、診斷，以及基于現(xiàn)有知識(shí)結(jié)構(gòu)去回答不同的問題。

引用Stuart German的一句話：

The world is compositional or God exists.
世界是組合性的，不然，上帝就是存在的。

雖然，深度神經(jīng)網(wǎng)絡(luò)也有些組合性：高級(jí)特征是由低級(jí)特征的響應(yīng)組成的；但在本文所討論的意義上，深度神經(jīng)網(wǎng)絡(luò)并不是組合性的。

組合模型的優(yōu)點(diǎn)已經(jīng)在許多視覺任務(wù)里面體現(xiàn)了：比如2017年登上Science的、用來識(shí)別CAPTCHA驗(yàn)證碼的模型。

還有一些理論上的優(yōu)點(diǎn)，比如可解釋，以及可以生成樣本。這樣一來，研究人員就更加容易發(fā)現(xiàn)錯(cuò)誤在哪，而不像深度神經(jīng)網(wǎng)絡(luò)是個(gè)黑盒，誰也不知道里面發(fā)生了什么。

但要學(xué)習(xí)組合模型，并不容易。因?yàn)檫@里需要學(xué)習(xí)所有的組成部分和語法；

還有，如果要通過合成 (Synthesis) 來作分析，就需要有生成模型(Generative Models) 來生成物體和場(chǎng)景結(jié)構(gòu)。

就說圖像識(shí)別，除了人臉、字母等等少數(shù)幾種很有規(guī)律的圖案之外，其他物體還很難應(yīng)付：

從根本上說，要解決組合爆炸的問題，就要學(xué)習(xí)3D世界的因果模型(Causal Models) ，以及這些模型是如何生成圖像的。

有關(guān)人類嬰兒的研究顯示，他們是通過搭建因果模型來學(xué)習(xí)的，而這些模型可以預(yù)測(cè)他們生活環(huán)境的結(jié)構(gòu)。

對(duì)因果關(guān)系的理解，可以把從有限數(shù)據(jù)里學(xué)到的知識(shí)，有效擴(kuò)展到新場(chǎng)景里去。

在組合數(shù)據(jù)里測(cè)試模型

訓(xùn)練過后，該測(cè)試了。

前面說過，世界那么復(fù)雜，而我們只能在有限的數(shù)據(jù)上測(cè)試算法。

要處理組合數(shù)據(jù) (Combinatorial Data) ，博弈論是一種重要的方法：它專注于最壞情況(Worst Case) ，而不是平均情況 (Average Case) 。

就像前面討論過的那樣，如果數(shù)據(jù)集沒有覆蓋到問題的組合復(fù)雜性，用平均情況討論出的結(jié)果可能缺乏現(xiàn)實(shí)意義。

而關(guān)注最壞情況，在許多場(chǎng)景下都是有意義的：比如自動(dòng)駕駛汽車的算法，比如癌癥診斷的算法。因?yàn)樵谶@些場(chǎng)景下，算法故障可能帶來嚴(yán)重的后果。

如果，能在低維空間里捕捉到故障模式 (Failure Modes) ，比如立體視覺的危險(xiǎn)因子 (Hazard Factors) ，就能用圖形和網(wǎng)格搜索來研究這些故障。

但是對(duì)于大多數(shù)視覺任務(wù)，特別是那些涉及組合數(shù)據(jù)的任務(wù)，通常不會(huì)有能找出幾個(gè)危險(xiǎn)因子、隔離出來單獨(dú)研究的簡單情況。

△對(duì)抗攻擊：稍稍改變紋理，只影響AI識(shí)別，不影響人類

有種策略，是把標(biāo)準(zhǔn)對(duì)抗攻擊(Adversarial Attacks) 的概念擴(kuò)展到包含非局部結(jié)構(gòu)(Non-Local Structure) ，支持讓圖像或場(chǎng)景發(fā)生變化的復(fù)雜運(yùn)算，比如遮擋，比如改變物體表面的物理性質(zhì)，但不要對(duì)人類的認(rèn)知造成重大改變。

把這樣的方法應(yīng)用到視覺算法上，還是很有挑戰(zhàn)性的。

不過，如果算法是用組合性(Compositional) 的思路來寫，清晰的結(jié)構(gòu)可能會(huì)給算法故障檢測(cè)帶來很大的幫助。

關(guān)于Alan Yuille

Alan Yuille，目前就職于約翰霍普金斯大學(xué)，是認(rèn)知科學(xué)和計(jì)算機(jī)科學(xué)的杰出教授。

1976年，在劍橋大學(xué)數(shù)學(xué)專業(yè)獲得學(xué)士學(xué)位。之后師從霍金，在1981年獲得理論物理博士學(xué)位。

畢業(yè)之后，轉(zhuǎn)而開拓計(jì)算機(jī)視覺領(lǐng)域。并先后就職于麻省理工學(xué)院的人工智能實(shí)驗(yàn)室，哈佛大學(xué)計(jì)算機(jī)系等等學(xué)術(shù)機(jī)構(gòu)。

2002年加入U(xiǎn)CLA，之后擔(dān)任視覺識(shí)別與機(jī)器學(xué)習(xí)中心主任，同時(shí)也在心理學(xué)系，計(jì)算機(jī)系，精神病學(xué)和生物行為學(xué)系任客座教授。

2016年，加入約翰霍普金斯大學(xué)。

他曾獲得ICCV的最佳論文獎(jiǎng)，2012年，擔(dān)任計(jì)算機(jī)視覺頂級(jí)會(huì)議CVPR的主席，計(jì)算機(jī)視覺界的奠基人之一。

此外，Alan Yuille也直接影響了中國AI的發(fā)展，其嫡系弟子朱瓏博士學(xué)成后，回國創(chuàng)辦了AI公司依圖科技，現(xiàn)在也是中國CV領(lǐng)域最知名的創(chuàng)業(yè)公司之一。

這篇文章中的觀點(diǎn)，出自Yuille在2018年5月發(fā)表的一篇論文，共同作者是他的博士生Chenxi Liu，在今年一月份，他們對(duì)這篇論文進(jìn)行了更新。

因?yàn)槲覍?duì)計(jì)算機(jī)視覺比較熟，就從計(jì)算機(jī)視覺的角度說一下自己對(duì)深度學(xué)習(xí)瓶頸的看法。

一、深度學(xué)習(xí)缺乏理論支撐
大多數(shù)文章的idea都是靠直覺提出來的，背后的很少有理論支撐。通過實(shí)驗(yàn)驗(yàn)證有效的idea，不一定是最優(yōu)方向。就如同最優(yōu)化問題中的sgd一樣，每一個(gè)step都是最優(yōu)，但從全局來看，卻不是最優(yōu)。

沒有理論支撐的話，計(jì)算機(jī)視覺領(lǐng)域的進(jìn)步就如同sgd一樣，雖然有效，但是緩慢；如果有了理論支撐，計(jì)算機(jī)視覺領(lǐng)域的進(jìn)步就會(huì)像牛頓法一樣，有效且迅猛。

CNN模型本身有很多超參數(shù)，比如設(shè)置幾層，每一層設(shè)置幾個(gè)filter，每個(gè)filter是depth wise還是point wise，還是普通conv，filter的kernel size設(shè)置多大等等。

這些超參數(shù)的組合是一個(gè)很大的數(shù)字，如果只靠實(shí)驗(yàn)來驗(yàn)證，幾乎是不可能完成的。最后只能憑直覺試其中一部分組合，因此現(xiàn)在的CNN模型只能說效果很好，但是絕對(duì)還沒達(dá)到最優(yōu)，無論是效果還是效率。

以效率舉例，現(xiàn)在resnet效果很好，但是計(jì)算量太大了，效率不高。然而可以肯定的是resnet的效率可以提高，因?yàn)閞esnet里面肯定有冗余的參數(shù)和冗余的計(jì)算，只要我們找到這些冗余的部分，并將其去掉，效率自然提高了。一個(gè)最簡單而且大多人會(huì)用的方法就是減小各層channel的數(shù)目。

如果一套理論可以估算模型的capacity，一個(gè)任務(wù)所需要模型的capacity。那我們面對(duì)一個(gè)任務(wù)的時(shí)候，使用capacity與之匹配的模型，就能使得效果好，效率優(yōu)。

二、領(lǐng)域內(nèi)越來越工程師化思維
因?yàn)樯疃葘W(xué)習(xí)本身缺乏理論，深度學(xué)習(xí)理論是一塊難啃的骨頭，深度學(xué)習(xí)框架越來越傻瓜化，各種模型網(wǎng)上都有開源實(shí)現(xiàn)，現(xiàn)在業(yè)內(nèi)很多人都是把深度學(xué)習(xí)當(dāng)樂高用。

面對(duì)一個(gè)任務(wù)，把當(dāng)前最好的幾個(gè)模型的開源實(shí)現(xiàn)git clone下來，看看這些模型的積木搭建說明書（也就是論文），思考一下哪塊積木可以改一改，積木的順序是否能調(diào)換一樣，加幾個(gè)積木能不能讓效果更好，減幾個(gè)積木能不能讓效率更高等等。

思考了之后，實(shí)驗(yàn)跑起來，實(shí)驗(yàn)效果不錯(cuò)，文章發(fā)起來，實(shí)驗(yàn)效果不如預(yù)期，重新折騰一遍。

這整個(gè)過程非常的工程師化思維，基本就是憑感覺trial and error，深度思考缺位。很少有人去從理論的角度思考模型出了什么問題，針對(duì)這個(gè)問題，模型應(yīng)該做哪些改進(jìn)。

舉一個(gè)極端的例子，一個(gè)數(shù)據(jù)實(shí)際上是一次函數(shù)，但是我們卻總二次函數(shù)去擬合，發(fā)現(xiàn)擬合結(jié)果不好，再用三次函數(shù)擬合，三次不行，四次，再不行，就放棄。我們很少思考，這個(gè)數(shù)據(jù)是啥分布，針對(duì)這樣的分布，有沒有函數(shù)能擬合它，如果有，哪個(gè)函數(shù)最合適。

深度學(xué)習(xí)本應(yīng)該是一門科學(xué)，需要用科學(xué)的思維去面對(duì)她，這樣才能得到更好的結(jié)果。

三、對(duì)抗樣本是深度學(xué)習(xí)的問題，但不是深度學(xué)習(xí)的瓶頸
我認(rèn)為對(duì)抗樣本雖然是深度學(xué)習(xí)的問題，但并不是深度學(xué)習(xí)的瓶頸。機(jī)器學(xué)習(xí)中也有對(duì)抗樣本，機(jī)器學(xué)習(xí)相比深度學(xué)習(xí)有著更多的理論支撐，依然沒能把對(duì)抗樣本的問題解決。

之所以我們覺得對(duì)抗樣本是深度學(xué)習(xí)的瓶頸是因?yàn)椋瑘D像很直觀，當(dāng)我們看到兩張幾乎一樣的圖片，最后深度學(xué)習(xí)模型給出兩種完全不一樣的分類結(jié)果，這給我們的沖擊很大。

如果修改一個(gè)原本類別是A的feature中某個(gè)元素的值，然后使得svm的分類改變?yōu)锽，我們會(huì)覺得不以為然，“你改變了這個(gè)feature中某個(gè)元素的值，它的分類結(jié)果改變很正常啊”。

個(gè)人認(rèn)為，當(dāng)前深度學(xué)習(xí)的瓶頸，可能在于 scaling。是的，你沒有聽錯(cuò)。

我們已經(jīng)有海量的數(shù)據(jù)，海量的算力，但我們卻難以訓(xùn)練大型的深度網(wǎng)絡(luò)模型（GB 到 TB 級(jí)別的模型），因?yàn)?BP 難以大規(guī)模并行化。數(shù)據(jù)并行不夠，用模型并行后加速比就會(huì)大打折扣。即使在加入諸多改進(jìn)后，訓(xùn)練過程對(duì)帶寬的要求仍然太高。

這就是為什么 nVidia 的 DGX-2 只有 16 塊 V100，但就是要賣到 250 萬。因?yàn)殡m然用少得多的錢就可以湊出相同的總算力，但很難搭出能高效運(yùn)用如此多張顯卡的機(jī)器。

而且 DGX-2 內(nèi)部的 GPU 也沒有完全互聯(lián)：

又例如 AlphaGo Zero 的訓(xùn)練，實(shí)際用于訓(xùn)練的只是很少的 TPU。即使有幾千幾萬張 TPU，也并沒有辦法將他們高效地用于訓(xùn)練網(wǎng)絡(luò)。

如果什么時(shí)候深度學(xué)習(xí)可以無腦堆機(jī)器就能不斷提高訓(xùn)練速度（就像挖礦可以堆礦機(jī)），從而可以用超大規(guī)模的多任務(wù)網(wǎng)絡(luò)，學(xué)會(huì) PB EB 級(jí)別的各類數(shù)據(jù)，那么所能實(shí)現(xiàn)的效果很可能會(huì)是令人驚訝的。

那么我們看現(xiàn)在的帶寬：

https://en.wikipedia.org/wiki/List_of_interface_bit_rates

2011年出了PCI-E 3.0 x16，是 15.75 GB/s，現(xiàn)在消費(fèi)級(jí)電腦還是這水平，4.0還是沒出來，不過可能是因?yàn)榇蠹覜]動(dòng)力（游戲?qū)捯鬀]那么高）。

NVLink 2.0是 150 GB/s，對(duì)于大型并行化還是完全不夠的。

大家可能會(huì)說，帶寬會(huì)慢慢提上來的。

很好，那么，這就來到了最奇怪的問題，我想這個(gè)問題值得思考：

AI芯片花了這么大力氣還是帶寬受限，那么人腦為何沒有受限于帶寬？

我的想法是：

人腦的并行化做得太好了，因此神經(jīng)元之間只需要kB級(jí)的帶寬。值得AI芯片和算法研究者學(xué)習(xí)。

人腦的學(xué)習(xí)方法比BP粗糙得多，所以才能這樣大規(guī)模并行化。

人腦的學(xué)習(xí)方法是去中心化的，個(gè)人認(rèn)為，更接近 energy-based 的方法。

人腦的其它特點(diǎn)，用現(xiàn)在的遷移學(xué)習(xí)+多任務(wù)學(xué)習(xí)+持續(xù)學(xué)習(xí)已經(jīng)可以模仿。

人腦還會(huì)用語言輔助思考。如果沒有語言，人腦也很難快速學(xué)會(huì)復(fù)雜的事情。

稍后我還會(huì)再進(jìn)一步寫寫這個(gè)問題，歡迎大家探討和指正。

責(zé)任編輯：lq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4763

瀏覽量
100541
計(jì)算機(jī)視覺

計(jì)算機(jī)視覺

+關(guān)注

關(guān)注
8

文章
1696

瀏覽量
45928
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5493

瀏覽量
120979

原文標(biāo)題：深度學(xué)習(xí)領(lǐng)域有哪些瓶頸？

文章出處：【微信號(hào)：vision263com，微信公眾號(hào)：新機(jī)器視覺】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

【小白入門必看】一文讀懂深度學(xué)習(xí)計(jì)算機(jī)視覺技術(shù)及學(xué)習(xí)路線

一、什么是計(jì)算機(jī)視覺？計(jì)算機(jī)視覺，其實(shí)就是教機(jī)器怎么像我們?nèi)?b class='flag-5'>一樣，用攝像頭看看周圍的世界，然后理

發(fā)表于 10-31 17:00 ?326次閱讀

【小白入門必看】<b class='flag-5'>一</b>文讀懂<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b><b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>技術(shù)及<b class='flag-5'>學(xué)習(xí)</b>路線

計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)

計(jì)算機(jī)視覺作為人工智能領(lǐng)域的一個(gè)重要分支，旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像和視頻中的信息

發(fā)表于 08-14 09:49 ?731次閱讀

計(jì)算機(jī)視覺的五大技術(shù)

計(jì)算機(jī)視覺作為深度學(xué)習(xí)領(lǐng)域最熱門的研究方向之一，其技術(shù)涵蓋了多個(gè)方面，為人工智能的發(fā)展開拓了廣闊

發(fā)表于 07-10 18:26 ?1196次閱讀

計(jì)算機(jī)視覺的工作原理和應(yīng)用

計(jì)算機(jī)視覺（Computer Vision，簡稱CV）是一門跨學(xué)科的研究領(lǐng)域，它利用計(jì)算機(jī)和數(shù)學(xué)算法來模擬人類

發(fā)表于 07-10 18:24 ?1643次閱讀

計(jì)算機(jī)視覺與人工智能的關(guān)系是什么

引言 計(jì)算機(jī)視覺是一門研究如何使計(jì)算機(jī)能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)

發(fā)表于 07-09 09:25 ?518次閱讀

計(jì)算機(jī)視覺與智能感知是干嘛的

引言 計(jì)算機(jī)視覺（Computer Vision）是一門研究如何使計(jì)算機(jī)能夠理解和解釋視覺信息的學(xué)科。它涉及到圖像處理、模式識(shí)別、機(jī)器

發(fā)表于 07-09 09:23 ?795次閱讀

計(jì)算機(jī)視覺和機(jī)器視覺區(qū)別在哪

計(jì)算機(jī)視覺和機(jī)器視覺是兩個(gè)密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。一、定義 計(jì)算機(jī)

發(fā)表于 07-09 09:22 ?407次閱讀

計(jì)算機(jī)視覺在人工智能領(lǐng)域有哪些主要應(yīng)用?

與分類是計(jì)算機(jī)視覺的基礎(chǔ)應(yīng)用之一。通過訓(xùn)練機(jī)器學(xué)習(xí)模型，計(jì)算機(jī)可以識(shí)別和分類各種圖像，如動(dòng)物、植物、物體等。這種技術(shù)

發(fā)表于 07-09 09:14 ?1187次閱讀

計(jì)算機(jī)視覺屬于人工智能嗎

屬于，計(jì)算機(jī)視覺是人工智能領(lǐng)域的一個(gè)重要分支。引言 計(jì)算機(jī)視覺是

發(fā)表于 07-09 09:11 ?1148次閱讀

深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用

隨著人工智能技術(shù)的飛速發(fā)展，深度學(xué)習(xí)作為其中的核心技術(shù)之一，已經(jīng)在計(jì)算機(jī)視覺

發(fā)表于 07-01 11:38 ?679次閱讀

機(jī)器視覺與計(jì)算機(jī)視覺的區(qū)別

在人工智能和自動(dòng)化技術(shù)的快速發(fā)展中，機(jī)器視覺（Machine Vision, MV）和計(jì)算機(jī)視覺（Computer Vision, CV）作為兩個(gè)重要的分支

發(fā)表于 06-06 17:24 ?1242次閱讀

計(jì)算機(jī)視覺的主要研究方向

計(jì)算機(jī)視覺（Computer Vision, CV）作為人工智能領(lǐng)域的一個(gè)重要分支，致力于使計(jì)算機(jī)能夠像人眼

發(fā)表于 06-06 17:17 ?849次閱讀

谷東科技與智譜AI合作推出首個(gè)AR+大模型行業(yè)解決方案

2024年，AR行業(yè)展現(xiàn)出一片欣欣向榮之態(tài)。注冊(cè)企業(yè)不斷增加，AR新品不斷上市。

發(fā)表于 05-06 10:12 ?415次閱讀

計(jì)算機(jī)視覺的十大算法

隨著科技的不斷發(fā)展，計(jì)算機(jī)視覺領(lǐng)域也取得了長足的進(jìn)步。本文將介紹計(jì)算機(jī)視覺領(lǐng)域的十大算法，包括它

發(fā)表于 02-19 13:26 ?1203次閱讀

計(jì)算機(jī)視覺：AI如何識(shí)別與理解圖像

計(jì)算機(jī)視覺是人工智能領(lǐng)域的一個(gè)重要分支，它致力于讓機(jī)器能夠像人類一樣理解和解釋圖像。隨著深度

發(fā)表于 01-12 08:27 ?1354次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

一片欣欣向榮背后，深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的瓶頸已至

評(píng)論

【小白入門必看】一文讀懂深度學(xué)習(xí)計(jì)算機(jī)視覺技術(shù)及學(xué)習(xí)路線

計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)

計(jì)算機(jī)視覺的五大技術(shù)

計(jì)算機(jī)視覺的工作原理和應(yīng)用

計(jì)算機(jī)視覺與人工智能的關(guān)系是什么

計(jì)算機(jī)視覺與智能感知是干嘛的

計(jì)算機(jī)視覺和機(jī)器視覺區(qū)別在哪

計(jì)算機(jī)視覺在人工智能領(lǐng)域有哪些主要應(yīng)用?

計(jì)算機(jī)視覺屬于人工智能嗎

深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用

機(jī)器視覺與計(jì)算機(jī)視覺的區(qū)別

計(jì)算機(jī)視覺的主要研究方向

谷東科技與智譜AI合作推出首個(gè)AR+大模型行業(yè)解決方案

計(jì)算機(jī)視覺的十大算法

計(jì)算機(jī)視覺：AI如何識(shí)別與理解圖像