精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于深度學習的七大學習步驟

電子設計 ? 作者:電子設計 ? 2018-12-14 16:01 ? 次閱讀

作者:Matthew Mayo 翻譯:Andrewseu

網上有很多的深度學習的免費學習資源,但是可能會對從哪里開始有些困惑。七步內從對深度神經網絡的模糊理解到知識淵博的從業者(knowledgeable practitioner)!

深度學習是機器學習的一個分支,擁有很多的相似性,但是卻也不同,深度神經網絡結構在自然語言處理、計算機視覺、生物信息學和其他領域解決了各種各樣的問題。深度學習經歷了一場巨大的最近研究的重現,并且在很多領域中已經展現出最先進的成果。

本質上,深度學習是超過一層隱藏神經元的神經網絡的執行。但是,這是對深度學習的一個簡單的看法,并且不是一個沒有爭議的觀點。這些深層構架也非常不同,對不同任務或目標優化會有不同的執行。在這樣一個恒定速率進行著的大量研究在以史上未有的速度展現新的和創新的深度學習模型。

關于深度學習的七大學習步驟

最近的一個白熱化的研究課題,深度學習似乎影響著機器學習的所有領域,相關的還有數據科學。粗略看看相關arXiv目錄下最近的論文,很容易看出大量正在被發表的論文都是深度學習相關的。鑒于已經產生的令人驚嘆的成果,很多研究者,從業者和外行都在想深度學習是否是真正的人工智能的邊界。

這系列的閱讀材料和教程旨在給深度神經網絡的新人提供一條路徑去理解這個巨大而復雜的課題。盡管我不假設對神經網絡和深度學習真正的理解,但是我假設你對一般的機器學習理論和實踐具有某種程度的熟悉度。為了克服在一般機器學習理論和實踐的不足,你可以看看最近KDnuggets發布的7 Steps to Mastering Machine Learning With Python。由于我們也看用Python寫的例子的執行,對語言有些熟悉會很有用。介紹和綜述的資源在previodsly mentioned post也是提供的。

這篇博客將以緊密結合的順序使用網絡上免費提供的材料在理論層面上獲得對深度神經網絡的一些理解,然后繼續轉向一些實際的執行。同樣的,借鑒過來的引用材料只屬于創建者,跟資源會一起被標注。如果你看到有人因為他們的工作沒有被正確引用,請告知我,我會很快修改的。

一個完全誠實的免責申明:深度學習是一個復雜而在廣度和深度(pun unintended?)變化很快的領域,因此這篇博客不保證包括所有成為深度學習專家的手冊;這樣的一個轉化將會需要更多的時間,很多附加材料和很多實際建立和測試的模型。但是,我相信的是,使用這里的資源可以幫你在這樣一個路徑下開始。

第一步:介紹深度學習

如果你正在讀這個并且對這個課題感興趣,你可能已經對深度神經網絡已經熟悉,甚至在一個很基礎的層次。神經網絡有一個故事性的歷史,但是我們將不會深入。但是,我們需要如果在開始就有一個普遍高層次的理解。

首先,看看DeepLearning .tv精彩的介紹視頻。在 寫完這個的時候已經有14個視頻了;如果你喜歡看完他們,但是一定要看前五個,包含了神經網絡的基礎和一些更常見的結構。

然后,仔細閱讀Geoff Hinton,Yoshua Bengioh和Yann LeCun的NIPS 2015 Deep Learning Tutorial,一個稍微更低層次的介紹。

完成我們的第一步,讀the first chapter of Neural Networks and Deep Learning,這個由Michael Nielden寫的精妙的,不斷更新的在線書,這會更近一步但是依然很粗淺。

第二步:學習技術

深度神經網絡依賴代數和微積分的數學基礎。然而這篇博客不會產生任何理論上的數學,在繼續之前有一些理解將會很有幫助。

第一,看Andrew Ng的linear algebra review videos。但是不是絕對的必要,想要對線性代數了解更深的話,從Ng的斯坦福課程看看Zico Kolter 和Chuong Do寫的Linear Algebra Review and Reference.

然后看看Professor Leonard的Introduction to the Derivative of a Function. 視頻是很簡潔的,例子是很清晰的,并且提供了從數學的視角來看在反向傳播的過程中到底發生了什么。一會兒會更多。

接下來迅速瀏覽下維基Sigmoid function的詞條,一個在神經網絡中經常通過單個神經元應用的邊界差分函數。

最后,從數學上休息下閱讀谷歌研究科學家 Quoc Le的Deep Learning Tutorial.

第三步:反向傳播和梯度下降

神經網絡包括現代深度構架重要的一部分是反向傳播算法的錯誤,使用離輸入更近的神經元通過網絡更新權重。非常坦率的說,這就是神經網絡繼承他們”力量“(缺乏更好的術語)的地方。反向傳播和一個隨后分布式的最小化權重的優化方法,為了最小化損失函數。在深度學習中一個常見的優化方法是梯度下降。

首先,看看這些斯圖加特大學Marc Toussaint 寫的關于梯度下降的介紹筆記。

然后,看看Matt Mazur寫的this step by step example of backpropagation in action.

繼續,閱讀Jeremy Kun關于 coding backpropagation in Python的信息博客。仔細看看完整代碼也是建議的,嘗試自己寫一遍代碼。

最后,讀Quoc Le寫的Deep Learning Tutorial的第二部分,為了獲取一些更具體更常見的深度結構和他們用途的介紹。

第四步:實踐

具體的神經網絡結構的下一步介紹將會使用在現在研究中最流行的python深度學習庫包括實際執行。在一些情況下,一些不同的庫的優化是為了某個特定的神經網絡結構,并且已經在某些特定的領域立足,我們將會使用三個不同的深度學習庫。這不是多余的,在特定領域的實踐中與最新的庫保持一致時學習時很重要的一步。接下來的訓練也將會讓你自己評價不同的庫,并且形成一個在哪些問題上用哪個的直覺。

現在歡迎你選擇一個庫或者聯合庫進行安裝,是否繼續那些教程取決于你的選擇。如果你希望嘗試一個庫并且使用它來執行接下來步驟的教程,我會推薦TensorFlow,原因如下,我會提到最相關的(至少是在我的眼中):它執行自動分化(autodifferentiation),意味著你不需要擔心從頭執行反向傳播,更可能使代碼更容易理解(尤其是對一個初學者來說)。

我寫關于TensorFlow的文章是在剛出來的時候TensorFlow Disappoints – Google Deep Learning Falls Shallow,這個標題暗示著比在實際中更失望;我最初關注的是它缺少GPU集叢的網絡訓練(很可能很快會有它自己的方式).無論如何,如果你沒有看列在下面的白皮書但是想看更多關于TensotFlow的材料,我建議讀我原始的文章,然后跟著Zachary Lipton's 寫的很好的部分,TensorFlow is Terrific – A Sober Take on Deep Learning Acceleration.

TensorFlow

Google的TensorFlow是基于數據流圖展現的一個通用的機器i學習庫。

安裝TensorFlow在這里

查看白皮書

嘗試它的

文檔

Theano

Theano是被蒙特利爾大學的LISA group積極開發的。

安裝Theano在這里

介紹教程

文檔

Caffe

Caffe是由加州大學伯克利分校的BVLC開發的。Theano和Tensorflow可以認為是通用的深度學習庫,Caffe是由一個計算機視覺的組開發的,主要考慮的解決那樣的問題;但是,它也是一個通用的庫為了為不同領域建立不同的深度學習框架。

在這里安裝Caffe

閱讀來進行熟悉

同時看看文檔

記住這些并不僅僅是現在流行的庫。事實上,還有很多很多可以選擇,這些選擇是基于教程的流行性,文檔和總體上研究上的接受程度。

其他的深度學習庫選擇包括:

Keras---一個用于Theano和TensorFlow高層、極簡Python神經網絡庫

Lasagne---Theano頂上的輕量級python庫

Torch---Lua機器學習算法庫

DeepLearning4j---Jaav和Scala開源、分布式深度學習庫

Chainer---一個靈活的、直觀的python神經網絡庫

Mocha---Juliade的一個深度學習框架

安裝好這些庫,現在我們可以繼續實踐。

第五步:卷積神經網絡和計算機視覺

計算機視覺解決處理和理解圖片和它的符號信息。大部分領域最近的突破都是來自于深度神經網絡的使用。特別的,卷積神經網絡在最近扮演一個很重要的角色。

首先,讀Yoshua Bengio的deep learning with computer vision,為了對這個課題有一個理解。

然后。如果你安裝好了TensorFlow,閱讀并執行這個教程,這個是用卷積i神經網絡分類CIFAR-10圖片。如果你安裝了Caffe,對于上一個教程的替代,執行Caffe中的卷積神經網絡分類MNIST數據集圖片。

這里是一個粗略等同于Caffe 的練習Theano tutorial.

然后,讀Krizhevsky, Sutskever和Hinton的seminal convolutional neural network paper增加額外的視野。

第六步:遞歸網和語言處理

自然語言處理(NLP)是收益與深度學習的另一個領域。關心理解自然語言,NLP通過運用遞歸神經網絡(RNN)有很多最新的成功。

Andrej Karpathy有一篇很贊的博客,題目是The Unreasonable Effectiveness of Recurrent Neural Networks,列出了RNN在訓練字符級語言模型的有效性的大綱。它提到的代碼是通過Torch用Lua寫的,所以你可以跳過;這個在純理論層次上依舊很有用。

這個教程為語言處理在TensorFlow上執行RNN.

你也可以用Theano并且用這個教程嘗試,用文字嵌套執行了一個RNN.

最后,你可以讀Yoon Kim的Convolutional Neural Networks for Sentence Classification,這是CNN在語言處理上的又一個應用。Denny Britz 有一篇博客,題目是Implementing A CNN For Text Clasification in TensorFlow,使用的是電影的評論數據。

第七步:更深入的課題

上面的步驟在深度學習已經從理論上進步到實踐。通過在前兩步執行卷積神經網絡和遞歸神經網絡,希望的是對它們力量和功能性的預先感知。與CNN和RNN一樣普遍的有很多其他隨著基礎研究出現的已經存在的深度結構。

有很多超過前面理論步驟展現的其他的考慮,同樣的,下面是這些另外結構和考慮的快速的調研。

為了更深的理解適合時間序列預測的特定類型的RNN,長短項記憶網絡,讀Christopher Olah寫的這篇文章。

Denny Britz寫的這篇文章是用LSTM和GRUs的 很好的一個關于RNN的教程。看這篇論文更深地討論GRUs和LSTMs.

很顯然這沒有包含所有的深度學習構架。限制波爾茲曼機是一個腦中很明顯需要排除的,正如antoencoders,和一系列產生的相關的模型包括Generative Adversarial Networks. 但是,必須在某處畫一條線,不然這篇將會一直下去。

對那些感興趣其他深度學習構架的,我建議看看Yshua Bengio的ftml.

對于我們的最終目標和有一些不同的東西,看看Google DeepMindShakir Mohamed的 A Statistical Analysis of Deep Learning。這個比我們平常看到的材料更理論一些,但是值得用另一種方法看我們熟悉的事物。Shakir對6個月的課程寫了一系列文章,展現測試wide-held beliefs,增強數據的連接,并且深度學習中要隱藏的東西。有一個所有發布的PDF集合.

希望足夠的信息已經展現,能夠給讀者一個對深度神經網絡介紹性的綜述,并且提供一些想對這個課題繼續研究的熱情。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4764

    瀏覽量

    100541
  • 機器學習
    +關注

    關注

    66

    文章

    8378

    瀏覽量

    132412
  • 深度學習
    +關注

    關注

    73

    文章

    5493

    瀏覽量

    120979
收藏 人收藏

    評論

    相關推薦

    NPU在深度學習中的應用

    隨著人工智能技術的飛速發展,深度學習作為其核心驅動力之一,已經在眾多領域展現出了巨大的潛力和價值。NPU(Neural Processing Unit,神經網絡處理單元)是專門為深度學習
    的頭像 發表于 11-14 15:17 ?298次閱讀

    GPU深度學習應用案例

    GPU在深度學習中的應用廣泛且重要,以下是一些GPU深度學習應用案例: 一、圖像識別 圖像識別是深度學習
    的頭像 發表于 10-27 11:13 ?328次閱讀

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大模型的基礎 技術支撐 :深度
    的頭像 發表于 10-23 15:25 ?378次閱讀

    深度學習中的時間序列分類方法

    時間序列分類(Time Series Classification, TSC)是機器學習深度學習領域的重要任務之一,廣泛應用于人體活動識別、系統監測、金融預測、醫療診斷等多個領域。隨著深度
    的頭像 發表于 07-09 15:54 ?708次閱讀

    深度學習中的無監督學習方法綜述

    深度學習作為機器學習領域的一個重要分支,近年來在多個領域取得了顯著的成果,特別是在圖像識別、語音識別、自然語言處理等領域。然而,深度學習模型
    的頭像 發表于 07-09 10:50 ?514次閱讀

    深度學習與nlp的區別在哪

    深度學習和自然語言處理(NLP)是計算機科學領域中兩個非常重要的研究方向。它們之間既有聯系,也有區別。本文將介紹深度學習與NLP的區別。 深度
    的頭像 發表于 07-05 09:47 ?816次閱讀

    深度學習中的模型權重

    深度學習這一充滿無限可能性的領域中,模型權重(Weights)作為其核心組成部分,扮演著至關重要的角色。它們不僅是模型學習的基石,更是模型智能的源泉。本文將從模型權重的定義、作用、優化、管理以及應用等多個方面,深入探討
    的頭像 發表于 07-04 11:49 ?948次閱讀

    深度學習常用的Python庫

    深度學習作為人工智能的一個重要分支,通過模擬人類大腦中的神經網絡來解決復雜問題。Python作為一種流行的編程語言,憑借其簡潔的語法和豐富的庫支持,成為了深度學習研究和應用的首選工具。
    的頭像 發表于 07-03 16:04 ?568次閱讀

    TensorFlow與PyTorch深度學習框架的比較與選擇

    深度學習作為人工智能領域的一個重要分支,在過去十年中取得了顯著的進展。在構建和訓練深度學習模型的過程中,深度
    的頭像 發表于 07-02 14:04 ?888次閱讀

    深度學習的模型優化與調試方法

    深度學習模型在訓練過程中,往往會遇到各種問題和挑戰,如過擬合、欠擬合、梯度消失或爆炸等。因此,對深度學習模型進行優化與調試是確保其性能優越的關鍵步驟
    的頭像 發表于 07-01 11:41 ?700次閱讀

    深度學習與傳統機器學習的對比

    在人工智能的浪潮中,機器學習深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器學習的范疇,但
    的頭像 發表于 07-01 11:40 ?1194次閱讀

    深度解析深度學習下的語義SLAM

    隨著深度學習技術的興起,計算機視覺的許多傳統領域都取得了突破性進展,例如目標的檢測、識別和分類等領域。近年來,研究人員開始在視覺SLAM算法中引入深度學習技術,使得
    發表于 04-23 17:18 ?1241次閱讀
    <b class='flag-5'>深度</b>解析<b class='flag-5'>深度</b><b class='flag-5'>學習</b>下的語義SLAM

    為什么深度學習的效果更好?

    導讀深度學習是機器學習的一個子集,已成為人工智能領域的一項變革性技術,在從計算機視覺、自然語言處理到自動駕駛汽車等廣泛的應用中取得了顯著的成功。深度
    的頭像 發表于 03-09 08:26 ?596次閱讀
    為什么<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的效果更好?

    什么是深度學習?機器學習深度學習的主要差異

    2016年AlphaGo 擊敗韓國圍棋冠軍李世石,在媒體報道中,曾多次提及“深度學習”這個概念。
    的頭像 發表于 01-15 10:31 ?1021次閱讀
    什么是<b class='flag-5'>深度</b><b class='flag-5'>學習</b>?機器<b class='flag-5'>學習</b>和<b class='flag-5'>深度</b><b class='flag-5'>學習</b>的主要差異

    GPU在深度學習中的應用與優勢

    人工智能的飛速發展,深度學習作為其重要分支,正在推動著諸多領域的創新。在這個過程中,GPU扮演著不可或缺的角色。就像超級英雄電影中的主角一樣,GPU在深度學習中擁有舉足輕重的地位。那么
    的頭像 發表于 12-06 08:27 ?1212次閱讀
    GPU在<b class='flag-5'>深度</b><b class='flag-5'>學習</b>中的應用與優勢