精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

神經網絡中的參數和超參數

倩倩 ? 來源:極客Array ? 2020-04-17 14:40 ? 次閱讀

參數VS超參數(Parameters vs Hyperparameters)

想要你的深度神經網絡起很好的效果,你還需要規劃好你的參數以及超參數。

什么是超參數?

比如算法中的learning rate a(學習率)、iterations(梯度下降法循環的數量)、L(隱藏層數目)、n^([l])(隱藏層單元數目)、choice of activation function(激活函數的選擇)都需要你來設置,這些數字實際上控制了最后的參數W和b的值,所以它們被稱作超參數。

實際上深度學習有很多不同的超參數,之后我們也會介紹一些其他的超參數,如momentum、mini batch size、regularization parameters等等。

如何尋找超參數的最優值?

走Idea—Code—Experiment—Idea這個循環,嘗試各種不同的參數,實現模型并觀察是否成功,然后再迭代。

今天的深度學習應用領域,還是很經驗性的過程,通常你有個想法,比如你可能大致知道一個最好的學習率值,可能說a=0.01最好,我會想先試試看,然后你可以實際試一下,訓練一下看看效果如何。然后基于嘗試的結果你會發現,你覺得學習率設定再提高到0.05會比較好。如果你不確定什么值是最好的,你大可以先試試一個學習率a,再看看損失函數J的值有沒有下降。

然后你可以試一試大一些的值,然后發現損失函數的值增加并發散了。然后可能試試其他數,看結果是否下降的很快或者收斂到在更高的位置。你可能嘗試不同的a并觀察損失函數J這么變了,試試一組值,然后可能損失函數變成這樣,這個a值會加快學習過程,并且收斂在更低的損失函數值上(箭頭標識),我就用這個a值了。

在前面,還有很多不同的超參數。然而,當你開始開發新應用時,預先很難確切知道,究竟超參數的最優值應該是什么。所以通常,你必須嘗試很多不同的值,并走這個循環,試試各種參數。試試看5個隱藏層,這個數目的隱藏單元,實現模型并觀察是否成功,然后再迭代。

另一個近來深度學習的影響是它用于解決很多問題,從計算機視覺語音識別,到自然語言處理,到很多結構化的數據應用,比如網絡廣告或是網頁搜索或產品推薦等等。

我所看到過的就有很多其中一個領域的研究員,這些領域中的一個,嘗試了不同的設置,有時候這種設置超參數的直覺可以推廣,但有時又不會。所以我經常建議人們,特別是剛開始應用于新問題的人們,去試一定范圍的值看看結果如何。

然后在后面的筆記中,我們會用更系統的方法,用系統性的嘗試各種超參數取值。

然后其次,甚至是你已經用了很久的模型,可能你在做網絡廣告應用,在你開發途中,很有可能學習率的最優數值或是其他超參數的最優值是會變的,所以即使你每天都在用當前最優的參數調試你的系統,你還是會發現,最優值過一年就會變化,因為電腦的基礎設施,CPU或是GPU可能會變化很大。

所以有一條經驗規律可能每幾個月就會變。如果你所解決的問題需要很多年時間,只要經常試試不同的超參數,勤于檢驗結果,看看有沒有更好的超參數數值,相信你慢慢會得到設定超參數的直覺,知道你的問題最好用什么數值。

這可能的確是深度學習比較讓人不滿的一部分,也就是你必須嘗試很多次不同可能性。

但參數設定這個領域,深度學習研究還在進步中,所以可能過段時間就會有更好的方法決定超參數的值,也很有可能由于CPU、GPU、網絡和數據都在變化,這樣的指南可能只會在一段時間內起作用,只要你不斷嘗試,并且嘗試保留交叉檢驗或類似的檢驗方法,然后挑一個對你的問題效果比較好的數值。

近來受深度學習影響,很多領域發生了變化,從計算機視覺到語音識別到自然語言處理到很多結構化的數據應用,比如網絡廣告、網頁搜索、產品推薦等等;

有些同一領域設置超參數的直覺可以推廣,但有時又不可以,特別是那些剛開始研究新問題的人們應該去嘗試一定范圍內的結果如何,甚至那些用了很久的模型得學習率或是其他超參數的最優值也有可能會改變。

有一條經驗規律:經常試試不同的超參數,勤于檢查結果,看看有沒有更好的超參數取值,你將會得到設定超參數的直覺。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4762

    瀏覽量

    100541
  • 語音識別
    +關注

    關注

    38

    文章

    1721

    瀏覽量

    112547
  • 深度學習
    +關注

    關注

    73

    文章

    5492

    瀏覽量

    120978
收藏 人收藏

    評論

    相關推薦

    時間緊急,所以菜鳥特此來詢問-----神經網絡參數畫法

    小弟想問下 那個神經網絡參數和改進遺傳算法的圖標是從程序面板哪里畫出來的?具體路徑哪里謝謝了
    發表于 03-16 14:55

    機器學習神經網絡參數的代價函數

    吳恩達機器學習筆記之神經網絡參數的反向傳播算法
    發表于 05-22 15:11

    【案例分享】ART神經網絡與SOM神經網絡

    ,同理,閾值越大,則容納的模式類也就越多----------以上純屬個人理解,如果有錯誤歡迎指正。ART比較好地緩解了競爭型學習的“可塑性-穩定性窘境”,其中可塑性指神經網絡要能夠學習新知識,穩定性
    發表于 07-21 04:30

    神經網絡結構搜索有什么優勢?

    近年來,深度學習的繁榮,尤其是神經網絡的發展,顛覆了傳統機器學習特征工程的時代,將人工智能的浪潮推到了歷史最高點。然而,盡管各種神經網絡模型層出不窮,但往往模型性能越高,對參數的要求
    發表于 09-11 11:52

    改善深層神經網絡--參數優化、batch正則化和程序框架 學習總結

    《深度學習工程師-吳恩達》02改善深層神經網絡--參數優化、batch正則化和程序框架 學習總結
    發表于 06-16 14:52

    如何移植一個CNN神經網絡到FPGA

    )第二步:使用Lattice sensAI 軟件編譯已訓練好的神經網絡,定點化網絡參數。該軟件會根據神經網絡結構和預設的FPGA資源進行分析并給出性能評估報告,此外用戶還可以在軟件
    發表于 11-26 07:46

    卷積神經網絡(CNN)是如何定義的?

    什么是卷積神經網絡?ImageNet-2010網絡結構是如何構成的?有哪些基本參數
    發表于 06-17 11:48

    如何構建神經網絡

    原文鏈接:http://tecdat.cn/?p=5725 神經網絡是一種基于現有數據創建預測的計算系統。如何構建神經網絡神經網絡包括:輸入層:根據現有數據獲取輸入的層隱藏層:使用反向傳播優化輸入變量權重的層,以提高模型的預測
    發表于 07-12 08:02

    可分離卷積神經網絡在 Cortex-M 處理器上實現關鍵詞識別

    /激活要調節模型,使之不超出微控制器的內存和計算限制范圍,必須執行參數搜索。下表顯示了神經網絡架構及必須優化的相應參數
    發表于 07-26 09:46

    基于BP神經網絡的PID控制

    神經網絡可以建立參數Kp,Ki,Kd自整定的PID控制器。基于BP神經網絡的PID控制系統結構框圖如下圖所示:控制器由兩部分組成:經典增量式PID控制器;BP神經網絡...
    發表于 09-07 07:43

    BP神經網絡在水質參數預測的應用_張昕

    BP神經網絡在水質參數預測的應用_張昕
    發表于 03-19 11:26 ?1次下載

    卷積神經網絡的振動信號模態參數識別

    神經網絡改成處理一維信號的卷積神經網絡,其中輸入層改成待提取模態參數的振動信號集合,中間層改成若干一維卷積層、抽樣層,輸出層得到的為信號對應的Ⅳ階模態參數集合;然后,在誤差評估
    發表于 12-05 14:39 ?5次下載
    卷積<b class='flag-5'>神經網絡</b>的振動信號模態<b class='flag-5'>參數</b>識別

    深度神經網絡不同參數調整規則總結

    在深度神經網絡參數的調整是一項必備技能,通過觀察在訓練過程的監測指標如損失loss和準確率來判斷當前模型處于什么樣的訓練狀態,及時調
    的頭像 發表于 08-29 15:53 ?4872次閱讀

    自構造RBF神經網絡及其參數優化

    自構造RBF神經網絡及其參數優化說明。
    發表于 05-31 15:25 ?9次下載

    教大家怎么選擇神經網絡參數

    1. 神經網絡參數分類 神經網路參數主要包
    的頭像 發表于 06-19 14:49 ?3586次閱讀
    教大家怎么選擇<b class='flag-5'>神經網絡</b>的<b class='flag-5'>超</b><b class='flag-5'>參數</b>