精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

電子發燒友App

硬聲App

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示
創作
電子發燒友網>電子資料下載>電子資料>PyTorch教程8.5之批量歸一化

PyTorch教程8.5之批量歸一化

2023-06-05 | pdf | 0.40 MB | 次下載 | 免費

資料介紹

訓練深度神經網絡很困難。讓它們在合理的時間內收斂可能很棘手。在本節中,我們將介紹 批量歸一化,這是一種流行且有效的技術,可以持續加速深度網絡的收斂 Ioffe 和 Szegedy,2015 年。連同殘差塊(稍后將在第 8.6 節中介紹),批量歸一化使從業者可以例行地訓練超過 100 層的網絡。批量歸一化的第二個(偶然的)好處在于其固有的正則化。

import torch
from torch import nn
from d2l import torch as d2l
from mxnet import autograd, init, np, npx
from mxnet.gluon import nn
from d2l import mxnet as d2l

npx.set_np()
from functools import partial
import jax
import optax
from flax import linen as nn
from jax import numpy as jnp
from d2l import jax as d2l
import tensorflow as tf
from d2l import tensorflow as d2l

8.5.1. 訓練深度網絡

在處理數據時,我們經常在訓練前進行預處理。關于數據預處理的選擇通常會對最終結果產生巨大影響。回想一下我們將 MLP 應用于預測房價(第 5.7 節)。我們處理真實數據的第一步是將我們的輸入特征標準化為零均值 μ=0和單位方差 Σ=1across multiple observations ( Friedman, 1987 )。至少,人們經常重新縮放它,使對角線是統一的,即 Σii=1. 另一種策略是將向量重新調整為單位長度,每次觀察的均值可能為零。這可以很好地工作,例如,對于空間傳感器數據。這些預處理技術以及更多技術有助于很好地控制估計問題。參見例如Guyon等人的文章。( 2008 )審查特征選擇和提取技術。標準化向量還有一個很好的副作用,即限制作用于它的函數的函數復雜性。例如,支持向量機中著名的半徑邊界( Vapnik, 1995 )和感知器收斂定理( Novikoff, 1962 )依賴有界范數的輸入。

直覺上,這種標準化與我們的優化器配合得很好,因為它先驗地參數放在相似的范圍內。因此,很自然地會問 深度網絡中相應的規范化步驟是否可能沒有好處。雖然這并不是導致批量歸一化發明的原因 Ioffe 和 Szegedy,2015 年 ,但它是在統一框架內理解它及其堂兄層歸一化Ba等人,2016 年的有用方法。

其次,對于典型的 MLP 或 CNN,在我們訓練時,中間層中的變量(例如,MLP 中的仿射變換輸出)可能采用幅度變化很大的值:沿著從輸入到輸出的層,跨同一層中的單元,隨著時間的推移,由于我們對模型參數的更新。批量歸一化的發明者非正式地假設,這種變量分布的漂移可能會阻礙網絡的收斂。憑直覺,我們可能會推測,如果一層的可變激活是另一層的 100 倍,這可能需要對學習率進行補償性調整。自適應求解器,例如 AdaGrad Duchi等人,2011 年、Adam Kingma 和 Ba,2014 年))、Yogi ( Zaheer et al. , 2018 )或 Distributed Shampoo ( Anil et al. , 2020 )旨在從優化的角度解決這個問題,例如,通過添加二階方法的方面。另一種方法是通過自適應規范化來防止問題發生。

第三,更深層次的網絡很復雜,而且往往更容易過度擬合。這意味著正則化變得更加關鍵。一種常用的正則化技術是噪聲注入。這已經為人所知很長時間了,例如,關于輸入的噪聲注入( Bishop, 1995 )。它還構成了第 5.6 節中 dropout 的基礎 。事實證明,批歸一化帶來了所有三個好處:預處理、數值穩定性和正則化。

批歸一化應用于單個層,或者可選地應用于所有層:在每次訓練迭代中,我們首先通過減去它們的均值并除以它們的標準差來歸一化(批歸一化的)輸入,其中兩者都是基于統計數據估計的當前的小批量。接下來,我們應用比例系數和偏移量來恢復丟失的自由度。批歸一化正是由于這種 基于統計的歸一化 而得名。

請注意,如果我們嘗試對大小為 1 的小批量應用批量歸一化,我們將無法學習任何東西。這是因為在減去均值后,每個隱藏單元的值為 0。正如您可能猜到的那樣,由于我們將整個部分用于批量歸一化,并且具有足夠大的小批量,因此該方法被證明是有效且穩定的。這里的一個要點是,當應用批量歸一化時,批量大小的選擇甚至比沒有批量歸一化更重要,或者至少需要適當的校準,因為我們可能會調整它。

表示為B一個小批量并讓 x∈B作為批量歸一化的輸入(BN). 在這種情況下,批量歸一化定義如下:

(8.5.1)BN(x)=γ⊙x?μ^Bσ^B+β.

在(8.5.1),μ^B 是樣本均值和σ^B是 minibatch 的樣本標準差B. 應用標準化后,生成的小批量具有零均值和單位方差。單位方差的選擇(相對于其他一些幻數)是一個任意選擇。我們通過包含元素尺度參數來恢復這種自由度 γ轉移參數 β具有相同的形狀x. 兩者都是需要在模型訓練中學習的參數。

中間層的可變幅度在訓練期間不能發散,因為批量歸一化主動將它們居中并將它們重新縮放回給定的均值和大?。ㄍㄟ^ μ^Bσ^B). 實踐經驗證實,正如在討論特征重新縮放時所提到的,批量歸一化似乎允許更積極的學習率。我們計算μ^Bσ^B(8.5.1)如下:

?

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1山景DSP芯片AP8248A2數據手冊
  2. 1.06 MB  |  532次下載  |  免費
  3. 2RK3399完整板原理圖(支持平板,盒子VR)
  4. 3.28 MB  |  339次下載  |  免費
  5. 3TC358743XBG評估板參考手冊
  6. 1.36 MB  |  330次下載  |  免費
  7. 4DFM軟件使用教程
  8. 0.84 MB  |  295次下載  |  免費
  9. 5元宇宙深度解析—未來的未來-風口還是泡沫
  10. 6.40 MB  |  227次下載  |  免費
  11. 6迪文DGUS開發指南
  12. 31.67 MB  |  194次下載  |  免費
  13. 7元宇宙底層硬件系列報告
  14. 13.42 MB  |  182次下載  |  免費
  15. 8FP5207XR-G1中文應用手冊
  16. 1.09 MB  |  178次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費
  3. 2555集成電路應用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費
  7. 4開關電源設計實例指南
  8. 未知  |  21549次下載  |  免費
  9. 5電氣工程師手冊免費下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費
  11. 6數字電路基礎pdf(下載)
  12. 未知  |  13750次下載  |  免費
  13. 7電子制作實例集錦 下載
  14. 未知  |  8113次下載  |  免費
  15. 8《LED驅動電路設計》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉中文版)
  4. 78.1 MB  |  537798次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191187次下載  |  免費
  13. 7十天學會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138040次下載  |  免費