精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

5行代碼打造無限寬神經網絡模型

倩倩 ? 來源:量子位 ? 2020-03-27 15:47 ? 次閱讀

只要網絡足夠寬,深度學習動態就能大大簡化,并且更易于理解。

最近的許多研究結果表明,無限寬度的DNN會收斂成一類更為簡單的模型,稱為高斯過程(Gaussian processes)。

于是,復雜的現象可以被歸結為簡單的線性代數方程,以了解AI到底是怎樣工作的。

所謂的無限寬度(infinite width),指的是完全連接層中的隱藏單元數,或卷積層中的通道數量有無窮多。

但是,問題來了:推導有限網絡的無限寬度限制需要大量的數學知識,并且必須針對不同研究的體系結構分別進行計算。對工程技術水平的要求也很高。

谷歌最新開源的Neural Tangents,旨在解決這個問題,讓研究人員能夠輕松建立、訓練無限寬神經網絡

甚至只需要5行代碼,就能夠打造一個無限寬神經網絡模型。

這一研究成果已經中了ICLR 2020。戳進文末Colab鏈接,即可在線試玩。

開箱即用,5行代碼打造無限寬神經網絡模型

Neural Tangents 是一個高級神經網絡 API,可用于指定復雜、分層的神經網絡,在 CPU/GPU/TPU 上開箱即用。

該庫用 JAX編寫,既可以構建有限寬度神經網絡,亦可輕松創建和訓練無限寬度神經網絡。

有什么用呢?舉個例子,你需要訓練一個完全連接神經網絡。通常,神經網絡是隨機初始化的,然后采用梯度下降進行訓練。

研究人員通過對一組神經網絡中不同成員的預測取均值,來提升模型的性能。另外,每個成員預測中的方差可以用來估計不確定性。

如此一來,就需要大量的計算預算。

但當神經網絡變得無限寬時,網絡集合就可以用高斯過程來描述,其均值和方差可以在整個訓練過程中進行計算。

而使用 Neural Tangents ,僅需5行代碼,就能完成對無限寬網絡集合的構造和訓練。

from neural_tangents import predict, staxinit_fn, apply_fn, kernel_fn = stax.serial( stax.Dense(2048, W_std=1.5, b_std=0.05), stax.Erf(), stax.Dense(2048, W_std=1.5, b_std=0.05), stax.Erf(), stax.Dense(1, W_std=1.5, b_std=0.05))y_mean, y_var = predict.gp_inference(kernel_fn, x_train, y_train, x_test, ‘ntk’, diag_reg=1e-4, compute_cov=True)

上圖中,左圖為訓練過程中輸出(f)隨輸入數據(x)的變化;右圖為訓練過程中的不確定性訓練、測試損失。

將有限神經網絡的集合訓練和相同體系結構的無限寬度神經網絡集合進行比較,研究人員發現,使用無限寬模型的精確推理,與使用梯度下降訓練整體模型的結果之間,具有良好的一致性。

這說明了無限寬神經網絡捕捉訓練動態的能力。

不僅如此,常規神經網絡可以解決的問題,Neural Tangents 構建的網絡亦不在話下。

研究人員在 CIFAR-10 數據集的圖像識別任務上比較了 3 種不同架構的無限寬神經網絡。

可以看到,無限寬網絡模擬有限神經網絡,遵循相似的性能層次結構,其全連接網絡的性能比卷積網絡差,而卷積網絡的性能又比寬殘余網絡差。

但是,與常規訓練不同,這些模型的學習動力在封閉形式下是易于控制的,也就是說,可以用前所未有的視角去觀察其行為。

對于深入理解機器學習機制來說,該研究也提供了一種新思路。谷歌表示,這將有助于“打開機器學習的黑匣子”。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4762

    瀏覽量

    100541
  • 代碼
    +關注

    關注

    30

    文章

    4748

    瀏覽量

    68356
  • 深度學習
    +關注

    關注

    73

    文章

    5492

    瀏覽量

    120978
收藏 人收藏

    評論

    相關推薦

    神經網絡教程(李亞非)

    源程序  4.3 旅行商問題(TSP)的HNN求解  Hopfield模型求解TSP源程序  第5章 隨機型神經網絡  5.1 模擬退火算法  5.2 Boltzmann機  Boltzmann機
    發表于 03-20 11:32

    非局部神經網絡打造未來神經網絡基本組件

    最高的精度。由此表明非局部模塊可以作為一種比較通用的基本組件,在設計深度神經網絡時使用。實驗及結果在這一節我們簡單介紹論文中描述的實驗及結果。 視頻的基線模型是 ResNet-50 C2D。三維輸出映射
    發表于 11-12 14:52

    如何構建神經網絡

    原文鏈接:http://tecdat.cn/?p=5725 神經網絡是一種基于現有數據創建預測的計算系統。如何構建神經網絡神經網絡包括:輸入層:根據現有數據獲取輸入的層隱藏層:使用反向傳播優化輸入變量權重的層,以提高
    發表于 07-12 08:02

    卷積神經網絡模型發展及應用

    的概率。Top-5 識別率指的是 CNN 模型預測出最大概率的前 5 個分 類里有正確類別的概率。2012 年,由 Alex Krizhevshy 提出的 AlexNet給卷 積神經網絡
    發表于 08-02 10:39

    神經網絡模型原理

    神經網絡模型原理介紹說明。
    發表于 04-21 09:40 ?7次下載

    卷積神經網絡模型有哪些?卷積神經網絡包括哪幾層內容?

    卷積神經網絡模型有哪些?卷積神經網絡包括哪幾層內容? 卷積神經網絡(Convolutional Neural Networks,CNN)是深度學習領域中最廣泛應用的
    的頭像 發表于 08-21 16:41 ?1885次閱讀

    卷積神經網絡模型原理 卷積神經網絡模型結構

    卷積神經網絡模型原理 卷積神經網絡模型結構? 卷積神經網絡是一種深度學習神經網絡,是在圖像、語音
    的頭像 發表于 08-21 16:41 ?984次閱讀

    卷積神經網絡算法代碼matlab

    卷積神經網絡算法代碼matlab 卷積神經網絡(Convolutional Neural Network,CNN)是一種深度學習網絡模型,其
    的頭像 發表于 08-21 16:50 ?1178次閱讀

    常見的卷積神經網絡模型 典型的卷積神經網絡模型

    常見的卷積神經網絡模型 典型的卷積神經網絡模型 卷積神經網絡(Convolutional Neural Network, CNN)是深度學習
    的頭像 發表于 08-21 17:11 ?2803次閱讀

    cnn卷積神經網絡模型 卷積神經網絡預測模型 生成卷積神經網絡模型

    cnn卷積神經網絡模型 卷積神經網絡預測模型 生成卷積神經網絡模型? 卷積
    的頭像 發表于 08-21 17:11 ?1206次閱讀

    卷積神經網絡模型搭建

    卷積神經網絡模型搭建 卷積神經網絡模型是一種深度學習算法。它已經成為了計算機視覺和自然語言處理等各種領域的主流算法,具有很大的應用前景。本篇文章將詳細介紹卷積
    的頭像 發表于 08-21 17:11 ?928次閱讀

    卷積神經網絡模型的優缺點

    卷積神經網絡模型的優缺點? 卷積神經網絡(Convolutional Neural Network,CNN)是一種從圖像、視頻、聲音和一系列多維信號中進行學習的深度學習模型。它在計算機
    的頭像 發表于 08-21 17:15 ?4288次閱讀

    構建神經網絡模型的常用方法 神經網絡模型的常用算法介紹

    神經網絡模型是一種通過模擬生物神經元間相互作用的方式實現信息處理和學習的計算機模型。它能夠對輸入數據進行分類、回歸、預測和聚類等任務,已經廣泛應用于計算機視覺、自然語言處理、語音處理等
    發表于 08-28 18:25 ?1012次閱讀

    rnn是什么神經網絡模型

    RNN(Recurrent Neural Network,循環神經網絡)是一種具有循環結構的神經網絡模型,它能夠處理序列數據,并對序列中的元素進行建模。RNN在自然語言處理、語音識別、時間序列預測等
    的頭像 發表于 07-05 09:50 ?521次閱讀

    神經網絡預測模型的構建方法

    神經網絡模型作為一種強大的預測工具,廣泛應用于各種領域,如金融、醫療、交通等。本文將詳細介紹神經網絡預測模型的構建方法,包括模型設計、數據集
    的頭像 發表于 07-05 17:41 ?603次閱讀