英偉達(dá)推出歸一化Transformer，革命性提升LLM訓(xùn)練速度

英偉達(dá)團(tuán)隊(duì)近日在AI領(lǐng)域投下了一枚震撼彈，他們提出了一種全新的神經(jīng)網(wǎng)絡(luò)架構(gòu)——?dú)w一化Transformer(nGPT)。這一創(chuàng)新架構(gòu)基于超球面(hypersphere)進(jìn)行表示學(xué)習(xí)，為AI領(lǐng)域帶來了新的突破。

相較于傳統(tǒng)的Transformer架構(gòu)，nGPT在保持原有精度的同時(shí)，直接將大型語言模型(LLM)的訓(xùn)練速度提升了高達(dá)20倍。這一顯著的性能提升，無疑將極大地推動(dòng)AI技術(shù)的發(fā)展和應(yīng)用。

在nGPT中，所有的向量(包括嵌入向量、多層感知機(jī)(MLP)向量、注意力矩陣向量以及隱藏狀態(tài)向量)都被歸一化為單位范數(shù)(unit norm)。這一設(shè)計(jì)不僅簡(jiǎn)化了模型訓(xùn)練過程，還提高了模型的穩(wěn)定性和泛化能力。

英偉達(dá)團(tuán)隊(duì)的這一創(chuàng)新成果，無疑為AI領(lǐng)域注入了新的活力。nGPT架構(gòu)的提出，不僅將推動(dòng)AI技術(shù)的進(jìn)一步發(fā)展，還將為各種應(yīng)用場(chǎng)景提供更加高效、準(zhǔn)確的解決方案。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4762

瀏覽量
100537
英偉達(dá)

英偉達(dá)

+關(guān)注

關(guān)注
22

文章
3746

瀏覽量
90833
Transformer

Transformer

+關(guān)注

關(guān)注
0

文章
141

瀏覽量
5982
LLM

LLM

+關(guān)注

關(guān)注
0

文章
273

瀏覽量
306

評(píng)論

相關(guān)推薦

什么是LLM？LLM在自然語言處理中的應(yīng)用

隨著人工智能技術(shù)的飛速發(fā)展，自然語言處理（NLP）領(lǐng)域迎來了革命性的進(jìn)步。其中，大型語言模型（LLM）的出現(xiàn)，標(biāo)志著我們對(duì)語言理解能力的一次飛躍。LLM通過深度學(xué)習(xí)和海量數(shù)據(jù)

發(fā)表于 11-19 15:32 ?326次閱讀

如何訓(xùn)練自己的LLM模型

訓(xùn)練自己的大型語言模型（LLM）是一個(gè)復(fù)雜且資源密集的過程，涉及到大量的數(shù)據(jù)、計(jì)算資源和專業(yè)知識(shí)。以下是訓(xùn)練LLM模型的

發(fā)表于 11-08 09:30 ?326次閱讀

英偉達(dá)Blackwell可支持10萬億參數(shù)模型AI訓(xùn)練，實(shí)時(shí)大語言模型推理

、NVLink交換機(jī)、Spectrum以太網(wǎng)交換機(jī)和Quantum InfiniBand交換機(jī)。 ? 英偉達(dá)稱，Blackwell擁有6項(xiàng)革命性技術(shù)，可支持多達(dá)10萬億參數(shù)的模型進(jìn)行AI訓(xùn)練

發(fā)表于 09-04 09:10 ?2824次閱讀

英偉達(dá)推出創(chuàng)新液冷技術(shù)

英偉達(dá)，這家領(lǐng)先的AI芯片制造商，近期在散熱技術(shù)上實(shí)現(xiàn)了重大突破，推出了創(chuàng)新的液冷技術(shù)。其即將問世的GB200服務(wù)器機(jī)架，將采用革命性的液體冷卻方式，摒棄傳統(tǒng)空氣冷卻，通過液體在硬件管

發(fā)表于 08-13 15:24 ?728次閱讀

llm模型訓(xùn)練一般用什么系統(tǒng)

LLM（Large Language Model，大型語言模型）是近年來在自然語言處理領(lǐng)域取得顯著成果的一種深度學(xué)習(xí)模型。它通常需要大量的計(jì)算資源和數(shù)據(jù)來進(jìn)行訓(xùn)練。以下是關(guān)于LLM模型

發(fā)表于 07-09 10:02 ?351次閱讀

llm模型有哪些格式

：基于Transformer的模型 Transformer是一種基于自注意力機(jī)制的模型，廣泛應(yīng)用于NLP領(lǐng)域。基于Transformer的LLM

發(fā)表于 07-09 09:59 ?546次閱讀

英偉達(dá)推出AI模型推理服務(wù)NVIDIA NIM

英偉達(dá)近日宣布推出一項(xiàng)革命性的AI模型推理服務(wù)——NVIDIA NIM。這項(xiàng)服務(wù)將極大地簡(jiǎn)化AI模型部署過程，為全球的2800萬

發(fā)表于 06-04 09:15 ?644次閱讀

【大規(guī)模語言模型：從理論到實(shí)踐】- 每日進(jìn)步一點(diǎn)點(diǎn)

的訓(xùn)練效率、穩(wěn)定性和泛化能力。以下是關(guān)于大模型訓(xùn)練歸一化的詳細(xì)介紹：一、歸一化的目的和重要

發(fā)表于 05-31 19:54

進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

2024年3月19日，[英偉達(dá)]CEO[黃仁勛]在GTC大會(huì)上公布了新一代AI芯片架構(gòu)BLACKWELL，并推出基于該架構(gòu)的超級(jí)芯片GB200，將助推數(shù)據(jù)處理、工程模擬、電子設(shè)計(jì)自動(dòng)

發(fā)表于 05-13 17:16

英偉達(dá)推出有2080億晶體管的GB200處理器

英偉達(dá)在最新一屆的GTC大會(huì)上隆重推出了全新的GB200處理器，這款處理器基于革命性的Blackwell架構(gòu)，并配備了驚人的2080億個(gè)晶體

發(fā)表于 03-20 11:10 ?743次閱讀

英偉達(dá)發(fā)布新一代AI芯片B200

在美國(guó)加州圣何塞舉辦的英偉達(dá)GTC生態(tài)大會(huì)上，英偉達(dá)CEO黃仁勛以一場(chǎng)震撼人心的演講，正式推出了

發(fā)表于 03-20 10:07 ?920次閱讀

英偉達(dá)發(fā)布性能大幅提升的新款B200 AI GPU

英偉達(dá)宣稱，B200在性能上比以往最好的GPU快30倍不止。由它構(gòu)成的服務(wù)器集群相比上一代，運(yùn)算能力飛躍性提升，甚至能使大語言模型的

發(fā)表于 03-20 09:37 ?738次閱讀

長(zhǎng)電科技推出了一項(xiàng)革命性的高精度熱阻測(cè)試與仿真模擬驗(yàn)證技術(shù)

在芯片封裝技術(shù)日益邁向高密度、高性能的今天，長(zhǎng)電科技引領(lǐng)創(chuàng)新，推出了一項(xiàng)革命性的高精度熱阻測(cè)試與仿真模擬驗(yàn)證技術(shù)。

發(fā)表于 03-08 13:33 ?466次閱讀

英偉達(dá)推出新產(chǎn)品，助力AIPC實(shí)現(xiàn)革命性升級(jí)

一直以來，英偉達(dá)的競(jìng)爭(zhēng)對(duì)手如英特爾與AMD均對(duì)“AI PC”寄予厚望。他們認(rèn)為，AI軟件在PC端運(yùn)行會(huì)比依賴網(wǎng)絡(luò)更為安全且響應(yīng)速度更快。由此可見，英

發(fā)表于 01-09 14:43 ?578次閱讀

Long-Context下LLM模型架構(gòu)全面介紹

隨著ChatGPT的快速發(fā)展，基于Transformer的大型語言模型(LLM)為人工通用智能(AGI)鋪平了一條革命性的道路，并已應(yīng)用于知識(shí)庫、人機(jī)界面和動(dòng)態(tài)代理等不同領(lǐng)域。然而，存

發(fā)表于 11-27 17:37 ?2865次閱讀

科技綠洲
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁

Hot javascript的成熟分類
Hot java和javaweb和javascript的區(qū)別

New 碳化硅SiC在高溫環(huán)境下的表現(xiàn)
New 碳化硅SiC制造工藝詳解碳化硅SiC與傳統(tǒng)半導(dǎo)體對(duì)比

精選推薦
更多

文章

資料

帖子

被人忽視的“ILD”指標(biāo)，竟隱藏著高速設(shè)計(jì)的核心思維

海馬硬件
43分鐘前

61 閱讀

湖北移動(dòng)，以5G-A規(guī)模商用“換”出內(nèi)需新活力

腦極體
58分鐘前

45 閱讀

如何在音頻播放時(shí)插播音頻

立功科技
1小時(shí)前

117 閱讀

ADC噪聲系數(shù)對(duì)射頻接收器的影響

德州儀器
1小時(shí)前

113 閱讀

適用于MEMS傳感器的先進(jìn)ML：提高精度、性能和功耗

eeDesigner
2小時(shí)前

142 閱讀

電源工程師教程：開關(guān)電源詳解（七）

KK
1.50 MB

免費(fèi)

23下載

Allusion圖像庫管理工具

王莉
18.64 MB

2積分

7下載

AYScrollerLabel_OC label跑馬燈顯示文字

klysa
0.35 MB

免費(fèi)

0下載

AT89C51 7段+按鍵矩陣開源資料分享

laisvl
0.14 MB

免費(fèi)

0下載

二合一PFC和逆變器智能電源模塊評(píng)估板STK5MFU3C1AGEVB數(shù)據(jù)手冊(cè)

1.16 MB

免費(fèi)

1下載

開源項(xiàng)目！可以自主演奏音樂的尤克里里機(jī)器人！

紅舊衫
17小時(shí)前

86 閱讀

【開箱評(píng)測(cè)】米爾電子PG2L100H開發(fā)板深度體驗(yàn)報(bào)告

asdfsdfsd
17小時(shí)前

108 閱讀

開源項(xiàng)目！基于 Arduino 的 MIDI 架子鼓

紅舊衫
17小時(shí)前

146 閱讀

電路小知識(shí) | 電源選型要點(diǎn)、電路圖的解讀方法、LED及其應(yīng)用示例

聽我講
17小時(shí)前

201 閱讀

【「HarmonyOS NEXT啟程：零基礎(chǔ)構(gòu)建純血鴻蒙應(yīng)用」閱讀體驗(yàn)】+1-7章有感

夜孤影
1天前

288 閱讀

推薦專欄
更多

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

英偉達(dá)推出歸一化Transformer，革命性提升LLM訓(xùn)練速度

評(píng)論

什么是LLM？LLM在自然語言處理中的應(yīng)用

如何訓(xùn)練自己的LLM模型

英偉達(dá)Blackwell可支持10萬億參數(shù)模型AI訓(xùn)練，實(shí)時(shí)大語言模型推理

英偉達(dá)推出創(chuàng)新液冷技術(shù)

llm模型訓(xùn)練一般用什么系統(tǒng)

llm模型有哪些格式

英偉達(dá)推出AI模型推理服務(wù)NVIDIA NIM

【大規(guī)模語言模型：從理論到實(shí)踐】- 每日進(jìn)步一點(diǎn)點(diǎn)

進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

英偉達(dá)推出有2080億晶體管的GB200處理器

英偉達(dá)發(fā)布新一代AI芯片B200

英偉達(dá)發(fā)布性能大幅提升的新款B200 AI GPU

長(zhǎng)電科技推出了一項(xiàng)革命性的高精度熱阻測(cè)試與仿真模擬驗(yàn)證技術(shù)

英偉達(dá)推出新產(chǎn)品，助力AIPC實(shí)現(xiàn)革命性升級(jí)

Long-Context下LLM模型架構(gòu)全面介紹