精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究人員提出了“Skim-RNN”的概念,用很少的時(shí)間進(jìn)行快速閱讀

zhKF_jqr_AI ? 2018-01-10 12:41 ? 次閱讀

循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是用于自然語(yǔ)言建模的主流架構(gòu),通常,RNN按順序讀取輸入的token,再輸出每個(gè)token的分布式表示。通過(guò)利用相同的函數(shù)來(lái)循環(huán)更新隱藏狀態(tài),RNN的計(jì)算成本將保持不變。雖然這一特點(diǎn)對(duì)于某些應(yīng)用來(lái)說(shuō)很常見,但在語(yǔ)言處理過(guò)程中,并不是所有token都同等重要,關(guān)鍵要學(xué)會(huì)取舍。例如,在問(wèn)答題中,只對(duì)重要部分進(jìn)行大量計(jì)算,不相關(guān)部分分配較少的計(jì)算才是有效的方法。

雖然有注意力模型和LSTM等方法提高計(jì)算效率或挑選重要任務(wù),但它們的表現(xiàn)都不夠好。在本篇論文中,研究人員提出了“Skim-RNN”的概念,用很少的時(shí)間進(jìn)行快速閱讀,不影響讀者的主要目標(biāo)。

Skim-RNN的構(gòu)成

研究人員提出了“Skim-RNN”的概念,用很少的時(shí)間進(jìn)行快速閱讀

受人類快速閱讀原理的啟發(fā),Skim-RNN的結(jié)構(gòu)由兩個(gè)RNN模型構(gòu)成:較大的默認(rèn)RNN模型d和較小的RNN模型d’。d和d’是用戶定義的超參數(shù),并且d’<< d。

如果當(dāng)前token比較重要,Skim-RNN就會(huì)使用大的RNN;如果不重要,它就會(huì)轉(zhuǎn)向使用小的RNN。由于小RNN比大RNN需要的浮點(diǎn)運(yùn)算次數(shù)更少,所以該模型比單獨(dú)使用大RNN所得結(jié)果更快,甚至更好。

推理過(guò)程

在每一步驟t中,Skim-RNN將輸入的Xt∈Rd和之前的隱藏狀態(tài)ht-1∈Rd作為其參數(shù),輸出新的狀態(tài)ht。k代表每一步做出harddecision的次數(shù)。在Skim-RNN中,不論是完全閱讀或跳過(guò),k=2。

研究人員使用多項(xiàng)隨機(jī)變量Qt對(duì)選擇概率分布Pt的決策過(guò)程進(jìn)行建模。Pt表示為:

這里,W∈Rk×2d,b∈Rk。

接下來(lái)我們定義隨機(jī)變量Qt,通過(guò)從概率分布Pt對(duì)Qt進(jìn)行采樣:

如果Qt=1,那么該模型與標(biāo)準(zhǔn)RNN模型一樣。如果Qt=2,那么模型選用了較小RNN模型以獲取較小的隱藏狀態(tài)。即:

其中f是帶有d輸出的完全RNN,而f'是帶有d'輸出的小RNN,d'<< d。

實(shí)驗(yàn)結(jié)果

研究人員在七組數(shù)據(jù)集上對(duì)Skim-RNN進(jìn)行測(cè)試,包括分類測(cè)試和問(wèn)答題兩種形式,目的是為了檢驗(yàn)?zāi)P偷臏?zhǔn)確度和浮點(diǎn)運(yùn)算減少率(Flop-R)。

研究人員提出了“Skim-RNN”的概念,用很少的時(shí)間進(jìn)行快速閱讀

文本分類

在這項(xiàng)任務(wù)中,輸入的是單詞序列,輸出的是分類概率的向量。最終,下表顯示出Skim-RNN模型與LSTM、LSTM-Jump的精確度和計(jì)算成本對(duì)比。

研究人員提出了“Skim-RNN”的概念,用很少的時(shí)間進(jìn)行快速閱讀

以SST、爛番茄、IMDB和AGnews四個(gè)網(wǎng)站為例進(jìn)行本文分類,在標(biāo)準(zhǔn)LSTM、Skim-RNN、LSTM-Jump和最先進(jìn)的模型(SOTA)上進(jìn)行對(duì)比

研究人員提出了“Skim-RNN”的概念,用很少的時(shí)間進(jìn)行快速閱讀

改變較小隱藏狀態(tài)的尺寸的影響,以及參數(shù)γ對(duì)精確度和計(jì)算成本的影響(默認(rèn)d=100,d'=10,γ=0.02)

下圖是IMDB數(shù)據(jù)集中的一個(gè)例子,其中Skim-RNN的參數(shù)為:d=200,d'=10,γ=0.01,最終將本段文字正確分類的概率為92%。

研究人員提出了“Skim-RNN”的概念,用很少的時(shí)間進(jìn)行快速閱讀

其中黑色的字被略過(guò)(用小LSTM模型,d'=10),藍(lán)色的字表示被閱讀(用較大的LSTM模型,d=200)

和預(yù)期的一樣,模型忽略了類似介詞等不重要的詞語(yǔ),而注意到了非常重要的單詞,例如“喜歡”、“可怕”、“討厭的”。

回答問(wèn)題

這項(xiàng)任務(wù)的目的是在給定段落中找到答案的位置。為了檢測(cè)Skim-RNN的準(zhǔn)確度,研究人員建立了兩個(gè)不同的模型:LSTM+注意力和BiDAF。結(jié)果如下所示:

F1和EM值可表明Skim-RNN的準(zhǔn)確度。最終發(fā)現(xiàn),速讀(skimming)模型的F1分?jǐn)?shù)比默認(rèn)沒(méi)有速讀(non-skimming)的模型相同甚至更高,并且計(jì)算成本消耗得更少(大于1.4倍)。

LSTM+注意力模型中,不同層的LSTM速度率(skimming rate)隨γ的變化而變化的情況

LSTM+注意力模型的F1分?jǐn)?shù)。計(jì)算成本越大,模型表現(xiàn)得越好。在同樣的計(jì)算成本下,Skim LSTM(紅色)比標(biāo)準(zhǔn)LSTM(藍(lán)色)的表現(xiàn)要好。另外,Skim-LSTM的F1分?jǐn)?shù)在不同參數(shù)和計(jì)算成本下都更穩(wěn)定

F1分?jǐn)?shù)與Flop-R之間的關(guān)系

下圖是模型回答問(wèn)題的一個(gè)例子,問(wèn)題為:最大的建筑項(xiàng)目(construction project)也稱作什么?(正確答案:megaprojects)

模型給出的答案:megaprojects。

研究人員提出了“Skim-RNN”的概念,用很少的時(shí)間進(jìn)行快速閱讀

紅色代表閱讀,白色代表略過(guò)

運(yùn)行時(shí)間

上圖顯示了與標(biāo)準(zhǔn)LSTM相比,Skim-LSTM的相對(duì)速度增益的隱藏狀態(tài)有不同大小和速度速率。在這一過(guò)程中,研究人員使用的是NumPy,并在CPU的單個(gè)線程上進(jìn)行推論。

可以看到,實(shí)際增益(實(shí)線)和理論增益(虛線)之間的差距無(wú)法避免。隨著隱藏狀態(tài)增大,這一差距會(huì)減小。所以對(duì)于更大的隱藏狀態(tài),Skim-RNN的表現(xiàn)會(huì)更好。

結(jié)語(yǔ)

本次研究表明,新型循環(huán)神經(jīng)網(wǎng)絡(luò)Skim-RNN可以根據(jù)輸入的重要性決定使用大的RNN還是小的RNN,同時(shí)計(jì)算成本比RNN更低,準(zhǔn)確度與標(biāo)準(zhǔn)LSTM和LSTM-Jump相比類似甚至更好。由于Skim-RNN與RNN具有相同的輸入輸出接口,因此可以輕松替換現(xiàn)有應(yīng)用中的RNN。

所以,這樣工作適用于需要更高隱藏狀態(tài)的應(yīng)用,比如理解視頻,同時(shí)還可以利用小RNN做不同程度的略讀。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:用Skim-RNN顯著降低計(jì)算成本,實(shí)現(xiàn)“速讀”

文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    美國(guó)普渡大學(xué)和哈佛大學(xué)的研究人員出了一項(xiàng)新發(fā)明 新...

    據(jù)物理學(xué)家組織網(wǎng)報(bào)道,美國(guó)普渡大學(xué)和哈佛大學(xué)的研究人員出了一項(xiàng)極為應(yīng)景的新發(fā)明:一種外形如同一顆圣誕樹一樣的新型晶體管,其重要組件“門”(柵極)的長(zhǎng)度縮減到了突破性的20納米。這個(gè)被稱為“4維
    發(fā)表于 02-03 20:30

    研究人員提出了一種柔性可拉伸擴(kuò)展的多功能集成傳感器陣列

    研究人員提出了一種柔性可拉伸擴(kuò)展的多功能集成傳感器陣列,成功將電子皮膚的探測(cè)能力擴(kuò)展到7種,實(shí)現(xiàn)溫度、濕度、紫外光、磁、應(yīng)變、壓力和接近等多種外界刺激的實(shí)時(shí)同步監(jiān)測(cè)。
    的頭像 發(fā)表于 01-24 15:15 ?7118次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>一種柔性可拉伸擴(kuò)展的多功能集成傳感器陣列

    日本研究人員利用單晶硅對(duì)可見光進(jìn)行精確的顏色控制

    研究人員最近展示了使用單晶硅對(duì)可見光進(jìn)行精確的顏色控制,該研究成果發(fā)表在納米快報(bào)上。
    的頭像 發(fā)表于 02-09 14:20 ?5337次閱讀

    研究人員提出了一系列新的點(diǎn)云處理模塊

    為了探索這些問(wèn)題的解決辦法、來(lái)自倫敦大學(xué)學(xué)院的研究人員提出了一系列新的點(diǎn)云處理模塊,從效率、信息共享和點(diǎn)云卷積操作等方面進(jìn)行研究,得到了更寬、更深、更快效率更高的點(diǎn)云處理網(wǎng)絡(luò),讓更
    的頭像 發(fā)表于 08-02 14:44 ?2969次閱讀
    <b class='flag-5'>研究人員</b>們<b class='flag-5'>提出了</b>一系列新的點(diǎn)云處理模塊

    Facebook的研究人員提出了Mesh R-CNN模型

    這一研究的目標(biāo)是通過(guò)單張圖像輸入,對(duì)圖像中的物體進(jìn)行檢測(cè)、獲取不同物體的類別、掩膜和對(duì)應(yīng)的三維網(wǎng)格,并對(duì)真實(shí)世界中的復(fù)雜模型進(jìn)行有效處理。在2D深度網(wǎng)絡(luò)的基礎(chǔ)上,研究人員改進(jìn)并
    的頭像 發(fā)表于 08-02 15:51 ?3782次閱讀
    Facebook的<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>Mesh R-CNN模型

    研究人員使用聲音技術(shù)來(lái)進(jìn)行藥物的傳遞

    從電信技術(shù)改造而來(lái)的技術(shù)有望實(shí)現(xiàn)更有效的癌癥治療。墨爾本研究人員發(fā)現(xiàn),藥物可以通過(guò)聲波傳遞到各個(gè)細(xì)胞中。
    發(fā)表于 03-11 09:38 ?445次閱讀

    研究人員提出了一個(gè)名為CommPlan的框架

    使用CommPlan,開發(fā)人員首先使用數(shù)據(jù),領(lǐng)域?qū)I(yè)知識(shí)和學(xué)習(xí)算法指定五個(gè)模塊-任務(wù)模型,通信功能,通信成本模型,人員響應(yīng)模型和人員可選動(dòng)作模型。通過(guò)對(duì)所有模塊的分析組合,得出決策模型,并且在任務(wù)執(zhí)行期間,機(jī)器人使用硬件傳感器
    的頭像 發(fā)表于 04-09 14:30 ?2093次閱讀

    研究人員最新開發(fā)出了快速、微米級(jí)的電光調(diào)制器

    喬治華盛頓大學(xué)的研究人員首次開發(fā)并演示了一種硅基電光調(diào)制器,該調(diào)制器比最新技術(shù)更小,更快,更高效。
    的頭像 發(fā)表于 04-15 20:07 ?2101次閱讀

    研究人員使用AI教機(jī)器人如何將物體交給人類

    英偉達(dá)(Nvidia)研究人員在本周發(fā)表的預(yù)印研究論文中提出了一種人類到機(jī)器人交接的方法,其中機(jī)器人會(huì)在半途中遇到人類,對(duì)人類的抓握進(jìn)行分類,并計(jì)劃一條從人類手中拿走物體的軌跡。
    發(fā)表于 04-28 17:16 ?1677次閱讀

    研究人員利用3D打印技術(shù)設(shè)計(jì)出了微米大小的鏡片

    波蘭華沙大學(xué)的研究人員利用激光直接書寫(DLW)3D打印技術(shù)設(shè)計(jì)出了微米大小的鏡片。這種3D打印的透鏡可以在各種材料上制作,包括易碎的石墨烯類材料。
    的頭像 發(fā)表于 05-18 23:36 ?3938次閱讀

    研究人員已經(jīng)使用機(jī)器學(xué)習(xí)來(lái)開發(fā)血液測(cè)試

    這個(gè)由來(lái)自哈佛醫(yī)學(xué)院,克利夫蘭診所,梅奧診所等眾多研究人員研究人員組成的多機(jī)構(gòu)團(tuán)隊(duì)對(duì)來(lái)自3,052名參與者的數(shù)據(jù)進(jìn)行了AI訓(xùn)練。其中,1,531例患有癌癥,1,521例沒(méi)有。
    的頭像 發(fā)表于 05-21 10:17 ?1905次閱讀

    佐治亞理工研究人員通過(guò)仿生樹懶推出了自己的巡檢機(jī)器人

    生活的快節(jié)奏讓很多人喘不過(guò)氣,這種影響似乎也蔓延到了機(jī)器人領(lǐng)域。但是來(lái)自佐治亞理工學(xué)院的研究人員更看重慢速、高效和節(jié)能,最近他們通過(guò)仿生樹懶推出了自己的巡檢機(jī)器人,也許這是研究人員第一次將目光放到樹懶這種慵懶的動(dòng)物身上。
    發(fā)表于 07-08 16:06 ?1140次閱讀

    AI研究人員如何應(yīng)對(duì)透明AI

    許多現(xiàn)代的AI系統(tǒng)都在神經(jīng)網(wǎng)絡(luò)上運(yùn)行,而我們僅了解其基礎(chǔ)知識(shí),因?yàn)樗惴ū旧?b class='flag-5'>很少提供解釋方式。缺乏解釋性通常被稱為AI系統(tǒng)的“黑匣子”。研究人員將注意力集中在神經(jīng)網(wǎng)絡(luò)如何工作的細(xì)節(jié)上
    的頭像 發(fā)表于 07-14 16:31 ?1816次閱讀

    研究人員發(fā)現(xiàn)自動(dòng)駕駛車輛可將交通流量速度大幅提高40%

    研究人員提出了實(shí)現(xiàn)有效監(jiān)管的指導(dǎo)方針,發(fā)現(xiàn)即使道路上的自動(dòng)駕駛車輛不到5%,自動(dòng)駕駛汽車還是能夠互相配合,以顯著改善交通流量。據(jù)研究人員所說(shuō),如果在擁堵道路上出發(fā),自動(dòng)駕駛汽車能夠在不到2分鐘的
    的頭像 發(fā)表于 09-09 15:20 ?2672次閱讀

    研究人員為鋰硫電池提出一種新陰極設(shè)計(jì)概念

    研究團(tuán)隊(duì),為鋰硫電池(Li–S)提出了一種新穎的陰極設(shè)計(jì)概念,將可大幅提升此類具有發(fā)展前景的下一代電池的性能。
    發(fā)表于 12-29 10:48 ?503次閱讀