国产国产人免费人成免费视频在线观看_亚洲AⅤ中文无码字幕_成年人电影中文字幕无码区_久久99热这里只有精品66

摘要

本文由深蘭科學(xué)院撰寫(xiě)，文章將為大家細(xì)致講解一種有效的無(wú)監(jiān)督深度表示器(Mix2Vec)，該方法可將異構(gòu)數(shù)據(jù)映射到統(tǒng)一的低維向量空間，避免混合異構(gòu)數(shù)據(jù)相似度度量偏差問(wèn)題。同時(shí)，該方法基于深度異構(gòu)信息網(wǎng)絡(luò)，采用隨機(jī)混洗預(yù)測(cè)學(xué)習(xí)機(jī)制，并融合先驗(yàn)分布匹配和結(jié)構(gòu)信息最大化學(xué)習(xí)目標(biāo)，學(xué)習(xí)混合異構(gòu)的基于向量空間的通用表示，可以用于無(wú)監(jiān)督和有監(jiān)督的學(xué)習(xí)任務(wù)。

隨著機(jī)器學(xué)習(xí)的發(fā)展和廣泛應(yīng)用，(無(wú)監(jiān)督或有監(jiān)督)表示學(xué)習(xí)被應(yīng)用于處理復(fù)雜(高維、異構(gòu)等)特征數(shù)據(jù)。通過(guò)將復(fù)雜特征數(shù)據(jù)映射到統(tǒng)一空間，可以有效避免復(fù)雜數(shù)據(jù)中的差異性，并提供方便有效的數(shù)據(jù)統(tǒng)一處理(例如：距離度量)。

01問(wèn)題

混合異構(gòu)數(shù)據(jù)中的挑戰(zhàn)

現(xiàn)實(shí)生活中的大量數(shù)據(jù)都混合了數(shù)值型和類(lèi)別型屬性，這些數(shù)據(jù)往往表現(xiàn)出以下一些典型特征：(1)數(shù)據(jù)中一些屬性是靜態(tài)的，而另一些是動(dòng)態(tài)的;(2)某些屬性經(jīng)常存在缺失值，且不同數(shù)據(jù)的缺失值的稀疏程度不同;(3)數(shù)據(jù)中可能是異構(gòu)的，不同的屬性可能具有不同的分布和結(jié)構(gòu);(4)實(shí)際數(shù)據(jù)往往沒(méi)有足夠的可用標(biāo)記信息并且標(biāo)記此類(lèi)數(shù)據(jù)成本太高，或者標(biāo)簽信息(例如：路徑和規(guī)劃)很難用以模型訓(xùn)練。這些數(shù)據(jù)特征在企業(yè)、制造、商業(yè)和醫(yī)療保健等典型應(yīng)用的數(shù)據(jù)中很常見(jiàn)。圖1源自于構(gòu)造的數(shù)據(jù)，舉例展示了混合異構(gòu)數(shù)據(jù)中的上述特征。

一種有效的無(wú)監(jiān)督深度表示器(Mix2Vec)

圖1 現(xiàn)實(shí)生活中混合數(shù)據(jù)的特征：動(dòng)態(tài)性、稀疏性、異質(zhì)性

混合數(shù)據(jù)表示學(xué)習(xí)主要的挑戰(zhàn)是來(lái)自多個(gè)方面。首先，很難在一個(gè)表示模型中處理上述所有特征和學(xué)習(xí)目標(biāo)。因?yàn)樯鲜雒恳环N數(shù)據(jù)特征、每一個(gè)學(xué)習(xí)目標(biāo)在實(shí)際中都非常具有挑戰(zhàn)性，并且將他們組合在一起會(huì)使學(xué)習(xí)系統(tǒng)非常復(fù)雜。因此，現(xiàn)有方法要么將混合數(shù)據(jù)類(lèi)型轉(zhuǎn)換為一種類(lèi)型，要么對(duì)于每種數(shù)據(jù)類(lèi)型分別學(xué)習(xí)其向量表示，然后所學(xué)的各種類(lèi)型數(shù)據(jù)的表示合并作為混合數(shù)據(jù)的表示。

此外，混合數(shù)據(jù)可能是靜態(tài)的，也可能是動(dòng)態(tài)的，并且在結(jié)構(gòu)和分布上呈現(xiàn)出明顯的異質(zhì)性，表示學(xué)習(xí)在保留原始信息的同時(shí)捕獲這樣的異質(zhì)性是非常具有挑戰(zhàn)性?，F(xiàn)有方法通常側(cè)重于單獨(dú)的解決某一個(gè)方面，而不是在一個(gè)模型中同時(shí)解決上述這些問(wèn)題。然后，在沒(méi)有監(jiān)督信息的情況下，確定哪些信息應(yīng)考慮到表示中以及驗(yàn)證生成的表示是否有效則都具有一定挑戰(zhàn)性。

最后，數(shù)據(jù)本身的質(zhì)量(缺失值)以及其他包括稀疏性、屬性冗余和互補(bǔ)性在內(nèi)的其他問(wèn)題進(jìn)一步增加了完成上述表示學(xué)習(xí)任務(wù)的難度，而現(xiàn)有的研究往往只是處理上述問(wèn)題中的單個(gè)問(wèn)題。

02動(dòng)機(jī)

混合異構(gòu)數(shù)據(jù)表示學(xué)習(xí)的空缺

通過(guò)調(diào)研現(xiàn)階段表示學(xué)習(xí)的文獻(xiàn)資料，可知目前沒(méi)有一種表示學(xué)習(xí)方法可以同時(shí)解決上述的無(wú)監(jiān)督混合數(shù)據(jù)表示中挑戰(zhàn)。現(xiàn)有方法可以根據(jù)其學(xué)習(xí)目標(biāo)分為基于下游任務(wù)的方法，自我監(jiān)督的方法和基于重構(gòu)的方法：

1基于下游任務(wù)的方法是學(xué)習(xí)一種數(shù)據(jù)表示，以最大化在特定學(xué)習(xí)任務(wù)的學(xué)習(xí)目標(biāo)(例如，軟聚類(lèi))。此類(lèi)方法學(xué)習(xí)的表示是為提升特定模型的學(xué)習(xí)性能而定制的，但往往很難遷移到其他模型和任務(wù)上。

2自我監(jiān)督方法需要在數(shù)據(jù)中指定特定的關(guān)系(例如，相同上下文中的對(duì)象相似)以學(xué)習(xí)數(shù)據(jù)表示，并且用于表示學(xué)習(xí)的監(jiān)督信息是針對(duì)單個(gè)數(shù)據(jù)類(lèi)型、特定域(例如，自然語(yǔ)言處理)和假設(shè)(例如，時(shí)間一致性)，使得這些方法很難應(yīng)用于混合數(shù)據(jù)表示學(xué)習(xí)中。

3基于重構(gòu)的方法最大化了原始輸入及其對(duì)應(yīng)表示之間的相互信息性，以保留與原始輸入中足夠多的信息。然而，信息保存并不一定能夠保證表示質(zhì)量，而且現(xiàn)有的基于重建的方法集中于研究數(shù)值型數(shù)據(jù)(例如，圖像和視頻)，數(shù)值型數(shù)據(jù)中兩個(gè)值之間的距離有特定的語(yǔ)義含義(例如，圖像中的值的大小的表示更暗或更亮)來(lái)體現(xiàn)。對(duì)于基于重構(gòu)的方法來(lái)說(shuō)，很難重建混合數(shù)據(jù)，因?yàn)榛旌蠑?shù)據(jù)中可能存在各種語(yǔ)義含義，甚至有些沒(méi)有特定的語(yǔ)義含義。

03方法

混合異構(gòu)數(shù)據(jù)表示學(xué)習(xí)的目標(biāo)和機(jī)制

以下將介紹一種新的混合數(shù)據(jù)表示學(xué)習(xí)器Mix2Vec：嘗試解決上文中所提到的數(shù)據(jù)特點(diǎn)和學(xué)習(xí)挑戰(zhàn)，旨在通過(guò)構(gòu)建功能強(qiáng)大的混合數(shù)據(jù)表示器來(lái)學(xué)習(xí)多方面無(wú)監(jiān)督混合數(shù)據(jù)表示。該表示器具有多種機(jī)制來(lái)應(yīng)對(duì)上述數(shù)據(jù)特征和表示學(xué)習(xí)中的挑戰(zhàn)。

Mix2Vec采用以下三種機(jī)制來(lái)實(shí)現(xiàn)上述多方面目標(biāo)：

1采用隨機(jī)混洗預(yù)測(cè)對(duì)輸入數(shù)據(jù)進(jìn)行隨機(jī)的變換，并最大化原始數(shù)據(jù)的表示和經(jīng)過(guò)混洗后數(shù)據(jù)的表示之間的互信息性。

2采用估計(jì)分布匹配的方法來(lái)將原始輸入分布中的先驗(yàn)知識(shí)嵌入到學(xué)習(xí)的表示中。

3采用結(jié)構(gòu)信息增強(qiáng)的方法來(lái)使表示中的結(jié)構(gòu)信息量最大化。

這些機(jī)制將同時(shí)在深層神經(jīng)表示器Mix2Vec實(shí)現(xiàn)，如此一來(lái)，Mix2Vec可以有效地將具有上述各種特征的混合數(shù)據(jù)轉(zhuǎn)換為基于向量空間的表示形式。這種學(xué)習(xí)的表示形式是通用的，并且對(duì)于不同的學(xué)習(xí)任務(wù)是透明且可復(fù)用的。

一種有效的無(wú)監(jiān)督深度表示器(Mix2Vec)

圖2 Mix2Vec學(xué)習(xí)機(jī)制

給定混合數(shù)據(jù)的輸入，無(wú)監(jiān)督表示學(xué)習(xí)將學(xué)習(xí)一種映射函數(shù)，在無(wú)監(jiān)督的情況下以將混合輸入轉(zhuǎn)換為連續(xù)表示。假定X和Y分別為混合數(shù)據(jù)原始輸入空間和連續(xù)表示空間，無(wú)監(jiān)督學(xué)習(xí)的任務(wù)是學(xué)習(xí)一系列可微分參數(shù)方程。對(duì)于Mixe2Vec而言，給定來(lái)自原始輸入空間的n個(gè)樣本，即，需要學(xué)習(xí)一個(gè)編碼器來(lái)實(shí)現(xiàn)以下三個(gè)目標(biāo)：

01互信息最大化(Mutual Information Maximization)

最大化輸入及其表示之間的互信息，在Mix2Vec中通過(guò)隨機(jī)混洗預(yù)測(cè)(Random Shuffling Predic tion，RSP)目標(biāo)機(jī)制來(lái)實(shí)現(xiàn);

02先驗(yàn)分布匹配(Prior Distribution Matching，PDM)

強(qiáng)制數(shù)據(jù)表示的分布匹配某一先驗(yàn)分布，使得學(xué)習(xí)的數(shù)據(jù)表示具有所需的特征;

03結(jié)構(gòu)信息量最大化(Structural Informativeness Maximization，SIM)

最大化表示中的結(jié)構(gòu)信息量，這是對(duì)上述目標(biāo)的補(bǔ)充，有利于從原始輸入中保留結(jié)構(gòu)信息。

圖2顯示了Mix2Vec表示學(xué)習(xí)的工作流程，其中展示了上述待實(shí)現(xiàn)的三個(gè)目標(biāo)以及為不同目標(biāo)實(shí)現(xiàn)的機(jī)制。對(duì)于目標(biāo)1，本工作中將原始輸入隨機(jī)混洗變成為新輸入，并且將原始輸入和對(duì)應(yīng)混洗后的輸入都編碼為其對(duì)應(yīng)的數(shù)據(jù)表示，而后通過(guò)解碼器從原始輸入和對(duì)應(yīng)的混洗后輸入的數(shù)據(jù)表示中預(yù)測(cè)混洗位置(屬性);對(duì)于目標(biāo)2，基于從輸入中獲得的先驗(yàn)知識(shí)，將從原始輸入編碼的數(shù)據(jù)表示的分布與先驗(yàn)分布相匹配;最后，對(duì)于目標(biāo)3，最大化學(xué)習(xí)到數(shù)據(jù)表示的結(jié)構(gòu)信息。將上述三個(gè)目標(biāo)組合起來(lái)構(gòu)成Mix2Vec整體的學(xué)習(xí)目標(biāo)和機(jī)制，共同指導(dǎo)混合異構(gòu)數(shù)據(jù)的表示學(xué)習(xí)。

04驗(yàn)證

Mix2Vec學(xué)習(xí)效果

通過(guò)可視化包括Mix2Vec及其變體(不同的超參數(shù))在內(nèi)的所有表示器所學(xué)到的數(shù)據(jù)表示，以顯示學(xué)習(xí)到的數(shù)據(jù)表示的可分離性。為了將數(shù)據(jù)集所學(xué)到的表示可視化為二維空間，實(shí)驗(yàn)中引入了t分布的隨機(jī)鄰居嵌入可視化法方法，將高維表示向量轉(zhuǎn)換為二維表示向量。

實(shí)驗(yàn)中，為每個(gè)數(shù)據(jù)集隨機(jī)抽取600個(gè)這些二維向量，并在圖3中展示它們的位置，圖3展示在Churn上的可視化效果。

從圖中結(jié)果可知，Mix2Vec可以生成包含更多信息的高度結(jié)構(gòu)化表示，從單個(gè)目標(biāo)的可視化效果來(lái)看，RSP擅長(zhǎng)捕獲單個(gè)信息，PDM提供先驗(yàn)匹配，SIM突出結(jié)構(gòu)表示，符合Mix2Vec在設(shè)置之初融合三個(gè)目標(biāo)的原因。

一種有效的無(wú)監(jiān)督深度表示器(Mix2Vec)

圖3 Mix2Vec在Churn上數(shù)據(jù)表示的結(jié)果可視化

05結(jié)論

在現(xiàn)實(shí)世界中，以無(wú)監(jiān)督的方式進(jìn)行混合異構(gòu)數(shù)據(jù)表示是非?？量痰奶魬?zhàn)。該工作中針對(duì)具有稀疏性、動(dòng)態(tài)性和異構(gòu)性等復(fù)雜特征的混合數(shù)據(jù)，引入了一種有效的無(wú)監(jiān)督表示方法Mix2Vec。Mix2Vec通過(guò)預(yù)測(cè)輸入的隨機(jī)混洗操作，將數(shù)據(jù)表示的分布與輸入分布匹配，并增強(qiáng)數(shù)據(jù)表示中的結(jié)構(gòu)信息。Mix2Vec可以生成復(fù)雜的混合數(shù)據(jù)的通用且可重復(fù)使用的數(shù)據(jù)表示，以滿(mǎn)足多個(gè)方面的目標(biāo)，包括解決上述混合數(shù)據(jù)的特征、支持信息表示質(zhì)量以及實(shí)現(xiàn)不同學(xué)習(xí)任務(wù)的更好學(xué)習(xí)性能。

下一期將介紹Mix2Vec每個(gè)機(jī)制具體實(shí)現(xiàn)方法，以及Mix2Vec在不同下游任務(wù)上的性能。

請(qǐng)繼續(xù)關(guān)注此頻道以獲取最新的研究成果!

原文標(biāo)題：技術(shù)沖擊波| 異構(gòu)數(shù)據(jù)的無(wú)監(jiān)督表示學(xué)習(xí)(一)

文章出處：【微信公眾號(hào)：DeepBlue深蘭科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

數(shù)據(jù)

數(shù)據(jù)

+關(guān)注

關(guān)注
8

文章
6892

瀏覽量
88828
模型

模型

+關(guān)注

關(guān)注
1

文章
3172

瀏覽量
48714
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8377

瀏覽量
132409
深蘭科技

深蘭科技

+關(guān)注

關(guān)注
1

文章
55

瀏覽量
5951

原文標(biāo)題：技術(shù)沖擊波| 異構(gòu)數(shù)據(jù)的無(wú)監(jiān)督表示學(xué)習(xí)（一）

文章出處：【微信號(hào)：kmdian，微信公眾號(hào)：深蘭科技】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

時(shí)空引導(dǎo)下的時(shí)間序列自監(jiān)督學(xué)習(xí)框架

【導(dǎo)讀】最近，香港科技大學(xué)、上海AI Lab等多個(gè)組織聯(lián)合發(fā)布了一篇時(shí)間序列無(wú)監(jiān)督預(yù)訓(xùn)練的文章，相比原來(lái)的TS2Vec等時(shí)間序列表示學(xué)習(xí)工作

發(fā)表于 11-15 11:41 ?132次閱讀

時(shí)空引導(dǎo)下的時(shí)間序列自<b class='flag-5'>監(jiān)督</b>學(xué)習(xí)框架

一種基于深度學(xué)習(xí)的二維拉曼光譜算法

近日，天津大學(xué)精密儀器與光電子工程學(xué)院的光子芯片實(shí)驗(yàn)室提出了一種基于深度學(xué)習(xí)的二維拉曼光譜算法，成果以“Rapid and accurate bacteria identification

發(fā)表于 11-07 09:08 ?130次閱讀

<b class='flag-5'>一種</b>基于<b class='flag-5'>深度</b>學(xué)習(xí)的二維拉曼光譜算法

mix2015a中的ep引腳是什么

請(qǐng)問(wèn)mix2015a中的ep引腳是什么？手冊(cè)里沒(méi)有，但是實(shí)際有，嘉立創(chuàng)里也有

發(fā)表于 10-18 19:19

一種無(wú)透鏡成像的新方法

使用OAM-HHG EUV光束對(duì)高度周期性結(jié)構(gòu)進(jìn)行成像的EUV聚光顯微鏡為了研究微電子或光子元件中的納米級(jí)圖案，一種基于無(wú)透鏡成像的新方法可以實(shí)現(xiàn)近乎完美的高分辨率顯微鏡。層析成像是一種強(qiáng)大的

發(fā)表于 07-19 06:20 ?326次閱讀

<b class='flag-5'>一種</b><b class='flag-5'>無(wú)</b>透鏡成像的新方法

為什么深度睡眠期間RTC定時(shí)器會(huì)丟失呢？

RTC定時(shí)器在深度睡眠期間丟失是否是一種設(shè)計(jì)功能？我觀察到以下內(nèi)容（使用 SDK 1.3）： The chip is awakened from deep sleep after a timer

發(fā)表于 07-11 07:17

神經(jīng)網(wǎng)絡(luò)如何用無(wú)監(jiān)督算法訓(xùn)練

神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的重要組成部分，其訓(xùn)練方式多樣，其中無(wú)監(jiān)督學(xué)習(xí)是一種重要的訓(xùn)練策略。無(wú)監(jiān)督學(xué)

發(fā)表于 07-09 18:06 ?699次閱讀

深度學(xué)習(xí)中的無(wú)監(jiān)督學(xué)習(xí)方法綜述

應(yīng)用中往往難以實(shí)現(xiàn)。因此，無(wú)監(jiān)督學(xué)習(xí)在深度學(xué)習(xí)中扮演著越來(lái)越重要的角色。本文旨在綜述深度學(xué)習(xí)中的無(wú)監(jiān)督

發(fā)表于 07-09 10:50 ?513次閱讀

基于FPGA的類(lèi)腦計(jì)算平臺(tái) —PYNQ 集群的無(wú)監(jiān)督圖像識(shí)別類(lèi)腦計(jì)算系統(tǒng)

用基于脈沖前饋卷積網(wǎng)絡(luò)，運(yùn)用 STDP 無(wú)監(jiān)督學(xué)習(xí)算法，相較于 CNN 等傳統(tǒng)神經(jīng)網(wǎng)絡(luò)，更具有生物真實(shí)性，事件觸發(fā)型的權(quán)重更新模式使計(jì)算需求降低，能耗減少。 (2)利用 SNN 仿真器

發(fā)表于 06-25 18:35

無(wú)監(jiān)督深度學(xué)習(xí)實(shí)現(xiàn)單次非相干全息3D成像

論文信息背景引入數(shù)字全息術(shù)因其能夠從單一視點(diǎn)對(duì)3D場(chǎng)景進(jìn)行成像而備受關(guān)注。與直接成像相比，數(shù)字全息是一種間接的多步驟成像過(guò)程，包括光學(xué)記錄全息圖和數(shù)值計(jì)算重建，為包括深度學(xué)習(xí)在內(nèi)的計(jì)算成像方法

發(fā)表于 05-13 17:38 ?383次閱讀

一種利用光電容積描記（PPG）信號(hào)和深度學(xué)習(xí)模型對(duì)高血壓分類(lèi)的新方法

了深度神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺(jué)任務(wù)中的有效性，并為開(kāi)發(fā)更強(qiáng)大、更復(fù)雜的神經(jīng)網(wǎng)絡(luò)架構(gòu)鋪平了道路。 ResNet-50是一種深度神經(jīng)網(wǎng)絡(luò)架構(gòu)，由研究人員Kaiming He、XiangyuZh

發(fā)表于 05-11 20:01

Meta發(fā)布新型無(wú)監(jiān)督視頻預(yù)測(cè)模型“V-JEPA”

Meta，這家社交媒體和科技巨頭，近日宣布推出一種新型的無(wú)監(jiān)督視頻預(yù)測(cè)模型，名為“V-JEPA”。這一模型在視頻處理領(lǐng)域引起了廣泛關(guān)注，因?yàn)樗ㄟ^(guò)抽象性預(yù)測(cè)生成視頻中缺失或模糊的部分來(lái)

發(fā)表于 02-19 11:19 ?947次閱讀

如何使用UART將TRAVEOTM T 2G設(shè)備從深度睡眠中喚醒

睡眠模式下可用，但是 UART 模式不支持從深度睡眠喚醒。在這種情況下，要通過(guò) UART 實(shí)現(xiàn)從深度睡眠中喚醒，一種選擇是使用 UART_RX 引腳的 GPIO 中斷作為喚醒源。在此應(yīng)用程序中，在

發(fā)表于 01-31 06:08

論文遭首屆ICLR拒稿、代碼被過(guò)度優(yōu)化，word2vec作者Tomas Mikolov分享背后的故事

盡管 word2vec 是我被引用最多的論文，但我從未認(rèn)為它是我最有影響力的項(xiàng)目。實(shí)際上，word2vec 代碼最初只是我之前項(xiàng)目 RNNLM 的一個(gè)子集，我感覺(jué) RNNLM 很快就被人們遺忘了。但在我看來(lái)，它應(yīng)該和 AlexN

發(fā)表于 12-18 16:51 ?726次閱讀

一種基于疊層成像和波前分離的新型無(wú)透鏡成像方法

該文提出了一種基于疊層成像和波前分離的新型無(wú)透鏡成像方法，其特點(diǎn)是快速收斂和高質(zhì)量成像。在該方法中，在光源和樣品之間插入一個(gè)調(diào)幅器進(jìn)行光波調(diào)制。通過(guò)將這個(gè)未知的調(diào)制

發(fā)表于 12-11 11:21 ?796次閱讀

動(dòng)態(tài)場(chǎng)景下的自監(jiān)督單目深度估計(jì)方案

自監(jiān)督單目深度估計(jì)的訓(xùn)練可以在大量無(wú)標(biāo)簽視頻序列來(lái)進(jìn)行，訓(xùn)練集獲取很方便。但問(wèn)題是，實(shí)際采集的視頻序列往往會(huì)有很多動(dòng)態(tài)物體，而自監(jiān)督訓(xùn)練本身就是基于靜態(tài)環(huán)境假設(shè)，動(dòng)態(tài)環(huán)境下會(huì)失效。

發(fā)表于 11-28 09:21 ?676次閱讀