首發：AI公園公眾號
作者：Andre Ye
編譯：ronghuaiyang

導讀

為什么半監督學習是機器學習的未來。

監督學習是人工智能領域的第一種學習類型。從它的概念開始，無數的算法，從簡單的邏輯回歸到大規模的神經網絡，都已經被研究用來提高精確度和預測能力。
然而，一個重大突破揭示了添加“無監督數據”可以提高模型泛化和性能。事實上，在非常多的場景中，帶有標簽的數據并不容易獲得。半監督學習可以在標準的任務中實現SOTA的效果，只需要一小部分的有標記數據 —— 數百個訓練樣本。
在這個我們對半監督學習的探索中，我們會有：

_半監督學習簡介_。什么是半監督學習，它與其他學習方法相比如何，半監督學習算法的框架/思維過程是什么？
_算法：Semi-Supervised GANs_。與傳統GANs的比較，過程的解釋，半監督GANs的性能。
_用例和機器學習的未來_。為什么半監督學習會有如此大的需求，哪里可以應用。

半監督學習介紹

半監督學習算法代表了監督和非監督算法的中間地帶。雖然沒有正式定義為機器學習的“第四個”元素(監督、無監督、強化)，但它將前兩個方面結合成一種自己的方法。
這些算法操作的數據有一些標簽，但大部分是沒有標簽的。傳統上，人們要么選擇有監督學習的方式，只對帶有標簽的數據進行操作，這將極大地減小數據集的規模，要么，就會選擇無監督學習的方式，丟棄標簽保留數據集的其余部分，然后做比如聚類之類的工作。

這在現實世界中是很常見的。由于標注是很昂貴的，特別是大規模數據集，特別是企業用途的，可能只有幾個標簽。例如，考慮確定用戶活動是否具有欺詐性。在100萬用戶中，該公司知道有1萬用戶是這樣的，但其他9萬用戶可能是惡意的，也可能是良性的。半監督學習允許我們操作這些類型的數據集，而不必在選擇監督學習或非監督學習時做出權衡。
一般來說，半監督學習算法在這個框架上運行：

半監督機器學習算法使用有限的標記樣本數據集來訓練自己，從而形成一個“部分訓練”的模型。
部分訓練的模型對未標記的數據進行標記。由于樣本標記數據集有許多嚴重的限制(例如，在現實數據中的選擇偏差)，標記的結果被認為是“偽標簽”數據。
結合標記和偽標簽數據集，創建一個獨特的算法，結合描述和預測方面的監督和非監督學習。

半監督學習利用分類過程來識別數據資產，利用聚類過程將其分成不同的部分。

算法：Semi-Supervised GAN

半監督的GAN，簡稱為SGAN，是[生成對抗網絡](https://medium.com/analy tics-... -an-直覺解釋-革命概念-2f962c858b95)架構的一個變體，用于解決半監督學習問題。
在傳統的GAN中，判別器被訓練來預測由生成器模型生成的圖像是真實的還是假的，允許它從圖像中學習判別特征，即使沒有標簽。盡管大多數人通常在GANs中使用訓練很好的生成器，可以生成和數據集中相似的圖像，判別器還是可以通過以轉移學習作為起點在相同的數據集上建立分類器，允許監督任務從無監督訓練中受益。由于大部分的圖像特征已經被學習，因此進行分類的訓練時間和準確率會更好。
然而，在SGAN中，判別器同時接受兩種模式的訓練：無監督和監督。

在無監督模式中，需要區分真實圖像和生成的圖像，就像在傳統的GAN中一樣。
在監督模式中，需要將一幅圖像分類為幾個類，就像在標準的神經網絡分類器中一樣。

為了同時訓練這兩種模式，判別器必須輸出1 + _n_個節點的值，其中1表示“真或假”節點，_n_是預測任務中的類數。
在半監督GAN中，對判別器模型進行更新，預測K+1個類，其中K為預測問題中的類數，并為一個新的“_假_”類添加額外的類標簽。它涉及到同時訓練無監督分類任務和有監督分類任務的判別器模型。整個數據集都可以通過SGAN進行傳遞 —— 當一個訓練樣本有標簽時，判別器的權值將被調整，否則，分類任務將被忽略，判別器將調整權值以更好地區分真實的圖像和生成的圖像。

雖然允許SGAN進行無監督訓練，允許模型從一個非常大的未標記數據集中學習非常有用的特征提取，但有監督學習允許模型利用提取的特征并將其用于分類任務。其結果是一個分類器可以在像MNIST這樣的標準問題上取得令人難以置信的結果，即使是在非常非常少的標記樣本(數十到數百個)上進行訓練。
SGAN巧妙地結合了無監督和監督學習的方面，強強聯合，以最小的標簽量，產生難以置信的結果。

用例和機器學習的未來

在一個可用數據量呈指數級增長的時代，無監督數據根本不能停下來等待標注。無數真實世界的數據場景會像這樣出現 —— 例如，YouTube視頻或網站內容。從爬蟲引擎和內容聚合系統到圖像和語音識別，半監督學習被廣泛應用。
半監督學習將監督學習和非監督學習的過擬合和“不擬合”傾向(分別)結合起來的能力，創建了一個模型，在給出最小數量的標記數據和大量的未標記數據的情況下，可以出色地執行分類任務。除了分類任務，半監督算法還有許多其他用途，如增強聚類和異常檢測。盡管這一領域本身相對較新，但由于在當今的數字領域中發現了巨大的需求，算法一直在不斷地被創造和完善。
半監督學習確實是機器學習的未來。

—END—

英文原文：https://toward sdatascience.co...

推薦閱讀

多攝像頭實時目標跟蹤和計數，使用YOLOv4，Deep SORT和Flask
使用深度學習從視頻中估計車輛的速度
圖像分割2020總結：結構，損失函數，數據集和框架

關注圖像處理，自然語言處理，機器學習等人工智能領域,請點擊關注AI公園專欄。
歡迎關注微信公眾號

審核編輯：符乾江

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

人工智能

人工智能

+關注

關注
1791

文章
46896

瀏覽量
237672
機器學習

機器學習

+關注

關注
66

文章
8382

瀏覽量
132444

時空引導下的時間序列自監督學習框架

【導讀】最近，香港科技大學、上海AI Lab等多個組織聯合發布了一篇時間序列無監督預訓練的文章，相比原來的TS2Vec等時間序列表示學習工作，核心在于提出了將空間信息融入到預訓練階段，即在預訓練階段

發表于 11-15 11:41 ?145次閱讀

【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習

收集海量的文本數據作為訓練材料。這些數據集不僅包括語法結構的學習，還包括對語言的深層次理解，如文化背景、語境含義和情感色彩等。自監督學習：模型采用自監督學習策略，在大量無標簽文本數據上學習

發表于 08-02 11:03

【《大語言模型應用指南》閱讀體驗】+ 基礎篇

章節最后總結了機器學習的分類：有監督學習、無監督學習、半監督學習、自監督學習和強化

發表于 07-25 14:33

神經網絡如何用無監督算法訓練

神經網絡作為深度學習的重要組成部分，其訓練方式多樣，其中無監督學習是一種重要的訓練策略。無監督學習旨在從未標記的數據中發現數據內在的結構、模式或規律，從而提取有用的特征表示。這種訓練方式對于大規模未

發表于 07-09 18:06 ?704次閱讀

深度學習中的無監督學習方法綜述

應用中往往難以實現。因此，無監督學習在深度學習中扮演著越來越重要的角色。本文旨在綜述深度學習中的無監督學習方法，包括自編碼器、生成對抗網絡、聚類算法等，并分析它們的原理、應用場景以及優

發表于 07-09 10:50 ?542次閱讀

基于FPGA的類腦計算平臺 —PYNQ 集群的無監督圖像識別類腦計算系統

STDP 無監督學習算法，可運用于圖像的無監督分類。從平臺設計角度： (1)本設計搭建的基于 PYNQ 集群的通用低功耗的大規模類腦計算平臺，搭載 PYNN，NEST 等通用 SNN

發表于 06-25 18:35

CVPR'24 Highlight！跟蹤3D空間中的一切！

為了使用三維運動先驗正則化估計的三維軌跡，模型另外預測了每條軌跡的剛性嵌入，這使能夠軟地分組表現出相同剛性體運動的像素，并為每個剛性集群強制執行ARAP正則化。作者證明了剛性嵌入可以通過自監督學習，并產生不同剛性部分的合理分割。

發表于 04-13 12:12 ?1167次閱讀

機器學習基礎知識全攻略

有監督學習通常是利用帶有專家標注的標簽的訓練數據，學習一個從輸入變量X到輸入變量Y的函數映射。Y = f (X)，訓練數據通常是(n×x,y)的形式，其中n代表訓練樣本的大小，x和y分別是變量X和Y的樣本值。

發表于 02-25 13:53 ?212次閱讀

OpenAI推出Sora：AI領域的革命性突破

大模型的核心技術是自然語言處理（NLP）和深度學習。具體而言，它基于Transformer架構，使用了大規模無監督學習方法，例如自回歸語言建模和掩碼語言建模，來訓練一個龐大的神經網絡模型。

發表于 02-21 16:36 ?994次閱讀

2024年AI領域將會有哪些新突破呢？

傳統的機器學習需要大量的標記數據進行訓練，但自監督學習可以通過無監督的方式從大規模未標記的數據中學習到更有用的表示形式，從而提高模型的性能。

發表于 01-24 09:58 ?1958次閱讀

谷歌MIT最新研究證明：高質量數據獲取不難，大模型就是歸途

另一個極端是，監督學習方法（即SupCE）會將所有這些圖像視為單一類（如「金毛獵犬」）。這就忽略了這些圖像在語義上的細微差別，例如在一對圖像中狗在騎自行車，而在另一對圖像中狗坐在壽司屋內。

發表于 01-15 15:40 ?515次閱讀

傳音AI技術部在ASRU 2023 MADASR低資源語音識別比賽斬獲多項佳績

自動語音識別（Automatic Speech Recognition，簡稱ASR）主要用于將人類語音轉換為計算機可讀的文本或命令，實現人機交互和自然語言處理。近年來，得益于基于自監督學習的聲學模型（如 wav2vec2）和大規模多語言訓練（如 Whisper）

發表于 12-21 16:33 ?909次閱讀

使用自監督學習重建動態駕駛場景

無論是單調的高速行車，還是平日的短途出行，駕駛過程往往平淡無奇。因此，在現實世界中采集的用于開發自動駕駛汽車（AV）的大部分訓練數據都明顯偏向于簡單場景。這給部署魯棒的感知模型帶來了挑戰。自動駕駛汽車必須接受全面的訓練、測試和驗證，以便能夠應對復雜的場景，而這需要大量涵蓋此類場景的數據。在現實世界中，收集此類場景數據要耗費大量時間和成本。而現在，仿真提供了另一個可選方案。但要大規模生成復雜動態場景仍然

發表于 12-16 16:05 ?633次閱讀

基于transformer和自監督學習的路面異常檢測方法分享

鋪設異常檢測可以幫助減少數據存儲、傳輸、標記和處理的壓力。本論文描述了一種基于Transformer和自監督學習的新方法，有助于定位異常區域。

發表于 12-06 14:57 ?1472次閱讀

無監督域自適應場景：基于檢索增強的情境學習實現知識遷移

本文對比了多種基線方法，包括無監督域自適應的傳統方法（如Pseudo-labeling和對抗訓練）、基于檢索的LM方法（如REALM和RAG）和情境學習方法（如In-context learning）。

發表于 12-05 14:14 ?569次閱讀