精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于條件概率分類的兩種模型算法:logistic回歸模型與最大熵模型。

lviY_AI_shequ ? 來源:lp ? 2019-04-13 10:45 ? 次閱讀

條件概率是機器學習模型的一種表現形式,應用這一模型,對于給定的輸入X,得到各輸出類的概率,選擇最大概率的類為輸出類,如下圖:

本文介紹基于條件概率分類的兩種模型算法:邏輯斯蒂(logistic)回歸與最大熵模型,其中,logistic回歸模型和最大熵模型分別是基于最大似然函數和熵來估計模型P(y|x)。公眾號已有logistic回歸模型的文章介紹,本文重點分析最大熵模型算法。

目錄

1. 最大熵模型算法

2. 最大熵模型例子

3. 最大熵模型在信號檢測的應用

4. logsitic回歸模型算法

5. 總結

1.最大熵模型算法

熵是衡量隨機變量不確定性的指標,熵越大,隨機變量的不確定性亦越大。假設X是一個離散型隨機變量,其概率分布為:

隨機變量X的熵定義為:

熵滿足下列不等式:

式中,|X|是x的取值個數,當且僅當X的分布是均勻分布時,右邊的等號成立,也就是說,當X服從均勻分布時,熵最大。

1.1 最大熵模型的定義

最大熵原理是概率模型學習的一個準則,最大熵原理認為,學習概率模型時,在所有可能的概率模型(分布)中,熵最大的模型是最好的模型。條件概率是機器學習模型的一種表現形式,學習該模型的一種方法是最大化該條件概率的熵,即最大化下式:

其中表示變量X的經驗分布:

其中v(X=x)表示訓練數據中輸入x出現的頻數,N表示樣本容量。

(1)式的未知變量就是需要學習的模型。

我們在構建分類模型的過程中假設訓練數據集的聯合概率分布與真實模型的聯合概率分布相等,這一假設用特征函數f(x,y)的期望來描述,特征函數的定義:

特征函數f(x,y)關于訓練數據集的聯合概率分布的期望值,用表示:

其中,

,v(X=x,Y=y)表示訓練數據中樣本(x,y)出現的頻數。

特征函數f(x,y)關于模型與經驗分布的期望值,用表示:

假設兩者期望相等,即:

結合(1)(4)式,得到最大熵模型:

約束條件:

1.2 最大熵模型的學習

我們求解(5)式在約束條件下的最大值,其對應的模型P(Y|X)就是所學習的最優模型。

對于給定的訓練數據集以及特征函數,i=1,2,...,n,最大熵模型的學習等價于約束最優化問題:

將最大值問題轉化為等價的求最小值問題:

引入拉格朗日乘子將約束的最優化問題轉換為無約束最優化的對偶問題,通過求解對偶問題求解原始問題。

定義拉格朗日函數L(P,w):

最優化的原始問題:

對偶問題:

得:

由于,對上式進行歸一化得:

其中,

易知對偶問題外部的極大化問題:

根據上式求解的代入(2.4)式,得到最終的學習模型P(y|x)。

2. 最大熵模型例子

假設隨機變量Y有5個取值,假設隨機變量Y的條件概率分布滿足如下條件:

求最大熵模型對應的概率分布P(Y)。

最大熵模型的目標函數:

引進拉格朗日乘子,定義拉格朗日函數:

,得:

將上式代入函數L(P,w)得,令,得:

于是最大熵模型對應的概率分布:

3. 熵模型在信號檢測的應用

由第一節我們知道,熵是描述事物不確定性的指標。我們將熵的這一性質應用在信號檢測領域,當信號包含了較強的隨機噪聲時或被噪聲完全掩蓋時,信號的隨機性大大的增加了,其對應的熵也較大,根據這一原理對信號的質量進行檢測,下圖是用熵檢測心電信號質量的效果圖:

黑色表示較好的心電信號質量,紅色表示較差的心電信號質量。

4. logistic回歸算法

logistic回歸是一種概率分類模型,對于二分類任務來說,其條件概率分布:

我們用最小化損失函數去估計上式的模型參數。對于給定的訓練數據集,其中,

設:

似然函數為:

對數似然函數為:

損失函數為:

用梯度下降法求解w的估計值

代入(2.1)(2.2)式,得到邏輯斯蒂回歸模型P(y|x),其中向量包含了b值。

5. 小結

本文介紹基于條件概率分類的兩種模型算法:logistic回歸模型與最大熵模型,其中,logistic回歸模型是基于最大似然函數估計模型P(y|x),最大熵模型是基于熵這一指標估計模型P(y|x)。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3178

    瀏覽量

    48730
  • 機器學習
    +關注

    關注

    66

    文章

    8382

    瀏覽量

    132444
  • Logistic
    +關注

    關注

    0

    文章

    11

    瀏覽量

    8847

原文標題:最大熵模型算法總結

文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    利用機器學習和大數據何建立信用評分的模型

    利用Logistic回歸擬合信用評分卡模型
    發表于 04-19 16:27

    機器學習之偏差、方差,生成模型,判別模型,先驗概率,后驗概率

    機器學習:偏差、方差,生成模型,判別模型,先驗概率,后驗概率
    發表于 05-14 15:23

    回歸算法有哪些,常用回歸算法(3)詳解

    隨機梯度下降來估計系數。損失函數通常被定義為交叉項: 邏輯回歸用于分類問題,例如,對于給定的醫療數據,可以使用邏輯回歸判斷一個人是否患有癌癥。如果輸出類別變量具有
    發表于 07-28 14:36

    Edge Impulse的回歸模型

    Edge Impulse的回歸模型可以從數據中學習模式,并將其應用于新數據。 非常適合預測數字連續值。
    發表于 12-20 06:21

    使用KNN進行分類回歸

    一般情況下k-Nearest Neighbor (KNN)都是用來解決分類的問題,其實KNN是一可以應用于數據分類和預測的簡單算法,本文中我們將它與簡單的線性
    發表于 10-28 14:44

    基于概率粗糙集模型的信息檢索

    針對經典粗糙集模型難以分類標引空間以及體現類間關聯的缺陷,將條件概率關系結合粗糙集理論引入信息檢索,提出一基于
    發表于 04-10 08:47 ?10次下載

    LTL概率模型檢驗工具的實現與優化

    概率模型檢驗建立在非概率模型檢驗技術的基礎上,不僅能夠對系統進行定性的驗證,還能夠定量判斷系統滿足相關性質的概率,具有廣泛的適用性。LTL
    發表于 11-21 15:09 ?6次下載
    LTL<b class='flag-5'>概率</b><b class='flag-5'>模型</b>檢驗工具的實現與優化

    基于Wasserstein距離概率分布模型的非線性降維算法

    降維是大數據分析和可視化領域中的核心問題,其中基于概率分布模型的降維算法通過最優化高維數據模型和低維數據模型之間的代價函數來實現降維。這種策
    發表于 11-24 17:13 ?3次下載

    基于概率主題模型的景點主題模型

    針對旅游文本噪聲多、景點多且展示不直觀的問題,提出一基于概率主題模型的景點一主題模型模型假設同一篇文檔涉及多個具有相關關系的景點,引入全
    發表于 12-13 14:07 ?3次下載

    掌握logistic regression模型,有必要先了解線性回歸模型和梯度下降法

    先回想一下線性回歸,線性回歸模型幫助我們用最簡單的線性方程實現了對數據的擬合,然而,這只能完成回歸任務,無法完成分類任務,那么 logist
    的頭像 發表于 06-04 11:31 ?7572次閱讀
    掌握<b class='flag-5'>logistic</b> regression<b class='flag-5'>模型</b>,有必要先了解線性<b class='flag-5'>回歸</b><b class='flag-5'>模型</b>和梯度下降法

    如何使用概率模型進行非均勻數據聚類算法的設計介紹

    針對傳統K-means型算法的“均勻效應”問題,提出一基于概率模型的聚類算法。首先,提出一個描述非均勻數據簇的高斯混合分布
    發表于 12-13 10:57 ?10次下載

    基于交叉算法的跟馳模型標定

    的確定性標定方法會導致大量局部最優值的出現。在此基礎上,本文提出了基于交叉算法的跟馳模型標定的框架,基于蒙地卡羅與重要樣本策略逐步逼近參數的最優概率密度函數。實例分別采用合成數據與實
    發表于 01-11 16:23 ?8次下載
    基于交叉<b class='flag-5'>熵</b><b class='flag-5'>算法</b>的跟馳<b class='flag-5'>模型</b>標定

    廣義線性模型介紹

    從線性回歸logistic回歸,softmax回歸最大
    的頭像 發表于 11-22 15:10 ?4266次閱讀

    基于直方圖條件的水聲數據分類算法

    水聲數據中目標的不確定性以及各種物質的聲納數據值的雜合程度,使基于直方圖最大值和直方圖算法都不能很好地解決水聲數據分類的問題。為此,提出一
    發表于 04-21 10:12 ?9次下載

    機器學習常用的十大算法

    二項logistic回歸模型是一分類模型,由條件
    發表于 10-16 10:10 ?1957次閱讀