精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習算法的介紹

新機器視覺 ? 來源:機器人網 ? 作者:機器人網 ? 2022-06-05 14:17 ? 次閱讀

b16add9c-e171-11ec-ba43-dac502259ad0.jpg

哲學要回答的基本問題是從哪里來、我是誰、到哪里去,尋找答案的過程或許可以借鑒機器學習的套路:組織數據->挖掘知識->預測未來。組織數據即為設計特征,生成滿足特定格式要求的樣本,挖掘知識即建模,而預測未來就是對模型的應用。

b19a7a7a-e171-11ec-ba43-dac502259ad0.jpg

特征設計依賴于對業務場景的理解,可分為連續特征、離散特征和組合高階特征。本篇重點是機器學習算法的介紹,可以分為監督學習和無監督學習兩大類。

b1bf5246-e171-11ec-ba43-dac502259ad0.jpg

無監督學習算法很多,最近幾年業界比較關注主題模型,LSA->PLSA->LDA為主題模型三個發展階段的典型算法,它們主要是建模假設條件上存在差異。LSA假設文檔只有一個主題,PLSA假設各個主題的概率分布不變(theta都是固定的),LDA假設每個文檔和詞的主題概率是可變的。

b20f703c-e171-11ec-ba43-dac502259ad0.jpg

LDA算法本質可以借助上帝擲骰子幫助理解,詳細內容可參加Rickjin寫的《LDA數據八卦》文章,淺顯易懂,順便也科普了很多數學知識,非常推薦

b24f76dc-e171-11ec-ba43-dac502259ad0.jpg

監督學習可分為分類和回歸,感知器是最簡單的線性分類器,現在實際應用比較少,但它是神經網絡深度學習的基本單元。

b27c3f82-e171-11ec-ba43-dac502259ad0.jpg

線性函數擬合數據并基于閾值分類時,很容易受噪聲樣本的干擾,影響分類的準確性。邏輯回歸(Logistic Regression)利用sigmoid函數將模型輸出約束在0到1之間,能夠有效弱化噪聲數據的負面影響,被廣泛應用于互聯網廣告點擊率預估。

b2c56c20-e171-11ec-ba43-dac502259ad0.jpg

b2e98e48-e171-11ec-ba43-dac502259ad0.jpg

邏輯回歸模型參數可以通過最大似然求解,首先定義目標函數L(theta),然后log處理將目標函數的乘法邏輯轉化為求和邏輯(最大化似然概率 -> 最小化損失函數),最后采用梯度下降求解。

b301a604-e171-11ec-ba43-dac502259ad0.jpg

b326e1f8-e171-11ec-ba43-dac502259ad0.jpg

相比于線性分類去,決策樹等非線性分類器具有更強的分類能力,ID3和C4.5是典型的決策樹算法,建模流程基本相似,兩者主要在增益函數(目標函數)的定義不同。

b34b38dc-e171-11ec-ba43-dac502259ad0.jpg

線性回歸和線性分類在表達形式上是類似的,本質區別是分類的目標函數是離散值,而回歸的目標函數是連續值。目標函數的不同導致回歸通常基于最小二乘定義目標函數,當然,在觀測誤差滿足高斯分布的假設情況下,最小二乘和最大似然可以等價。

b370df42-e171-11ec-ba43-dac502259ad0.jpg

當梯度下降求解模型參數時,可以采用Batch模式或者Stochastic模式,通常而言,Batch模式準確性更高,Stochastic模式復雜度更低。

b38d0ee2-e171-11ec-ba43-dac502259ad0.jpg

b3ed7ba6-e171-11ec-ba43-dac502259ad0.jpg

上文已經提到,感知器雖然是最簡單的線性分類器,但是可以視為深度學習的基本單元,模型參數可以由自動編碼(Auto Encoder)等方法求解。

b42f756a-e171-11ec-ba43-dac502259ad0.jpg

深度學習的優勢之一可以理解為特征抽象,從底層特征學習獲得高階特征,描述更為復雜的信息結構。例如,從像素層特征學習抽象出描述紋理結構的邊緣輪廓特征,更進一步學習獲得表征物體局部的更高階特征。 俗話說三個臭皮匠賽過諸葛亮,無論是線性分類還是深度學習,都是單個模型算法單打獨斗,有沒有一種集百家之長的方法,將模型處理數據的精度更進一步提升呢?當然,Model Ensembel就是解決這個問題。Bagging為方法之一,對于給定數據處理任務,采用不同模型/參數/特征訓練多組模型參數,最后采用投票或者加權平均的方式輸出最終結果。 Boosting為Model Ensemble的另外一種方法,其思想為模型每次迭代時通過調整錯誤樣本的損失權重提升對數據樣本整體的處理精度,典型算法包括AdaBoost、GBDT等。

b4591816-e171-11ec-ba43-dac502259ad0.jpg

不同的數據任務場景,可以選擇不同的Model Ensemble方法,對于深度學習,可以對隱層節點采用DropOut的方法實現類似的效果。

b4823dea-e171-11ec-ba43-dac502259ad0.jpg

b4a5cb84-e171-11ec-ba43-dac502259ad0.jpg

b4cc1172-e171-11ec-ba43-dac502259ad0.jpg

介紹了這么多機器學習基礎算法,說一說評價模型優劣的基本準則。欠擬合和過擬合是經常出現的兩種情況,簡單的判定方法是比較訓練誤差和測試誤差的關系,當欠擬合時,可以設計更多特征來提升模型訓練精度,當過擬合時,可以優化特征量降低模型復雜度來提升模型測試精度。

b4f27376-e171-11ec-ba43-dac502259ad0.jpg

特征量是模型復雜度的直觀反映,模型訓練之前設定輸入的特征量是一種方法,另外一種比較常用的方法是在模型訓練過程中,將特征參數的正則約束項引入目標函數/損失函數,基于訓練過程篩選優質特征。

b511daae-e171-11ec-ba43-dac502259ad0.jpg

模型調優是一個細致活,最終還是需要能夠對實際場景給出可靠的預測結果,解決實際問題。期待學以致用!

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4600

    瀏覽量

    92647
  • 機器學習
    +關注

    關注

    66

    文章

    8378

    瀏覽量

    132415

原文標題:零基礎入門機器學習算法(附圖)

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習
    的頭像 發表于 11-15 09:19 ?316次閱讀

    人工智能、機器學習和深度學習存在什么區別

    人工智能指的是在某種程度上顯示出類似人類智能的設備。AI有很多技術,但其中一個很大的子集是機器學習——讓算法從數據中學習
    發表于 10-24 17:22 ?2447次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區別

    LIBS結合機器學習算法的江西名優春茶采收期鑒別

    以廬山云霧茶和狗牯腦茶的明前茶、雨前茶為對象,研究激光誘導擊穿光譜結合機器學習的茶葉鑒別方法。將茶葉茶,水數據融合可有效鑒別春茶采收期,且數據融合后表現出更好的穩定性和魯棒性,LIBS結合機器
    的頭像 發表于 10-22 18:05 ?197次閱讀
    LIBS結合<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b>的江西名優春茶采收期鑒別

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    如何通過根因分析技術獲得導致故障的維度和元素,包括基于時間序列異常檢測算法的根因分析、基于熵的根因分析、基于樹模型的根因分析、規則學習等。 ●第7章“智能運維的應用場景”:介紹智能運維領域的應用,包括
    發表于 08-07 23:03

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數據中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發表于 07-02 11:25 ?786次閱讀

    機器學習在數據分析中的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從數據中學習規律,為企業和組織提供了更高效、更準確的數據分析能力。本文將深入探討機器
    的頭像 發表于 07-02 11:22 ?545次閱讀

    深度學習與傳統機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發表于 07-01 11:40 ?1198次閱讀

    機器學習的經典算法與應用

    關于數據機器學習就是喂入算法和數據,讓算法從數據中尋找一種相應的關系。Iris鳶尾花數據集是一個經典數據集,在統計學習
    的頭像 發表于 06-27 08:27 ?1576次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的經典<b class='flag-5'>算法</b>與應用

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?

    應用,將理論基礎與實踐案例相結合,作者憑借扎實的數學功底及其在企業界的豐富實踐經驗,將機器學習與時間序列分析巧妙融合在書中。 全書書共分為8章,系統介紹時間序列的基礎知識、常用預測方法、異常檢測
    發表于 06-25 15:00

    機器學習入門:基本概念介紹

    機器學習(GraphMachineLearning,簡稱GraphML)是機器學習的一個分支,專注于利用圖形結構的數據。在圖形結構中,數據以圖的形式表示,其中的節點(或頂點)表示實體
    的頭像 發表于 05-16 08:27 ?477次閱讀
    圖<b class='flag-5'>機器</b><b class='flag-5'>學習</b>入門:基本概念<b class='flag-5'>介紹</b>

    深入探討機器學習的可視化技術

    機器學習可視化(簡稱ML可視化)一般是指通過圖形或交互方式表示機器學習模型、數據及其關系的過程。目標是使理解模型的復雜算法和數據模式更容易,
    發表于 04-25 11:17 ?374次閱讀
    深入探討<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的可視化技術

    機器學習怎么進入人工智能

    ,人工智能已成為一個熱門領域,涉及到多個行業和領域,例如語音識別、機器翻譯、圖像識別等。 在編程中進行人工智能的關鍵是使用機器學習算法,這是一類基于樣本數據和模型訓練來進行預測和判斷的
    的頭像 發表于 04-04 08:41 ?266次閱讀

    機器學習8大調參技巧

    今天給大家一篇關于機器學習調參技巧的文章。超參數調優是機器學習例程中的基本步驟之一。該方法也稱為超參數優化,需要搜索超參數的最佳配置以實現最佳性能。
    的頭像 發表于 03-23 08:26 ?565次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>8大調參技巧

    AI算法的本質是模擬人類智能,讓機器實現智能化

    電子發燒友網報道(文/李彎彎)AI算法是人工智能領域中使用的算法,用于模擬、延伸和擴展人的智能。這些算法可以通過機器學習、深度
    的頭像 發表于 02-07 00:07 ?5626次閱讀

    目前主流的深度學習算法模型和應用案例

    深度學習在科學計算中獲得了廣泛的普及,其算法被廣泛用于解決復雜問題的行業。所有深度學習算法都使用不同類型的神經網絡來執行特定任務。
    的頭像 發表于 01-03 10:28 ?1769次閱讀
    目前主流的深度<b class='flag-5'>學習</b><b class='flag-5'>算法</b>模型和應用案例