機器學習是一種數據分析技術,讓計算機執行人和動物與生俱來的活動:從經驗中學習。
技能挑戰
MATLAB 微信公眾號回復【M測試】,10 道選擇題考驗你的機器學習技能!敢來試試嗎?
機器學習算法使用計算方法直接從數據中“學習”信息,而不依賴于預定方程模型。當可用于學習的樣本數量增加時,這些算法可自適應提高性能。隨著大數據應用增加,機器學習已成為解決以下領域問題的一項關鍵技術:
計算金融學,用于信用評估和算法交易
計算生物學,用于腫瘤檢測、藥物發現和 DNA 序列分析
能源生產,用于預測價格和負載
汽車、航空航天和制造業,用于預見性維護
自然語言處理,用于語音識別應用
視頻:什么是機器學習?
機器學習算法能夠在產生洞察力的數據中發現自然模式,幫助您更好地制定決策和做出預測。醫療診斷、股票交易、能量負荷預測及更多行業每天都在使用這些算法制定關鍵決策。例如,媒體網站依靠機器學習算法從數百萬種選項中篩選出為您推薦的歌曲或影片。零售商利用這些算法深入了解客戶的購買行為。
何時應該使用機器學習?
當您遇到涉及大量數據和許多變量的復雜任務或問題,但沒有現成的處理公式或方程式時,可以考慮使用機器學習。例如,如果您需要處理以下情況,使用機器學習是一個很好的選擇:
機器學習的工作原理
機器學習采用兩種技術:監督式學習和無監督學習。監督式學習根據已知的輸入和輸出訓練模型,讓模型能夠預測未來輸出;無監督學習從輸入數據中找出隱藏模式或內在結構。
監督式機器學習能夠根據已有的包含不確定性的數據建立一個預測模型。監督式學習算法接受已知的輸入數據集(包含預測變量)和對該數據集的已知響應(輸出,響應變量),然后訓練模型,使模型能夠對新輸入數據的響應做出合理的預測。
監督式學習采用分類和回歸技術開發預測模型。
分類技術可預測離散的響應—如果您的數據能進行標記、分類或分為特定的組或類,則使用分類。
用于實現分類的常用算法包括:支持向量機 (SVM)、提升 (boosted) 決策樹和袋裝 (bagged)決策樹、k-最近鄰、樸素貝葉斯 (Na?ve Bayes)、判別分析、邏輯回歸和神經網絡。
回歸技術可預測連續的響應—如果您在處理一個數據范圍,或您的響應性質是一個實數(比如溫度,或一件設備發生故障前的運行時間),則使用回歸方法。
常用回歸算法包括:線性模型、非線性模型、規則化、逐步回歸、提升 (boosted)和袋裝 (bagged)決策樹、神經網絡和自適應神經模糊學習。
無監督學習可發現數據中隱藏的模式或內在結構。這種技術可根據未做標記的輸入數據集得到推論。
聚類是一種最常用的無監督學習技術。這種技術可通過探索性數據分析發現數據中隱藏的模式或分組。
用于執行聚類的常用算法包括:k-均值和 k-中心點(k-medoids)、層次聚類、高斯混合模型、隱馬爾可夫模型、自組織映射、模糊 c-均值聚類法和減法聚類。
入門視頻
在 MATLAB 微信公眾號回復【機器學習入門教程】,獲取《機器學習快速入門》系列視頻,全面介紹實用的 MATLAB 機器學習方法,包括:
線性回歸
判別分析
決策樹
支持向量機(SVM)
k近鄰算法(K-NN)
k均值聚類算法(k-means)
選擇合適的機器學習算法
沒有最佳方法或萬全之策。找到正確的算法只是試錯過程的一部分——即使是經驗豐富的數據科學家,也無法說出某種算法是否無需試錯即可使用。但算法的選擇還取決于您要處理的數據的大小和類型、您要從數據中獲得的洞察力以及如何運用這些洞察力。
下面是選擇監督式或者無監督機器學習的一些準則:
在以下情況下選擇監督式學習:您需要訓練模型進行預測(例如溫度和股價等連續變量的值)或者分類(例如根據網絡攝像頭的錄像片段確定汽車的技術細節)。
在以下情況下選擇無監督學習:您需要深入了解數據并希望訓練模型找到好的內部表示形式,例如將數據拆分到集群中。
MATLAB 機器學習
如何借助機器學習的力量,使用數據做出更好的決策?MATLAB 讓機器學習簡單易行。借助用于處理大數據的工具和函數,以及讓機器學習發揮作用的應用程序,MATLAB 是將機器學習應用于您的數據分析的理想環境。
使用 MATLAB,工程師和數據科學家可以立即訪問預置的函數、大量的工具箱以及用于分類、回歸和聚類的專門應用程序。MATLAB 可以做到:
比較各種方法,例如邏輯回歸、分類樹、支持向量機、集成方法和深度學習。
使用模型精化和縮減技術創建能夠最好地捕捉預測能力的精確模型。
將機器學習模型集成到企業系統、集群和云中,并且將模型定位于實時嵌入式硬件。
為嵌入式傳感器分析工具執行自動代碼生成。
支持從數據分析到部署的集成工作流程。
有趣的應用
機器學習算法實現藝術鑒賞
小即是好—昆蟲大腦完勝機器學習
把 AI 基因植入您的工作流程
MATLAB 填補數據科學家的空白
-
集成方法
+關注
關注
0文章
3瀏覽量
6038 -
機器學習
+關注
關注
66文章
8377瀏覽量
132407 -
數據分析
+關注
關注
2文章
1427瀏覽量
34015
發布評論請先 登錄
相關推薦
評論