機器學習(ML)是教導計算機系統根據一組數據進行預測的過程。通過為系統提供一系列的試驗和錯誤場景,機器學習研究人員致力于創建 可以分析數據,回答問題并自行做出決定的人工智能系統。
機器學習通常使用基于測試數據的算法,該算法有助于在將來的決策中進行推理和模式識別,從而消除了對傳統計算機軟件要求的來自人類的明確指令的需求。
什么是機器學習?
機器學習依賴于大量數據,這些數據被饋送到算法中,以生成一個模型,系統可以根據該模型來預測其未來的決策。例如,如果您要輸入到系統中的數據是一年中每天在午餐中吃的水果,則您可以使用預測算法來分析不同的水果,并為該水果建立預測模型您可能在第二年進食。
該過程基于反復試驗的情況,通常使用多種算法。這些算法分為線性模型,非線性模型,甚至神經網絡。它們最終將取決于您正在使用的數據集以及您要回答的問題。
機器學習算法如何工作?
機器學習算法會隨著時間的推移使用數據來學習和改進,并且不需要人工指導。該算法分為三種類型:有監督,無監督和強化學習。每種學習類型都有不同的目的,并且可以使數據以不同的方式使用。
監督學習
監督學習涉及標記的訓練數據,算法使用該訓練數據來學習將輸入變量轉換為輸出變量以求解方程的映射函數。其中有兩種監督學習類型:分類,當輸出為類別形式時,用于預測給定樣本的結果;回歸,當輸出時,用于預測給定樣本的結果。變量是實際值,例如“工資”或“權重”。
監督學習模型的一個示例是K-最近鄰居(KNN)算法,它是一種模式識別方法。KNN本質上涉及使用圖表來根據附近相似物體的傳播情況得出關于物體分類的有根據的猜測。
在上表中,綠色圓圈表示一個尚未分類的對象,它只能屬于兩個可能的類別之一:藍色正方形或紅色三角形。為了識別其所屬的類別,在這種情況下,算法將分析圖表上最接近的對象,算法將合理地假設綠色圓圈應屬于紅色三角形類別。
無監督學習
當只有輸入變量而沒有相應的輸出變量時,將使用無監督學習模型。它使用未標記的訓練數據來建模數據的基礎結構。
無監督學習算法有三種類型:關聯,廣泛用于市場購物分析;聚類,用于匹配與另一個聚類中的對象相似的樣本;和降維,用于減少數據集中變量的數量,同時保持其重要信息不變。
強化學習
強化學習允許代理通過學習最大化獎勵的行為,根據其當前狀態決定其下一步行動。它通常用于游戲環境,在游戲環境中提供了規則的算法,并負責以最有效的方式解決挑戰。該模型最初會隨機開始,但是隨著時間的流逝,通過反復試驗,它將了解需要在游戲中移動的位置和時間以最大化得分。
在這種類型的培訓中,獎勵僅僅是與積極成果相關的狀態。例如,如果算法能夠將汽車保持在道路上而不會撞到障礙物,那么它將“獎勵”任務完成。
為什么機器學習很有用?
本質上,機器學習解決了數據過多的問題。人們,行動,事件,計算機和小工具所產生的信息太多,以至于人類幾乎不可能從中學習任何東西。在醫學分析中,要在成千上萬的MRI掃描中找到模式,一個人可能要花費數小時,數天或數周的時間才能完成,但是如果正確標記了機器,機器可以吸收這些信息并在幾秒鐘內發現這些模式。
機器學習在哪里使用?
我們每天都會使用最簡單,最成功的機器學習示例之一-Google搜索。搜索引擎由許多ML算法提供支持,這些算法可以讀取和分析您輸入的文本,并根據您的搜索歷史和在線習慣來定制結果。例如,如果您輸入“ Java”,您將獲得圍繞編程語言的結果,或者更頻繁地浮出水面,這取決于它決定了您的偏好。
我們未來的許多技術進步都取決于機器學習的發展,例如無人駕駛汽車和智慧城市。許多為智慧城市提供動力的系統正在進入公共空間,例如面部識別系統,該系統中的機器學習算法被教為識別圖像中的模式并根據其特征識別對象。但是,這已被證明是ML的有爭議用途,尤其是因為它并不總是準確的,并且經常涉及對公民的某種定期監視。
數據偏差
隨著機器學習的改進和更多技術的使用,人們越來越擔心將偏見嵌入關鍵的和面向公眾的軟件中。機器學習應用程序依賴于數據,而正是這些數據可能成為偏差的來源。例如,如果一家公司想雇用更多不同種類的人,但使用其當前雇員的簡歷,則默認情況下,其機器學習程序將只尋找更多相同的人。
正是這種類型的機器學習應用引起了政府的擔憂,因此,許多政府正在采取強制性的法規來解決這個問題。英國數據倫理與創新中心(CDEI)宣布將與內閣辦公室種族差異部門合作,調查算法決策中的潛在偏見。同樣,美國政府將試行AI方面的多樣性法規,以降低計算機系統中性偏見和種族偏見的風險。
責編AJX
-
數據
+關注
關注
8文章
6909瀏覽量
88850 -
人工智能
+關注
關注
1791文章
46896瀏覽量
237670 -
機器學習
+關注
關注
66文章
8382瀏覽量
132444
發布評論請先 登錄
相關推薦
評論