機(jī)器學(xué)習(xí) (ML) 采用算法和統(tǒng)計(jì)模型,使計(jì)算機(jī)系統(tǒng)能夠在大量數(shù)據(jù)中找到規(guī)律,然后使用可識(shí)別這些模式的模型來(lái)預(yù)測(cè)或描述新數(shù)據(jù)。
什么是機(jī)器學(xué)習(xí)?其工作原理是什么?
簡(jiǎn)而言之,機(jī)器學(xué)習(xí)就是訓(xùn)練機(jī)器去學(xué)習(xí),而不需要明確編程。機(jī)器學(xué)習(xí)作為 AI 的一個(gè)子集,以其最基本的形式使用算法來(lái)解析數(shù)據(jù)、學(xué)習(xí)數(shù)據(jù),然后對(duì)現(xiàn)實(shí)世界中的某些內(nèi)容做出預(yù)測(cè)或判斷。
換句話(huà)說(shuō),機(jī)器學(xué)習(xí)使用算法從輸入到機(jī)器學(xué)習(xí)平臺(tái)的數(shù)據(jù)中自動(dòng)創(chuàng)建模型。典型的程序化或基于規(guī)則的系統(tǒng)獲取程序化規(guī)則中的專(zhuān)家知識(shí),但當(dāng)數(shù)據(jù)發(fā)生變化時(shí),這些規(guī)則可能會(huì)變得難以更新和維護(hù)。機(jī)器學(xué)習(xí)的優(yōu)勢(shì)在于,它能夠從越來(lái)越多輸入算法的數(shù)據(jù)中學(xué)習(xí),并且可以給出數(shù)據(jù)驅(qū)動(dòng)的概率預(yù)測(cè)。這種在當(dāng)今大數(shù)據(jù)應(yīng)用中快速有效地利用和應(yīng)用高度復(fù)雜算法的能力是一種相對(duì)較新的發(fā)展。
幾乎任何可以用數(shù)據(jù)定義的模式或一組規(guī)則來(lái)完成的離散任務(wù)都可以通過(guò)自動(dòng)化方式進(jìn)行,因此使用機(jī)器學(xué)習(xí)可以大大提高效率。這使得公司可以改變以前只有人工才能完成的流程,包括客戶(hù)服務(wù)電話(huà)路由以及履歷審查等等。
機(jī)器學(xué)習(xí)系統(tǒng)的性能取決于一些算法將數(shù)據(jù)集轉(zhuǎn)換為模型的能力。不同算法適用于不同問(wèn)題和任務(wù),而這些問(wèn)題的解決和任務(wù)的完成也取決于輸入數(shù)據(jù)的質(zhì)量以及計(jì)算資源的能力。
機(jī)器學(xué)習(xí)采用兩種主要技術(shù),將算法的使用劃分為不同類(lèi)型:監(jiān)督式、無(wú)監(jiān)督式以及這兩種技術(shù)的組合。監(jiān)督式學(xué)習(xí)算法使用已標(biāo)記數(shù)據(jù),無(wú)監(jiān)督式學(xué)習(xí)算法在未標(biāo)記數(shù)據(jù)中找規(guī)律。半監(jiān)督式學(xué)習(xí)混合使用已標(biāo)記和未標(biāo)記數(shù)據(jù)。增強(qiáng)學(xué)習(xí)訓(xùn)練算法,基于反饋更大限度地利用獎(jiǎng)勵(lì)。
監(jiān)督式學(xué)習(xí)
監(jiān)督式機(jī)器學(xué)習(xí)(也稱(chēng)為預(yù)測(cè)分析)使用算法來(lái)訓(xùn)練模型,以在包含標(biāo)簽和特征的數(shù)據(jù)集中找規(guī)律。然后,它使用經(jīng)過(guò)訓(xùn)練的模型預(yù)測(cè)新數(shù)據(jù)集的特征標(biāo)簽。
監(jiān)督式學(xué)習(xí)可以進(jìn)一步分為分類(lèi)和回歸。
分類(lèi)
分類(lèi)根據(jù)已知項(xiàng)目的已標(biāo)簽示例來(lái)確定一個(gè)項(xiàng)目屬于哪個(gè)類(lèi)別。邏輯回歸用于根據(jù)已知為/非欺詐交易的特征(交易金額、時(shí)間以及上次交易地點(diǎn))來(lái)估計(jì)信用卡交易為欺詐交易的概率(標(biāo)簽)。
其他分類(lèi)示例包括:
垃圾郵件檢測(cè)
文本情感分析
預(yù)測(cè)患者風(fēng)險(xiǎn)、敗血癥或癌癥
回歸
回歸可估算目標(biāo)結(jié)果標(biāo)簽與一個(gè)或多個(gè)特征變量之間的關(guān)系,以預(yù)測(cè)連續(xù)數(shù)值。在下面的簡(jiǎn)單示例中,線(xiàn)性回歸用于根據(jù)房屋面積(特征)估算房?jī)r(jià)(標(biāo)簽)。
回歸的其他示例包括:
預(yù)測(cè)欺詐數(shù)量
預(yù)測(cè)銷(xiāo)售額
監(jiān)督式學(xué)習(xí)算法包括:
邏輯回歸
線(xiàn)性回歸
支持向量機(jī)
決策樹(shù)
隨機(jī)森林
梯度提升決策樹(shù)
無(wú)監(jiān)督式學(xué)習(xí)
無(wú)監(jiān)督式學(xué)習(xí)(也稱(chēng)為描述性分析)事先未提供已標(biāo)記數(shù)據(jù),因此有助于數(shù)據(jù)科學(xué)家發(fā)現(xiàn)先前未知數(shù)據(jù)規(guī)律。這些算法嘗試“學(xué)習(xí)”輸入數(shù)據(jù)中的固有結(jié)構(gòu),并發(fā)現(xiàn)相似性或規(guī)律性。常見(jiàn)的無(wú)監(jiān)督式任務(wù)包括聚類(lèi)和關(guān)聯(lián)。
聚類(lèi)
在聚類(lèi)中,算法通過(guò)分析輸入示例之間的相似性將輸入分為不同類(lèi)別。聚類(lèi)的一個(gè)示例是,為了更好地定制產(chǎn)品和服務(wù),公司希望對(duì)其客戶(hù)進(jìn)行細(xì)分。客戶(hù)可以按人口統(tǒng)計(jì)數(shù)據(jù)和購(gòu)買(mǎi)記錄等特征進(jìn)行分組。為了得到更有價(jià)值的結(jié)果,通常將無(wú)監(jiān)督式學(xué)習(xí)聚類(lèi)與監(jiān)督式學(xué)習(xí)聚類(lèi)相結(jié)合。
其他聚類(lèi)示例包括:
搜索結(jié)果分組
對(duì)相似患者進(jìn)行分組
文本分類(lèi)
異常檢測(cè)(從集群中找出不相似的地方,即異常值)
關(guān)聯(lián)學(xué)習(xí)
關(guān)聯(lián)或頻繁模式挖掘可以在大型數(shù)據(jù)項(xiàng)集合中發(fā)現(xiàn)頻繁同時(shí)發(fā)生的關(guān)聯(lián)(關(guān)系、依賴(lài)關(guān)系)。一個(gè)同時(shí)發(fā)生的關(guān)聯(lián)示例是經(jīng)常一起購(gòu)買(mǎi)的產(chǎn)品,例如有名的啤酒和紙尿褲。對(duì)購(gòu)物者行為的分析發(fā)現(xiàn),購(gòu)買(mǎi)紙尿褲的男性通常也會(huì)買(mǎi)啤酒。
無(wú)監(jiān)督式學(xué)習(xí)算法包括:
K-means
隱含狄利克雷分布 (LDA)
高斯混合模型 (GMM)
交替最小二乘法 (ALS)
FP 增長(zhǎng)
機(jī)器學(xué)習(xí)的優(yōu)勢(shì)
機(jī)器學(xué)習(xí)對(duì)企業(yè)的好處是多種多樣的,包括:
以足夠及時(shí)的方式進(jìn)行快速分析、預(yù)測(cè)和處理,使企業(yè)能夠快速做出基于數(shù)據(jù)的決策
通過(guò)快速識(shí)別高風(fēng)險(xiǎn)患者、推薦一系列藥物以及預(yù)測(cè)再入院率,促進(jìn)準(zhǔn)確的醫(yī)學(xué)預(yù)測(cè)和診斷
通過(guò)顯著減少由數(shù)據(jù)重復(fù)和其他不準(zhǔn)確造成的錯(cuò)誤,簡(jiǎn)化數(shù)據(jù)輸入中的時(shí)間密集型文檔,同時(shí)使工作人員擺脫繁重的數(shù)據(jù)輸入任務(wù)
提高金融規(guī)則和模型的精確度,促進(jìn)投資組合管理;實(shí)現(xiàn)算法交易、貸款承銷(xiāo),重要的是推進(jìn)欺詐檢測(cè)
通過(guò)制定高效預(yù)測(cè)性維護(hù)計(jì)劃,提高預(yù)測(cè)性維護(hù)效率
改善客戶(hù)分割和生命周期價(jià)值預(yù)測(cè),為營(yíng)銷(xiāo)人員提供寶貴信息以?xún)?yōu)化潛在客戶(hù),更大限度地提高網(wǎng)絡(luò)流量,以及提高郵件和電子郵件活動(dòng)的回報(bào)。
機(jī)器學(xué)習(xí)用例
加速計(jì)算和 ML 正推動(dòng)醫(yī)療健康領(lǐng)域的智能計(jì)算。NVIDIA Clara 提供單一平臺(tái),整合醫(yī)學(xué)影像、基因組學(xué)、患者監(jiān)控以及藥物研發(fā),并可將該平臺(tái)部署在嵌入式系統(tǒng)、邊緣、每個(gè)云端等任何地方,助力醫(yī)療健康行業(yè)進(jìn)行創(chuàng)新并加快實(shí)現(xiàn)精準(zhǔn)醫(yī)療的目標(biāo)。
領(lǐng)先的零售商正利用 ML 來(lái)減少損耗、改善預(yù)測(cè)、實(shí)現(xiàn)倉(cāng)庫(kù)物流自動(dòng)化、確定店內(nèi)促銷(xiāo)活動(dòng)和實(shí)時(shí)定價(jià)、為客戶(hù)提供個(gè)性化服務(wù)和建議,以及在實(shí)體店和網(wǎng)店提供更出色的購(gòu)物體驗(yàn)。
了解消費(fèi)者行為對(duì)于零售商而言變得更為重要。為了推動(dòng)發(fā)展,采用智能推薦進(jìn)行個(gè)性化營(yíng)銷(xiāo)。為提高收入,在線(xiàn)零售商使用由 GPU 提供支持的機(jī)器學(xué)習(xí) (ML) 和深度學(xué)習(xí) (DL) 算法來(lái)打造更快速、更準(zhǔn)確的推薦引擎。購(gòu)物者的購(gòu)買(mǎi)以及網(wǎng)絡(luò)操作歷史記錄為機(jī)器學(xué)習(xí)模型的分析提供了數(shù)據(jù),從而得出建議,并支持零售商在促銷(xiāo)方面所作的努力。
金融機(jī)構(gòu)正在采用 ML 來(lái)提供更智能、更安全的服務(wù)。GPU 驅(qū)動(dòng)的 ML 解決方案可以在大量數(shù)據(jù)中識(shí)別關(guān)鍵見(jiàn)解,通過(guò)自動(dòng)化減輕員工的日常任務(wù)負(fù)擔(dān),加速風(fēng)險(xiǎn)計(jì)算和欺詐檢測(cè),并借助更準(zhǔn)確的推薦系統(tǒng)改善客戶(hù)服務(wù)。
NVIDIA 提供預(yù)訓(xùn)練模型和軟件解決方案,可大幅簡(jiǎn)化 ML 應(yīng)用程序。例如,NVIDIA Metropolis 平臺(tái)讓開(kāi)發(fā)者能夠構(gòu)建 ML 應(yīng)用程序,以改進(jìn)零售庫(kù)存管理、增強(qiáng)損失預(yù)防措施,并簡(jiǎn)化消費(fèi)者的結(jié)賬體驗(yàn)。
作為一個(gè)實(shí)際示例,沃爾瑪利用 NVIDIA 的技術(shù)來(lái)管理員工工作流程,并確保某些商店的肉類(lèi)和農(nóng)產(chǎn)品的新鮮度。同樣地,寶馬采用 NVIDIA 的先進(jìn) AI 解決方案,在其制造廠(chǎng)中自動(dòng)進(jìn)行光學(xué)檢查。中國(guó)移動(dòng)運(yùn)營(yíng)著超大無(wú)線(xiàn)網(wǎng)絡(luò),利用 NVIDIA 的平臺(tái)通過(guò) 5G 網(wǎng)絡(luò)提供 AI 功能。
機(jī)器學(xué)習(xí)的重要意義
企業(yè)越來(lái)越受數(shù)據(jù)驅(qū)動(dòng):感知市場(chǎng)和環(huán)境數(shù)據(jù),并使用分析和機(jī)器學(xué)習(xí)來(lái)識(shí)別復(fù)雜模式、檢測(cè)變化,并做出直接影響利潤(rùn)的預(yù)測(cè)。數(shù)據(jù)驅(qū)動(dòng)型公司使用數(shù)據(jù)科學(xué)來(lái)管理和理解海量數(shù)據(jù)。
數(shù)據(jù)科學(xué)是每個(gè)行業(yè)的一部分。零售、金融、醫(yī)療健康和物流等行業(yè)的大型企業(yè)利用數(shù)據(jù)科學(xué)技術(shù)提高其競(jìng)爭(zhēng)力、響應(yīng)速度和效率。廣告公司用它更有效地定位廣告。按揭貸款公司用它來(lái)準(zhǔn)確預(yù)測(cè)默認(rèn)風(fēng)險(xiǎn),以獲得最大收益。零售商用它來(lái)簡(jiǎn)化供應(yīng)鏈。事實(shí)上,正是本世紀(jì)頭中期 Hadoop、NumPy、scikitlearn、Pandas 和 Spark 等開(kāi)源、大規(guī)模數(shù)據(jù)分析和機(jī)器學(xué)習(xí)軟件的出現(xiàn),引發(fā)了這場(chǎng)大數(shù)據(jù)革命。
如今,數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)已成為全球超大的計(jì)算領(lǐng)域。預(yù)測(cè)機(jī)器學(xué)習(xí)模型的精度即便提升微小,最低也能帶來(lái)數(shù)十億的價(jià)值。預(yù)測(cè)模型訓(xùn)練是數(shù)據(jù)科學(xué)的核心。事實(shí)上,大部分?jǐn)?shù)據(jù)科學(xué) IT 預(yù)算都用于構(gòu)建機(jī)器學(xué)習(xí)模型,其中包括數(shù)據(jù)轉(zhuǎn)換、特征工程、訓(xùn)練、評(píng)估和可視化。要構(gòu)建更好的模型,數(shù)據(jù)科學(xué)家需要通過(guò)大量迭代進(jìn)行訓(xùn)練、評(píng)估和再訓(xùn)練。現(xiàn)今,這些迭代可能需要數(shù)天時(shí)間,這不僅會(huì)限制產(chǎn)品部署之前完成的迭代周期數(shù)量,還會(huì)影響最終結(jié)果的質(zhì)量。
在企業(yè)間運(yùn)行分析和機(jī)器學(xué)習(xí)需要大量的基礎(chǔ)設(shè)施。《財(cái)富》500 強(qiáng)企業(yè)擴(kuò)展計(jì)算能力,并投資數(shù)千臺(tái) CPU 服務(wù)器以構(gòu)建大量數(shù)據(jù)科學(xué)集群。CPU 橫向擴(kuò)展不再有效。每年,全球數(shù)據(jù)量都會(huì)翻倍,而隨著摩爾定律的終結(jié),CPU 計(jì)算也遭遇了瓶頸。GPU 擁有一個(gè)大規(guī)模并行架構(gòu),當(dāng)中包含數(shù)千個(gè)高效小核心,專(zhuān)為同時(shí)處理多重任務(wù)而設(shè)計(jì)。類(lèi)似于科學(xué)計(jì)算和深度學(xué)習(xí)如何轉(zhuǎn)向 NVIDIA GPU 加速,數(shù)據(jù)分析和機(jī)器學(xué)習(xí)也將受益于 GPU 并行化和加速。
原文標(biāo)題:NVIDIA 大講堂 | 什么是機(jī)器學(xué)習(xí)?
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
審核編輯:湯梓紅
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4949瀏覽量
102826 -
gpu
+關(guān)注
關(guān)注
28文章
4703瀏覽量
128725 -
工作原理
+關(guān)注
關(guān)注
4文章
274瀏覽量
37662 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8382瀏覽量
132444
原文標(biāo)題:NVIDIA 大講堂 | 什么是機(jī)器學(xué)習(xí)?
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論