精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習入門需要掌握的八大基礎概念

Dbwd_Imgtec ? 2018-01-30 10:45 ? 次閱讀

準備好開始AI了嗎?可能你已經開始了在機器學習領域的實踐學習,但是依然想要擴展你的知識并進一步了解那些你聽過卻沒有時間了解的話題。

這些機器學習的專業術語能夠簡要地介紹最重要的機器學習概念—包括商業界和科技界都感興趣的話題。在你遇到一位AI指導者之前,這是一份不詳盡,但清楚易懂又方便在工作、面試前快速瀏覽的內容。

1 自然語言處理

自然語言處理對于許多機器學習方法來說是一個常用的概念,它使得計算機理解并使用人所讀或所寫的語言來執行操作成為了可能。

機器學習入門需要掌握的八大基礎概念

自然語言處理最重要的最有用的實例:

① 文本分類和排序這項任務的目標是對一個文本進行預測標簽(類別)或對列表中相關聯的文本進行排序。它能夠用于過濾垃圾郵件(預測一封電子郵件是否是垃圾郵件),或進行文本內容分類(從網絡上篩選出那些與你的競爭者相關的文章)。

② 情感分析句子分析是為了確定一個人對某個主題的看法或情感反應,如正面或負面情緒,生氣,諷刺等。它廣泛應用于用戶滿意度調查(如對產品的評論進行分析)。

③ 文件摘要文件摘要是用一些方法來得到長文本(如文檔,研究論文)短且達意的描述。對自然語言處理方向感興趣嗎?

④ 命名實體識別命名實體識別算法是用于處理一系列雜亂的文本并識別目標(實體)預定義的類別,如人,公司名稱,日期,價格,標題等等。它能夠將雜亂的文本信息轉換成規則的類表的格式,來實現文本的快速分析。

語音識別語音識別技術是用于得到人所講的一段語音信號的文本表達。你可能聽說過Siri助手?這就是語音識別應用的一個最好的例子。

⑥ 自然語言的理解和生成自然語言的理解是通過計算機,將人類生成的文本轉換成更正式的表達。反過來,自然語言生成技術是將一些正式又有邏輯性的表達轉換成類人的生成文本。如今,自然語言理解和生成主要用于聊天機器人和報告的自動生成。

從概念上來說,它與實體命名識別任務是相反的。

⑦ 機器翻譯機器翻譯是將一段文本或語音自動從一種語言翻譯成另一種語言的一項任務。

2 數據庫

數據庫是機器學習一個必要的組成部分。如果你想構建一個機器學習系統,你要么可以從公眾資源中得到數據,要么需要自己收集數據。所有的用于構建和測試機器學習模型的數據集合成為數據庫?;旧?,數據科學家會將數據劃分為三個部分:

訓練數據:訓練數據是用于訓練模型。這意味著機器學習模型需要認識并通過學習得到數據的模式以及確定預測過程中最重要的數據特征。

驗證數據:驗證數據是用于微調模型參數和比較不同模型來確定最優的模型。驗證數據應該不同于訓練數據,且不能用于訓練階段。否則,模型將出現過擬合現象,且對新的數據泛化不佳。

測試數據:這看起來似乎有些單調,但這通常是第三個也是最后的測試集(經常也被稱為對抗數據)。一旦最終的模型確定,它就用于測試模型在從未見過的數據集上的表現,如這些數據從未在構建模型或確定模型時使用過。

圖像:混合使用t-SNE和Jonker-Volgenant算法得到的MNIST數據庫的可視化結果。T-SNE是一種廣泛使用的降維算法,通過壓縮數據的表達來得到更好的可視化和進一步處理。

3 計算機視覺

計算機視覺是一個專注于分析并深層次理解圖像和視頻數據的人工智能領域。計算機視覺領域最常見的問題包括:

① 圖像分類圖像分類是教模型去識別給定的圖像的一種計算機視覺任務。例如,訓練一個模型去識別公共場景下的多個物體(這可以應用于自動駕駛)。

② 目標檢測目標檢測是教模型從一系列預定義的類別中檢測出某一類別的實例,并用矩形框框注出來的一種計算機視覺任務。例如,利用目標檢測來構建人臉識別系統。模型可以在圖片中檢測出每張臉并畫出對應的矩形框(順便說下,圖像分類系統只能識別出一張圖片中是否有臉的存在,而不能檢測出臉的位置,而目標檢測系統就可以)。

機器學習入門需要掌握的八大基礎概念

③ 圖像分割圖像分割是訓練模型去標注類的每一個像素值,并能大致確定給定像素所屬的預定義類別的一種計算機視覺任務。

機器學習入門需要掌握的八大基礎概念

顯著性檢測

顯著性檢測是訓練模型產生最顯著區域的一種計算機視覺任務。這可以用于確定視頻中廣告牌的位置。

4 監督學習

監督學習是用實例來教模型學習的一類機器學習模型集合。這意味著用于監督學習任務的數據需要被標注(指定正確的,真實類別)。例如,如果我們想要構建一個機器學習模型用于識別一個給定的文本是否被標記過的,我們需要給模型提供一個標記過的樣本集 (文本+信息,是否該文本被標記過)。給定一個新的,未見過的例子,模型能夠預測它的目標,例如,規定樣本的標簽,1表示標記過的而0表示未標記的。

5 無監督學習

相比于監督學習,無監督學習模型是通過觀察來進行自我學習。算法所用的數據是未標記過的(即提供給算法的是沒有真實標簽值的數據)。無監督學習模型能夠發現不同輸入之間的相關關系。最重要的無監督學習技術是聚類方法。對于給定的數據,模型能夠得到輸入的不同聚類(對于相似的數據聚合在同一類中),并能將新的、未見過的輸入歸入到相似的聚類中。

機器學習入門需要掌握的八大基礎概念

6 強化學習

強化學習區別于先前我們提到的那些方法。強化學習算法一種“游戲”的過程,其目標是最大化 “游戲獎勵”。該算法通過反復的實驗來嘗試確定不同的 “走法”,并查看哪種方式能夠最大化 “游戲收益”

最廣為人知的強化學習例子就是教計算機來解決魔方問題或下象棋,但是強化學習能解決的問題不僅只有游戲。最近,強化學習大量地應用于實時競價,其模型負責為一個廣告競拍價格而它的報酬是用戶的轉換率。

想要學習人工智能在實時競價和程序化廣告中的應用嗎?

神經網絡是一個非常廣泛的機器學習模型集合。它的主要思想是模擬人類大腦的行為來處理數據。就像大腦中真實神經元之間相互連接形成的網絡一樣,人工神經網絡由多層組成。每層都是一系列神經元的集合,這些神經元負責檢測不同的食物。一個神經網絡能夠連續地處理數據,這意味著只有第一層才與輸入直接相連,隨著模型層數的增加,模型將學到越來越復雜的數據結構。當層數大量地增加,模型通常就是一個所謂的深度學習模型。很難給一個深度網絡確定一個特定的網絡層數,10年前通常3層神經網絡就可謂深,而如今通常需要20層。

機器學習入門需要掌握的八大基礎概念

神經網絡有許許多多不同的變體,最常用的是:

? 卷積神經網絡—它給計算機視覺任務帶來了巨大的突破(而如今,它同樣對于解決自然語言處理問題有很大幫助)。

? 循環神經網絡—被設計為處理具有序列特征的數據,如文本或股票票價。這是個相對古老的神經網絡,但隨著過去20年現代計算機計算能力的突飛猛進,使得它的訓練變得容易并在很多時候得以應用。

? 全連接神經網絡—這是處理靜態/表格式數據最簡單的模型。

8 過擬合

當模型從不充分的數據中學習會產生偏差,這對模型會有負面的影響。這是個很常見,也很重要的問題。

當你在不同的時間進入一個面包坊,而每一次所剩下的蛋糕都沒有你喜歡的,那么你可能會對這個面包坊失望,即使有很多其他的顧客可能會對剩下的蛋糕滿意。如果你是個機器學習模型,可以說你對這一小數量樣本產生了過擬合現象—要構建一個具有偏置量的模型,其得到的表示才不會過度擬合真實數據。

當過擬合現象發生,它通常意味著模型將隨機噪聲當作數據,并作為一個重要的信號去擬合它,這就是為什么模型在新數據上的表現會出現退化(噪聲也有差異)。這在一些非常復雜的模型如神經網絡或加速梯度模型上是很常見的。

想象構建一個模型來檢測文章中出現的有關奧運的特定體育項目。由于所用的訓練集與文章是由偏差的,模型可能學習到諸如 “奧運”這樣詞的特征,而無法檢測到那些未包含該詞的文章。

機器學習入門需要掌握的八大基礎概念

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30239

    瀏覽量

    268475
  • 數據庫
    +關注

    關注

    7

    文章

    3767

    瀏覽量

    64279
  • 機器學習
    +關注

    關注

    66

    文章

    8382

    瀏覽量

    132444
  • 自然語言
    +關注

    關注

    1

    文章

    287

    瀏覽量

    13334

原文標題:先搞懂這八大基礎概念,再談機器學習入門!

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    如何輕松掌握機器學習概念和在工業自動化中的應用

    ,突破傳統自動化技術發展的天花板呢?面對人工智能、機器學習、深度學習、神經網絡……這些深奧的概念,如何快速了解和掌握呢? 今天,給我5分鐘,
    的頭像 發表于 01-16 09:45 ?3068次閱讀

    EMC工程師必須具備的八大技能

    EMC工程師需要具備那些技能?從企業產品需要進行設計、整改認證的過程看,EMC工程師必須具備以下八大技能:1、EMC的基本測試項目以及測試過程掌握;2、產品對應EMC的標準
    發表于 05-08 15:31

    【阿里云大學免費精品課】機器學習入門概念原理及常用算法

    摘要: 阿里云大學聯合螞蟻金服高級算法專家推出了免費的機器學習入門課程:機器學習入門
    發表于 06-23 13:51

    Java入門需要學習什么?

    下,Java更具備了顯著優勢和廣闊前景。對于Java初學者來學,想要快速入門Java需要掌握的一定的方法。作為剛接觸Java的新手,先了解Java的基礎。Java 基本語法、Java 平臺
    發表于 03-01 15:45

    全球八大發動機結構

    全球八大發動機結構,關注、星標公眾號,不錯過精彩內容來源:EDN電子技術設計發動機是一種能夠把其它形式的能轉化為機械能的機器,包括如內燃機(汽油發動機等)、外燃機(斯特林發動機、蒸汽機等)、電動機等。下面我...
    發表于 07-07 07:20

    Python機器學習入門之pandas的使用提示

    系列文章目錄提示:這里可以添加系列文章的所有文章的目錄,目錄需要自己手動添加例如:第一章 Python 機器學習入門之pandas的使用提示:寫完文章后,目錄可以自動生成,如何生成可參
    發表于 08-13 07:36

    什么是機器學習? 機器學習基礎入門

    本文旨在為硬件和嵌入式工程師提供機器學習(ML)的背景,它是什么,它是如何工作的,它為什么重要,以及 TinyML 是如何適應的機器學習是一個始終存在并經常被誤解的技術
    發表于 06-21 11:06

    學習單片機不可欠缺的八大步驟

    學習單片機不可欠缺的八大步驟
    發表于 01-12 21:52 ?15次下載

    磷酸鐵鋰電池八大缺陷及八大優勢分析

    本文開始介紹了磷酸鐵鋰電池的概念和工作原理,其次介紹了磷酸鐵鋰電池八大優勢和八大劣勢,最后介紹了磷酸鐵鋰電池在通信行業中的應用及發展方向。
    發表于 04-17 08:37 ?7.1w次閱讀
    磷酸鐵鋰電池<b class='flag-5'>八大</b>缺陷及<b class='flag-5'>八大</b>優勢分析

    如何開始接觸機器學習_機器學習入門方法盤點

    機器學習入門方法 一說到機器學習,我被問得最多的問題是:給那些開始學習機器
    的頭像 發表于 05-20 07:10 ?4040次閱讀
    如何開始接觸<b class='flag-5'>機器</b><b class='flag-5'>學習</b>_<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>入門</b>方法盤點

    詳細putty串口使用教程與八大使用技巧分享

    本文首先介紹了putty的概念及優點,其次詳細介紹了PuTTY安裝及使用教程,最后闡述了putty八大使用技巧說明。
    的頭像 發表于 05-23 10:09 ?7.6w次閱讀
    詳細putty串口使用教程與<b class='flag-5'>八大</b>使用技巧分享

    00004__2016八大MCU廠商

    00004__2016八大MCU廠商
    發表于 11-25 18:51 ?3次下載
    00004__2016<b class='flag-5'>八大</b>MCU廠商

    2023年工業機器人行業的八大趨勢

    UR機器人通過對機器人產業的梳理,結合宏觀數據和調研數據信息,本著客觀的態度,深度解析2023年工業機器人行業的八大趨勢:
    發表于 12-27 10:28 ?610次閱讀

    機器學習算法入門 機器學習算法介紹 機器學習算法對比

    機器學習算法入門 機器學習算法介紹 機器學習算法對比
    的頭像 發表于 08-17 16:27 ?929次閱讀

    模電學習八大概念

    電子發燒友網站提供《模電學習八大概念.doc》資料免費下載
    發表于 11-18 10:39 ?0次下載
    模電<b class='flag-5'>學習</b><b class='flag-5'>八大概念</b>