精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習教父:從未標記數據中促進機器學習能力

倩倩 ? 來源:lq ? 作者:環球網 ? 2019-09-20 11:12 ? 次閱讀

人工智能作為推動當下科技創新和生產力整體提升的重要戰略性技術,受到世界范圍內的普遍關注,尤其是隨著云計算和大數據的迅速興起。人工智能迎來了新的發展契機,而算法則是在幕後推動人工智能實現的“核心引擎”,過去六十多年來以大腦模擬、神經處理再以神經網絡為代表的機器學習,每一次突破都推動著人工智能技術的迭代演進。

當前,人工智能已經在物聯網智能家居機器人等多領域中落地應用,與實體經濟深度融合,迎來了發展的大好時期。豐富的應用場景也對算法提出了新需求。自動機器學習、聯邦遷移學習、可解釋深度學習等,一批算法促進新產品的發展,加快社會向智能化不斷躍升。

值此之際,8月30日,由世界人工智能大會組委會主辦,上海交通大學、第四范式承辦的“2019世界人工智能大會國際前沿算法峰會”在上海世博展覽館舉行,作為此次世界人工智能大會十大主題峰會之一,國際算法峰會聚集超過1000位人工智能研究者和產業界實踐者,共同向底層技術發問,求解能夠推動產業變革的未來算法。

會上,美國卡內基梅隆大學CMU計算機學院院長、機器學習教父、乂學教育-松鼠AI首席AI科學家Tom Mitchell教授以“Learning from Unlabeled Data”為題,做了精彩的主題報告。

機器學習教父、乂學教育-松鼠AI首席人工智能科學家Tom Mitchell發表演講

Tom Mitchell長期從事機器學習、認知神經學科等研究,曾編寫Machine Learning (《機器學習》)一書,這是人工智能領域最經典的教材之一,他也因此被稱為機器學習之父。近年,Tom Mitchell開始深度關注AI對教育的應用,2018年11月起任中國AI教育獨角獸公司乂學教育-松鼠AI首席AI科學家,作為松鼠AI人工智能領域第一負責人,Mitchell 帶領團隊十多位AI科學家和幾百位AI應用工程師以及技術團隊,進行人工智能在智適應教育領域的基礎研究和相關產品的研發應用等。

在此次大會上,Tom Mitchell教授指出,在我們的世界,非標記的數據要比已標記的數據龐大,機器學習非常重要的一點就是學習如何將非標記數據進行分類,來改善機器學習的能力。實現這一目標就要求學習程序必須要具備某種架構,能弄清楚不同的函數及不同的限制關系。如果能對海量未經標注的數據進行分類,不管對機器學習還是自我反思預測錯誤都將非常有意義。

當前,以機器學習為核心的人工智能技術正在逐步推動各行各業產業升級,機器學習作為AI的一個重要分支,為人工智能提供了新的發展機遇。盡管如此、和人類學習的方式相比,機器學習的方法依然非常狹窄。

Tom Mitchell教授著重介紹了一種被稱之為永無止境的語言學習項目模型——NELL(Never-Ending Language Learner)框架。NELL像人類一樣,學習很多類型的知識,已經具有自我監督的經驗,能利用學到的知識改善后續學習,并通過充分的自我反思來避免學習中的平臺期。

“NELL理念非常簡單,相當于有一位程序員每天24小時不間斷工作,每天程序都會有兩個任務:第一是閱讀提取來自網絡的更多信息,并刪除舊的錯誤信息,以填充不斷增長的知識庫,其中包含對每個信息的信心和來源,比如說水是一種飲料,或者比爾蓋茨創立的微軟;第二,自我進化,學習如何比昨天做得更好,如果任務跟昨天一樣,可以簡單挖掘更多準確的數據?!?/p>

NELL在初始階段會有少量分類,如飲料、人、植物、城市等是本體,同時加入關系,比如說人創建了公司,或者飲料是食物產生。除此之外還會輸入樣本,大部分情況下輸入網端的是末標注的數據,未標注數據的信息分類問題也是目前大部分機器學習過程中的問題所在。

Tom Mitchell教授稱,其2010年開始NELL項目,每天24小時運作,直到去年九月,其擁有1.2億三元數據知識庫,并且每一年的邏輯推理能力、學習能力都在提升。而且基于十幾個沒有標注的原始樣本數據,NELL可以擴展已知的關系本體,并能參加一些新型的關系。通過不斷的累計,目前每個知識庫中擁有數億個三元數據庫。比如說楓葉國是加拿大,多倫多是屬于加拿大的一座城市等,像這樣的例子均是程序從網絡當中學習攫取的數據。

在教育領域也是如此,現在已經有幾百萬人在使用人工智能教育系統,積累了許多數據,機器學習可以利用這些數據進一步發展。

“如果機器學習應用在智適應教育當中,應該在每一領域都具備一種功能,去了解學生現在的學習狀態,機器學習就是能夠發現這個功能是什么,我們可以用機器學習來不斷的修改它,這是機器學習在其中的核心作用。”Mitchell談到。

新的機器學習和人工智能的工具出現后,或許一個機器就可以收集高達十萬名學生的答卷,就可以去分析這些答卷當中學生出錯的規律,在過去,一位老師窮其一生都不可能接觸多達這么多學生。

Tom Mitchell認為,目前正在進入AI對如何教育孩子產生重大影響的十年。

因為AI的進步,研究人員和公司正在不斷更迭新一代系統。例如松鼠AI智適應學習系統運用進化算法、深度神經網絡、貝葉斯網絡、遷移學習、圖論、及其他機器學習等多種AI技術,通過對學生學習過程中多維數據的全方位評估,給與最高效的學習內容、學習路徑、學習節奏的把握以及深度的效果評估,最大化學習效率的提升,進而實現在模擬優秀特級教師的基礎之上,達到超越真人教學的目的。

回到NELL,其可以用擴展kb、OntExt考慮NELL當前本體中的每對類別,在三個步驟中搜索類別對成員之間經常討論的關系的證據、提取兩個類別的已知實例的句子、從提取的句子中通過上下文共生矩陣構建上下文,然后將相關的上下文聚類在一起。 每個集群對應于兩個輸入類別實例之間可能的新關系。

如果嘗試去訓練這兩個函數,即通常所說的協同訓練,只要這些函數有足量多的標注數據,誤差就會接近于零。并且最后能使用這些未標注的數據學習這些函數。

比如,松鼠AI系統成果之中的“非關聯性知識點關聯概率”及“用錯因重構知識地圖”。

在將學科中的知識點進行超納米級拆分的基礎上,非關聯性知識點關聯概率基于知識地圖理論中不僅對知識點建立關聯性,追根溯源還對非關聯性的知識點建立了關聯概率,讓測試效率和學習效率可以分別比同類產品的知識地圖理論模型提高3-10倍。從而提高測試效率和學習效率,更加精準的檢測到孩子的知識薄弱點。

用錯因重構知識地圖就是將每一道題標注不同種的錯因。進一步重構知識地圖。更加精準定位學生錯因,知識薄弱點、精準的給出最適合每一個孩子的學習路徑、從而提高學習效率。

“NELL理念一個非常重要的特點是能夠不斷的學習、不斷的改善,盡管它大部分使用的是網絡上未經標注的數據,但用未標記的數據來訓練機器學習的邏輯,對我以及對團隊其他成員來說都非常驚艷,希望更多的人能參與進來,不斷優化。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 物聯網
    +關注

    關注

    2903

    文章

    44277

    瀏覽量

    371289
  • 人工智能
    +關注

    關注

    1791

    文章

    46862

    瀏覽量

    237587
  • 機器學習
    +關注

    關注

    66

    文章

    8378

    瀏覽量

    132412
收藏 人收藏

    評論

    相關推薦

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統自身的性能”。事實上,由于“經驗”在計算機系統主要以數據的形式存在,因此機器學習需要設法對數據進行分析
    的頭像 發表于 11-16 01:07 ?231次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習
    的頭像 發表于 11-15 09:19 ?309次閱讀

    eda在機器學習的應用

    機器學習項目中,數據預處理和理解是成功構建模型的關鍵。探索性數據分析(EDA)是這一過程不可或缺的一部分。 1.
    的頭像 發表于 11-13 10:42 ?171次閱讀

    魯棒性在機器學習的重要性

    金融風險評估。這些應用場景對模型的魯棒性提出了極高的要求。 魯棒性的定義 魯棒性通常被定義為系統在面對不確定性和變化時仍能保持其功能的能力。在機器學習,這意味著即使輸入
    的頭像 發表于 11-11 10:19 ?211次閱讀

    具身智能與機器學習的關系

    (如機器人、虛擬代理等)通過與物理世界或虛擬環境的交互來獲得、發展和應用智能的能力。這種智能不僅包括認知和推理能力,還包括感知、運動控制和環境適應能力。具身智能強調智能體的身體和環境在
    的頭像 發表于 10-27 10:33 ?271次閱讀

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示了機器學習如何在這一領域發揮巨
    發表于 08-12 11:21

    機器學習數據分割方法

    機器學習數據分割是一項至關重要的任務,它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討
    的頭像 發表于 07-10 16:10 ?1323次閱讀

    如何理解機器學習的訓練集、驗證集和測試集

    理解機器學習的訓練集、驗證集和測試集,是掌握機器學習核心概念和流程的重要一步。這三者不僅構成了模型學習
    的頭像 發表于 07-10 15:45 ?3217次閱讀

    機器學習數據預處理與特征工程

    機器學習的整個流程,數據預處理與特征工程是兩個至關重要的步驟。它們直接決定了模型的輸入質量,進而影響模型的訓練效果和泛化能力。本文將從
    的頭像 發表于 07-09 15:57 ?300次閱讀

    遷移學習的基本概念和實現方法

    遷移學習(Transfer Learning)是機器學習領域中的一個重要概念,其核心思想是利用在一個任務或領域中學到的知識來加速或改進另一個相關任務或領域的學習過程。這種方法在
    的頭像 發表于 07-04 17:30 ?1344次閱讀

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數據學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器
    的頭像 發表于 07-02 11:25 ?777次閱讀

    機器學習數據分析的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從
    的頭像 發表于 07-02 11:22 ?544次閱讀

    深度學習與傳統機器學習的對比

    在人工智能的浪潮,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于
    的頭像 發表于 07-01 11:40 ?1194次閱讀

    機器學習的經典算法與應用

    關于數據機器學習就是喂入算法和數據,讓算法從數據尋找一種相應的關系。Iris鳶尾花數據集是一個
    的頭像 發表于 06-27 08:27 ?1576次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的經典算法與應用

    如何使用TensorFlow構建機器學習模型

    在這篇文章,我將逐步講解如何使用 TensorFlow 創建一個簡單的機器學習模型。
    的頭像 發表于 01-08 09:25 ?915次閱讀
    如何使用TensorFlow構建<b class='flag-5'>機器</b><b class='flag-5'>學習</b>模型