无码国产伦一区二区三区视频_久久午夜福利电影_中文字幕一区二区三区_99久久人妻精品免费一区

上月，由 Michael I.Jordan 、Jeff Dean、李飛飛、LeCun 等多位人工智能領域的大牛發(fā)起的系統(tǒng)機器學習會議 SysML 在斯坦福開幕。

會上，機器學習宗師級大牛 Michael I.Jordan 就《系統(tǒng)與機器學習的前景與挑戰(zhàn)》進行了主旨演講。因為和 NBA 球星邁克爾·喬丹名字相近，他有著一個有趣的稱號：“The Michael Jordan of Machine Learning”，即機器學習界的邁克爾·喬丹。

為什么說他是機器學習宗師級大牛？要知道，在這一領域的重要學者如吳恩達，Zoubin Ghahramani,Tommi Jaakkola,Lawrence Saul和David Blei 都是他的學生。他現(xiàn)在擔任加州大學伯克利分校電機工程與計算機系和統(tǒng)計學系教授。

Michael I.Jordan的重要貢獻則包括指出了機器學習與統(tǒng)計學之間的聯(lián)系，并推動機器學習界廣泛認識到貝葉斯網(wǎng)絡的重要性。他還以近似推斷變分方法的形式化、最大期望算法在機器學習的普及方面的工作而知名。

此次演講中，從一開始他就現(xiàn)在所謂的“AI”進行了抨擊。他認為，現(xiàn)在媒體上熱炒的“AI”概念言過其實，很多人都是為了借此向 VC、媒體以及大眾兜售概念。至于真正的 AI，“我們根本還沒有實現(xiàn)”。也有相當一部分研究者陷入了深度學習的泥潭，思維變得更加狹窄。

他回顧了機器學習領域的現(xiàn)狀，以及今后發(fā)展面臨的挑戰(zhàn)。雖然機器學習理論目前的發(fā)展達到了一定高度，但他很討厭人們現(xiàn)在突然將它稱為 AI，因為那仍然還只是機器學習。他認為真正 AI 的實現(xiàn)，需要依靠邏輯、推理、決策等運算的突破才能實現(xiàn)，但現(xiàn)在它們之間還存在明顯脫節(jié)。

一些經(jīng)典 AI 領域，如計算機視覺、NLP 等還遠未達到智能和實用的地步，有賴進一步研究和努力。與此同時，傳統(tǒng)的社交平臺，如 Facebook，還遠沒有真正地將人們連接起來。醫(yī)療、金融、音樂、餐飲等眾多系統(tǒng)平臺仍存在巨大的想象空間，要做到這些，需要研究者們跳出傳統(tǒng)視角。

本文為 Michael I.Jordan 在大會上的演講實錄（有刪節(jié)），人工智能頭條整理。

▌我們還沒有實現(xiàn)真正的 AI

你們知道，我之前從 MIT（麻省理工）離職去了 UC 伯克利。這其實是因為 MIT 沒有任何跟統(tǒng)計相關的專業(yè)，并且直到現(xiàn)在也還不算有，而我認為統(tǒng)計學對計算機科學至關重要。雖然今天計算機科學的發(fā)展已經(jīng)十分激動人心，但它依然還沒有解決推理性的問題，在計算機和推理之間有一個脫節(jié)，所以我才要跳槽去研究概率和統(tǒng)計。

很多人說我這些做法是在從統(tǒng)計視角在研究 AI，這種看法欠妥，我只是在研究機器學習。AI 是一個非常寬泛的概念，它幾乎涉及到所有層面的計算機科學。它的每一部分都應該涉及到數(shù)據(jù)流，并且應該基于這些數(shù)據(jù)自適應地進化。這里面全是計算機科學，但直到今天，這一看法也還沒有在計算機系得到很多認同，他們?nèi)匀徽J為統(tǒng)計是 AI 的一部分。

我已經(jīng)疲于應對這些爭論了。

今天，我們到處都可以看到“AI”這一字眼，媒體上鋪天蓋地。這讓我感到非常不安，因為那些說法太言過其實了。我們沒有實現(xiàn)人工智能，沒有實現(xiàn)智能，甚至連它們是什么都不知道。我們說現(xiàn)在的系統(tǒng)都涉及到數(shù)據(jù)的輸入輸出，它們其實是在模仿一些很聰明的東西，但也僅僅是模仿，根本稱不上是智能，我們并沒有實現(xiàn)它。

今天，很多人樂衷于使用“AI”這個流行詞。但這只不過是他們借此向 VC（風險投資）、企業(yè)、媒體以及大眾兜售一些他們自己的概念。至于真正的 AI，我們根本還沒有實現(xiàn)。我現(xiàn)在雖然不再跳出來爭論這些話的對錯，但依然會在內(nèi)心時時刻刻提醒自己：我們還并沒有實現(xiàn)所謂的 AI。

現(xiàn)在，我非常高興我們有了一個這樣的社區(qū)，我們當前真正需要的正是建設性的努力，那必須保持嚴肅和清醒。并不是所有的炒作都是在為了在 AI 淘金熱中大賺一筆，他們或許也是為了能夠真正實現(xiàn) AI，讓這個世界變得越來越美好，讓 AI 更加穩(wěn)定，更加真實，足夠支撐建立一個全新科學領域所需的概念。

這就像有人喜歡土木工程、喜歡化工工程師一樣，我也非常尊敬他們在所在領域做出的實實在在的努力。他們研究出的東西切實改變了每個人的生活，而這也正是 AI 領域所需要的和依然欠缺的。

▌機器學習領域的現(xiàn)狀

機器學習理論已經(jīng)發(fā)展到了目前我們所看到的高度，我在二十年前我就已經(jīng)預見到它的發(fā)展會是這樣：數(shù)據(jù)將無處不在，用機器學習進行決策和商業(yè)建模將成為我們的習慣。但我很討厭人們現(xiàn)在突然將它稱為 AI，雖然最近有一些新的想法出現(xiàn)，但那仍然還只是機器學習。我不和他們爭論，并不代表認可他們的說法。相反，我會更加堅持自己的追求。

這世上并沒有魔法，機器學習只是將它的輸入輸出映射到它對一些處理機制的模仿之上了，雖然這看起來很神奇，但其實依然還有很多真正的問題——比如從廣義上來說，很多層面上的系統(tǒng)問題——都還沒有得到解決。

機器學習也還遠遠沒有發(fā)展到足以成為一個可靠的工程原則，可以針對現(xiàn)代數(shù)據(jù)分析問題得到魯棒的、可擴展的解決方案。有很多涉及到不確定性、推理、決策、魯棒性和規(guī)模化的問題都還沒有得到解決。更不要說經(jīng)濟學系統(tǒng)了，因為我們甚至對建立系統(tǒng)時的定價和激勵行為也還沒有足夠的思考。社會法律系統(tǒng)也是如此。

我以為每個人都會或多或少意識到這一點，但沒想到等待他們意識到這一點需要的時間卻長得不可思議。

扎克伯格在一年前的演講中曾談到他創(chuàng)建 Facebook 時的經(jīng)歷，“我什么都不知道，在這一過程中也并沒有扮演任何角色。我們只是搭建了一個平臺，而關于如何使用它甚至都沒有規(guī)定。但后來讓我感到震驚的是，人們并沒有很好地使用它”。

我們不僅要時刻注意人們有沒有用這個平臺來做壞事——比如虛假新聞，還要讓人們可以通過這個平臺得到正確結果，否則每天都會有數(shù)十萬人因此做出錯誤的醫(yī)療決定、糟糕的交通狀況或者財務決策。到目前為止，我們甚至都還沒有在解決這些問題上取得一點進步。我們的反應就好像在說我們本來就是如此。

對我來說，系統(tǒng)機器學習瞄準的目標太低了。這個社區(qū)中的很多人炒作深度學習太過頭了，我們已經(jīng)有了反向傳播（Backpropagation）這個偉大的學習機器；我們要讓它可以更好、更快、更容易實現(xiàn)，所有這些都會很快實現(xiàn)；公司也會成立，經(jīng)濟也會向前發(fā)展。但這樣做的目標定得太低了，這僅僅是一個非參數(shù)回歸問題，甚至都談不上“是”。所以我希望作為一個社區(qū)，我們可以有更高的目標，我們不能僅僅努力讓反向傳播更容易。

▌“AI” = IA + II

下面我來談一下為什么我說在人們的腦海里計算機和推理沒有連接起來。

其實在我一開始接觸這個領域的時候，我當時學習了一些關于 AI 的東西，但我沒有真正研究過。那時候有很多研究 AI 的觀點，比如通過廣度優(yōu)先搜索來尋找一個明星，這也是約翰·麥卡錫（John McCarthy）真正在 MIT 在做的研究。(注：約翰麥卡錫，人工智能領域的開山鼻祖之一，他曾發(fā)起和參與 AI 歷史上著名的達特茅斯會議，后來前往斯坦福并組建了斯坦福人工智能實驗室。)

我要說的這個故事和你們往常聽的有點不同：人工智能這個概念并不是 Minsky、McCarthy、Newell 他們那些人坐在一起開了個會就討論出來的。

麥卡錫剛到 MIT 的時候就說過他會研究智能（Intelligence）和計算領域。他們說那并不是控制論，控制論已經(jīng)有維納在做了，麥卡錫解釋了這兩個領域的區(qū)別。真正讓人們意識到 AI 是一個新領域的是，這個領域更多的是基于邏輯而不是控制理論和信號優(yōu)化，所以他必須給它一個新的名字，所以他發(fā)明了“Artificial Intelligence”這個詞。我覺得這個故事更加真實。

然而，歷史的奇異轉(zhuǎn)折之處在于現(xiàn)在研究 AI 的所有想法都在維納那一邊，都是關于優(yōu)化統(tǒng)計的，并且沒有邏輯，但現(xiàn)在大家用的“AI”這個詞卻依然還是麥卡錫發(fā)明的那個詞。

無論如何，AI 依然是一個偉大的愿景。這是一個在思考應該如何將計算實體與軟硬件結合到一起，并構建能夠捕捉智能的東西的哲學問題，這很有意思。

我認為這仍然還只是一個學術領域的愿景，并不認為它有必要或者已經(jīng)足夠用于促進社會進步或工業(yè)發(fā)展。我并不相信我們能夠建立通用智能，并且它可以解決世界上所有問題的說法。那只是愚蠢的科幻小說里的東西，并且是既不必要也不足夠的。我們需要把思想從一些真實問題中解放出來。有很多有錢的名人說我們要建立一個通用人工智能，然后就可以解決世界上的問題，比如癌癥。我并不想談論這些東西，但人們總是這樣在說。

不管如何，現(xiàn)在有個有趣的觀點，我們并不是要讓所有的事情都變好。與此同時，真正發(fā)生的事實也并不是 AI 取得了巨大的成功，而是“IA”（Intelligence Augmentation）取得的巨大成就。

搜索引擎就是這其中的一個代表，它是一個機器學習系統(tǒng)，不停地獲取數(shù)據(jù)并隨時間進行改善以做出更好的決策。像其他很多實際工程系統(tǒng)一樣，那是一個涉及到很多東西的機器學習算法，但那也意味著很多智能。比如我不必記住白俄羅斯的首都，但是當我在網(wǎng)上搜索一下就可以馬上知道。我看起來非常聰明，因為我無所不知。

我也可以在這里說英語，然后通過安裝同傳系統(tǒng)讓你們聽到漢語。看起來似乎我可以說很多門語言，但其實我并不會說漢語，這是因為電腦增強了我的智能。很多這種用深度學習實現(xiàn)的東西，我認為它們很有趣，但是——比如你見得很多的風格轉(zhuǎn)換，人們輸進去一張圖片，然后它會被轉(zhuǎn)換成另一張很酷的圖片，看起來像梵高的畫一樣，那作為一個玩具會非常有趣。但它真正做的是增強了人們的創(chuàng)造力。

它是一種“增強” ，并不是人們說的智能。但那已經(jīng)很有趣了，你甚至可以用它來創(chuàng)作音樂，但直接用它寫交響樂就很傻了，誰會在乎一臺電腦會不會寫交響樂呢，無論那意味著什么。但它卻可以為下一個貝多芬或者杰出藝術家的誕生提供一個自由創(chuàng)作的環(huán)境，那才是真正令人激動的，那就是 IA。

還有一些更為重要的東西，我將其稱之為“II”，即“Intelligent Infrastructure”。在我們身邊發(fā)生的事正越來越多的體現(xiàn)著這個世界對我們的了解。

世界正在被連接起來，比如我只要動動手機，就可以在幾秒鐘之內(nèi)約到一輛汽車，它可以帶我到達目的地。這個世界正在通過網(wǎng)絡變得越來越智能——只要你在一個大的復雜系統(tǒng)上加上數(shù)據(jù)，加上人類，那就是物聯(lián)網(wǎng)。那是一個萬億美元的經(jīng)濟市場，并且正在改變?nèi)祟惖纳睿淖兡銓τ卺t(yī)療、金融和日常生活的想象。所有這些都是非常巨大的改變，并且在過去的幾十年確確實實發(fā)生了。

這讓我想起了亞馬遜——他們是第一家認真做這件事的公司，并且是在 90 年代，遠在我們炒作這個概念之前。現(xiàn)在有很多公司正在建設物流預測以及欺詐系統(tǒng)，還有推薦系統(tǒng)，這些都是非常棒的事情，但那都是機器學習，不是我所謂的 AI，真正的 AI 將比我們現(xiàn)在看到的更為激動人心。

我認為在這里有一個脫節(jié)。如果你以這種經(jīng)典的方式研究 AI ，你或許會對視覺、語音、自然語言處理還有機器人感興趣，因為你是對這種具體的智能體感興趣，它們會像我們一樣做出智能的行動。你想到的所有東西都是和具體智能體有關，所以你可以根據(jù)場景開發(fā)算法，并且將它們轉(zhuǎn)變成目標、標簽或者語音。那都是很棒的，但那并不能解決我們在建立一個真實世界系統(tǒng)時所遇到的真實問題的十分之一。那只是“IA”或者“II”，而且人們的注意力會被視覺或語音方面的問題所分散。

▌未曾解決的經(jīng)典 AI 問題

雖然有些經(jīng)典的 AI 問題看起來已經(jīng)快要解決了，但我要說，我認為我們實際上還遠沒有解決這些經(jīng)典的 AI 問題。

在計算機視覺中，我們可以比之前更好的標注目標和場景，但它們并不是真實場景，那只不過是從互聯(lián)網(wǎng)上獲取的包含目標的圖片。如果你使用相同的訓練集進行測試，正確率可以達到 90%，但是在真實的世界中那可能只有 20%。因此，我們只不過是對場景中的對象進行了標注，并沒有真正解決這個問題。而關于場景的意義是什么？場景中正在發(fā)生什么事？接下來會發(fā)生什么？我們甚至都還不知道。所以人們說計算機視覺技術得到的一些東西非常荒謬。

語音領域和語義領域也是一樣。總的來說，我們生活在一個依靠聽覺的聲音世界中，但在閉上眼睛之后，我們還遠不能單純靠聽聲音來了解周圍世界。因為沒有語義信息，甚至都沒法開始自然語言處理。

翻譯并不是輸進去一種語言的字符串，然后得到另一種你之前已經(jīng)見過很多次的語言的字符串就可以了。我說法語很流暢，你用英語和我交流，我也能理解你說話的意思，我會將你話里的概念轉(zhuǎn)換成法語詞匯，而不是將英語字符串映射為正確的法語字符串。你甚至還可以再通過努力讓它的正確率達到 90%，但那依然是無效的。

視覺技術可以通過有監(jiān)督標記和一些無監(jiān)督標記技術來應用，而自然語言就不行。如果不相信，你可以試著讀一下道格拉斯·霍夫施塔特（Douglas Hofstad ter）前幾天在美國《大西洋月刊》上的一篇文章。他通過英語、法語、德語和中文四種語言翻譯的比對論證得出一個結果：谷歌翻譯即使應用了人工智能技術也沒有真正理解語言。

語言真的是人類的智慧，包含了對這個世界各種事物的諷刺、隱喻、引用和參考。只有我們真的了解這個世界才能搞明白語義，它需要理解人類的社會行為、概念行為，而這些并不能通過標簽數(shù)據(jù)和很多字符串來實現(xiàn)。

讓我們繼續(xù)回到主題上。剛剛我們討論的是翻譯，現(xiàn)在說一下對話。

對話并不只是一個可以和你不停對話的聊天機器人，雖然那聽起來比較有趣。它實際上是試圖實現(xiàn)一個目標，比如我想訂一個飛往巴黎的航班，這中間涉及到我自己的各種復雜偏好，然后最終可以把我?guī)У侥抢铩Ｋ晕覀儽仨氂幸粋€對話逐漸地將我這個意愿通過機器人落實到真實世界的實際行動上，但我們離這一步還很遠。

談到機器人技術，你知道它有很多進步。但我仍然十分懷疑，目前工業(yè)界的機器人只能在非常有限的環(huán)境中工作。我們雖然已經(jīng)可以讓機器人和人類進行互動，但我并不認為它在我們的生活環(huán)境中工作會沒有問題。

▌機器學習近期的挑戰(zhàn)

現(xiàn)在讓我們接著談論技術。如果你是一個系統(tǒng)機器學習研究人員，并且認為自己的生活將支持深度學習方式——我也認為這非常有用——但這里還有一大堆其它的甚至稱不上是 AI 的東西。

多重決策（Multiple Decisions），統(tǒng)計學家一直在討論這個話題，但機器學習領域的人卻幾乎不談論這個。你可以構造一個神經(jīng)網(wǎng)絡，它需要輸入一些圖片或者搜索引擎營銷信息（SEM），甚至一些數(shù)據(jù)的歷史信息來進行決策。它會對不同環(huán)境中的不同人員使用相同的神經(jīng)網(wǎng)絡做出成百上千次決策，那完全是個災難。

這些決策有可能是完全錯誤的。比如碰巧在下雨天你要乘坐某個交通工具，每個人可能最后都會乘坐同樣的交通工具，到達相同的街道，這勢必會造成擁擠。相關決策波動會導致最終結果的變化，即使那不滿足獨立同分布假設。

我們現(xiàn)在的系統(tǒng)仍然是假設我們處在一種理想世界中，所以總會有錯誤發(fā)現(xiàn)率存在（注：錯誤發(fā)現(xiàn)率 FDR( False Discovery Rate)是指錯誤拒絕（拒絕真的（原）假設）的個數(shù)占所有被拒絕原假設個數(shù)比例的期望值）。系統(tǒng)應該支持可以有錯誤發(fā)現(xiàn)率，而不僅僅是支持神經(jīng)網(wǎng)絡中的邏輯回歸、決策樹。如果你的系統(tǒng)不支持，我就不會在我的公司用它。

要有一個這樣能夠創(chuàng)造市場的系統(tǒng)，我認為需要考慮大量的因素。所以我們會將經(jīng)濟學引入我們的系統(tǒng)，我們需要擁有消費者和生產(chǎn)者雙向的連接，而不是僅僅建立一個可以讓人們上傳數(shù)據(jù)并從中獲取答案的平臺，而不建立一個實際系統(tǒng)。

在今天，不確定性依然存在。我們在統(tǒng)計學中談論的 Bootstrap、貝葉斯理論、Jackknife(刀切法)以及其他原則都還沒有在計算機科學系統(tǒng)內(nèi)部建立。

它們只是輸入輸出，給出一條 ROC 曲線就好像已經(jīng)完成了其實本沒有完成的工作。所以要如何將智力結合到其中呢？要怎樣解決他們兩者之間不連貫的事實？這是非常關鍵的問題，我們必須解決這一點，并且必須假設這些問題可以通過計算機科學進行處理。

談到抽象，人類其實非常善于發(fā)現(xiàn)抽象。舉個例子，比如我可以發(fā)明一個新詞匯“Blecch”，然后說一些關于“Blecch”的事情，你就可以知道和它有關的各種各樣的事。你可以通過抽象進行推理，事實上也正是因為我們可以創(chuàng)建抽象概念，計算機科學才可以發(fā)展的這么好。

我的兒子非常擅長發(fā)現(xiàn)類比、隱喻以及那些有趣的東西，這些都會在他的大腦中形成一個新的抽象。但神經(jīng)網(wǎng)絡和那個差的太遠了，神經(jīng)網(wǎng)絡必須要先看到大量的數(shù)據(jù)，最終才能發(fā)現(xiàn)一個新特征，或者如果有人非要稱其為抽象也可以。

數(shù)據(jù)溯源（Provenance），這非常重要。實際上我對數(shù)據(jù)科學非常感興趣。在醫(yī)療系統(tǒng)中，有很多誤報（假陽性）導致很多死亡的案例。在我兒子出生的時候，有一些錯誤的成像結果，那是一個誤報。如果我們相信了那條決策路線，就可能會走一個非常危險的程序，甚至殺死胎兒。我認為那也可能發(fā)生在你身上，我計算的結果是在過去的幾年中，由于誤報，每天大概有 20 個胎兒會被殺死。

誤報和不好的統(tǒng)計數(shù)據(jù)無關，而是與錯誤的報告結果有關。在某種情況下進行計算的數(shù)據(jù)，實際上在相同情形下用于新的成像機器時是不準確的。那聽起來是一個討厭的數(shù)據(jù)庫問題。但就是那個東西讓模型有時難以發(fā)揮作用。

關于長期目標，人類非常善于追求長期目標，比如選擇職業(yè)、買房。而我們的機器卻并不具備實現(xiàn)長期目標的能力。不要跟我說強化學習，那也沒有長期目標。

實時性能這一目標，我想那些設計自動駕駛汽車的人應該認識到了它的重要性，而其他人還沒有意識到這正是我們要考慮的關鍵部分。這也不是傳統(tǒng) AI 的一部分。

如果你是一個真正有雄心的系統(tǒng)人員，這些都會是亟待解決的重大問題，并且大多還是很少受到關注或者正在受關注但還需要一段時間才能解決的問題。

▌機器學習與市場的創(chuàng)造性

我的一些觀點是基于我的研究和在公司的經(jīng)歷形成的。今天我將向大家分享兩個觀點。

就我實際所做的工作而言，我只是一個理論研究者，所以關于這些神經(jīng)網(wǎng)絡發(fā)展的良好勢頭，我都樂于看著它們發(fā)生，但當我看到所有人都在扎堆朝著一個方向前進時，我就會尋找其它方向。我現(xiàn)在做的所有工作都是在證明收斂率和隨機性的定理，你要是看過我的主頁就會知道我這些天有多興奮，但我形成這些觀點卻是基于在公司的（實踐）經(jīng)歷而不是通過證明它們。

United Masters 公司是一個美國音樂人服務平臺，它在 2017 年 11 月宣布成立。現(xiàn)在音樂人非常多，創(chuàng)作的音樂也非常多，但除了少數(shù)幾個掌握權力的人之外，大多數(shù)音樂人的第一筆訂單并不會賺錢，音樂創(chuàng)作實際上沒有得到報酬。

發(fā)生這種狀況的原因有很多，比如我們處在一個并不景氣的市場，而如果連接生產(chǎn)者和消費者的經(jīng)濟的話，就會產(chǎn)生很多價值。它不像之前的唱片公司一樣，在生產(chǎn)者和消費者之間有中介存在，那在這種模式下不會有效。所以你必須做些別的什么，就像 Uber 那樣，或者其他你看到的真實的機會。

United Masters 已經(jīng)和 Spotify 跟 Youtube 等公司建立了合作關系，并且獲得了所有數(shù)據(jù)。他們會了解任何藝術家，不僅僅有碧昂絲那樣的世界級歌手，還有成百上千個不太出名的藝術家，然后了解有哪些用戶在聽他們的音樂。他們提供給藝術家展示的機會：我知道我不是非常出名，但我知道佛羅里達州有一萬人喜歡定期收聽我。

這種口碑就意味著如果我去那里舉辦一場音樂會，我就可以賺兩萬五千美元。一年我可以做三到四次，那就是十萬美元的薪水。我不必再做一個出租車司機，然后每周只有周末才有時間創(chuàng)作音樂。我實際上可以成為一個真正活躍的全職音樂家，很多人都可以這樣。這就可以創(chuàng)造一個市場，你知道誰在聽你的音樂，然后你就可以做得更多。

這實際上就是在生產(chǎn)者和消費者之間建立了連接。有了這種連接，一旦數(shù)據(jù)流通過，商品買賣就可以更流暢。所以藝術家可以說你只要付兩萬美元我就可以在你婚禮上表演，或者你是我的一個超級粉絲，你想來后臺...所有這些商品的形式都可能出現(xiàn)，而公司實際上就提供了這種可以賺錢的方式。他們提供這些平臺當然也應該得到一些錢，當然那到不了像一個標準代理人一樣可以獲取百分之五十的費用，不過百分之十也差不多，所以你知道你的音樂大師夢真的有希望了。

這家公司的 CEO 是 Steve Stoute，他是個了不起的人，也是我曾見過的最聰明的人之一。他曾在索尼旗下的唱片公司工作，后來創(chuàng)建了 Translation 廣告公司，并且完成了很多實際的東西。他了解很多音樂人，Steve 的經(jīng)歷以及他的音樂背景，讓他剛好處于一個可以將音樂、技術和人聯(lián)系在一起的位置。我認為我們的社區(qū)可以參與這種活動是非常令人激動的，而 Steve 就剛好給出了這把鑰匙。

去年我曾請他做一個開場演講。那場演講的主題是關于 Hip-hop ，自我賦權和解放，創(chuàng)造力以及這些該如何和數(shù)據(jù)科學聯(lián)系起來。

▌機器學習與數(shù)據(jù)共享

現(xiàn)在還有一個數(shù)據(jù)共享的問題。

所有這些都還只是想法，如果我有時間的話就會進行實驗，所有這些都是想法的實驗。這些都只是我的一些研究建議，我的團隊可能會做的。我們這些時間主要是證明定理，但這里還有一個數(shù)據(jù)共享的想法實驗。

數(shù)據(jù)共享不是“AI”的問題，但卻是現(xiàn)實世界的“II”問題。很多公司都有數(shù)據(jù)，如果可以將它們放到一起，那將對他們有用，但這通常不被允許。法律上不允許出于很多原因，比如，在某天一個公司可能會遭受入侵或欺詐攻擊，但這可能同時發(fā)生在所有公司，也可能只針對特定的公司。

如果將每個人的數(shù)據(jù)都匯總起來，你就可以構建世界上最好的分類器，并且可以讓系統(tǒng)受欺詐的程度保持的相當?shù)停藗儾粫菢幼觥槭裁茨兀亢芏嘣颉Ｄ阋鯓蛹钏麄冮_始分享數(shù)據(jù)？你把你的數(shù)據(jù)發(fā)送給我，是因為我是個值得信賴的中心人員，我會通過密碼機制或其他方式保護你的數(shù)據(jù)。

我會獲取你的數(shù)據(jù)，然后構建一個完美的分類器，然后再把它們送回去。我不會和任何人分享你的數(shù)據(jù)。但那并不是很有趣，因為可能我收到的數(shù)據(jù)中有欺詐數(shù)據(jù)。對公司來說，如果他們把真實的數(shù)據(jù)放到系統(tǒng)中，別人會得到比他們更多的優(yōu)勢，所以他們不會發(fā)送高質(zhì)量的數(shù)據(jù)，他們不傻。

那他們應該發(fā)送的數(shù)據(jù)質(zhì)量要多高？系統(tǒng)應該有什么激勵機制來讓他們衡量要發(fā)送數(shù)據(jù)的質(zhì)量？這還涉及到隱私問題，他們的律師就會一直強調(diào)不要發(fā)送數(shù)據(jù)。所以這里從機器學習的視角來說，有一種方式就是你讓每個公司自己決定要發(fā)送的數(shù)據(jù)質(zhì)量或者隱私，或者其它想要對數(shù)據(jù)進行的操作。比如，他們要把噪聲加到數(shù)據(jù)中，然后才會放心地把數(shù)據(jù)交出來。他們對這樣有些差異化的私人系統(tǒng)會感到滿意。

現(xiàn)在數(shù)據(jù)到了我這里，我會用所有這些數(shù)據(jù)構建一個分類器，然后看這個分類器在測試集中的表現(xiàn)如何。之后我要做的是留出一個公司的數(shù)據(jù)，然后用其他公司的數(shù)據(jù)做訓練集得到一個分類器，然后看分類器效果多好。然后對比留出不同公司數(shù)據(jù)后得到的分類器。如果在某個公司數(shù)據(jù)是訓練集時，得到的分類器效果最好，就說明這個公司提供的數(shù)據(jù)是好的。

我可以僅僅通過在經(jīng)典 Handout 方法中的一個損失函數(shù)量化數(shù)據(jù)的好壞。我現(xiàn)在要為每個公司做的是每次留出它們一個，然后就知道他們發(fā)給我的數(shù)據(jù)有多好，他們覺得要給我發(fā)多好的數(shù)據(jù)，以及數(shù)據(jù)差異有多大。并且一旦我知道了這些，我就可以進行評估，現(xiàn)在我做的是世界上最好的分類器。但我會把模型或者預測結果，根據(jù)它們發(fā)給我的數(shù)據(jù)質(zhì)量返還給他們。

這也可以說是經(jīng)濟學，我設定了一個博弈，有一些激勵的概念，并且可能存在納什均衡，而不是說誰都不發(fā)高質(zhì)量的數(shù)據(jù)。但這個提議或許會是一個研究，可能不會有結果。

總之，如果很多事情你能擺脫傳統(tǒng)的思考角度，那么這個社區(qū)將有很多路可以走。我不認為只靠深度學習的那群人可以實現(xiàn)那個目標。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
30172

瀏覽量
268439
人工智能

人工智能

+關注

關注
1791

文章
46872

瀏覽量
237608
機器學習

機器學習

+關注

關注
66

文章
8378

瀏覽量
132425

原文標題：邁克爾 · 喬丹：我討厭將機器學習稱為AI

文章出處：【微信號：fbigdata，微信公眾號：AI報道】歡迎添加關注！文章轉(zhuǎn)載請注明出處。

什么是機器學習？通過機器學習方法能解決哪些問題？

來源：Master編程樹“機器學習”最初的研究動機是讓計算機系統(tǒng)具有人的學習能力以便實現(xiàn)人工智能。因為沒有學習能力的系統(tǒng)很難被認為是具有智能的。目前被廣泛采用的

發(fā)表于 11-16 01:07 ?245次閱讀

什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>？通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題？

NPU與機器學習算法的關系

在人工智能領域，機器學習算法是實現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復雜度的提升，對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習等機器

發(fā)表于 11-15 09:19 ?317次閱讀

魯棒性在機器學習中的重要性

在機器學習領域，模型的魯棒性是指模型在面對輸入數(shù)據(jù)的擾動、異常值、噪聲或?qū)剐怨魰r，仍能保持性能的能力。隨著人工智能技術的快速發(fā)展，機器學習

發(fā)表于 11-11 10:19 ?214次閱讀

使用機器學習和NVIDIA Jetson邊緣AI和機器人平臺打造機器人導盲犬

Selin Alara Ornek 是一名富有遠見的高中生。她使用機器學習和 NVIDIA Jetson 邊緣 AI 和機器人平臺，為視障人士打造了機器人導盲犬。該項目名為 I

發(fā)表于 11-08 10:05 ?320次閱讀

具身智能與機器學習的關系

（如機器人、虛擬代理等）通過與物理世界或虛擬環(huán)境的交互來獲得、發(fā)展和應用智能的能力。這種智能不僅包括認知和推理能力，還包括感知、運動控制和環(huán)境適應能力。具身智能強調(diào)智能體的身體和環(huán)境在智能發(fā)展中的重要性。 2. 機器

發(fā)表于 10-27 10:33 ?274次閱讀

【「時間序列與機器學習」閱讀體驗】+ 簡單建議

這本書以其系統(tǒng)性的框架和深入淺出的講解，為讀者繪制了一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識，更巧妙地展示了機器

發(fā)表于 08-12 11:21

如何理解機器學習中的訓練集、驗證集和測試集

理解機器學習中的訓練集、驗證集和測試集，是掌握機器學習核心概念和流程的重要一步。這三者不僅構成了模型學習與評估的基礎框架，還直接關系到模型性

發(fā)表于 07-10 15:45 ?3241次閱讀

生成式AI的基本原理和應用領域

生成式人工智能（Generative Artificial Intelligence，簡稱Generative AI）是一種利用機器學習算法和深度學習技術，通過模擬人類的創(chuàng)造性思維過程

發(fā)表于 07-04 11:50 ?1233次閱讀

機器學習在數(shù)據(jù)分析中的應用

隨著大數(shù)據(jù)時代的到來，數(shù)據(jù)量的爆炸性增長對數(shù)據(jù)分析提出了更高的要求。機器學習作為一種強大的工具，通過訓練模型從數(shù)據(jù)中學習規(guī)律，為企業(yè)和組織提供了更高效、更準確的數(shù)據(jù)分析能力。本文將深入

發(fā)表于 07-02 11:22 ?546次閱讀

深度學習與傳統(tǒng)機器學習的對比

在人工智能的浪潮中，機器學習和深度學習無疑是兩大核心驅(qū)動力。它們各自以其獨特的方式推動著技術的進步，為眾多領域帶來了革命性的變化。然而，盡管它們都屬于

發(fā)表于 07-01 11:40 ?1200次閱讀

名單公布！【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來？

設備的運行狀況，生成各種維度的報告。同時，通過大數(shù)據(jù)分析和機器學習技術，可以對業(yè)務進行預測和預警，從而協(xié)助社會和企業(yè)進行科學決策、降低成本并創(chuàng)造新的價值。當今時代，數(shù)據(jù)無處不在，而時間序列數(shù)據(jù)更是

發(fā)表于 06-25 15:00

機器學習8大調(diào)參技巧

今天給大家一篇關于機器學習調(diào)參技巧的文章。超參數(shù)調(diào)優(yōu)是機器學習例程中的基本步驟之一。該方法也稱為超參數(shù)優(yōu)化，需要搜索超參數(shù)的最佳配置以實現(xiàn)最佳性能。

發(fā)表于 03-23 08:26 ?565次閱讀

基礎模型能為機器人帶來怎樣的可能性？

機器人是一種擁有無盡可能性的技術，尤其是當搭配了智能技術時。近段時間創(chuàng)造了許多變革性應用的大模型有望成為機器人的智慧大腦，幫助

發(fā)表于 01-26 14:47 ?214次閱讀

基于MCX微控制器的機器學習解決方案

隨著人工智能（AI）技術的發(fā)展，如何在MCU上實現(xiàn)機器學習，創(chuàng)造更多邊緣AI的新用例，一直是嵌入式開發(fā)社區(qū)的熱點話題。

發(fā)表于 01-05 09:18 ?720次閱讀

什么是機器學習？它的重要性體現(xiàn)在哪

任務的解決方法。機器學習的重要性體現(xiàn)在幾個方面數(shù)據(jù)處理能力：在當今數(shù)字化時代，我們產(chǎn)生了大量的數(shù)據(jù)。機器學習能夠處理和分析這些龐大的數(shù)據(jù)集，

發(fā)表于 01-05 08:27 ?1441次閱讀

精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

搜索歷史

機器學習與市場的創(chuàng)造性

評論

什么是機器學習？通過機器學習方法能解決哪些問題？

NPU與機器學習算法的關系

魯棒性在機器學習中的重要性

使用機器學習和NVIDIA Jetson邊緣AI和機器人平臺打造機器人導盲犬

具身智能與機器學習的關系

【「時間序列與機器學習」閱讀體驗】+ 簡單建議

如何理解機器學習中的訓練集、驗證集和測試集

生成式AI的基本原理和應用領域

機器學習在數(shù)據(jù)分析中的應用

深度學習與傳統(tǒng)機器學習的對比

名單公布！【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來？

機器學習8大調(diào)參技巧

基礎模型能為機器人帶來怎樣的可能性？

基于MCX微控制器的機器學習解決方案

什么是機器學習？它的重要性體現(xiàn)在哪