精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習模型也能分得清菜系嗎?

算法與數據結構 ? 來源:未知 ? 作者:胡薇 ? 2018-08-10 15:26 ? 次閱讀

吃飯的時候會見到很多奇怪的菜名,很多店常常會取一些奇怪的名字來吸引眼球,吃飯的時候基本靠猜,或者……通過食材預估一下彩色和口味是否符合自己的要求。其實通過食材預測菜系,用 python 也可以做到!

可以用機器學習的方法搭建、訓練和測試模型,并通過評估矩陣來選擇最優模型,實現原材料與菜系的映射。為了實現預期的功能,我們需要進行以下三個步驟。

1.加載并分析數據

2.建立模型

3.模型預測

加載并分析數據

以意大利菜系為例,我們準備好以下格式的樣例數據。其中“id”代表不同的菜肴種類,“cuisine”則代表菜系名稱。

拿到數據后,首先對數據進行提取,其中配方節點如下。其中包含了食譜 id,菜肴類型和成分列表的訓練集。

之后將 features 與 target 分別賦值到 train_ingredients 和 train_targets。通過統計分析等操作,可以計算出使用最頻繁的前 10 種原料,并將原料名和出現次數賦值到 sum_ingredients 字典中。通過樣例數據,還能計算出意大利菜系中使用最頻繁的前 10 種原料,并將原料名和出現次數賦值到 italian_ingredients 字典中。

得到的結果可以通過 matplotlib 進行可視化。通過數據分析,可以得出許多有意思的信息,比如,巴西菜用的最多的食材有洋蔥、橄欖油、檸檬等。而在中國,檸檬顯然不是家常飯的常客。我們用的最多的食材有醬、芝麻油、玉米淀粉等。小編猜測,老干媽一定對中國排名第一的食材有巨大貢獻!

日本比較有特色的清酒和醬油也都榜上有名。而在寒冷的俄羅斯,黃油則成為餐桌上必不可少的食材,成為戰斗民族每天所需能量的重要來源。英國更不必多說,如果你熱愛黃油、奶油、土豆和牛奶,去英國就是了!

建立模型

建立模型的過程可能稍微有點復雜,主要分以下四步進行:

1、單詞清洗

2、特征提?。ㄊ褂?a target="_blank">TF_IDF)

3、數據分割與重排

調用 train_test_split 函數將訓練集劃分為新的訓練集和驗證集。

4、訓練模型

在訓練模型的過程中,需要嘗試不同的參數,挑選出泛化力最好的模型。通過訓練模型,可以計算得出驗證集上的得分。得分越高,說明分類準確度(正確分類的菜肴百分比)越高。這樣,一個優秀的模型就大功告成啦!

模型預測

在測試文件 test.json 中,配方的格式與 train.json 相同,只刪除了美食類型,因為它是我們要預測的目標變量。

總的來說,要實現通過食材預測菜系的過程并不復雜,但是如何完善代碼、優化模型,使分類體系和匹配程度更高,才是我們要完成的關鍵目標。如果不能做到數據的有效清洗和分類,就會出現很多法國菜被誤分為意大利菜這樣的情況。

至于能不能分清川菜和湘菜……可以自己來試一試!這個項目其實來自優達學城 Udacity 的「機器學習工程師」納米學位。

優達學城 Udacity由Google 無人車之父Sebastion Thrun創立,與Google、Facebook、亞馬遜等名企聯合打造了一系列前沿技術課程,旨在讓每個人都能用遠低于線下教育的成本學習硅谷前沿技術,最終成為有能力通過技術改變世界的搶手人才。2017 年8 月,騰訊宣布將 Udacity 納米學位項目作為內部員工學習內容。

與國內其他平臺相比,Udacity 的一大優勢是來自硅谷的獨家特色實戰項目。項目難度深入淺出,能夠讓學習者快速將所學運用到實際生活,并直觀看到學習成果。下面的部分項目成果示例來自「機器學習工程師」和「深度學習」納米學位的正式課程:

項目示例 1訓練機器人走迷宮

通過實現 Q-learning 算法解決走迷宮問題。同時你有機會將你的算法應用在股市中,讓機器學習出高收益策略。

項目示例 2貓狗圖像識別

使用深度學習方法識別圖片中是貓還是狗。

實戰項目示例 3訓練四軸飛行器學會飛行

設計一個深度強化學習系統,構建懲罰函數、強化學習模型、深度學習隱藏層幫助四軸飛行器了解每一個動作的優劣。你的四軸飛行器將從一系列動作狀態中,選擇最優的策略來平穩起飛和降落。

實戰項目示例 3風格遷移

深度學習模型可以用來完成「風格遷移」項目。神經網絡會學習這些畫作采用的技巧,并學會如何自己應用這些繪畫技巧。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8377

    瀏覽量

    132410
  • python
    +關注

    關注

    56

    文章

    4782

    瀏覽量

    84453

原文標題:機器學習模型,能分清川菜和湘菜嗎?

文章出處:【微信號:TheAlgorithm,微信公眾號:算法與數據結構】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    機器學習模型評估指標

    機器學習模型指標在機器學習建模過程中,針對不同的問題,需采用不同的模型評估指標。
    發表于 09-06 12:51 ?1049次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>模型</b>評估指標

    DP DP1.0 DP++

    本帖最后由 gk320830 于 2015-3-8 12:15 編輯 有沒有大神分得清他們的區別?PIN定義&功能{:11:}
    發表于 03-28 19:00

    機器學習模型之性能度量

    機器學習模型的性能度量
    發表于 05-12 10:27

    什么是機器學習? 機器學習基礎入門

    另一方面,機器學習是向計算機提供一組輸入和輸出,并要求計算機識別“算法”(或用機器學習的說法稱為模型)的過程,這種算法每次都將這些輸入轉化為
    發表于 06-21 11:06

    部署基于嵌入的機器學習模型

    1、如何在生產中部署基于嵌入的機器學習模型  由于最近大量的研究,機器學習模型的性能在過去幾年里
    發表于 11-02 15:09

    指令和偽指令分得清嗎?

    指令(instruction):告訴計算機從事某一特殊運算的代碼,如數據傳送指令、算術運算指令、位運算指令、程序流程控制指令、串操作指令、處理器控制指令。一條指令通常由兩部分組成:操作碼和地址碼。
    的頭像 發表于 06-01 10:58 ?6855次閱讀
    指令和偽指令<b class='flag-5'>分得清</b>嗎?

    統計學和機器學習的真正差別。你分得清嗎?

    這兩種方法的目標不同,盡管使用的方法類似。機器學習算法的評估使用測試集來驗證其準確性。統計模型可以使用置信區間,顯著性檢驗和其他檢驗對回歸參數進行分析,以評估模型的合法性。由于這些方法
    的頭像 發表于 04-08 08:55 ?8570次閱讀
    統計學和<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的真正差別。你<b class='flag-5'>分得清</b>嗎?

    AI的真真假假你分得清

    AI,人工智能,令人興奮教人愉快,因為機器居然做的跟人一樣,甚至比人做的更好。
    發表于 04-10 16:59 ?2436次閱讀

    微處理器實現機器學習?

    許多公司目前專注于為機器學習構建專門的硅材料,以便在數據中心內訓練網絡。他們還希望在邊緣使用硅來對機器學習模型進行推理運行數據,以查看數據是
    的頭像 發表于 04-15 16:37 ?1817次閱讀

    燈具的種類百科:你分得清哪些是可以調光的嗎

    隨著技術的發展,燈具的種類越來越多。那你分得清哪些是可以調光的嗎?今天我們來聊一聊,有哪些光源是可以調光的。
    的頭像 發表于 12-24 11:14 ?1630次閱讀

    SB接頭那么多種怎么分得清

    說起USB,想必大家對這個詞兒都不默生,USB接頭那么多種,怎么分得清呢? 常見USB接頭及連接線介紹 通過上面兩幅圖,我們心里已經有了一個大致的概念了,那么在USB接口設計的時候,通常我們要在
    的頭像 發表于 11-18 10:39 ?4164次閱讀
    SB接頭那么多種怎么<b class='flag-5'>分得清</b>

    如何評估機器學習模型的性能?機器學習的算法選擇

    如何評估機器學習模型的性能?典型的回答可能是:首先,將訓練數據饋送給學習算法以學習一個模型。第二
    發表于 04-04 14:15 ?968次閱讀

    激光加工納秒激光、皮秒激光、飛秒激光,你分得清嗎?

    大家對激光加工并不陌生,但你對經常能聽到的納秒激光、皮秒激光、飛秒激光等,你是否分得清呢?▌我們先來搞清楚時間單位換算1ms(毫秒)=0.001秒=10-3秒1μs(微秒)=0.000001
    的頭像 發表于 06-21 17:25 ?1316次閱讀
    激光加工納秒激光、皮秒激光、飛秒激光,你<b class='flag-5'>分得清</b>嗎?

    機器學習算法匯總 機器學習算法分類 機器學習算法模型

    機器學習算法匯總 機器學習算法分類 機器學習算法模型
    的頭像 發表于 08-17 16:11 ?1067次閱讀

    分得清啟動電容和運行電容?

    電容器的容量是一個重要的參數,通常以微法拉(μF)為單位。啟動電容的容量一般較大,而運行電容的容量則相對較小。因此,可以通過測量電容器上的標注容量來判斷哪一個是啟動電容,哪一個是運行電容。
    發表于 11-06 09:49 ?4999次閱讀