精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

模型不起作用時的解決辦法

汽車玩家 ? 來源:人工智能遇見磐創 ? 作者:人工智能遇見磐創 ? 2020-05-04 09:54 ? 次閱讀

你的團隊幾個月來一直在收集數據、構建預測模型、創建用戶界面,并與一些早期的用戶一起部署新的機器學習產品。但你現在聽到的并不是大家一起慶祝項目勝利的聲音,而是聽到產品經理對那些早期用戶的抱怨,這些早期用戶對模型精度不滿意并開始認為“模型不起作用”。所以你現在應該做什么?

我們常常在很多模式識別實驗室里給相關組織應用機器學習算法到新產品見到這種情況。這不是一個容易迅速解決的問題。真實世界的機器學習模型的性能受到許多因素的影響,其中一些因素可能在控制之下,而另一些因素則可能不在控制之下。最重要的是,當試圖對真實世界的現象建模時,每個建模問題都有一個固有的噪聲或隨機性被混合在信號中,這使得很難理解我們使用一個預測模型真正能夠達到的準確度。再加上用戶對你的模型準確性的期望,你的數據科學團隊就突然陷入了一個棘手的境地,并試圖找出從哪里開始解決問題。

1. 了解要解決的問題

首先要確保團隊對他們試圖用模型解決的用戶問題有很好的理解。令人驚訝的是,數據科學團隊對成功的定義的理解與用戶的標準經常不同。最近,我們與一家公司合作,試圖預測惡劣天氣對公用事業公司運營的影響。技術團隊絞盡腦汁想要提高他們模型的MAPE分數。當我們深入研究時,我們發現MAPE根本不是正確的度量標準,他們所追求的目標是他們自己設定的(而不是傾聽用戶的意見)。用戶實際上最關心的是,我們能夠始終如一地將風暴的影響嚴重程度劃分為1-5級的能力,這個劃分是為他們的操作程序定義的。

要確保數據科學團隊對這個問題有一個全面的理解,并且這個理解最好直接來自用戶,這對于一個新計劃的成功是至關重要的。如果你的團隊陷入了上面描述的模型“不能工作”的情況,那么第一步就是回去,確保你已經正確地定義了問題,并理解你的用戶如何定義成功。

2. 數據是否正確、完整?

下一步是回頭查看你的團隊收集的輸入數據。通常,在處理復雜的實際模型時,模型性能不好的主要原因是由于輸入數據集和特征的問題,而不是模型本身。特別是當你運行多種類型的模型(我們建議你盡可能這樣做)并得到類似的結果時,這通常是輸入數據集的問題。

這一步的一個關鍵部分是確保你已經收集了盡可能多的相關數據。通常,現實世界的模式中有一些因素并不總是直觀或者明顯的,因此你可以收集的數據和特征越多越好。你可以使用許多技術來降低特征的選擇,以便在最相關的特征上構建模型,我們將在下一個步驟中討論這些特征。但是對于這一步,重點是重新檢查你的假設,哪些輸入的特征影響了你試圖建模的輸出,如果需要,還可以返回以獲取額外的數據。例如,當試圖為現實世界的現象建模時,通常需要考慮一些不明顯的因素,因為這些不明顯的因素會造成影響,特別是異常情況——例如季節性、天氣、日歷事件,甚至地緣政治事件。

其次,應該進行一些簡單的QA檢查,以確保輸入數據得到正確映射和處理。最近,我們與一個想改善模型性能的客戶進行了合作,但最終發現問題根本不是與模型有關——客戶錯誤地處理了一些地理位置的特征數據,這使得他們運行的模型無法識別正確的模式。

CRISP-DM流程是許多數據科學團隊用于管理項目的最常見框架之一。我們喜歡它的重點在于它確保在深入建模之前就能理解業務和數據。CRISP-DM過程中的兩個關鍵步驟是“數據理解”和“數據準備”。正確地遵循這些步驟需要深入研究輸入數據以真正地理解它,通常需要可視化數據中的分布、趨勢和關系。“數據準備”通常包括預處理、數據擴充與標準化,以便為建模做準備。如果處理得當,這兩個步驟可以幫助數據科學家確保輸入數據中的錯誤不會導致他以后遇到的任何模型性能問題。

3. 調整模型提升性能

既然你已經盡可能正確和完整地驗證了輸入數據,現在是時候關注有趣的東西了——建模本身。這一步中影響最大的部分之一是特征選擇——從上到下選擇最影響輸出的關鍵特征,并對這些特征進行訓練,消除冗余或高度相關的特征,以提高模型的速度和準確度。關于特征選擇技術有一些很好的博客文章,包括單變量選擇、遞歸特征消除和隨機森林特征重要性。這里有一個可供參考:https://machinelearningmastery.com/feature-selection-machine-learning-python/。無論你使用的是哪種技術,或者它們的組合,都要確保在這一步上花費時間,為你的模型獲得特征的最佳組合。

此步驟的另一個重要部分是重新考慮模型的選擇,或者考慮添加額外的模型類型或組合多個模型。同樣的,也有許多比較不同模型優缺點的好文章,但是我們建議盡可能運行至少兩種模型類型(理想情況下,一種是神經網絡)來比較結果。

最后,一旦你的特征和選擇的模型確定了后,重新調參,并且確保你正確地定義訓練集,驗證集和測試集,這代表你在調參時并沒有選擇欺詐,所以它在新數據上可以泛化的很好,而不是在訓練集上表現良好甚至過擬合導致在新數據上模型沒有良好的工作。

4. 最后,也是最重要的,管理客戶的期望

這是許多數據科學家忽視的另一個關鍵步驟,因為他們認為這“不是他們的工作”。當推出一個面向世界的新機器學習產品時,模型在真實世界的性能存在相當大的不確定性。此外,如上所述,盡管你盡了最大的努力使準確度最大化,但是在你正在解決的問題在真實世界中會出現的大量噪聲,這可能會限制模型的性能。所以這個步驟是數據科學團隊的責任,需要數據科學團隊去與產品經理,銷售人員,客戶正確定義客戶期待在模型中看到的性能,并且在時間的推移擁有額外的數據的情況下,指導他們如何去訓練改善模型。

所以下次你的團隊在模型放入真實世界里遇到性能問題時,不要玩指責游戲或直接一頭扎進調參工作進行優化與擬合,后退一步,跟著這個簡單的,結構化的過程一步一步來解決這個問題,在你的新模型上最大化性能。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3172

    瀏覽量

    48714
  • 數據集
    +關注

    關注

    4

    文章

    1205

    瀏覽量

    24644
收藏 人收藏

    評論

    相關推薦

    調試PCM3070的時候,進行通道切換時不起作用,為什么?

    當前在調試PCM3070的時候,進行通道切換時不起作用,加載的EQ 數據在IN1也都已工作正常。 我的電路工作方式為三個模擬輸入(IN1,IN2,IN3),一個模擬輸出(LOL/R),采用DSP做為EQ處理。
    發表于 11-06 07:16

    常見MCU故障及解決辦法

    微控制器單元(MCU)是現代電子設備中的核心組件,負責處理和控制各種功能。然而,由于各種原因,MCU可能會出現故障。以下是一些常見的MCU故障及其解決辦法: 1. 電源問題 故障現象: MCU無法
    的頭像 發表于 11-01 13:41 ?614次閱讀

    TPA3112D1為什么不起作用了?

    您好,我有一塊TPA3112D1模塊之前用著一直是好的,但是突然就不起作用了,我想知道友們有辦法測試一下我的芯片是好是壞,是否工作正常??謝謝
    發表于 09-06 07:45

    通過system_restart WPS重新啟動esp8266首次連接不起作用,返回f r-15863的原因?

    當我通過system_restart WPS 重新啟動 esp8266 并首次連接不起作用時,返回 f r-15863。此信息: f r-15863 是什么意思?這種情況發生在一臺設備上,什么原因可能導致此問題?
    發表于 07-18 08:08

    AT CWHOSTNAME不起作用的原因?

    我想更改主機名,但在命令 AT CWHOSTNAME 不起作用。 我嘗試過 AT CWMODE_CUR=1 或 AT CWMODE_CUR=3,但我得到了相同的結果。 PS
    發表于 07-15 06:09

    無人機主動防御系統不起作用

    起作用。無人機主動防御系統是一種用于保護無人機免受攻擊的系統。這種系統可以有效地防止無人機被敵方攻擊,提高無人機的生存能力。然而,無人機主動防御系統并不是萬能的,它也存在一定的局限性。 一、無人機
    的頭像 發表于 07-08 09:57 ?455次閱讀

    stm32cubemx的功能不起作用是哪里的問題?

    最近幾個版本的stm32cubemx的功能不起作用: 在cube上有一個很好用的功能就是點按ctrl和click按鍵會讓alternative pin顯示出來,這個功能非常高效率。然而不知道是java的問題還是新版本的問題,目前的按鍵不起作用
    發表于 04-08 07:28

    Profinet IO通信故障的解決辦法

    Profinet IO通信故障可能由多種原因引起,以下是一些常見的通信故障及其解決辦法
    的頭像 發表于 03-08 11:27 ?1075次閱讀

    用中斷測試了CAN EVAL_BDPS_DRIVER,中斷不起作用的原因?

    我用中斷測試了 CAN EVAL_BDPS_DRIVER 。 但中斷不起作用。 根據我對配置文件所做的更改。 但EVAL_IM_FLEX_ADAPTER_V1未獲得正確的輸出。 請幫我解決這個問題。
    發表于 03-06 07:44

    TC387不起作用的原因?

    我使用的是 TC387。當我使用 Trace32 下載 *.elf 文件時,它運行良好。但是我使用 Trace32 下載了*.hex 文件,但它不起作用。即使我使用 Trace32 下載 *.elf
    發表于 02-27 08:02

    安裝了HighteCide和DAS來連接TriBoard然后使用它,為什么不起作用

    我試著用 TriBoard TC3X9 TH V2.01 我安裝了 HighteCide 和 DAS 來連接 TriBoard 然后使用它。 但是,它不起作用,我看到了這樣的窗口。 我
    發表于 01-30 08:28

    使用psoc63-ble進行計數,它不起作用的原因?

    我嘗試使用 psoc63-ble 進行計數,但它不起作用。 當我嘗試在 10MHz 下進行計數時,我只能在較低頻率范圍內進行計數。 我想知道 CAN 進行的最大計數是多少,以及如果我想以更高的值(例如 10 MHz 或更高)進行計數,如何編寫代碼。
    發表于 01-30 07:35

    TC377的EVADC配置,硬件觸發器不起作用的原因?

    我正在研究 TC377 的 EVADC 配置,我的頻道上有硬件觸發器 g0ch6-ATOM1_5(不起作用 ) g0ch 7-與 g2ch7 G1ch1-同步 G1ch1-ATOM1_ 4
    發表于 01-25 07:50

    模型訓練loss突刺原因和解決辦法

    PaLM和GLM130b之前的解決辦法是找到loss spike之前最近的checkpoint,更換之后的訓練樣本來避免loss spike的出現。
    的頭像 發表于 01-09 14:20 ?1243次閱讀
    大<b class='flag-5'>模型</b>訓練loss突刺原因和<b class='flag-5'>解決辦法</b>

    ad9371 radioOn() radioOff()函數不起作用是為什么?

    ),提示radio不在off/idle狀態, 執行MYKONOS_radioOn( mykDevice)時也顯示錯誤。 回讀radiostatus時一直為1(ready狀態)。后來我在這個地方加入radioon()和radiooff()函數后,發現無論怎么樣,radiostatus一直為1,函數不起作用
    發表于 12-12 08:05