精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習算法的實現時所面臨的問題及相關開源軟件

如意 ? 來源:CSDN ? 作者:Soren Sonnenburg等 ? 2020-08-17 16:57 ? 次閱讀

開源工具已經趨于成熟,這使其能構建大規模的自然場景下的系統。與此同時,機器學習領域為各種應用開發了大量強大的學習算法。但是,由于沒有公開共享現有的實現方式,去真正的利用這些方法,從而導致軟件的可用性和互操性較弱。

本文作者認為,可以通過提高研究人員在源代碼模型下發布軟件的動機來明顯改善這種情況。此外,本文概述了作者在嘗試發布機器學習算法的實現時所面臨的問題。作者認為,經過同行評審的軟件資源以及簡短的文檔對機器學習和整個科學界非常有價值。

概述

機器學習領域發展迅速,為不同的應用提供了各種各樣的學習算法。這些算法的最終價值在很大程度上取決于它們在解決實際問題中的成功。因此,將算法進行復制并應用于新任務對于該領域的進步至關重要。

但是,目前很少有機器學習研究人員發布與其論文相關的軟件和/或源代碼。這與生物信息學界的做法形成了鮮明對比,后者的開源軟件已經成為進一步研究的基礎。缺少公開可用的算法實現是我們這一學科進步的主要障礙。

我們相信,機器學習軟件的開源共享可以在消除障礙方面發揮非常重要的作用。

開源模型具有許多優勢,這些優勢將帶來更好的實驗結果重現性:更快地檢測錯誤,創新性應用以及在其他學科和行業中更快地采用機器學習方法。但是,目前缺乏完善和發布軟件的動機。已發布的軟件本身在我們領域中沒有標準的,可接受的引用方式。

目前引用它的唯一方法是引用與代碼相關聯的論文,或者通過引用以某種技術報告的形式發布的用戶手冊。為了解決這一難題,本文提出了一種正式發布機器學習軟件的方法,類似于ACM Transactions on Mathematical Software提供的用于數值分析的方法。

注:本文作者隨后簡要解釋了開源軟件背后的思想,然后介紹了廣泛采用開源的模型將產生的一些積極影響。接下來,本文討論了當前主要的阻礙,并提出可能的改變以改善這種情況。最后,作者為JMLR(JMLR-MLOSS)中的機器學習開源軟件提出了一個新的、單獨的track。

開源背后的思想

開源軟件的基本思想非常簡單;程序員或用戶可以閱讀,修改和重新分發軟件的源代碼。盡管有各種開源軟件許可,但它們都有一個共同的出發點,那就是允許自由交換和使用信息。開源模型更注重貢獻者的協作。每個貢獻者都可以利用網絡中其他人所做的工作,從而最大程度地減少“重新造輪子”所花費的時間。

開源的軟件主要有下面的10個屬性:

1.免費重新使用

2.源代碼

3.衍生作品

4.作者源代碼的完整性

5.不歧視個人或群體

6.不歧視工作領域

7.許可證的分配

8.許可不得用于特定產品

9.許可不得限制其他軟件

10.許可必須是技術中立的

開源的積極影響

這一部分主要是簡要概述開源軟件及其與科學活動(特別是機器學習)的關系。讀者可能會認為我們對開源的好處過于樂觀,而沒有討論負面影響。事實是,要獲得專有系統與開源軟件之間抄襲的確鑿證據是極其困難的。

本文從道德,倫理和社會基礎三個方面進行闡釋,開源應該是機器學習研究的首選軟件發布選項,并向讀者介紹開源軟件的許多優點。在這里,本文將重點放在用于機器學習研究的開源軟件的特定優勢上,該優勢結合了科學進步以及軟件生產者和消費者的需求和要求。作者從以下7點說明了開源的優勢:

1.科學結果的可重復性和算法的合理比較;

2.發現問題;

3.利用已有資源(而不是重新實現);

4.不斷獲得科學的工具;

5.優勢結合;

6.在不同學科和行業中更快地適用某方法;

7.出現協同標準。

最后,作者使用一個表格總結了開源會帶來的優點,一共有11條,分別如下:

1.提高了科學研究的可復現性

2.有助于公平比較在相同框架中實施的算法

3.可以更快地發現問題

4.可以修復bug和擴展外部來源的錯誤

5.方法可以被其他人更快地采用

6.可以使用高效的算法

7.能利用現有資源來幫助新研究

8.廣泛的使用算法會使其得到廣泛的認可

9.可以開發更復雜的機器學習算法

10.可以加速研究進展

11.對新研究者和較小的研究小組非常有幫助

開源社區當前主要的障礙

盡管根據開源模型發布實現方式具有許多優點,但是當前很少采用此選項。作者認為,有六個主要的原因,總結起來概括如下:

1、發布軟件不能夠被視為一種科學貢獻

2、公開與商業利益存在根源上的沖突

3、發布開源軟件的激勵措施沒有足夠高

4、機器學習研究人員不是一個優秀的程序員

5、這種松懈能掩蓋新方法的問題,并降低會議和期刊的接收難度

6、存在一種習慣,對質量相似的論文采用相同的處理方法

建議

作者給出了提交高質量機器學習開源軟件實現的描述。提交的內容至少應包括:

1、一封書面信,說明該提交內容適用于機器學習開源軟件部分,發布該軟件的開源許可證,項目的網址以及要查看的軟件版本。

2、最多四頁基于JMLR格式的描述。

3、包含源代碼和文檔的zip或tar壓縮的歸檔文件。

結論

綜上,作者認為,采用共享信息的開源模型來實現機器學習軟件對整個領域都非常有幫助。開源模型具有許多優勢,例如提高了實驗結果的可重復性,更快地檢測錯誤,加速科學進步以及在其他學科和行業中更快地采用了機器學習方法。由于當前發布開源軟件的動機不足,本文概述了一個發布用于機器學習的軟件平臺。

此外,本文討論了機器學習軟件的理想功能,這些功能最終將產生一個高度可用,靈活和可擴展的軟件。本文邀請所有開發機器學習算法的機器學習研究人員提交機器學習軟件的JMLR track。定義精心設計的界面對于提高交互操作至關重要,這將使社區能構建一套高質量的機器學習軟件。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4600

    瀏覽量

    92647
  • 人工智能
    +關注

    關注

    1791

    文章

    46872

    瀏覽量

    237594
  • 機器學習
    +關注

    關注

    66

    文章

    8378

    瀏覽量

    132415
收藏 人收藏

    評論

    相關推薦

    【「從算法到電路—數字芯片算法的電路實現」閱讀體驗】+介紹基礎硬件算法模塊

    作為嵌入式開發者往往比較關注硬件和軟件的協調。本書介紹了除法器,信號發生器,濾波器,分頻器等基本算法的電路實現,雖然都是基礎內容,但是也是最常用到的基本模塊。 隨著逆全球化趨勢的出現,過去的研發
    發表于 11-21 17:05

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度
    的頭像 發表于 11-15 09:19 ?316次閱讀

    “0元購”智元靈犀X1機器人,軟硬件全套圖紙和代碼全公開!資料免費下載!

    軟件算法代碼+高性能關節電機,讓“人形機器人人人造”的理想真正成為現實,不管是愛好者還是科技達人,都能夠迅速搭建機器人并實現基本的行走功能
    發表于 10-25 15:20

    深度學習算法在嵌入式平臺上的部署

    隨著人工智能技術的飛速發展,深度學習算法在各個領域的應用日益廣泛。然而,將深度學習算法部署到資源受限的嵌入式平臺上,仍然是一個具有挑戰性的任務。本文將從嵌入式平臺的特點、深度
    的頭像 發表于 07-15 10:03 ?1184次閱讀

    利用Matlab函數實現深度學習算法

    在Matlab中實現深度學習算法是一個復雜但強大的過程,可以應用于各種領域,如圖像識別、自然語言處理、時間序列預測等。這里,我將概述一個基本的流程,包括環境設置、數據準備、模型設計、訓練過程、以及測試和評估,并提供一個基于Mat
    的頭像 發表于 07-14 14:21 ?1915次閱讀

    開啟開源布道新篇章 — LF開源軟件學園誠邀開源精英加入成為OSPO講師

    OSPO——企業開源戰略的引擎在當今數字化時代,開源軟件已成為推動全球技術創新的加速器。它不僅重塑了軟件開發的模式,更成為企業構建競爭優勢的關鍵。然而,隨著
    的頭像 發表于 07-04 08:36 ?271次閱讀
    開啟<b class='flag-5'>開源</b>布道新篇章 — LF<b class='flag-5'>開源</b><b class='flag-5'>軟件</b>學園誠邀<b class='flag-5'>開源</b>精英加入成為OSPO講師

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數據中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發表于 07-02 11:25 ?785次閱讀

    機器學習的經典算法與應用

    關于數據機器學習就是喂入算法和數據,讓算法從數據中尋找一種相應的關系。Iris鳶尾花數據集是一個經典數據集,在統計學習
    的頭像 發表于 06-27 08:27 ?1576次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的經典<b class='flag-5'>算法</b>與應用

    機器學習8大調參技巧

    今天給大家一篇關于機器學習調參技巧的文章。超參數調優是機器學習例程中的基本步驟之一。該方法也稱為超參數優化,需要搜索超參數的最佳配置以實現
    的頭像 發表于 03-23 08:26 ?565次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>8大調參技巧

    人工智能和機器學習的頂級開發板有哪些?

    機器學習(ML)和人工智能(AI)不再局限于高端服務器或云平臺。得益于集成電路(IC)和軟件技術的新發展,在微型控制器和微型計算機上實現機器
    的頭像 發表于 02-29 18:59 ?768次閱讀
    人工智能和<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的頂級開發板有哪些?

    AI算法的本質是模擬人類智能,讓機器實現智能化

    電子發燒友網報道(文/李彎彎)AI算法是人工智能領域中使用的算法,用于模擬、延伸和擴展人的智能。這些算法可以通過機器學習、深度
    的頭像 發表于 02-07 00:07 ?5626次閱讀

    開源項目!教你如何復刻自平衡賽車機器人、智能家居中控、競技機器人先進模糊控制器等

    開源項目作品 為了方便大家更好提升自己,電子發燒友小編為大家整理了一些工程師大佬設計的開源項目作品,供大家可以參考學習,希望對廣大工程師有所幫助。 1.用全志R128復刻自平衡賽車機器
    發表于 12-26 09:17

    開源作品!稚暉君超迷你低成本開發板、超酷機器人、智能手環等參考方案

    開源項目作品秀 為了方便大家更好提升自己,電子發燒友小編為大家整理了一些工程師大佬設計的開源項目作品,供大家可以參考學習,希望對廣大工程師有所幫助。 1.基于NRF51822的開源
    發表于 12-12 10:28

    解鎖未來軟件安全的利器——華為云 CodeArts 開源治理服務

    在當今數字化時代,軟件安全問題愈發突顯,而開源軟件的廣泛應用更是為安全挑戰蒙上了一層陰影。開源軟件漏洞的逐年增多成為
    的頭像 發表于 12-10 21:01 ?891次閱讀
    解鎖未來<b class='flag-5'>軟件</b>安全的利器——華為云 CodeArts <b class='flag-5'>開源</b>治理服務