精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI 創新的阻礙是對現有計算利用不足和成本增加

如意 ? 來源:讀芯術微信公眾號 ? 作者:讀芯術微信公眾號 ? 2020-11-02 15:02 ? 次閱讀

雖然人工智能融合到商業具有很高的商業價值,但通常這個價值還不能抵消把模型應用到商業中所需的計算成本。機器學習深度學習是計算密集型的學習,有人認為,除非云計算或本地計算成本降低,否則盡管具有空前的商業價值,也不值得付出這筆成本。

麻省理工學院的研究科學家兼《深度學習的計算極限》一書的作者尼爾·湯普森(Neil Thompson)在《連線》雜志上發表的文章中提到,Google、Facebook等眾多組織已經建立了影響力廣又能節約成本的模型,但由于計算成本高而導致這些模型無法盈利。

湯普森表示在最近的一些演講和論文中表示,從事大型和前沿人工智能項目的研究人員開始抱怨,因為成本太高,他們無法測試多個算法設計,或者重新進行實驗。

商業機構需要極大地完善計算效率的方法,以促進創新并提高人工智能工作的投資回報率。但是,高昂的計算成本以及人們對高效計算的關注并不應該就此背黑鍋。

實際上,GPU加速基礎架構和其他云供應商已經取得了重大的進步,極大提高了訓練復雜人工智能網絡的能力,這種速度是前所未有的。

2020年5月,DeepCube發布了基于軟件的推理加速器,大大提高了所有現有硬件上的深度學習性能。換句話說,人們正在開發計算解決方案以滿足機器學習和深度學習日益增長的需求。人工智能創新潛在的阻礙就是對現有計算利用不足,以及“計算債務”的成本不斷增加。

什么是“計算債務”?

人工智能的領頭羊或許會驚訝地發現,阻礙機器學習投資回報的主要因素之一是GPU,CPU和內存資源利用不足。

公司在計算上投資了數百萬美元,這些計算有可能極大地加速人工智能工作的負載量并提高性能,但最終只利用其中的一小部分,有時只利用了20%的資源。計算分配和實際利用率之間的差距令人震驚,可能需要公司付出比想象中更高的成本。

計算、分配和利用率之間的差距可稱為“計算債務”。指的是分配和能力之間的“浪費”。下圖直觀地對比了綠色所代表的平均利用率和黃色所代表的(當時的)分配。

當工作負載正在運行時,通常僅利用GPU的一部分,而另一部分則被其他潛在的工作負載所阻擋。灰色區域表示容量即GPU,CPU或內存可用的現有計算量,是所有閑置且未充分利用的計算區域。

資料來源:cnvrg.io

是什么導致了“計算債務”?

機器學習和深度學習是計算密集型的學習,管理起來很復雜,降低這種計算負擔會更難。人工智能基礎設施團隊面臨的最大挑戰之一是知道如何提高利用率,并以最大化消耗的方式管理資源,提高機器學習項目的投資回報率。導致“計算債務”的主要原因包括:

(1) 基礎設施團隊缺乏人工智能項目可見性

機器學習項目的基礎設施成本每年以兩倍的速度增長,但是IT團隊卻缺乏正確管理、優化和預算機器學習資源的工具。大多數IT/DevOps領導者無法在給定時間了解GPU/CPU和內存的利用率、分配和容量。這導致無法控制消耗,無法提高效率。

(2) “計算債務”增長

隨著人工智能計算需求變得越來越復雜,計算分配和實際利用率之間的差距也越來越大。通常來說,公司可能只消耗了全部資源的30%。這導致將近70%的計算資源閑置,浪費了公司幾千甚至數百萬美元。

(3) 無法識別效率低下的工作

基礎架構團隊無法輕松識別未充分利用GPU/CPU的工作負載。如果沒有收集有關歷史工作負載的數據,就無法分析和識別運行效率低下的工作負載。缺乏可見性導致難以提高利用率,也難以控制工作負載的優先級。

(4) 生產力中斷

未充分利用的GPU被打斷為其他工作讓路,增加了數據科學家的等待時間。這導致在等待GPU上浪費了很多時間和資源。同時還包括資源處于閑置狀態的問題,這些資源本來可以用于做其他工作的。

(5) 缺乏標準化和統一性

團隊經常無法將一項工作與利用率指標關聯起來。沒有標準的可視化工具來查看特定時間點的工作分配、利用率和容量。這使得識別效率低下的工作變得十分困難,而且難以確定浪費的工作量。機器學習已經達到了成熟的階段,為了成長,必須對人工智能基礎架構進行戰略化發展。

(6) 無法控制優化策略

有些團隊能識別低效率并計劃好優化的基礎架構策略,卻缺乏執行這些策略上的工具。IT / DevOps團隊需要控制人工智能工作負載,以優化資源管理。如果沒有辦法確定工作的優先級、配置計算模板以及監視工作負載的分配和利用率,就無法做出重大改進。

減少“計算債務”的策略

這一問題沒有明確的解決方法,但是有一些方法可以提高資源管理的效率。

(1) 投資最先進的具有GPU加速技術的人工智能基礎設施

GPU加速技術已經取得了一些成就。硬件和軟件深度學習加速解決方案已經出現,可提供前所未有的計算性能。研究最新的GPU加速解決方案,采用真正的現代人工智能基礎架構。

(2) 采用混合的云基礎架構

結合公共云、私有云和本地資源可在運行人工智能工作負載方面更加敏捷和靈活。由于人工智能工作負載之間的負載類型差異很大,因此公司搭建了混合云基礎架構后,能夠更靈活地分配資源和自定義大小。可以使用公共云降低資本支出,并提供高計算需求期間所需的可伸縮性。

如果一些公司有著嚴格的安全性要求,則必須添加私有云,隨著時間的推移可降低運營支出。混合云可實現必要的控制和靈活性,以改善資源預算。

(3) 利用估算工具估算GPU / CPU內存消耗

根據Microsoft Research對Microsoft的4960個失敗的深度學習任務的研究,8.8%的失敗是由GPU內存耗盡導致的,這是所有深度學習故障中最主要的問題。當前已經開發出許多估算工具用以預估GPU內存消耗以減少這些故障。此外,如果能夠收集利用率數據,則可以使用此歷史數據更好地預測每個季度的GPU / CPU和內存需求。

(4) 規模化MLOps

引入可以簡化機器學習工作流程,并標準化科學和工程角色之間轉換的方法。由于IT和DevOps負責部署和管理工作負載,因此在執行不同的工作時擁有清晰的溝通渠道非常重要。適當的調度工具和對資源模板進行策略化可以改善人工智能工作負載的資源管理。

(5) 最大限度地提高利用率,減少“計算債務”

為了提高利用率,有必要將計算債務作為基礎架構團隊和數據科學團隊的KPI。如果公司能減少計算債務并提高利用率,就可以在向人工智能的競爭中脫穎而出。

要想讓基礎架構團隊最大限度地提高GPU/CPU的可見性和內存消耗從而提高利用率,基本上是沒有萬全之策。盡管業界正在迅速構建更高效的硬件和軟件來解決計算債務的威脅,但仍然任重而道遠。很多公司花費了幾百萬美元在計算上,而這些計算并未被充分利用。

通過使用現有資源并完善資源管理,公司可以使人工智能基礎架構具有巨大的可擴展性。根據文章中的策略,你可以完全利用好計算資源。公司若專注于優化基礎架構,將會看到辛苦付出得到更高的投資回報率,從而在競爭中獲得優勢。
責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算
    +關注

    關注

    2

    文章

    445

    瀏覽量

    38737
  • AI
    AI
    +關注

    關注

    87

    文章

    30191

    瀏覽量

    268444
  • 人工智能
    +關注

    關注

    1791

    文章

    46877

    瀏覽量

    237614
  • 機器學習
    +關注

    關注

    66

    文章

    8381

    瀏覽量

    132425
收藏 人收藏

    評論

    相關推薦

    深度評測:云計算平臺的優勢和不足

    計算平臺具有成本效益、靈活性和可擴展性、簡化維護和升級、全球訪問性以及災難恢復等優勢,但也面臨安全性問題、依賴性問題、合規性和隱私問題、性能限制以及遷移復雜性等挑戰。企業在采用云計算之前需要仔細權衡這些優勢和
    的頭像 發表于 11-22 10:48 ?97次閱讀

    PCB層數增加對成本有哪些影響

    PCB層數增加成本影響 層數與成本的關系 :通常情況下,PCB的層數越多,其價格也越貴。這是因為層數的增加會導致生產步驟(如層壓過程)的數量增加
    的頭像 發表于 11-07 09:12 ?212次閱讀

    阻礙計算采用5種原因

    盡管云計算在企業和普通用戶未來的計算需求里占據重要位置,但云計算存在的一切缺點和瑕疵還是在阻礙著企業和組織采用云計算。在云服務交付中扮演重要
    的頭像 發表于 10-23 10:57 ?132次閱讀

    中國AI企業創新降低成本打造競爭力模型

    在中國,面對美國實施的芯片限制以及相較于西方企業更為有限的預算,人工智能(AI)公司正積極尋求降低成本的方法,以開發出具有市場競爭力的模型。初創公司如01.ai(零一萬物)和DeepSeek(深度求索)等,通過聚焦小數據集進行
    的頭像 發表于 10-22 14:56 ?351次閱讀

    AI for Science:人工智能驅動科學創新》第6章人AI與能源科學讀后感

    幸得一好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅動科學創新》的第6章后,我深刻感受到人工智能在能源科學領域中的巨大潛力和廣泛應用。這一章詳細
    發表于 10-14 09:27

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    很幸運社區給我一個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅動科學創新》第4章關于AI與生命科學的部分,為我們揭示了人工智能技術在生命科學領域中的廣泛應用和深遠影響。在
    發表于 10-14 09:21

    AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得

    非常高興本周末收到一本新書,也非常感謝平臺提供閱讀機會。 這是一本挺好的書,包裝精美,內容詳實,干活滿滿。 關于《AI for Science:人工智能驅動科學創新》第二章“AI
    發表于 10-14 09:16

    AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得

    ,還促進了新理論、新技術的誕生。 3. 挑戰與機遇并存 盡管人工智能為科學創新帶來了巨大潛力,但第一章也誠實地討論了伴隨而來的挑戰。數據隱私、算法偏見、倫理道德等問題不容忽視。如何在利用AI提升科研效率
    發表于 10-14 09:12

    利用AI構建實用量子計算應用

    在實踐中構建實用量子計算機的難度極高,這需要大幅提高量子計算機的規模、保真度、速度、可靠性和可編程性,才能充分發揮其優勢。另外,還需要功能強大的工具以解決許多阻礙實現實用量子計算的復雜
    的頭像 發表于 09-09 10:24 ?305次閱讀
    <b class='flag-5'>利用</b><b class='flag-5'>AI</b>構建實用量子<b class='flag-5'>計算</b>應用

    NVIDIA在加速計算和生成式AI領域的創新

    在最新發布的公司 2024 財年可持續發展報告開篇的一封信中,NVIDIA 創始人兼首席執行官黃仁勛介紹了 NVIDIA 在加速計算和生成式 AI 領域的創新,以及 AI 技術在提高生
    的頭像 發表于 09-09 09:18 ?497次閱讀

    如何利用AI進行提升自我呢?

    利用AI進行學習是一個高效且富有創新性的過程。以下是一些建議,幫助你充分利用AI進行學習: 選擇適合的A
    的頭像 發表于 07-19 10:46 ?496次閱讀

    平衡創新與倫理:AI時代的隱私保護和算法公平

    ,如果醫生和患者都能了解AI推薦治療方案的原因,將大大增加對技術的接受度和信任。 算法公平性的保障同樣不可或缺。AI系統在設計時就需要考慮到多樣性和包容性,避免因為訓練數據的偏差而導致結果的不公平
    發表于 07-16 15:07

    廣和通端側AI解決方案榮膺MWCS 2024邊緣AI計算最佳創新

    在近日舉行的2024世界移動通信大會·上海(MWCS 2024)上,廣和通憑借其卓越的端側AI解決方案榮獲2024信息通信業“新質推薦”——邊緣AI計算最佳創新方案獎。這一榮譽不僅彰顯
    的頭像 發表于 06-28 15:44 ?716次閱讀

    Imagination 引領邊緣計算AI創新,擁抱AI未來發展

    6月25日,2024“N+”AI互動創新論壇在南京舉辦,Imagination中國資深副總裁張曉波受邀出席。在主題演講中,張曉波表示,Imagination作為圖形、計算和邊緣人工智能領域的領導者
    的頭像 發表于 06-28 08:28 ?509次閱讀
    Imagination 引領邊緣<b class='flag-5'>計算</b>和<b class='flag-5'>AI</b><b class='flag-5'>創新</b>,擁抱<b class='flag-5'>AI</b>未來發展

    計算與企業IT成本治理

    時至今日,云計算已逐步替代傳統IT中服務器、存儲、虛擬化等單體軟硬件的IT架構,成為企業IT能力中最重要的組成部分。企業在利用計算帶來的便利、敏捷的同時,也越來越多依靠云計算提供的持
    的頭像 發表于 06-19 09:40 ?500次閱讀
    云<b class='flag-5'>計算</b>與企業IT<b class='flag-5'>成本</b>治理