精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

邊緣AI應用越來越普遍,AI模型在邊緣端如何部署?

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2023-07-04 00:11 ? 次閱讀

電子發燒友網報道(文/李彎彎)在人工智能時代,越來越多的AI應用需要從云端擴展到邊緣端,比如智能耳機、智能攝像機、智能手環、物流機器人等,在邊緣端部署AI已經成為趨勢。如今AI大模型迅猛發展,AI大模型在端側的部署也成了業界關注的焦點。

如何把AI模型在邊緣端部署

首先得軟硬件適配,硬件方面,適配的AI芯片越多越好,這樣對于工程師來說,就降低了端側模型適配遷移的難度,即使換一個設備也可以輕松部署上去;軟件方面,主要的操作系統需要做適配,包括Linux、Windows、AndroidiOS等,這樣無論是手機、PC都可以部署。還有框架適配,也是越全越好,比如PaddlePaddle、TensorFlow、PyTorch、Caffe、MXNet等。

其次是需要對模型進行壓縮,在保證高精度的同時,最好也能夠讓模型跑得更快更省內存,這里需要采用模型壓縮技術,比如模型量化、剪枝和蒸餾技術。尤其是如今AI大模型迅猛發展,未來大模型在端側的部署也少不了要用到壓縮技術。

可以說,模型壓縮技術是實現AI大模型在邊/端部署的核心技術。模型壓縮技術可在保有大模型原有性能和精度基本不變前提下降低對推理算力的需求。

具體來看,量化,即將浮點計算轉成低比特定點計算;網絡剪枝,即去除神經網絡中冗余的通道、神經元節點等;知識蒸餾,即將大模型作為教師模型,用其輸出訓練性能接近、結構更簡的模型。

以清華大學唐杰教授團隊2022年8月發布的1300億參數模型 GLM-130B 為例,原模型支持在一臺 A100 40G*8或 V100 32G*8 服務器上進行推理,而將模型量化至 INT 4精度后,相較INT 8精度其所需 GPU 內存降低50%,且可在一臺4×RTX 3090(24G)或 8×RTX 2080Ti (11G )服務器上進行推理。

眾多廠商實現AI大模型的端側部署

谷歌、高通、華為等廠商已經實現AI大模型在端側的部署。今年5月份,在Google/O開發者大會上,Google宣布了一個專門針對移動設備優化系統的TensorFlow新版本TensorFlowLite。這款被稱為TensorFlowLite的軟件庫,是可在移動設備上運行的深度學習工具,它允許開發人員在用戶的移動設備上實時地運行人工智能應用。

該軟件庫在設計上追求高速度和小儲存,支持iOS和Android系統。如果開發者使用其他系統,也可以經過一系列復雜而冗長的編譯流程,將TensorFlow編譯成移動操作系統所支持的軟件庫,這樣并不會改變TensorFlow的功能。

TensorFlowLite還提供了有限的預訓練人工智能模型,包括MobileNet和InceptionV3物體識別計算機模型,以及SmartReplay自然語言處理模型。開發者用自己的數據集做的定制模型也可以部署在上面。TensorFlowLite使用Android神經網絡應用程序界面(API),可以在沒有加速硬件時直接調用CPU來處理,確保其可以兼容不同設備。

高通技術公司產品管理高級副總裁兼AI負責人Ziad Asghar此前表示,隨著生成式AI的飛速普及,混合處理的重要性空前突顯?;旌咸幚鞟I的重要性空前突顯,正如傳統計算從大型主機和瘦客戶端演變為當前云端和邊緣終端相結合的模式,AI處理必須在云端和終端混合進行才能發揮其最大潛能。

根據高通的演示,將手機設置成“飛行模式”,再通過手機端全棧AI優化,這一模型能夠完全在終端側運行,實現在15秒內完成20步推理,生成飽含細節的圖像。很重要的是,即便在飛行模式下,這些AI能力都可以得到實現,例如將Stable Diffusion的能力集成到相機應用中之后,用戶在任何一個地點拍攝照片,再要求AI將照片背景改為夕陽之下的萬里長城。

Ziad Asghar透露,如果在云端運行一個超過10億參數的生成式AI模型,可能需要數百瓦的功耗,而在終端側運行需要的功耗僅有幾毫瓦。這賦予了高通在生成式AI領域的獨特優勢。不久的將來,擁有 100 億或更高參數的模型將能夠在終端上運行。

在今年3月春季旗艦新品發布會上,華為帶來全新智慧搜圖功能,基于多模態大模型技術,在手機端側對模型進行小型化處理,在業界率先實現了首創的、精準的自然語言手機圖庫搜索體驗。用戶可以像與人對話一樣,通過語音喚醒小藝,使用自然語言在手機圖庫中搜索出匹配如 “山頂看日出”、“圍爐煮茶”、“藍色珊瑚中的小丑魚”等描述的照片。

相較于傳統圖庫使用標簽進行照片搜索,存在準確率低、響應速度慢等問題,智慧搜圖更加“聰明”。結合多模態大模型技術,智慧搜圖對億級的圖文數據進行預訓練,增加了對泛化通用語義的理解,支持包含顏色、形狀、物體、行為、時間和地點等多信息組合的自然語言搜索,同時還實現了端側輕量化應用。

小結

由于AI在邊緣或者端側的部署具有諸多優勢,近年來AI在邊緣側的應用滲透率也越來越高。AI大模型迅猛發展,未來在終端的部署也是必然趨勢,眾多廠商已經對此進行探索,并有所突破,期待AI大模型未來能夠是實實在在賦能各行各業。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30239

    瀏覽量

    268474
收藏 人收藏

    評論

    相關推薦

    研華科技打造整體邊緣AI服務器解決方案

    近年來,AIoT數據量快速成長、硬件效能提升、綠色低碳意識抬頭等趨勢影響下,邊緣AI應用的系統架構也出現改變。隨著越來越多企業將AI
    的頭像 發表于 11-18 15:35 ?160次閱讀

    什么是邊緣AI?邊緣AI的供電挑戰

    RECOM 的 RACM1200-V 采用數字通信,可輕松集成到邊緣 AI設計中。
    的頭像 發表于 09-02 11:52 ?418次閱讀
    什么是<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>?<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>的供電挑戰

    廣和通AI解決方案榮膺MWCS 2024邊緣AI計算最佳創新獎

    近日舉行的2024世界移動通信大會·上海(MWCS 2024)上,廣和通憑借其卓越的AI解決方案榮獲2024信息通信業“新質推薦”——邊緣AI
    的頭像 發表于 06-28 15:44 ?716次閱讀

    ai邊緣盒子有哪些用途?ai視頻分析邊緣計算盒子詳解

    近年來,隨著人工智能和邊緣計算的發展,一種名為AI邊緣盒子的新型設備正逐漸引起廣泛關注。作為一種集成了邊緣計算和AI算法處理能力的設備,
    的頭像 發表于 05-29 14:24 ?904次閱讀
    <b class='flag-5'>ai</b><b class='flag-5'>邊緣</b>盒子有哪些用途?<b class='flag-5'>ai</b>視頻分析<b class='flag-5'>邊緣</b>計算盒子詳解

    支持大模型部署和運行的邊緣計算SoC芯片

    電子發燒友網報道(文/李彎彎)如今,AI邊緣側的應用越來越廣泛,這其中少不了AI SoC芯片的支持,
    的頭像 發表于 05-27 08:00 ?3231次閱讀

    主流邊緣AI算法,安防、零售、交通等領域的應用

    電子發燒友網報道(文/李彎彎)邊緣AI,是邊緣設備部署AI算法,其計算發生在靠近用戶和數據的網
    的頭像 發表于 05-13 01:56 ?2913次閱讀

    部署邊緣設備上的輕量級模型

    電子發燒友網報道(文/李彎彎)邊緣AI算法是一種將人工智能(AI)算法和計算能力放置接近數據源的終端設備中的策略。這種算法通常被部署
    的頭像 發表于 05-11 00:17 ?2551次閱讀

    NVIDIA與恩智浦聯手,邊緣設備上部署AI模型

    恩智浦工業及IoT邊緣高級副總裁Charles Dachs表示,人工智能的創新將塑造智能互聯世界的未來,融入Nvidia先進的AI培訓技術以及恩智浦工業及物聯網邊緣科研實力,將產生協
    的頭像 發表于 03-25 16:05 ?835次閱讀

    英特爾發布全新邊緣計算平臺,解決AI邊緣落地難題

    電子發燒友網報道(文/李彎彎)AI越來越多地邊緣部署。Gartner最新預測數據顯示,到2025年,50%以上的企業管理數據將在數據中心
    的頭像 發表于 03-12 09:06 ?4279次閱讀
    英特爾發布全新<b class='flag-5'>邊緣</b>計算平臺,解決<b class='flag-5'>AI</b><b class='flag-5'>邊緣</b>落地難題

    Supermicro全新系統產品組合將前沿AI性能推向邊緣計算環境

    模型(Pre-trained Model)及將AI推論解決方案部署產生數據的邊緣,進而縮短響
    的頭像 發表于 02-24 09:10 ?970次閱讀
    Supermicro全新系統產品組合將前沿<b class='flag-5'>AI</b>性能推向<b class='flag-5'>邊緣</b>計算環境

    什么是AI邊緣計算,AI邊緣計算的特點和優勢介紹

    隨著人工智能的迅猛發展,AI邊緣計算成為了熱門話題。那么什么是AI邊緣計算呢?簡單來說,它是將人工智能技術引入邊緣計算的新興領域,旨在將計算
    的頭像 發表于 02-01 11:42 ?836次閱讀

    通用Tensilica軟件堆棧提供最佳邊緣AI性能

    開發敏捷的軟件堆棧對 AI 邊緣側的成功部署非常重要。
    的頭像 發表于 01-18 13:39 ?751次閱讀
    通用Tensilica軟件堆棧提供最佳<b class='flag-5'>邊緣</b><b class='flag-5'>AI</b>性能

    AI邊緣計算機應用場景廣泛!大語言模型與數字人結合方案邊緣側落地

    。 ? 當下,AI邊緣側的部署正在成為趨勢,包括近年來備受矚目的大語言模型,
    的頭像 發表于 01-16 01:11 ?4386次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>邊緣</b>計算機應用場景廣泛!大語言<b class='flag-5'>模型</b>與數字人結合方案<b class='flag-5'>在</b><b class='flag-5'>邊緣</b>側落地

    邊緣AI它到底是什么?能做什么?

    邊緣,減少了數據的傳輸延遲和依賴云端的通信需求。邊緣AI能夠接近數據源的設備上進行實時決策和推理,這為許多應用領域帶來了革命性的改變。 邊緣
    的頭像 發表于 01-11 14:44 ?1250次閱讀

    邊緣部署模型優勢多!模型量化解決邊緣設備資源限制問題

    設備上,可以減少數據傳輸的延遲和帶寬需求,提高模型的實時性和響應速度。 ? 邊緣部署模型的優勢 ?
    的頭像 發表于 01-05 00:06 ?3395次閱讀