精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AT&T利用GPU優化速度、成本和效率

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-10-11 11:08 ? 次閱讀

眾所周知, GPU 是大型機器學習( ML )應用程序的典型解決方案,但如果 GPU 應用于 AI 管道數據的早期階段,該怎么辦?

例如,如果不必為每個管道處理階段切換集群配置,則會更簡單。您可能仍然有一些問題:

從成本角度來看,這是否可行?

對于一些接近實時處理的數據處理時間預算,您還能滿足 SLA 嗎?

優化這些 GPU 集群有多困難?

如果您為一個階段優化了配置,那么其他階段也會這樣嗎?

在 At&T ,當我們的數據團隊在規模上平衡簡單性的同時管理云成本時,這些問題就出現了。我們還觀察到,我們的許多數據工程師和科學家同事都不知道 GPU 是一個有效和高效的基礎設施,可以在其上運行更普通的 ETL ,并具有工程階段的特點。

與 GPU 配置相比, CPU 的相對性能也不清楚。我們在 at & T 的目標是運行一些典型的配置示例以了解差異。

在本文中,我們將從速度、成本和完整管道的簡單性方面分享我們的數據管道分析。我們還提供有關設計考慮的見解,并解釋我們如何優化 GPU 集群的性能和價格。優化來自于使用 RAPIDS accelerator for Apache Spark, 這一開源庫,它支持 GPU 加速 ETL 和特性工程。

SPOILER ALERT :我們驚喜地發現,至少對于所研究的示例來說,在每個管道階段使用 GPU 證明是更快、更便宜、更簡單的!

用例

AI 管道的數據包括多個批處理階段:

數據準備或聯合

轉型

功能工程

數據提取

批處理涉及處理包含數萬億條記錄的大量數據。批處理作業通常針對成本或性能進行優化,具體取決于該用例的 SLA 。

針對成本進行優化的批處理作業的一個很好的例子是從調用記錄中創建功能,這些功能將用于訓練 ML 模型。另一方面,用于檢測欺詐的實時推理用例針對性能進行了優化。 GPU 經常被忽視,對于 AI / ML 管道的這些批處理階段來說,它被認為是昂貴的。

這些批處理作業通常涉及大型聯接、聚合、排名和轉換操作。可以想象, AT & T 有許多涉及批量處理的數據和 AI 用例:

網絡規劃和優化

欺詐

銷售和營銷

根據用例的不同,這些管道可以使用 NVIDIA GPU 和 RAPIDS Accelerator for Apache Spark 來優化成本或提高性能。

為了進行此分析,我們查看了兩個到 AI 管道的數據。第一個用例將呼叫記錄的特征工程用于營銷用例,第二個用例執行復雜稅務數據集的 ETL 轉換。

使用 GPU 加速特征工程和轉換

高效地將數據擴展到 AI 管道仍然是數據團隊的需要。高成本的管道每月、每周甚至每天都要處理數百 TB 到 PB 的數據。

在檢查效率時,重要的是確定所有 ETL 和特征工程階段的優化機會,然后比較速度、成本和管道簡單性。

對于我們的數據管道分析,我們比較了三個選項:

各種基于 CPU 的 Spark 集群解決方案

GPU Spark 集群上的 RAPIDS accelerator for Apache Spark

使用 Databricks 最新發布的 Photon 引擎的 Apache Spark CPU 集群

為了衡量我們離最佳成本有多遠,我們使用 AT & T 的開源 GS-lite 解決方案比較了一個基本 VM 解決方案,該解決方案使您能夠編寫 SQL ,然后將其編譯為 C ++。

如前所述,在優化每個解決方案后,我們發現在 GPU 集群上運行的 Apache Spark 加速器具有最佳的總體速度、成本和設計簡單性權衡。

在下面的部分中,我們將討論為每種類型選擇的優化和設計注意事項。

優化 AI / ML 管道解決方案的設計考慮

為了比較這三個潛在解決方案的性能,我們進行了兩個實驗,每個實驗針對選定的用例。對于每種情況,我們都優化了不同的參數,以深入了解速度、成本和設計是如何受到影響的。

示例 1 :通過聚合為呼叫記錄優化簡單組用例

對于第一個特性工程示例,我們選擇從每月包含近 3 萬億條記錄(行)的調用記錄數據集創建特性(表 1 )。此數據預處理用例是幾個銷售和營銷 AI 管道中的基本構建塊,例如客戶細分、預測客戶流失以及預測客戶趨勢和情緒。在這個用例中有各種各樣的數據轉換,但其中許多都涉及簡單的“分組”聚合,例如下面的聚合,我們希望對其進行優化處理。

res=spark.sql("""
Select DataHour, dev_id, 
    sum(fromsubbytes) as fromsubbytes_total, 
    sum(tosubbytes) as tosubbytes_total, 
From df
Group By DataHour, dev_id
""")

從數據中獲取見解并進行數據分析仍然是許多企業的最大痛點之一。這并不是因為缺乏數據,而是因為在數據準備和分析上花費的時間仍然是數據工程師和數據科學家的障礙。

以下是此預處理示例中的一些關鍵基礎架構挑戰:

CPU 集群上的查詢執行時間過長,導致超時問題。

計算成本昂貴。

poYBAGNE3pSAEr0yAAAcrDLXpwY823.png

此外,這個調用記錄用例在壓縮類型方面有額外的實驗維度。數據通過某種形式的壓縮從網絡邊緣到達云端,我們可以指定并評估折衷。因此,我們試驗了幾種壓縮方案,包括 txt / gzip 、 Parquet / Z 標準和 Parquet / Snappy 。

Z 標準壓縮的文件大小最小(在本例中約為一半)。正如我們稍后所展示的,我們發現了與 Parquet / Snappy 更好的速度/成本權衡。

接下來,我們考慮了集群的類型,包括每個 VM 的內核數、 VM 數、工作節點的分配,以及是使用 CPU 還是 GPU 。

對于 CPU 集群,我們選擇了能夠處理工作負載的最低數量的核心,即 VM 和工人的最低數量,以防止資源過度分配。

對于 GPU ,我們使用了 RAPIDS Accelerator 調優指南[spark rapids tuning],該指南針對每個執行器的并發任務、 maxPartitionBytes 、 shuffle 分區和并發 GPU 任務提供了分級建議。

在 GPU 上實施數據處理后的一個目標是確保所有關鍵特征工程步驟都保留在 GPU 上(圖 1 )。

poYBAGNE3kiAQHNtAAHZy8Bn9kQ530.png

圖 1. GPU 物理處理計劃

示例 2 :為稅務數據集優化多個 ETL 和功能創建階段

示例 2 的用例允許我們比較 ETL 、特性創建和 AI 的許多不同轉換和處理階段。每個階段有不同的記錄體積大小(圖 2 )。

pYYBAGNE3kmAePVGAAC3aT-PQMY480.png

圖 2.ETL / AI 流量和記錄體積大小

這種具有多個階段的 ETL 管道是數據存儲在豎井中的企業中的常見瓶頸。大多數情況下,海量數據處理需要使用模糊邏輯查詢和連接來自兩個或多個數據源的數據。如圖 2 所示,盡管我們一開始只有 2000 萬行數據,但隨著數據處理階段的推移,數據量呈指數級增長。

如示例 1 所示,在比較 CPU 和 GPU 時,設計考慮的是每個 VM 的內核數、 VM 數和工作節點的分配。

后果

在為示例 1 和 2 中所示的用例嘗試了不同的核心、工作機和集群配置之后,我們收集了結果。我們確保在分配的時間內完成任何特定 ETL 作業,以跟上數據輸入數據速率。兩者中最好的方法都具有最低的成本和最高的簡單性。

示例 1 結果

圖 3 顯示了調用記錄用例中簡單分組聚合的一系列設置之間的成本/速度權衡。您可以進行幾個觀察:

成本最低、最簡單的解決方案是使用具有 Snappy 壓縮功能的 GPU 集群,它比成本最低的 Photon 解決方案便宜約 33% ,比最快的 Photon 方案便宜近一半。

所有標準 Databricks 集群在成本和執行時間方面都表現較差。光子是最好的 CPU 溶液。

雖然圖 3 中沒有顯示,但 GS-lite 解決方案實際上是最便宜的,只需要兩個 VM 。

poYBAGNE3kmAKdAIAAEf6W_ONwc173.png

圖 3.不同 Databricks 集群配置的成本/執行和時間權衡

示例 2 結果

與示例 1 一樣,我們使用 Databricks 10.4 LTS ML 運行時為五個 ETL 和 AI 數據處理階段嘗試了幾個 CPU 和 GPU 集群配置。表 2 顯示了得到的最佳配置。

poYBAGNE3q-AHo82AAA6c2-Udjc387.png

這些配置產生了有利于 GPU 的相對成本和執行時間(速度)性能(圖 4 )。

pYYBAGNE3kqAW4dsAAD1wpvFNME979.png

圖 4.成本和執行時間權衡

雖然此處未顯示,但我們確認,示例 1 中使用 XGBoost 建模的 AI 管道的下一階段也受益于 GPU 和 RAPIDS Accelerator for Apache Spark 。這證實了 GPU 可能是最好的端到端解決方案。

結論

雖然并非所有 AT & T 數據和 AI 管道都詳盡無遺,但基于 GPU 的管道似乎在所有示例中都是有益的。在這些情況下,我們能夠減少數據準備、模型培訓和優化的時間。這導致在更簡單的設計上花費更少的錢,因為沒有跨階段的配置切換。

關于作者

作為 at & T 數據科學副總裁, Mark Austin 博士領導了數百名數據科學家和工程師團隊,他們實施了新的創新技術,幫助 at & T 業務部門采用人工智能和機器學習技術。他獲得了馬里蘭大學和佐治亞理工大學的電氣電子工程學士和碩士學位。奧斯汀博士還擁有佐治亞科技大學的電氣工程博士學位。

Satya Vivek Kanakadandila 是 at & T 的主要大數據軟件工程師,他利用自己在軟件開發方面的豐富經驗為公司的數據驅動計劃構建新功能。 Kanakadandila 擁有德克薩斯理工大學電氣和計算機工程碩士學位。他在 Hive 、 Apache Spark 、需求分析、數據工程和 shell 腳本編寫方面也有豐富的經驗。

Abhay Dabholkar 是一位實踐經驗豐富的 AI / ML 和大數據軟件工程主管,在大規模轉型、制定業務戰略和領導端到端數據科學/ AI 項目方面具有豐富經驗。 Abhay 目前是 at & T 杰出的 AI / ML 企業架構師,他建立并領導了全球分布的高績效團隊。 Abhay 還參與了數據科學和文本分析領域的多項專利。

Chris Vo 是 at & T 技術人員的主要成員。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10827

    瀏覽量

    211177
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4703

    瀏覽量

    128716
  • 機器學習
    +關注

    關注

    66

    文章

    8381

    瀏覽量

    132431
收藏 人收藏

    評論

    相關推薦

    AT&;T Project AirGig網絡建設方案

    AT&;T的Project AirGig自2016年10月推出以來,一直披著神秘的面紗,一度被貼上“黑科技”、“革命性”的標簽。兩天前,一份來自EJL Wireless Researchon
    發表于 06-12 07:02

    AT&;amp;T網絡上未收到NTP udp數據包如何解決?

    有一個 ESP8266,使用 NTP 的污水坑監控器;它與我們的 Xfinity 網絡路由器完美配合。ESP8266連接AT&;amp;T路由器;不接收 UDP 數據包。NVG588已配置
    發表于 05-11 08:08

    美國AT&;amp;T正式商用的5G可能是假的

    美國運營商AT&;T12月21日宣布在美國十幾個城市正式商用5G移動服務。不過,這家運營商營銷花樣百出,真假5G難辨。
    的頭像 發表于 12-28 17:12 ?3896次閱讀
    美國<b class='flag-5'>AT&</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>T</b>正式商用的5G可能是假的

    一男子認為5G能監控,炸彈襲擊AT&;amp;amp;T大樓

    納什維爾市長本周日表示,在圣誕節期間發生的爆炸似乎是針對 AT&;amp;T 大樓發起的一起“基礎設施攻擊”事件。因為有報道稱,嫌疑人偏執的認為 5G 網絡正在監控美國人。這起可能的自殺式炸彈
    的頭像 發表于 12-28 11:33 ?1695次閱讀

    AT&;amp;T如何借助數據科學抓住新機遇

    作為在 AT&;T 工作十余年的杰出 AI 架構師,Dabholkar 表示:“我們可以使用新工具來改變在 AT&;T 的日常工作,這一過程十分有趣,并且當我們為員工提供最
    的頭像 發表于 04-01 09:22 ?1493次閱讀

    廣和通LTE-A模組FM101-NA強勢取得北美運營商AT&;amp;amp;T認證

    5月,廣和通LTE-A模組FM101-NA率先獲得北美重要運營商AT&;T認證,這表明FM101-NA符合北美地區通信產品性能準入標準和要求,并可在AT&;T無線網絡下平穩
    的頭像 發表于 05-20 17:52 ?772次閱讀
    廣和通LTE-A模組FM101-NA強勢取得北美運營商<b class='flag-5'>AT&</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>T</b>認證

    美格智能SLM750模組再獲北美運營商AT&;amp;T認證,助力終端客戶揚帆出海

    AT&;T是美國第二大移動運營商和互聯網服務提供商,截至今年一季度末,AT&;T北美用戶總量已達2.44億。SLM750模組通過各項嚴苛測試獲得
    的頭像 發表于 08-15 17:14 ?845次閱讀

    技術角度看AT&;amp;T為何“拋棄”諾基亞

    但是諾基亞所選擇的是Inline這種加速技術,其把第一層放在由Marvell給諾基亞開發的定制芯片上。或許AT&;T可能認為“云經濟”將抵消CPU成本,并同意Verizon的觀點——諾基亞的解決方案并不是真正的“云原生”。
    的頭像 發表于 12-15 16:49 ?732次閱讀

    AT&;amp;T正式道歉并承諾提供信用額度及5美元話費補貼以彌補斷網之失?

    為了補償因故障導致的損失,AT&;T決定為受影響的用戶每人提供 5 美元的話費獎勵。但值得注意的是,僅限擁有個人付費賬號的AT&;T用戶才能享受此優惠;商務型一類的業務或預
    的頭像 發表于 02-26 11:22 ?494次閱讀

    Open RAN的未來及其對AT&;amp;T的意義

    3月14日消息,在“Connected America 2024”會議上,AT&;T高級副總裁兼網絡首席技術官Yigal Elbaz討論了Open RAN 的未來及其對AT&;T
    的頭像 發表于 03-14 14:40 ?678次閱讀

    愛立信旗下Vonage與AT&;amp;T合作,通過API為開發者提供更豐富的網絡能力

    近日,愛立信旗下的Vonage正在與美國跨國電信運營商AT&;T合作,通過API為開發者和企業提供更豐富的網絡能力。
    的頭像 發表于 03-21 10:37 ?1.2w次閱讀

    解讀北美運營商,AT&;amp;amp;T的認證分類與認證內容分享

    在數字化日益深入的今天,通信技術的穩定與安全對于個人、企業乃至整個國家都至關重要。作為北美通信領域的領軍者,AT&;T一直致力于為用戶提供高效、可靠的通信服務。而在這背后,AT&;
    的頭像 發表于 06-05 17:27 ?537次閱讀
    解讀北美運營商,<b class='flag-5'>AT&</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>T</b>的認證分類與認證內容分享

    北美運營商AT&;amp;amp;T認證入庫產品范圍名單相關

    AT&;T作為全球領先的通信服務運營商之一,通過AT&;T認證不僅是對產品質量的認可,更是產品打開北美市場大門的重要憑證。然而,或許您還不清楚
    的頭像 發表于 06-28 16:58 ?405次閱讀
    北美運營商<b class='flag-5'>AT&</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>T</b>認證入庫產品范圍名單相關

    北美運營商AT&;amp;amp;T認證的費用受哪些因素影響

    申請北美運營商AT&;T認證的價格因多種因素而異,包括產品類型、認證范圍、測試難度等。一般來說,申請AT&;T認證的費用可能相對較高,因為
    的頭像 發表于 10-16 17:10 ?161次閱讀
    北美運營商<b class='flag-5'>AT&</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>T</b>認證的費用受哪些因素影響

    北美運營商AT&;amp;amp;T認證的測試內容有哪些?

    北美運營商AT&;T的認證測試內容涵蓋了多個方面,以確保設備和服務的質量、兼容性以及用戶體驗。以下是英利檢測整合的AT&;T認證的主要測試內容:基礎認證測試聯邦通信委員會(
    的頭像 發表于 11-12 17:39 ?143次閱讀
    北美運營商<b class='flag-5'>AT&</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>T</b>認證的測試內容有哪些?