圖形分析(或圖形算法)是用于確定圖形中對象之間的關系強度和方向的分析工具。圖形分析的重點在于每次兩個對象之間的成對關系和整個圖形的結構特征。
什么是圖形分析?
圖形分析是一種新興的數據分析形式,可幫助企業理解網絡或圖形中關聯實體數據之間的復雜關系。
圖形是一種數學結構,用于對物理、生物、社會和信息系統中多種類型的關系和過程進行建模。圖形由通過邊緣連接(表示這些實體之間的關系)的節點或頂點(表示系統實體)構成。圖形處理是一種能夠穿梭各邊緣和節點的功能,用于發現和理解網絡中關聯數據之間的復雜關系和/或優化路徑
圖形網絡分析有許多用途,例如分析社交網絡中的關系、網絡威脅檢測,以及根據共同偏好識別潛在買家。
在現實世界中,節點可以是人員、群組、地點或事物,例如客戶、產品、成員、城市、商店、機場、端口、銀行帳戶、設備、手機、分子或網頁。
節點之間的邊緣或關系示例包括友誼、網絡連接、超鏈接、道路、路線、電線、電話、電子郵件、“點贊”、付款、交易、電話呼叫和社交網絡消息。邊緣可以有一個單向箭頭來表示從一個節點到另一個節點的關系,比如 Janet“點贊了”Jeanette 的一篇社交媒體文章。不過,它們也可以是非定向的,比如,如果 Bob 是 Alice 的 Facebook 好友,那么 Alice 也是 Bob 的好友。
為何選擇圖形分析?
圖形分析可用于確定圖形中對象之間的關系強度和方向。重點是一次處理兩個對象之間的關系,以及整個圖形的結構特征。道路網絡、通信網絡、社交網絡、網頁和鏈接以及金融交易數據均為非常適合圖形的數據示例。圖形分析對于實現以下目標尤為有效:
檢測洗錢等金融犯罪
識別欺詐交易及活動
在社交網絡社區執行網紅分析
根據客戶評級或購買物來執行推薦分析
發現電網、水網和運輸網絡的缺點
優化航空公司、零售和制造業的路線
圖形分析的工作原理是什么?
圖形分析使用聚類、分區、廣度優先搜索、PageRank、連接組件和最短路徑等特定的圖形算法來分析多個應用程序中實體之間的關系:
| 聚類
基于物體的對象進行分組,因此集群內相似度較高,集群間相似性低。應用程序包括機器學習、數據挖掘、統計學、圖像處理以及大量物理和社會科學應用程序。
| 切割或分割
找到交叉邊緣最少的切口。應用程序包括發現數據和通信網絡的薄弱點,以及社交網絡中的社區檢測。
| 搜索
廣度優先搜索和深度優先搜索。
| 最短路徑
找到兩個興趣節點之間的最短路徑。應用程序包括社交網絡分析、交通運輸物流和許多其他優化問題。
| 最寬路徑
在加權圖形中找到兩個指定頂點之間的路徑,從而將路徑中最小權重邊緣的權重更大化。應用程序包括 IP 流量路由和流量敏感型路線規劃。
| 連接組件
強連接圖形就是您從任何起始節點開始均可到達圖形中每個節點的圖形。強連接組件是各個子區域均強連接的圖形的最大子區域。應用程序包括社交網絡分析。
| 頁面排名
一種由互聯網搜索用于網頁排名的衡量網頁受歡迎程度的方法。應用程序還包括社交網絡分析、推薦系統以及在自然科學(研究蛋白質之間的關系時)和生態網絡中的新用途。
熱門圖形分析用例
創建推薦系統 通過識別客戶、社交媒體和產品數據之間的關系和頻率,公司可以創建智能推薦引擎,實時響應客戶的在線活動。
檢測欺詐。圖形分析支持您以極大的靈活性大規模地建模數據關系,快速分析大量交易數據,實時識別欺詐。
遵守監管規定。遵守 HIPAA、PCI/DSS 和 GDPR 等法規關系到各行各業的企業。在收集客戶個人信息時,這些法規要求您在這些數據通過各種企業系統傳輸時能夠監控這些數據。圖形分析能夠為您提供流經不同系統的數據的直觀表示,使得在企業系統中追蹤敏感數據更加容易。這就會為您提供一種實現合規性的簡化方法。
身份認證與訪問管理 (IAM)。確定哪些人可以進入敏感的應用程序和數據(基于云和內部部署)是一個復雜的過程。圖形分析能夠對所有必要的數據進行更加穩健、實時的跨平臺管理,從而確定數據之間的關系并加速安全可靠的身份認證與訪問管理。
深入了解供應鏈效率。隨著全球化的發展,企業供應鏈變得更加復雜。借助圖形分析,您可以為這些復雜的關系建模,并深入了解供應鏈運營中效率低下的問題。
構建推薦系統
檢測欺詐
借助 GPU 加速圖形分析
網絡分析、基因組學、社交網絡分析等領域的大規模圖形處理需要強大且高效的計算性能。
GPU 具有大規模并行性,并且顯存訪問帶寬優勢顯著,因此十分適用于加速數據密集型分析,特別是圖形分析。GPU 采用大規模并行架構,包含數千個專為同時處理多個任務而設計的小核心,非常適合執行“為每個 X 執行 Y”的計算任務,可應用于大型圖形中的頂點或邊緣集。
NVIDIA RAPIDS cuGraph 能夠提供將 RAPIDS 生態系統與熱門的 python 圖形庫 NetworkX 相集成的加速圖形分析庫。RAPIDS cuGraph 的愿景是使圖形分析無處不在,以便用戶只需考慮分析而無需考慮技術或框架。
新款 NVIDIA GPU 的強大計算能力實現更快的加快圖形分析速度。此外,GPU 的內部顯存速率使 cuGraph 能夠快速切換數據結構,滿足分析需求,而不限于單一數據結構。
通過有效利用 GPU 中的大規模并行性,RAPIDS 的圖形算法能夠將大型圖形的分析速度提高 1000 多倍。在單塊 A100 GPU 上探索多達 2 億個邊緣節點,并在 DGX A100 集群上擴展至數十億個邊緣節點。
NVIDIA GPU 加速的端到端數據科學
NVIDIA RAPIDS 結合了執行高速 ETL、圖形分析、機器學習和深度學習的能力。這套完全在 GPU 上執行數據科學流程的開源軟件庫和 API,可以將訓練時間從幾天縮短至幾分鐘。它依賴于 NVIDIA CUDA 基元進行低級別計算優化,但通過用戶友好型 Python 界面實現 GPU 并行結構和極高的顯存帶寬。
RAPIDS cuGraph 無縫集成到 RAPIDS 數據科學生態系統中,使數據科學家能夠使用存儲在 GPU DataFrame 中的數據輕松調用圖形算法。借助 RAPIDS GPU DataFrame,數據可以通過一個類似 Pandas 的接口加載到 GPU 上,然后用于各種連接的機器學習和圖形分析算法,而無需離開 GPU。這種級別的互操作性是通過 Apache Arrow 這樣的庫實現的。從數據準備到機器學習,再到深度學習,它可加速端到端流程。RAPIDS 和 DASK 使 cuGraph 能夠擴展為多個 GPU,支持數十億個邊緣圖形。
原文標題:NVIDIA 大講堂 | 什么是圖形分析?
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
NVIDIA
+關注
關注
14文章
4939瀏覽量
102815 -
gpu
+關注
關注
28文章
4700瀏覽量
128699 -
圖形分析
+關注
關注
0文章
3瀏覽量
875
原文標題:NVIDIA 大講堂 | 什么是圖形分析?
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論