在當今復雜的業務環境中,IT 團隊面臨著不斷的挑戰,從員工賬號鎖定等簡單問題到關鍵的安全威脅,不勝枚舉。針對這些情況,既需要快速修復,也需要戰略防御,這使得維持平穩和安全運營的工作變得愈發困難。
而這正是 AIOps 的用武之地。它將人工智能與 IT 運營相結合,不僅可以自動執行日常任務,還能夠增強安全措施。這種方法非常高效,不僅可讓團隊快速處理小問題,而且更重要的是,還能讓團隊比以前更快、更準確地識別安全問題并作出響應。
借助機器學習,AIOps 不僅成為了簡化操作的重要工具,而且還能全面加強安全性。事實證明,對于希望為團隊引入先進 AI 的企業來說,AIOps 將成為一個顛覆性的工具,幫助企業未雨綢繆,提前為應對潛在安全風險做好準備。
據 IDC 數據顯示,IT 運營管理軟件市場預計將以每年 10.3% 的速度增長;到 2027 年,預計收入將達到 284 億美元。這一增長凸顯了企業日益依賴 AIOps 來提升運營效率,并且它已成為現代網絡安全戰略的關鍵組成部分。
隨著機器學習運維的快速增多,生成式 AI 時代不斷發展。由 NVIDIA 合作伙伴組成的廣泛生態系統正在提供 AIOps 解決方案,利用 NVIDIA AI 幫助企業改進 IT 運營。
NVIDIA 致力于通過加速計算和 AI 軟件,為廣泛的 AIOps 合作伙伴生態系統提供幫助。其中包括 NVIDIA AI Enterprise,這是一個可以在任何地方運行的云原生堆棧,并通過 NVIDIA NIM(用于加快 AI 模型推理)、NVIDIA Morpheus(用于基于 AI 的網絡安全)和 NVIDIA NeMo(用于自定義生成式 AI)等軟件,為實現 AIOps 奠定堅實的基礎。該軟件有助于實現基于生成式 AI 的聊天機器人、摘要和搜索功能。
使用 NVIDIA AI 的 AIOps 服務提供商包括:
Dynatrace Davis 超模態 AI 集成了因果 AI、預測式 AI 和生成式 AI 技術,并采用 Davis CoPilot,以強化 AIOps。這一組合能夠提供精確、切實可行且由 AI 驅動的回答和自動化,有助于增強 IT、開發、安全和業務運營的可觀察性和安全性。
Elastic 提供用于語義和向量搜索的 Elasticsearch Relevance Engine (ESRE),該引擎集成了 GPT-4 等熱門 LLM,能夠為可觀察性和安全性解決方案中的 AI 助手提供強大的支持。Observability AI Assistant 是新一代 AIOps 功能,可協助 IT 團隊了解復雜系統、監控運行狀況,并自動修復運營問題。
New Relic 正在利用其機器學習、生成式 AI 助手框架以及長期以來在可觀察性方面積累的專業知識來強化 AIOps。它的機器學習和高級邏輯可幫助 IT 團隊減少警報噪音、縮短平均檢測時間和平均修復時間、自動分析根本原因并生成回顧。它的生成式 AI 助手 New Relic AI 可加快問題解決速度,用戶無需切換上下文,即可識別、解釋和解決錯誤。它能夠直接在開發者的集成開發環境中提供代碼修復建議并修復代碼。此外,它還能自動生成高級系統運行狀況報告、分析和匯總儀表盤以及回答有關用戶應用、基礎設施和服務的簡單語言問題,將事件可見性和預防擴展到非技術團隊。對于受益于 NVIDIA GPU 的 AI 驅動的應用,New Relic 還能實現全棧可觀察性。
PagerDuty 在 PagerDuty Copilot 中新增一項功能,即在 Slack 中集成了生成式 AI 助手,以便在從事件發生到解決的整個過程中提供深入洞察,簡化事件生命周期,并減少 IT 團隊的人工任務量。
ServiceNow 致力于創建主動 IT 運維, 包括自動產出洞察(以對事件作出快速響應)、優化服務管理和檢測異常。現在,該公司正在與 NVIDIA 合作推進生成式 AI 的發展,進一步推動技術服務和運營的創新。
Splunk 的技術平臺依托人工智能和機器學習,針對實現運營問題與威脅,實現了識別、診斷和解決流程的自動化,進而提高 IT 效率,并改善安全狀況。Splunk IT Service Intelligence 是 Splunk 的主要 AIOps 產品,能夠從一個位置提供由嵌入式 AI 驅動的事件預測、檢測和解決方案。
亞馬遜云科技 (AWS)、谷歌云和 Microsoft Azure 等云服務提供商為企業和組織靈活地提供大規模云資源,幫助其實現 IT 運營的自動化和優化。
亞馬遜云科技提供了一套有助于 AIOps 的服務,包括用于監控和可觀察性的 Amazon CloudWatch、用于跟蹤用戶活動和 API 使用情況的 AWS CloudTrail、用于創建可重復且負責任的機器學習工作流的 Amazon SageMaker 和用于無服務器計算、可基于觸發器自動執行響應操作的 AWS Lambda。
谷歌云通過 Google Cloud Operations 等服務為 AIOps 提供支持,該服務可為云端和本地的應用提供監控、日志記錄和診斷功能。谷歌云的 AI 和機器學習產品包括 Vertex AI(用于模型訓練和預測)和 BigQuery(利用 Google 基礎設施的處理能力進行快速 SQL 查詢)。
Microsoft Azure 通過 Azure Monitor 來全面監控應用、服務和基礎設施,推動 AIOps 發展。Azure Monitor 的內置 AIOps 功能有助于預測容量使用情況,實現自動擴展,識別應用性能問題,以及檢測虛擬機、容器和其他資源中的異常行為。Microsoft Azure 機器學習(AzureML)提供了一個基于云的 MLOps 環境,可安全、負責任地大規模訓練、部署和管理機器學習模型。
專注于 MLOps 的平臺主要致力于簡化機器學習模型的生命周期(從開發到部署和監控)。下列公司雖然核心任務在于讓機器學習變得更易于獲取、更高效和更具可擴展性,但鑒于其技術和方法增強了 IT 運營中的 AI 功能,因此也間接實現了對 AIOps 的支持:
Anyscale 的平臺基于 Ray,可以輕松擴展 AI 和機器學習應用,包括 AIOps 中用于異常檢測和自動修復等任務的應用。Anyscale 通過促進分布式計算,幫助 AIOps 系統更高效地處理大量運營數據,實現實時分析和決策。
Dataiku 可用于創建預測 IT 系統故障或優化資源分配的模型,IT 團隊借助它,可在生產環境中快速部署和迭代這些模型。
Dataloop 的平臺提供完整的數據生命周期管理功能,并能夠靈活地為端到端工作流引入 AI 模型,使用戶能夠使用自身數據開發 AI 應用。
DataRobot 是一個完整的 AI 生命周期平臺,可幫助 IT 運營團隊快速構建、部署和管理 AI 解決方案,提高運營效率和性能。
Domino Data Lab 的平臺使企業及其數據科學家在統一的端到端平臺上構建、部署和管理 AI。所有環境中的數據、工具、計算、模型和項目都是集中管理的,因此團隊可以彼此協作、監控生產模型,并實現受治理的 AI 創新最佳實踐標準化。這種方法對于 AIOps 至關重要,因為它既能滿足數據科學團隊對自助服務的需求,又能滿足 IT 運營所需的完全可復現性、精細的成本跟蹤和對 AI 的主動治理。
Weights & Biases 提供用于實驗跟蹤、模型優化和協作的工具,這對于開發和微調 AIOps 中使用的 AI 模型至關重要。Weights & Biases 還提供有關模型性能的詳細洞察,并促進團隊間的協作,這有助于確保為 IT 運營部署有效且透明的 AI 模型。
審核編輯:劉清
-
NVIDIA
+關注
關注
14文章
4949瀏覽量
102826 -
人工智能
+關注
關注
1791文章
46896瀏覽量
237667 -
機器學習
+關注
關注
66文章
8382瀏覽量
132443 -
聊天機器人
+關注
關注
0文章
332瀏覽量
12295
原文標題:GTC24 | 設計安全:NVIDIA AIOps 合作伙伴生態系統為企業帶來 AI 加持
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論