如今,在我們所有人都學著如何在家生活、辦公、學習的時候,作為支持我們新常態的工具,視頻流的重要性日益凸現。具體而言,使用視頻直播平臺將幫助我們與親友保持聯系,確保我們的子女能夠繼續完成既定學業,必要時我們還可以與自己的醫生進行面對面交流。作為一種新興技術,視頻直播將繼續在我們的生活中發揮重要作用。
這個領域將發生爆發式增長。到 2026 年,視頻直播的市場規模預計將接近 940 億美元。此外,與 Netflix 和 HBO 等非視頻直播平臺相比,諸如 Twitch 和 YouTube 游戲這樣的視頻直播平臺將吸引更大批的觀眾。
思科的視覺網絡指數表明,到 2022 年,僅視頻一項就將占據全部網絡流量的 82%。該流量中的“直播”部分毫無疑義地在增長,并即將成為網絡流量中比重不斷增大的組成部分。實時視頻轉碼與處理所需的計算強度極大。賽靈思已幫助其客戶解決了這個問題,同時提高了計算效率并降低了總體擁有成本 (TCO)。
視頻直播提供商面臨的最大問題是,他們必須為支持其網絡而支付出口帶寬成本。例如,如果帶寬成本能夠降低 30%,就能給運營費用帶來實質性影響。如果一個流媒體平臺有大約 10 萬個并發流媒體,那么額定帶寬成本大約為每年 7,300 萬美元。在這種假設情況下,如果平臺運營方能夠在保持視頻畫質不變的前提下將成本降低 30%,那么每年就能夠節省 2,200 萬美元的成本。
這種情況實際上并非假設,而是切實影響當今實時視頻流平臺的緊急狀況。以中國最大的游戲直播平臺虎牙直播 (Huya.com) 為例。從該公司近期向美國證券交易委員會備案的財報來看,因為用戶數量增加以及該公司企圖通過改進平臺上的視頻畫質來提升用戶體驗,虎牙直播 2019 年第四季度(日歷季度)的帶寬成本上漲 40%。不斷增長的帶寬成本和運營成本是真實存在的問題,正在對這些提供商的業務模式提出挑戰。
下圖準確表現了大多數視頻直播平臺運營商正在面臨的境況。正如生活中的大部分事物一樣,帕累托原理也同樣適用于網絡中的流量模式。在這個示例中,大約 20% 的主播占用了約 80% 的流量,因此對推高帶寬成本應承擔大部分責任。網絡的首端顯然是運營商關注的焦點區域,但網絡也有另一端,那就是尾端。在這里,運營商關心的是如何以盡可能低的成本實現所有基礎設施,從而為面對較小受眾群體的所有其他主播提供支持。這里的目標不在于對運營費用的管理,而是關注于如何才能更有力地管理資本開支,從而在盡可能增大通道密度的前提下盡量降低單通道成本。如何在網絡中平衡這兩項要求持續成為運營商面臨的挑戰。
為解決視頻直播平臺運營商面臨的挑戰,賽靈思近期推出了一系列專用的視頻轉碼一體機,它基于賽靈思新型的實時(RT)服務器參考架構(圍繞賽靈思 Alveo 系列數據中心加速器卡構建)開發而成。最初的賽靈思 RT 服務器參考架構可支持兩種視頻轉碼版本:一個注重在最低比特率下提供最高視頻畫質;另一個注重在最低的單通道成本下提供極高的通道密度。基于這兩種參考架構的服務器一體機由賽靈思經銷商和 OEM 廠商實施,將預先配置最多 8 塊 Alveo U50 卡或新的 Alveo U30 加速器卡。U30 加速器于近期推出,是一款專門的媒體加速器,最多可支持兩個 4KP30 通道。分辨率可進一步細分,每卡可支持 16 個 1080p30 通道。在集成到 1RU 外形尺寸的 RT 服務器后,該應用能支持 128 通道 1080p 視頻。針對為受眾群體極小的這些尾端主播提供支持這一方面來說,這算是密度極大的實現方案。Alveo U30 采用賽靈思 Zynq UltraScale+ MPSoC 全可編程 SoC,同時基于該系列的 EV 版,即內置硬化視頻編解碼器單元(VCU)的版本。由于 Alveo U30 主要使用 VCU,大量 FPGA 架構可用于支持更多功能。賽靈思正在準備移植其深度學習處理單元 (DPU),以支持視頻分析領域中的更多用例。HEVC 編解碼器的 Alveo U50 實現方案基于由 NGCodec 開發的廣受推崇的 NGCodec HEVC 算法。賽靈思在大約一年前收購了 NGCodec,這是該 HEVC 編解碼器在收購后首次實現商業化。
賽靈思準備使用這些一體機解決視頻直播市場中的多個現有的和新涌現的用例。其中一個主要的應用重點是電子競技。類似于 Twitch 這樣的平臺已經受到很大的追捧,不僅是針對游戲內容而言,更是作為直播平臺而言。在中國和美國以外的其他市場有眾多平臺提供類似的服務。企業協作是另一個重點領域。新冠疫情期間涌現出大量用例,如遠程醫療、遠程教育和社交視頻協作網站,都需要可靠性高、可擴展的視頻直播平臺。
RT 服務器一體機基于業經驗證的賽靈思軟件協議棧。系統采用異構形式,最多能夠搭載 8 塊 Alveo U50 或 Alveo U30 加速器。與 Alveo 硬件配套的是 X86 處理器。雖然視頻轉碼被卸載到 FPGA 或 VCU,像 AMD“Rome”Epyc 這樣的高性能 CPU 能解決其他復雜的工作負載,如音頻處理、廣告插入,或者也可托管用于轉碼通道管理的 Wowza Streaming Engine 服務器等 GUI 應用。在硬件層之上,賽靈思為運行在 FPGA 上的特定算法功能開發了加速器二進制文件。賽靈思運行時 (XRT) 運行在這些二進制文件的上方,負責向軟件層提供硬件內核。賽靈思媒體加速 (XMA) API 負責提供實現轉碼微服務所需的硬件加速解碼、視頻處理和編碼功能。用戶通過 FFmpeg 命令行就能尋址賽靈思 API。FFmpeg 廣泛應用于視頻轉碼領域。大多數用戶熟悉也樂于使用這個 CLI。對于非 CLI 的用途,賽靈思正在與經銷商和 Wowza 合作,共同將 Wowza Streaming Engine 媒體服務器整合到由賽靈思經銷商提供的 RT 服務器一體機中。Wowza 集成的工作預計將在 2020 年夏季完成。
相對于基于軟件的傳統實現方案而言,RT 服務器參考架構的比特率優化版擁有顯著的競爭優勢。在下圖中,搭載 8 塊 Alveo U50 的單個 HP ProLiant DL385 Gen 10 Plus 服務器(可通過訪問 hpe.com 配置),等同于 5 個搭載 10 塊英特爾 8275CL 3.0GHz CPU 的 HPE ProLiant DL380 Gen 10 服務器。與替代實現方案相比,賽靈思參考架構每節點吞吐量是它的 5 倍,硬件成本降低 6 倍,功耗降低 3 倍。詳細了解如何使用 HPE 提供的 COTS 設備構建功能強大的轉碼一體機,請點擊此處觀看視頻。
RT 服務器的高密度版搭載 8 塊 Alveo U30,集成在 1RU 機柜中,目前賽靈思經銷商已開始供貨。要在相當于 NVENC“中等”質量的條件下處理同等 1080p480 HEVC,需要搭載 32 塊 Nvidia Tesla T4 加速器的四個 HPE ProLiant DL380 Gen 10 服務器。與等效 Nvidia 實現方案相比,賽靈思一體機吞吐量是其 4 倍,硬件成本降低 6 倍,功耗僅相當于它的 20%。
賽靈思 RT 服務器視頻一體機目前已提供評估,可通過 hpe.com 購買比特率優化型 Alveo U50 版本,或通過授權賽靈思增值經銷商購買。
-
賽靈思
+關注
關注
32文章
1794瀏覽量
131166 -
數據中心
+關注
關注
16文章
4693瀏覽量
71959 -
思科
+關注
關注
0文章
298瀏覽量
32188 -
加速器卡
+關注
關注
0文章
18瀏覽量
8761 -
實時服務器
+關注
關注
0文章
3瀏覽量
1861
發布評論請先 登錄
相關推薦
評論