1872年,斯坦福找到了一位科學家進行連續攝影并由此創造了人類歷史上第一個“視頻”。1877年,愛迪生在其“圓筒留聲機”上錄制了《瑪麗有只小羊羔》的幾秒鐘歌詞,標志著人類歷史上的第一條音頻記錄。由此,人類正式進入了音視頻時代。
在人類漫長的歷史長河中,文字、圖畫是記錄和傳遞信息的主要方式,直到音視頻出現,才將人類記錄信息的方式升級到了一個更高維度。從黑白電視再到8K杜比全景聲超清音視頻,音視頻產業經過一百多年的發展,已然成長為萬億級產業。
01
風口之上的多重挑戰
在數字化浪潮的推動下,AI、大模型與音視頻的結合正成為產業焦點,引領著一場全新的內容革命。從 AI 作曲到智能配音,從視頻生成到虛擬形象,AI 在音頻、視頻創作領域的應用正在全面開花。
不久前的2024中國新媒體大會上,一系列獲獎的AI融媒精品案例彰顯了文化與科技的“雙向奔赴”,其中包括5G密集視音頻傳輸系統、視頻內容生產與傳播一體化完整技術方案等,AI已重新定義音視頻生產力的“新范式”,人工智能和音視頻領域融合趨勢日漸顯著,同時音視頻服務已廣泛應用于互娛、廣電傳媒、教育、金融等各種行業,對場景的滲透愈發深入,“人工智能+音視頻”技術正加速賦能千行百業。
與此同時,這一核心變革的背后,也對AI算力提出了更高要求。
視頻生成模型的數據處理挑戰
視頻生成模型需要處理包括圖像、音頻和視頻在內的大量數據,樣本數據模態多樣化、數據質量參差不齊,導致數據處理鏈路環節多、工程復雜。另外大量的多模態數據處理也對數據存儲以及異構算力資源調度提出了極高的需求。
算力需求及成本挑戰
音視頻AI技術快速發展伴隨著算力需求激增,隨之是高昂的算力成本。細膩的畫面質感、流暢的幀率,還有精準的特效處理,這一切都需要強大的算力支持,以某影片為例,該影片有1600個視覺特效鏡頭,用單機渲染,需要1700多年,即便用1000臺主機,也要耗時約1.7年,算力需求及算力成本都將是天文數字。
02
軟硬協同,錨定性能升級
作為中國領先的國產軟硬一體產品及服務提供商,拓維信息持續深耕人工智能等前沿技術領域,長期堅持AI算力研發投入,自主研發的兆瀚CTS5301-L AI服務器作為一款專為 “AI+” 時代而生的算力新星,是音視頻行業 “減負”與實現創意的最佳拍檔。
1
智能算力,多維賦能
兆瀚CTS5301-L AI服務器擁有卓越的AI性能和強大的異構計算能力,全面支持昇騰Atlas 300I Duo等多款行業主流高性能加速卡,最大算力可達1.98PFlops@FP16,全面適用于大模型微調/推理、大模型訓練、CV模型推理等多重場景,為支持多模態大模型、計算機視覺(CV)大模型推理等領域處理復雜音視頻制作任務提供強大的基礎設施支撐。
2
高效渲染,極致視效
兆瀚CTS5301-L AI服務器具備卓越的AI計算能力以及靈活的配置選項,無論是文本生成圖像,數據傳輸還是復雜的圖形渲染、視頻解碼等需求,兆瀚CTS5301-L AI服務器皆能提供多樣化算力支撐,大幅縮短渲染時間、降低渲染成本,打造極致的視覺體驗。此外兆瀚CTS5301-L AI服務器的整機功耗降低了30%,整機TCO提升了20%,大幅降低 AI 算力使用成本。
3
AIGC,創意無界
除了高質量渲染與超強算力支撐,提升內容制作的效率,兆瀚CTS5301-L AI服務器還支持多種行業主流的高性能加速卡,能夠適配多種AI模型和框架,包括但不限于盤古、GLM、GPT-3、STABLE Diffusion等,廣泛的兼容性能夠滿足不同的內容生成類場景對更強大計算資源的需求。
AI技術的進步不斷拓展創意的疆界,無論是創造高品質的視覺作品,還是實現精確的語音合成,兆瀚CTS5301-L AI服務器都是音視頻行業創意道路上的「硬」核后盾。
未來,拓維信息將攜旗下“兆瀚”持續為醫療、金融、教育、娛樂等諸多領域的音視頻解決方案提供智能算力底座,助力各行業在數字化轉型的道路上實現更高效、更智能的音視頻內容創作與傳播,攜手邁向一個創意無限、精彩紛呈的數字新紀元。
-
音視頻
+關注
關注
4文章
465瀏覽量
29854 -
算力
+關注
關注
1文章
928瀏覽量
14743 -
AIGC
+關注
關注
1文章
356瀏覽量
1508
發布評論請先 登錄
相關推薦
評論