火山引擎視頻云是如何發展起來的?火山引擎要做什么樣的視頻云?未來視頻云又會是什么樣的?火山引擎視頻云技術負責人浩銘在以《面向體驗,助推超視頻時代新增長》為主題的演講中,分享了對視頻體驗、交互、增長的觀察與思考,并介紹了火山引擎視頻云的從前、現在,以及未來的技術規劃與構想。他表示:相信視頻應用會持續朝著三個方向演進,更高清、更交互、更沉浸。
以下為浩銘的演講實錄:
大家好,我是來自火山引擎視頻的浩銘,很高興今天能跟大家一起做分享,共同面向體驗,助推超視頻時代新增長。
首先給大家介紹一下火山引擎視頻云的進化史,這里列了幾個關鍵的時間點:
起初在2014年,這時候字節跳動還在做圖文應用。大家比較熟悉的今日頭條,就是這個時候DAU突破一千萬。當時,公司已經預計到未來是視頻的時代,就開始在頭條探索視頻的形態,視頻架構部門也是在這個時間點誕生的。
下一個時間點到了2016年,字節跳動推出短視頻APP抖音,與直播APP火山直播。隨著字節系的產品不斷擴充,視頻架構在公司的位置也變成了視頻中臺。我們作為中臺不斷地在公司里面孵化更多端到端的解決方案,像圖片點播也在這個時間點成為解決方案,但是那時候我們的定位是面向功能、解決業務的問題。
2018年,字節跳動本身業務飛速發展的一年,對我們來說也是挑戰很大的一年。首先我們要保證業務的穩定增長,保證業務的擴容是平順的,同時業務對我們有了更多的要求,不止功能層面,還要對業務的功能與結果提供更大的幫助,于是我們對業務的體驗優化做了更多的投入,持續優化端到端的視頻體驗。這個時間點,我們自己開始逐漸意識到,“體驗”的重要性。
到了2020年,我們開始認真考慮ToB的事情。之所以在這個時間點考慮ToB,基于三點考慮:
第一點,我們作為中臺支持的字節產品越來越多,如果把中臺的服務模式變成ToB的服務模式,相信對業務的支持效率與組織效能上有很大的提升;
第二點,經過幾年的業務打磨,已經具備行業領先性,我們把已經沉淀好的能力輸出出去,應該可以得到更好的商業價值;
第三,我們希望引入外部的視角,傾聽來自行業的聲音、用戶的聲音、客戶的聲音,讓我們審視已有的技術,保持我們的先進性。
基于幾點考慮,我們逐漸把團隊從中臺走向ToB,把之前的沉淀解決方案改造為對外的解決方案,把自己的服務做成平臺化,更加規模化地接外部客戶。這時我們接了第一個外部客戶,懂球帝。
在2020年之后,這樣的演進還在持續發生,比如說火山引擎正式ToB,讓視頻云在ToB上順利承接有了更大的投入,在產品的完備度和服務的規范性上有了大幅的提升。以及字節跳動收購了Pico之后,我們開始在沉浸式視頻上進行了更多的探索。
如何搭建質量體驗體系
從整個視頻云的成長史來看,字節跳動的業務“養成”了視頻云,而且視頻云非常有幸在這個過程當中見證與幫助字節跳動的成長。我們希望今天把沉淀下來的能力與經驗開放給行業的合作伙伴。
剛才在演講過程當中,我提到了一點,我們從能力建設開始面向體驗的建設。通過幾個直觀的問題讓大家感受一下到底這兩個之間有什么區別。
業務數據不好,是不是因為播放體驗有問題?
我們播放體驗的優勢是什么?
新上線一些新的功能,對業務的貢獻到底如何?
我們總說極致體驗,體驗是什么,以及怎樣才算極致?
大家能夠感覺到畫風不一樣了,之前我們談功能的時候,更多是在談功能有沒有,好不好,有多好。這些會落到可以對比的,類似卡頓這類的指標。但回到體驗,更多是業務帶著最終結果向我們發問,到底我們的能力對業務有什么幫助,我們怎么回答這樣的問題。
首先我覺得每個問題都很難回答。在這兒我想分享一下經驗,包括做事方式與思路。
大家看右邊這張圖,分成外邊的一個圓環與里面的矩形。外邊的圓形更多是我們在日常研發里面的做事方式,相信大家都非常熟悉。這里面有一個與大家做的不一樣的,是線上實驗的環節,里面的矩陣更多是內功,核心就是一直在努力建設數據的分析和歸因能力。我們要做一個事情能夠預估它的收益,并且能夠及時回收收益。在內外結合、相輔相成的思路與做事方式下,我們再看剛才的幾個靈魂拷問是不是可以回答了。
對于剛才的幾個問題我們可以抽象一下,變成一些更本質的問題。
第一個是如何衡量體驗?
大家應該會有一些共識,體驗指標可以分成 QoS(Quality of Service)指標和 QoE(Quality of Experience)指標。QoS 往往是從服務或者功能的視角統計服務質量,包括起播時間、百秒卡頓、畫質指標、延時等。這些是跟研發具體做的動作直接相關的,它們非常重要,而且是研發做的每個動作的直觀表現。
我們在實踐過程中,逐漸從最初的關注QoS指標,過渡到現在以QoE指標為主。因為QoE是從用戶視角反映問題,通常是與用戶播放時長和頻次等相關的聚合指標,以反映用戶的使用意愿,也與增長關聯更加直接。它比QoS好的一點,QoS是單方面,有可能把我們的優化指導偏,而不是全局最優,QoE是給了一個最終結果。我們帶著這個最終結果有能力與業務的增長結果做關聯。
下一個問題,體驗與增長之間是怎么關聯的?
之前有很多次的技術分享,大家對字節跳動的A/B實驗有了解,它提供了一個讓我們真正成為業務里面的技術參與方,能直接看到我們的動作與業務增長關聯的平臺。有了這個平臺之后,我們可以很方便地每個月做幾十次線上實驗,不斷探索體驗指標與業務指標的關聯,一點點消除元無知。
最后,如何優化體驗,體驗需要優化到什么程度?
如果我們打算做一個功能優化,什么時候該做,做到什么時候該停。第一因為我們有內部優勢,可以快捷地開大量的實驗,所以能快速、不停地迭代嘗試出一個經驗值,這個經驗值可以在具體場景里面復制、沉淀,可以推廣出更多的業務方使用的。
另外一個方式就是使用業務已有的數據,做一些已有數據分析,比如說首幀與棄播之間的關系。我們找到拐點,因為這個拐點可能就是這個業務的優化空間,如果過了這個拐點,有可能優先級可以放一放。我們通過這種方式建立決策,去回答體驗到底需要優化到什么程度。
剛才介紹了研發的體系,下面我舉幾個例子,把這些例子得到的沉淀結論分享給大家。
首先是在短視頻場景下,剛才我也提到了對于首幀的分析,我們經過試驗與數據分析得到這樣的一個結論,就是210ms這個數字。在短視頻feed場景下,我們認為210ms相當于流媒體首幀的滿分標準。首幀大于這個值,用戶的留存可能就會受到影響。
對于畫質來講,也是一個很直觀的指標,大家希望有很清晰的視頻體驗,我們做了非常多的動作,這里舉一個例子,特定環境下網絡受限的用戶,不得不選擇低分辨率的視頻去播放,這樣終端的效果肯定是不好的。我們有一些手段,通過超分辨率的方式,在終端把不好的播放體驗重新超分成一個好的視頻效果。單單這樣的對于受限場景下的優化,對于大盤整個視頻播放時長有0.23%的增長。
在直播上,延時也是很敏感的指標,但是確實與業務增長的關系是比較難量化,我們在“低延遲直播”功能上線之后,也嘗試做了反轉實驗,把已經3s端到端延時的用戶,重新提升到7s,我們看了一下結果是什么樣。這個工作做了之后,我們看到用戶的看播時長下降1.3%,社交滲透與電商訂單都有顯著的下降。也是因為有了這樣時延的佐證,我們對于低延時直播的資源投入在持續的增長。
剛才提到了一些研發投入深耕的場景,其實對于體驗的優化可能不需要那么高深,有一些簡單的Case被大家忽略掉,一樣可以達到很好的結果。舉一個看上去很簡單的音量均衡例子,大家看直播或者點播的時候有刷視頻的動作,刷到下一個視頻如果聲音忽高忽低,可能會有很差的播放體驗,甚至因為聲音變大嚇一跳。我們預期音量均衡的方案會拿到正向的結果,實際上做完試驗之后結果遠超預期,不僅在人均看播時長增長了3%,而且電商直播的GMV超預期提升4%。其他像這些小的點有很多很多,只要這個思路存在,我們就有更多可挖的空間。
除了技術,還有很多的玩法,能讓留存、拉新得到很多提升。介紹一下“一起看抖音”場景功能,這個場景是在抖音短視頻觀看時,可以讓很多用戶同時在看,大家看的進度是一樣的,而且看的同時可以做音視頻的聊天,以增加趣味性與陪伴感。它在抖音上線已經接近一年,月均DAU持續保持30%以上的增長,滲透率已經提升10倍。
剛才是對體驗優化方法論結果的展示,我后面分享一下火山引擎視頻云未來的技術規劃與構想。正如我們和IDC一同發布的視頻云白皮書中所提到的,我們相信視頻應用會持續朝著三個方向演進,更高清、更交互、更沉浸。下面對這三個方面,我分別談一下我們在技術上的儲備與規劃。
更高清
首先更高清。大家都經歷了從彩色電視,到數字電視,到后邊1080P,以及這次北京冬奧會大家都享受到的8K超高清轉播,以及8K VR直播,甚至8K更高分辨率的視頻。這樣對視頻編碼與傳輸,始終都是很大的壓力,如果壓縮跟不上的話,雖然可以用一些手段降低畫質完成8K的傳輸,但是這樣效果是“高不清”。
火山引擎多媒體實驗室團隊,一直在持續地探索極致的視頻壓縮和圖像增強技術,在受限帶寬下持續提升用戶的視覺體驗。
近期火山引擎落地業界首個H.266端云一體視頻解決方案,相比目前主流的265編碼方案,能節省30%-50%的碼率,在一些應用場景下最高可節省70%以上碼率,可以大大降低超高清視頻應用的門檻,加速推進體驗升級的進程。
除了剛才編碼效率的優化,我們對更高清的追求,不只是壓縮效率更高了就是高清,當用戶都覺得清晰了那才是高清。到底怎么衡量、反映用戶觀看視頻的感受呢?
除了一直致力于建立畫質的端到端整體優化方案之外,我們還在嘗試建立一套和用戶感官完全匹配的評估體系,我們推出的是VQScore畫質評估算法體系。我們可以把它用在很多不具備參考條件的場景下,比如競品評測、視頻質量監控、基于視頻質量的推薦,基于人類主觀感受的視頻端到端優化、低質視頻篩查等。而且VQScore畫質評估體系已經在多媒體領域的世界級會議拿到第一名的好成績。
更交互
下一個發展趨勢是更交互。在業務發展中,新的交互方式往往會帶來新的商業突破,技術的優化,可以讓更多的互動玩法與商業場景成為可能。這里我們看兩個極致些的例子。
第一個是語音沙龍。語音沙龍是今年年初非常火爆的場景。之前由于技術架構的限制,產品不得不把能夠上麥的主播數量控制到20-50個,一旦更多就會很混亂。火山引擎RTC通過訂閱邏輯的改造,讓產品邏輯更加靈活,單房間最高支持超過千人上麥,成為國內首家能夠提供單房間超過千人上麥的音視頻服務。
第二個例子是VR場景下的千人Livehouse,這對端上渲染能力有很大的要求。因為我們有了低時延服務端渲染的能力,云渲染的超低延時架構將復雜的渲染計算放到云端做,把計算后產生的音視頻畫面,用RTC傳輸到本機。無論多復雜的計算,本機只需要播放音視頻的性能消耗,從而解放終端的性能限制。
更沉浸
最后一點,是更沉浸。前邊提到更高清與更交互,是達到更沉浸的先決條件。另外還有兩個要素,自由度和虛實融合。我們一直以來大家觀看視頻的體驗,主要是滑動、切換下一個視頻或者是拖拽,其實這時候我們沒有太多的自由度,而更多的視頻未來要求我們提供更多的自由度。比如可以通過VR看到更廣闊的視野,甚至可以通過多機位達到自由度的效果,共同組合成六自由度的XR體驗。
我相信很快會有更多殺手級的XR應用出現,給視頻的呈現與體驗模式帶來代際的更新。我們不斷打磨沉浸式視頻體驗能力,也不斷地沉淀在云解決方案當中,希望能和更多業務合作伙伴一起推進行業的變革。
比如,剛才提到了超過千人連麥,未來通過VR設備和技術,我們可以實現千人在一個共同的虛擬場景中,實現更多樣化、更沉浸的社交活動,比如通過自己的Avatar替身聊天、一起刷抖音、看直播、一起玩游戲等,這種應用場景會涉及到點播、直播、RTC、邊緣渲染、云游戲等多個視頻云解決方案的融合。
面向體驗,助推超視頻時代新增長
更高清、更交互、更沉浸是我們不斷的追求,希望幫助合作伙伴引爆一個又一個新的業務增長點。今天,火山引擎視頻云發布產品矩陣——為用戶體驗而生的視頻云服務,我們希望打造全新的產品服務體系。
產品矩陣整體劃分為三層,分別是核心中臺、核心產品及解決方案。
底層是我們的核心中臺,是我們技術能力的沉淀,從生產、處理、傳輸、消費,覆蓋視頻內容消費全鏈路。讓更多的互動玩法和商業場景成為可能。
中間層是我們的核心產品,包含點播、直播、圖片處理、實時音視頻等。
上層是行業全棧解決方案,包含泛互聯網游戲、在線教育、金融廣電等,我們相信全棧解決方案是驅動更多商業場景落地的關鍵變量。
火山引擎視頻云面向體驗,助推超視頻時代新增長,希望可以和更多的業務伙伴一起探索下一代互聯網新場景,一同創造更多的價值。今天我的分享就到這兒,謝謝大家!
審核編輯:符乾江
-
視頻
+關注
關注
6文章
1933瀏覽量
72814 -
云技術
+關注
關注
1文章
189瀏覽量
18817
發布評論請先 登錄
相關推薦
評論