在視頻的發(fā)展歷程中,對于體驗(yàn)感的極致追求貫穿始終。
從短視頻到直播,從云游戲到 VR 電競,從視頻會議到虛擬機(jī)器人,盡管應(yīng)用場景在不斷變化,但不變的是,用戶的需求始終是以更加高清、更低延時,更強(qiáng)的沉浸性和交互性為導(dǎo)向。在這樣的需求推動下,視頻處理精細(xì)化成為了行業(yè)的必然發(fā)展方向。然而,這種精細(xì)化的演進(jìn)之路卻并非一帆風(fēng)順,需要在成本和體驗(yàn)之間找尋最佳的平衡點(diǎn)。當(dāng)前,互聯(lián)網(wǎng)的流量 80% 來自視頻,僅短視頻領(lǐng)域的用戶規(guī)模就達(dá)到 5 億。如何能夠把大量視頻以更加高效、高性價比的方式計算、存儲、傳播是對視頻平臺最大的挑戰(zhàn)。
近日,InfoQ 與 Intel 聯(lián)合打造的「英特爾 至強(qiáng) 實(shí)戰(zhàn)課」,特邀火山引擎點(diǎn)播多媒體平臺技術(shù)負(fù)責(zé)人張清源與英特爾云計算資深架構(gòu)師陸揚(yáng)進(jìn)行分享,二位針對如何更好地?fù)肀б曨l化浪潮,如何實(shí)現(xiàn)更精細(xì)化的視頻處理,如何平衡成本與體驗(yàn)等眾多實(shí)際問題展開探討。InfoQ 將本場分享內(nèi)容整理成文,希望對大家有所幫助。
01
成本與體驗(yàn)到底是不是零和博弈?
隨著短視頻行業(yè)的蓬勃崛起和 AI、異構(gòu)等技術(shù)的快速發(fā)展,視頻處理系統(tǒng)的架構(gòu)發(fā)生了很大的變化。在視頻處理的演變過程中,逐漸出現(xiàn)端云結(jié)合的處理方式,進(jìn)而實(shí)現(xiàn)了更加靈活和多樣的視頻處理體驗(yàn)。張清源以點(diǎn)播業(yè)務(wù)為例,介紹了視頻處理的基本工作模式。
點(diǎn)播鏈路主要分為四個部分:端側(cè)生產(chǎn)、云端生產(chǎn)、審核和下發(fā)。端側(cè)生產(chǎn)是指使用移動設(shè)備拍攝視頻,并進(jìn)行增強(qiáng)和編輯,然后將視頻上傳至云端發(fā)布。其次是云端生產(chǎn),包含兩個流程:視頻處理系統(tǒng)對視頻進(jìn)行處理,生成不同檔位的視頻;審核系統(tǒng)對視頻進(jìn)行合規(guī)審核。完成這兩個流程后,視頻可以進(jìn)行下發(fā),通過下發(fā)系統(tǒng)最終在播放器上播放。
當(dāng)前,字節(jié)點(diǎn)播業(yè)務(wù)規(guī)模龐大。從計算方面來看,視頻處理系統(tǒng)規(guī)模已經(jīng)達(dá)到數(shù)百萬核,預(yù)計不久的將來可能達(dá)到千萬核。存儲容量已經(jīng)達(dá)到 EB 級別,帶寬規(guī)模超過 100TB。因此,點(diǎn)播業(yè)務(wù)的成本巨大。
點(diǎn)播業(yè)務(wù)的成本主要由存儲成本、轉(zhuǎn)碼成本、CDN 帶寬成本等構(gòu)成,其中 CDN 帶寬成本占到整體成本的 70% 以上。點(diǎn)播業(yè)務(wù)的體驗(yàn)主要指播放體驗(yàn)。播放體驗(yàn)受到 QoS 指標(biāo)(播放失敗率、起播時間、卡頓率、視頻質(zhì)量等)、QoE 指標(biāo)(播放次數(shù)、播放時長、完播率等)等多項(xiàng)指標(biāo)的影響,且 QoS 指標(biāo)也會對 QoE 指標(biāo)產(chǎn)生影響。那么,如何優(yōu)化成本和體驗(yàn)?zāi)兀?/strong>
在成本方面,火山引擎分別針對影響帶寬成本、計算成本和存儲成本的因素進(jìn)行優(yōu)化。例如,調(diào)整視頻的碼率可以降低帶寬成本。同時,還可以減少不必要的數(shù)據(jù)傳輸,避免浪費(fèi)帶寬,優(yōu)化緩存機(jī)制,減少不必要的數(shù)據(jù)緩存。對于計算成本,利用異構(gòu)資源和工程優(yōu)化來降低計算成本。在存儲方面,采取轉(zhuǎn)冷存儲或刪除低觀看率的檔位等措施來節(jié)省存儲成本。
在提升體驗(yàn)方面,視頻處理系統(tǒng)最主要的是對畫質(zhì)進(jìn)行處理。而在播放端,包括首幀優(yōu)化、移動端后處理等都可以改善播放體驗(yàn)。此外,還可以優(yōu)化卡頓問題和同步性,以提升整體體驗(yàn)。
盡管單獨(dú)優(yōu)化某一方面可以采取很多措施,但成本和體驗(yàn)存在置換關(guān)系。例如,下發(fā)低檔位的視頻或調(diào)整轉(zhuǎn)碼參數(shù)可以降低成本,但會導(dǎo)致體驗(yàn)略有損失。預(yù)加載可以優(yōu)化首幀和提升體驗(yàn),但也會增加數(shù)據(jù)浪費(fèi)和帶寬成本。因此,在決策時,需要精細(xì)評估找到成本和體驗(yàn)的平衡點(diǎn)。通過 A/B 實(shí)驗(yàn)評估體驗(yàn)影響,最終,通過 ROI 評估判斷是否將優(yōu)化項(xiàng)應(yīng)用或進(jìn)一步優(yōu)化。
02視頻處理系統(tǒng)精細(xì)化演進(jìn)之路
由于視頻業(yè)務(wù)規(guī)模逐漸龐大,哪怕是很小的優(yōu)化,放在大規(guī)模的系統(tǒng)里收益都非常可觀。因此,視頻處理系統(tǒng)向數(shù)據(jù)驅(qū)動的精細(xì)化演進(jìn)的方向發(fā)展很有必要。視頻處理系統(tǒng)的精細(xì)化演進(jìn)可拆解為畫質(zhì)精細(xì)化、資源精細(xì)化、策略精細(xì)化三個方面。
畫質(zhì)精細(xì)化
畫質(zhì)精細(xì)化即為每個視頻定制處理流程,解決如何處理視頻的問題。它是針對云端視頻處理流程的一部分,從視頻分析到視頻前處理再到視頻編碼的過程。視頻分析使用檢測算法提取高維特征,為下一步處理決策提供依據(jù)。視頻前處理采用增強(qiáng)算法對原片進(jìn)行處理,然后使用編碼器和內(nèi)容自適應(yīng)算法進(jìn)行視頻編碼。
盡管云端處理是重要的,但張清源認(rèn)為,未來視頻處理系統(tǒng)將是端到端的統(tǒng)一系統(tǒng)。隨著移動端計算性能的提升,一些算法可以在移動端進(jìn)行補(bǔ)充,既可以節(jié)省云端計算資源,又可以結(jié)合用戶算法策略。因此,需要建立云端和移動端之間的策略來連接它們。通過建設(shè)離線畫質(zhì)分析平臺,即端到端實(shí)驗(yàn)仿真平臺,實(shí)現(xiàn)端云算法結(jié)合,結(jié)合全鏈路仿真,獲得最佳算法策略,實(shí)現(xiàn)線上收益最大化。
資源精細(xì)化
資源精細(xì)化,即在處理視頻和資源規(guī)劃中選擇最合適和最優(yōu)的資源配置,解決使用什么資源的問題。過去,視頻處理系統(tǒng)幾乎 100% 使用 CPU 資源,但隨著時間的推移,除了 CPU 資源外,還可以選擇具有彈性的 GPU 資源及其他異構(gòu)資源進(jìn)行使用。
在評估這些資源時,火山引擎會首先考慮業(yè)務(wù)特點(diǎn),因?yàn)椴煌臉I(yè)務(wù)對于壓縮性能和任務(wù)延遲的要求可能不同。其次,需考慮峰谷時段選擇合適的資源。高峰期可借用離線彈性資源以降低成本。第三,需要結(jié)合資源的特性,比如 CPU 最大的優(yōu)點(diǎn)是穩(wěn)定,通用性好,但是對于算力要求比較高,可能 GPU 更合適。此外,需要考慮預(yù)算、交付周期、線上實(shí)驗(yàn)、突發(fā)流量和容災(zāi)需求。資源分布在點(diǎn)播和實(shí)時業(yè)務(wù)中也需考慮。確定最優(yōu)資源和配比,考慮當(dāng)前和未來業(yè)務(wù)情況,進(jìn)行分析和決策。
策略精細(xì)化
策略精細(xì)化,即結(jié)合業(yè)務(wù)場景的特點(diǎn),尋找最佳的資源使用方式,用最少的資源實(shí)現(xiàn)最佳用戶體驗(yàn)。
現(xiàn)有的策略能力有熱度轉(zhuǎn)碼和冷啟動。熱度轉(zhuǎn)碼是根據(jù)視頻熱度階段選擇轉(zhuǎn)碼檔位,而冷啟動則通過預(yù)測模型預(yù)測視頻的整體價值。此外,削峰填谷也是策略精細(xì)化的常見方式之一,其是基于視頻價值函數(shù)曲線,考慮帶寬收益、轉(zhuǎn)碼成本、播放成本和業(yè)務(wù)價值等因素,當(dāng)視頻價值大于零時選擇轉(zhuǎn)碼高壓縮率檔位,以實(shí)現(xiàn)更精確地控制。最后是轉(zhuǎn)存聯(lián)動,指在轉(zhuǎn)碼和存儲之間進(jìn)行置換,特別是針對相對冷門的視頻。對于這些視頻,可以刪除其中的一些檔位以節(jié)省存儲成本,但在需要時可以再次轉(zhuǎn)碼并恢復(fù)這些檔位,從而在計算和存儲成本之間實(shí)現(xiàn)節(jié)約,降低整體點(diǎn)播成本。
以上三種視頻處理系統(tǒng)精細(xì)化演進(jìn)的策略,在火山引擎的很多業(yè)務(wù)上都有應(yīng)用,并且取得了非常大的成本和收益。但是,火山引擎希望這些能力不只是定制化的能力,而是能夠朝著更加通用化和產(chǎn)品化的方向發(fā)展,這對成本優(yōu)化非常重要,但也是一個具有挑戰(zhàn)性的任務(wù)。
03軟硬一體的視頻處理體系架構(gòu)
成本體驗(yàn)的極致優(yōu)化和業(yè)務(wù)的規(guī)模效應(yīng),促使視頻處理系統(tǒng)向數(shù)據(jù)驅(qū)動的精細(xì)化方向演進(jìn)。在視頻處理系統(tǒng)精細(xì)化演進(jìn)的趨勢下,視頻云解決方案應(yīng)運(yùn)而生。視頻云解決方案通過整合大數(shù)據(jù)分析、人工智能、算法優(yōu)化等技術(shù),將數(shù)據(jù)驅(qū)動、策略優(yōu)化和資源管理等能力融入視頻處理和傳輸服務(wù)。
在眾多的視頻云解決方案中,英特爾視頻云解決方案以其先進(jìn)的硬件技術(shù)和開放式的架構(gòu)脫穎而出。它利用英特爾強(qiáng)大的處理能力和豐富的視頻處理經(jīng)驗(yàn),提供高效、可靠、高質(zhì)量的視頻處理能力,在資源精細(xì)化管理和策略優(yōu)化方面具有獨(dú)特優(yōu)勢。
首先,通過 CPU 平臺,它提供了高質(zhì)量,編碼靈活、通用性強(qiáng)且穩(wěn)定可靠的視頻處理方案。其次在密度成本方面,通過一機(jī)多卡高密度 GPU 編解碼,實(shí)現(xiàn)了更高的計算密度和成本效益。在大部分情況下,視頻處理平臺也采用了異構(gòu)平臺的方式,即在云計算或視頻處理集群中同時使用 CPU 和 GPU 等加速卡。這種異構(gòu)平臺的優(yōu)勢在于可以靈活配置計算資源,根據(jù)具體應(yīng)用需求分配不同的計算算力和計算單元。對于質(zhì)量、編程靈活性、通用性要求較高的應(yīng)用,使用以 CPU 為主的集群進(jìn)行處理。而對于游戲等需要渲染和密集計算的應(yīng)用,通過 GPU 加速方案實(shí)現(xiàn)高效處理。在異構(gòu)平臺中,關(guān)鍵是如何管理和調(diào)配 CPU 和 GPU 的計算能力,以實(shí)現(xiàn)最佳的時延和吞吐性能。
英特爾的軟硬件解決方案在視頻領(lǐng)域應(yīng)用廣泛,主要集中在視頻編解碼、視頻分析、游戲、遠(yuǎn)程桌面(VDI)、內(nèi)容分發(fā)網(wǎng)絡(luò)(CDN)、沉浸式 AR/VR/XR 六大領(lǐng)域。旨在幫助用戶在視頻領(lǐng)域的不同應(yīng)用場景中獲得最佳性能。
在視頻編解碼平臺,基于英特爾的 CPU 和 GPU 平臺可以搭建一個高效能的異構(gòu)計算平臺。在軟件方面,包括提供了軟件編碼、硬件編碼、軟件開發(fā)工具庫、性能監(jiān)控工具等。英特爾的一些軟件和工具已經(jīng)開源,可通過相應(yīng)的鏈接進(jìn)行下載。
在視頻分析領(lǐng)域,英特爾提供了基于其底層硬件,如 CPU、GPU 和 FPJA(例如 Habana)的解決方案。這些硬件可以與各種與人工智能相關(guān)的框架和平臺集成,例如英特爾 發(fā)行版 OpenVINO 工具套件,它集成了最新的 AMX 指令集,以實(shí)現(xiàn)最佳的 AI 推理性能。此外,英特爾還提供了經(jīng)過優(yōu)化的 TensorFlow 和 PyTorch 版本以及自己的模型庫(ModelZoo),并將優(yōu)化后的 AI 模型開源,以便用戶集成、測試和應(yīng)用。
在游戲領(lǐng)域,英特爾提供了基于安卓和 Windows 的云游戲解決方案,并提供了 GPA 工具,用于監(jiān)控游戲和 GPU 的性能,并實(shí)現(xiàn)最佳的性能調(diào)優(yōu)。
對于 VDI、CDN 等領(lǐng)域,英特爾也提供了相應(yīng)的軟硬件配置、庫、SDK 和 Library 等工具,用戶可以方便地下載和使用。
所有這些解決方案都基于以英特爾 至強(qiáng)為主的 CPU 平臺、以 Xe 為主英特爾 dGPU 平臺和 oneAPI 軟硬件,并已經(jīng)得到廣泛應(yīng)用和成熟驗(yàn)證。
隨著每一代至強(qiáng)處理器架構(gòu)的升級,視頻處理性能持續(xù)提升。從 Catholic 8260 到之前的 istake,再到現(xiàn)在的第四代英特爾 至強(qiáng) 可擴(kuò)展處理器(Sapphire Rapids),視頻編解碼和轉(zhuǎn)碼的處理能力呈線性增長。在第四代英特爾 至強(qiáng) 可擴(kuò)展處理器問世之前,所有的 8K 實(shí)時編解碼賽事都需要使用四個至強(qiáng)處理器。而今年隨著第四代至強(qiáng)的推出,已經(jīng)能夠在兩個至強(qiáng)處理器或兩個 Sapphire Rapids 處理器上實(shí)現(xiàn) 8K 的實(shí)時轉(zhuǎn)碼,性能更優(yōu),性價比更高。
在基于第四代英特爾 至強(qiáng) 可擴(kuò)展處理器和 GPU 的異構(gòu)視頻處理平臺中,CPU 負(fù)責(zé)處理視頻業(yè)務(wù)的接收和分發(fā),作為整體調(diào)度中心。CPU 編解碼產(chǎn)生的視頻質(zhì)量可靠且高。GPU 主要處理速度敏感型的在線業(yè)務(wù),包括直播、游戲和渲染加速。使用小型且高密度的 GPU 部署,可進(jìn)一步降低總體成本。根據(jù)需求進(jìn)行擴(kuò)展和優(yōu)化,提供更好的性價比和吞吐量。這種異構(gòu)平臺已經(jīng)在許多應(yīng)用領(lǐng)域得到了廣泛應(yīng)用,例如直播編解碼、賽事轉(zhuǎn)播、游戲 VDI 超分和視頻分析等。它為客戶帶來了更高的性能和性價比,滿足了不同領(lǐng)域的視頻處理需求。
在異構(gòu)平臺中,如何協(xié)同調(diào)配 CPU、GPU 和其他加速卡之間的任務(wù)是非常重要的。為了解決這個問題,英特爾推出了名為 Deeplink 的技術(shù)。Deeplink 技術(shù)提供了 Dynamic Power Share(動態(tài)功耗共享)、Stream Assist(流式訪問)等協(xié)同處理和加速的方法,以提高異構(gòu)平臺的整體性能和效率。 通過 Deeplink 技術(shù),英特爾可以在 Flex140 這款 GPU 卡上穩(wěn)定實(shí)現(xiàn) 8K 的實(shí)時 GPU 編解碼。
基于至強(qiáng) CPU 和 GPU,英特爾構(gòu)建了可擴(kuò)展的視頻處理器平臺。該平臺涵蓋底層硬件和軟件基礎(chǔ)架構(gòu),包括操作系統(tǒng)、硬件加速器、Docker、API、數(shù)據(jù)庫和 SDK 等。雖然英特爾被認(rèn)為是一家以硬件為主的公司,但也擁有龐大的軟件團(tuán)隊(duì)。從底層的 Firmware 到驅(qū)動、操作系統(tǒng),再到 Kubernetes、虛擬化和容器化環(huán)境的調(diào)度和利用,軟件團(tuán)隊(duì)致力于與合作伙伴合作,充分利用硬件架構(gòu)的特性,為視頻云上的各種應(yīng)用提供高效的軟件解決方案。
04
極致的性能,成本與體驗(yàn)“魚與熊掌”兼得的密碼
談到這里,回歸最初的問題“成本與體驗(yàn)到底是不是零和博弈”想必大家都有了答案。陸揚(yáng)表示,成本的優(yōu)化,無外乎是性價比的問題。當(dāng)性能提高到一定水平,性價比、整體成本自然就有所下降。在英特爾平臺的迭代中,不斷提升核心計算能力,包括頻率、緩存大小和內(nèi)存容量等,都是希望通過這些升級來降低整體擁有成本,提高性價比。在過去幾十年以及未來,英特爾的軟硬件架構(gòu)解決方案將繼續(xù)與合作伙伴一起致力于提高視頻云行業(yè)的服務(wù)質(zhì)量、總體性能和應(yīng)用成本。
有關(guān)未來視頻處理系統(tǒng)的趨勢和發(fā)展方向,張清源持極其樂觀的態(tài)度。他表示,整個視頻領(lǐng)域未來會朝著更高清、更沉浸、更交互的方向去演進(jìn)。算力的增長還會繼續(xù),并將推動計算資源的創(chuàng)新,從而提高計算效率和降低成本。其次,AI 算法和端到端算法聯(lián)動將成為重要的發(fā)展方向,使視頻處理從全鏈路角度考慮整體效果。此外,精細(xì)化也是一個趨勢,類似于推薦系統(tǒng)的個性化推薦,視頻處理可能會結(jié)合人群特點(diǎn)進(jìn)行定制化處理。這些方向都有很大的潛力。
陸揚(yáng)補(bǔ)充道,視頻的發(fā)展趨勢包括分辨率的提升和適配范圍的擴(kuò)大。視頻分辨率已經(jīng)發(fā)展到 8K,然而,這種超高清分辨率對計算中心提出了巨大挑戰(zhàn),因?yàn)樘幚磉@樣的視頻需要處理龐大的計算量。另外,AI 應(yīng)用的迅猛發(fā)展也對計算中心提出了挑戰(zhàn)。無論是 CPU、加速器還是異構(gòu)平臺,如何高效智能地運(yùn)行越來越復(fù)雜的應(yīng)用和計算中心,使計算能夠無縫銜接,具備全鏈路的動態(tài)感知和自適應(yīng)能力,都是未來的重要方向。基于此,陸揚(yáng)希望英特爾的最新硬件架構(gòu)平臺能夠適應(yīng)不斷變化的視頻云應(yīng)用,更好地服務(wù)大眾需求。
點(diǎn)擊視頻了解實(shí)戰(zhàn)課精彩內(nèi)容!
點(diǎn)擊閱讀原文,了解更多英特爾云及互聯(lián)網(wǎng)行業(yè)創(chuàng)新實(shí)踐。
文章轉(zhuǎn)載自:InfoQ
作者:張雅文
一般提示和法律聲明:
文章僅代表媒體觀點(diǎn)
文章圖片等素材的版權(quán)歸其所有者
-
英特爾
+關(guān)注
關(guān)注
61文章
10007瀏覽量
172333 -
cpu
+關(guān)注
關(guān)注
68文章
10902瀏覽量
213015
原文標(biāo)題:視頻處理系統(tǒng)精細(xì)化演進(jìn),成本與體驗(yàn)之間如何找尋平衡點(diǎn)?
文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論