本申請涉及一種視頻編碼參數獲取方法、裝置、網絡模型及電子設備,屬于視頻編碼技術領域。該視頻編碼參數獲取方法包括:獲取待編碼視頻;利用預先訓練好的多叉戟神經網絡模型對待編碼視頻進行處理,輸出不同分辨率不同碼率下的質量分數;根據不同分辨率不同碼率下的質量分數確定出目標分辨率和目標碼率,其中,目標分辨率和目標碼率為待編碼視頻編碼所需的編碼參數。本申請實施例中,僅需要向多叉戟神經網絡模型輸入一個待編碼視頻便可得到多個不同分辨率和/或不同碼率的質量分數,解決了現有技術需要多次編碼才能得到不同分辨率和/或不同碼率的視頻所存在的問題,即改善了現有視頻編碼方法耗時長以及消耗的編碼資源多的問題。問題。問題。
【技術實現步驟摘要】
一種視頻編碼參數獲取方法、裝置、網絡模型及電子設備
[0001]本申請屬于視頻編碼
,具體涉及一種視頻編碼參數獲取方法、裝置、網絡模型及電子設備。
技術介紹
[0002]視頻是由連續的幀圖像構成的視頻幀序列。原始的視頻幀序列需要占用很大的內存或帶寬,導致存儲和傳輸困難。由于連續的幀圖像之間具有相似性,為便于儲存和傳輸,可以通過視頻編碼技術對原始的視頻進行編碼壓縮,將原始視頻格式的文件轉換成另一種視頻格式文件,以去除空間、時間維度的冗余。
[0003]目前對于智能視頻編碼技術,主要采用基于視頻復雜性的恒定場景質量硬編碼技術。這種編碼方式的主要做法是:1)根據所需要的視頻質量的分辨率和碼率對原始視頻進行編碼,并計算出編碼視頻相對于原始視頻的PSNR(Peak Signal to Noise Ratio,峰值信噪比)分數;2)以碼率為橫軸,以PSNR分數為縱軸,畫出不同分辨率下的PSNR分數
?
碼率曲線(R
?
D曲線);3)由于視頻質量的PSNR分數會隨著碼率增大而增大,而增長率會逐漸降低,因此多條不同分辨率下的曲線會呈現出類似凸函數的曲線,取所有曲線或每條曲線的最大凸包(最大凸點,該點即是同等碼率下視頻質量分數最好的點),這個點對應的分辨率和碼率就是最優編碼條件,使用這組分辨率和碼率對原始視頻編碼即可得到最優視頻。
[0004]這種方法缺點是每次需要對同一個的視頻使用不同分辨率、不同碼率來編碼,這樣如果想要得到更稠密的由碼率
?
分數點組成的曲線,需要消耗平方倍的編碼資源,導致視頻編碼的過程所消耗時間會很長。
技術實現思路
[0005]鑒于此,本申請的目的在于提供一種視頻編碼參數獲取方法、裝置、電子設備及計算機可讀存儲介質,以改善現有視頻編碼方法耗時長以及消耗的編碼資源多的問題。
[0006]本申請的實施例是這樣實現的:第一方面,本申請實施例提供了一種視頻編碼參數獲取方法,包括:獲取待編碼視頻;利用預先訓練好的多叉戟神經網絡模型對所述待編碼視頻進行處理,輸出不同分辨率不同碼率下的質量分數;根據不同分辨率不同碼率下的質量分數確定出目標分辨率和目標碼率,其中,所述目標分辨率和所述目標碼率為所述待編碼視頻編碼所需的編碼參數。
[0007]本申請實施例中,僅需要向多叉戟神經網絡模型輸入一個待編碼視頻便可得到多個不同分辨率和/或不同碼率的質量分數,解決了現有技術需要多次編碼才能得到不同分辨率和/或不同碼率的視頻所存在的問題,即改善了現有視頻編碼方法耗時長以及消耗的編碼資源多的問題。
[0008]結合第一方面實施例的一種可能的實施方式,所述利用預先訓練好的多叉戟神經網絡模型對所述待編碼視頻進行處理,輸出不同分辨率不同碼率下的質量分數,包括:利用所述多叉戟神經網絡模型對所述待編碼視頻進行處理,得到淺層特征;利用所述多叉戟神
經網絡模型對所述淺層特征進行處理,得到多個不同分辨率下的深層特征;利用所述多叉戟神經網絡模型對每一個所述深層特征進行處理,得到多個不同碼率下的質量分數。
[0009]本申請實施例中,先對待編碼視頻進行淺層特征提取,之后基于同一個淺層特征得到多個不同分辨率下的深層特征,使得這多個深層特征均是基于同一個淺層特征得到,之后再對每一個所述深層特征進行處理,得到多個不同碼率下的質量分數,這樣便可得到快速不同分辨率不同碼率下的質量分數。
[0010]結合第一方面實施例的一種可能的實施方式,所述多叉戟神經網絡模型包括:依次連接的主干網絡、多叉戟網絡、多網絡頭,所述多叉戟網絡中的每個分支均連接一個所述多網絡頭,所述多叉戟網絡中的每個分支對應的分辨率不同,所述多網絡頭中的每個分支對應的碼率不同;所述利用預先訓練好的多叉戟神經網絡模型對所述待編碼視頻進行處理,輸出不同分辨率不同碼率下的質量分數,包括:利用所述主干網絡對所述待編碼視頻進行處理,得到淺層特征;利用所述多叉戟網絡對所述淺層特征進行處理,得到多個不同分辨率下的深層特征;利用對應的所述多網絡頭對每一個所述深層特征進行處理,得到多個不同碼率下的質量分數。
[0011]本申請實施例中,采用上述結構的多叉戟神經網絡模型,使得僅需要輸入一個待編碼視頻便可得到多個不同分辨率和/或不同碼率的質量分數,同時利用多叉戟網絡來表示不同分辨率的深層特征,與只使用不分叉的、單結構的網絡相比,能夠更好表示不同分辨率的視頻的特征;與另一種多分辨率的表示方法(特征金字塔)相比,不需要使用上采樣的方式模擬不同分辨率,不會引入新的誤差。
[0012]結合第一方面實施例的一種可能的實施方式,所述待編碼視頻包括k幀圖像,k為正整數;所述根據不同分辨率不同碼率下的質量分數確定出目標分辨率和目標碼率,包括:從圖像幀的維度,確定所述待編碼視頻的平均質量分數和平均碼率;根據所述平均質量分數和所述平均碼率,得到表征質量分數和碼率的曲線;獲取所述曲線中的最大凸包對應的所述目標分辨率和所述目標碼率。
[0013]本申請實施例中,通過獲取表征質量分數和碼率的曲線中的最大凸包對應的目標分辨率和目標碼率,從而可以獲得最優的編碼參數。
[0014]結合第一方面實施例的一種可能的實施方式,所述質量分數包括峰值信噪比分數和/或結構相似性分數。
[0015]本申請實施例中,可以基于峰值信噪比分數和/或結構相似性分數來表征視頻的編碼質量得分,靈活性高,若同時考慮峰值信噪比分數和結構相似性分數時,可以提高準確性,進而篩選出來的目標分辨率和目標碼率的參數最好。
[0016]結合第一方面實施例的一種可能的實施方式,所述待編碼視頻為對原始視頻進行指定處理后的視頻,所述指定處理包括針對所述原始視頻中的每幀圖像,將該幀圖像的尺寸縮放至設定大小,對縮放后的該幀圖像中的每一個像素點除以第一閾值,得到數值在設定范圍內的數組,之后對數組內的每一個點先減去第二閾值,再除以第三閾值。
[0017]本申請實施例中,通過對原始視頻進行指定處理,可以消除異常像素點導致的不良影響,可以防止過擬合,提高模型的泛化能力。
[0018]結合第一方面實施例的一種可能的實施方式,所述方法還包括:獲取訓練樣本,所述訓練樣本包括訓練視頻和m
×
n個編碼視頻對應的實際分數,不同所述編碼視頻的分辨率
和/或碼率不同,所述m
×
n個編碼視頻為利用給定的m個分辨率和n個碼率對所述訓練視頻編碼得到,m、n均為正整數;利用訓練樣本對初始的多叉戟神經網絡模型進行訓練,得到訓練好的多叉戟神經網絡模型。
[0019]結合第一方面實施例的一種可能的實施方式,利用訓練樣本對初始的多叉戟神經網絡模型進行訓練,得到訓練好的多叉戟神經網絡模型,包括:將所述訓練視頻的每幀圖像輸入初始的多叉戟神經網絡模型中進行處理,輸出m
×
n個質量分數;確定質量分數與該訓練視頻對應的實際分數的損失誤差;基于所述損失誤差更新模型參數,之后繼續將所述訓練視頻的每幀圖像輸入初始的多叉戟神經網絡模型中進行本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種視頻編碼參數獲取方法,其特征在于,包括:獲取待編碼視頻;利用預先訓練好的多叉戟神經網絡模型對所述待編碼視頻進行處理,輸出不同分辨率不同碼率下的質量分數;根據不同分辨率不同碼率下的質量分數確定出目標分辨率和目標碼率,其中,所述目標分辨率和所述目標碼率為所述待編碼視頻編碼所需的編碼參數。2.根據權利要求1所述的方法,其特征在于,所述利用預先訓練好的多叉戟神經網絡模型對所述待編碼視頻進行處理,輸出不同分辨率不同碼率下的質量分數,包括:利用所述多叉戟神經網絡模型對所述待編碼視頻進行處理,得到淺層特征;利用所述多叉戟神經網絡模型對所述淺層特征進行處理,得到多個不同分辨率下的深層特征;利用所述多叉戟神經網絡模型對每一個所述深層特征進行處理,得到多個不同碼率下的質量分數。3.根據權利要求1或2所述的方法,其特征在于,所述多叉戟神經網絡模型包括:依次連接的主干網絡、多叉戟網絡、多網絡頭,所述多叉戟網絡中的每個分支均連接一個所述多網絡頭,所述多叉戟網絡中的每個分支對應的分辨率不同,所述多網絡頭中的每個分支對應的碼率不同;所述利用預先訓練好的多叉戟神經網絡模型對所述待編碼視頻進行處理,輸出不同分辨率不同碼率下的質量分數,包括:利用所述主干網絡對所述待編碼視頻進行處理,得到淺層特征;利用所述多叉戟網絡對所述淺層特征進行處理,得到多個不同分辨率下的深層特征;利用對應的所述多網絡頭對每一個所述深層特征進行處理,得到多個不同碼率下的質量分數。4.根據權利要求3所述的方法,其特征在于,所述待編碼視頻包括k幀圖像,k為正整數;所述根據不同分辨率不同碼率下的質量分數確定出目標分辨率和目標碼率,包括:從圖像幀的維度,確定所述待編碼視頻的平均質量分數和平均碼率;根據所述平均質量分數和所述平均碼率,得到表征質量分數和碼率的曲線;獲取所述曲線中的最大凸包對應的所述目標分辨率和所述目標碼率。5.根據權利要求1所述的方法,其特征在于,所述質量分數包括峰值信噪比分數和/或結構相似性分數。6.根據權利要求1所述的方法,其特征在于,所述待編碼視頻為對原始視頻進行指定處理后的視頻,所述指定處理包括針對所述原始視頻中的每幀圖像,將該幀圖像的尺寸縮放至設定大小,對縮放后的該幀圖像中的每一個像素點除以第一閾值,得到數值在設定范圍內的數組,之后對數組內的每一...
【專利技術屬性】
技術研發人員:?七四專利代理機構,
申請(專利權)人:沐曦科技成都有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。