【技術實現步驟摘要】
視頻的處理方法和模型的構建方法
[0001]本專利技術涉及視頻處理
,具體而言,涉及一種視頻的處理方法和模型的構建方法。
技術介紹
[0002]高動態范圍(High Dynamic Range,以下簡稱HDR)視頻,相對于標準動態范圍(Standard Dynamic Range,以下簡稱SDR)視頻,圖像的明暗層次更清晰,圖像細節更豐富,能夠更逼真的重現真實場景。隨著HDR技術的發展以及HDR顯示器的逐步普及,對HDR視頻的需求逐步增加。真正的HDR視頻制作需要在采集端使用高動態范圍的成像器件,制作時也要使用支持HDR非編軟件,也就是說HDR視頻的內容制作對拍攝設備和前處理技術都有很高的要求,因此目前的HDR內容仍處于相對匱乏的狀態。
[0003]目前的HDR重建算法主要是針對單幀圖片,并不適合用于生成HDR視頻,因為視頻中存在著更復雜的運動信息。
[0004]針對上述的問題,目前尚未提出有效的解決方案。
技術實現思路
[0005]本專利技術實施例提供了一種視頻的處理方法和模型的構建方法,以至少解決現有技術中重建高動態范圍視頻的效果不佳的技術問題。
[0006]根據本專利技術實施例的一個方面,提供了一種視頻的處理方法,包括:接收客戶端發送的服務調用請求,其中,所述服務調用請求中攜帶有滿足第一預設條件的視頻數據以及滿足第二預設條件的視頻序列;對滿足第一預設條件的視頻數據以及滿足第二預設條件的視頻序列通過機器學習訓練;以及輸出訓練結果,其中,所述訓練結果為模型參數集合。r/>[0007]進一步地,所述方法還包括:將所述模型參數集合進行打包并發送至所述客戶端。
[0008]根據本專利技術實施例的一個方面,提供了一種模型的構建方法,包括:獲取滿足第一預設條件的視頻數據;將所述視頻數據中的視頻序列進行對齊處理;將對齊處理后的視頻序列進行處理,得到不同曝光時長下滿足第二預設條件的視頻序列;將所述滿足第二預設條件的視頻序列和所述滿足第一預設條件的視頻數據輸入深度卷積神經網絡模型進行訓練,得到目標模型。
[0009]進一步地,在得到不同曝光時長下滿足第二預設條件的視頻序列之后,所述方法還包括:從所述滿足第二預設條件的視頻序列中進行采樣,得到訓練樣本數據;將所述滿足第二預設條件的視頻序列和所述滿足第一預設條件的視頻數據輸入深度卷積神經網絡模型進行訓練,得到目標模型包括:將所述訓練樣本數據和所述滿足第一預設條件的視頻數據輸入深度卷積神經網絡模型進行訓練,得到所述目標模型。
[0010]進一步地,將所述訓練樣本數據和所述滿足第一預設條件的視頻數據輸入深度卷積神經網絡模型進行訓練,得到所述目標模型包括:從所述訓練樣本數據中選取第一組相鄰三幀圖片輸入所述深度卷積神經網絡模型,得到中間幀的HDR圖像一;將所述中間幀的
HDR圖像一與對應的滿足所述第一預設條件的圖像一進行對比,得到誤差一;從所述訓練樣本數據中選取第二組相鄰三幀圖片輸入所述深度卷積神經網絡模型,得到中間幀的HDR圖像二,其中,所述第一組相鄰三幀圖片的中間幀與所述第二組相鄰三幀圖片的中間幀相鄰;將所述中間幀的HDR圖像二與對應的滿足所述第一預設條件的圖像二進行對比,得到誤差二;基于所述誤差一和所述誤差二確定損失函數;將所述損失函數計算出的估計誤差通過反向傳播算法傳回所述深度卷積神經網絡模型以梯度下降算法訓練模型,得到所述目標模型。
[0011]進一步地,所述方法還包括:對所述中間幀的HDR圖像一和所述中間幀的HDR圖像二加入時序一致性的約束條件。
[0012]進一步地,將所述視頻數據集中的視頻序列進行對齊處理包括:對所述視頻數據中的相鄰三幀圖像,提取每幀圖像上的特征點,其中,所述相鄰三幀圖像中包括:第一幀圖像、第二幀圖像和第三幀圖像,所述第二幀圖像是所述相鄰三幀圖像中的中間幀;基于每幀圖像上的特征點確定所述第一幀圖像的變換矩陣和所述第三幀圖像的變換矩陣;基于所述第一幀圖像的變換矩陣對所述第一幀圖像進行變換,以將所述第一幀圖像和第二幀圖像進行對齊,基于所述第三幀圖像的變換矩陣對所述第三幀圖像進行變換,以將所述第三幀圖像和所述第二幀圖像進行對齊。
[0013]進一步地,從所述滿足第二預設條件的視頻序列中進行采樣,得到訓練樣本數據包括:對滿足所述第二預設條件的視頻序列中相鄰兩幀圖像序列之間光流大于預設光流的圖像區域進行采樣,得到訓練樣本數據。
[0014]進一步地,將對齊處理后的視頻序列進行處理,得到不同曝光時長下滿足第二預設條件的視頻序列包括:利用相機響應函數以及隨機生成的曝光時間,對對齊處理后的視頻序列進行重曝光處理,得到不同曝光時長下的滿足所述第二預設條件的視頻序列。
[0015]進一步地,在得到不同曝光時長下的滿足所述第二預設條件的視頻序列之后,所述方法還包括:對所述不同曝光時長下的滿足所述第二預設條件的視頻序列加入噪聲信號以及應用伽馬顏色變化,以模擬真實的滿足所述第二預設條件的視頻序列。
[0016]進一步地,在得到目標模型之后,所述方法還包括:獲取滿足所述第二預設條件的視頻數據,其中,所述視頻數據中包括不同曝光時長的視頻序列;將所述視頻序列進行對齊處理;將對齊處理后的視頻序列輸入目標模型,得到滿足所述第一預設條件的視頻數據。
[0017]根據本專利技術實施例的一個方面,提供了一種計算機可讀的存儲介質,其特征在于,所述存儲介質包括存儲的程序,其中,在所述程序運行時控制所述存儲介質所在設備執行上述任意一項所述的方法。
[0018]根據本專利技術實施例的一個方面,提供了一種處理器,其中,所述處理器用于運行程序,其中,所述程序運行時執行上述任意一項所述的方法。
[0019]在本專利技術實施例中,通過獲取滿足第一預設條件的視頻數據;將所述視頻數據中的視頻序列進行對齊處理;將對齊處理后的視頻序列進行處理,得到不同曝光時長下滿足第二預設條件的視頻序列;將所述滿足第二預設條件的視頻序列和所述滿足第一預設條件的視頻數據輸入深度卷積神經網絡模型進行訓練,得到目標模型,通過將對齊處理后的視頻序列輸入目標模型,得到滿足所述第一預設條件的視頻數據對能夠有效避免因視頻序列對齊不準導致的輸出視頻中的迭影現象,從而保證了重建高動態范圍視頻的效果,進而解
決了現有技術中重建高動態范圍視頻的效果不佳的技術問題。
附圖說明
[0020]此處所說明的附圖用來提供對本專利技術的進一步理解,構成本申請的一部分,本專利技術的示意性實施例及其說明用于解釋本專利技術,并不構成對本專利技術的不當限定。在附圖中:
[0021]圖1是根據本專利技術實施例的計算機終端的硬件結構框圖;
[0022]圖2是根據本專利技術實施例一提供的模型的構建方法的流程圖;
[0023]圖3是根據本專利技術實施例一的模型的構建方法中訓練模型的示意圖;
[0024]圖4是根據本專利技術實施例一提供的可選的模型的構建方法的流程圖;
[0025]圖5是根據本專利技術實施例二提供的視頻的處理方法的流程圖;以及
[0026]圖6是根據本文檔來自技高網...
【技術保護點】
【技術特征摘要】
1.一種視頻的處理方法,其特征在于,包括:接收客戶端發送的服務調用請求,其中,所述服務調用請求中攜帶有滿足第一預設條件的視頻數據以及滿足第二預設條件的視頻序列;對滿足所述第一預設條件的視頻數據以及滿足所述第二預設條件的視頻序列通過機器學習訓練;以及輸出訓練結果,其中,所述訓練結果為模型參數集合。2.根據權利要求1所述的方法,其特征在于,所述方法還包括:將所述模型參數集合進行打包并發送至所述客戶端。3.一種模型的構建方法,其特征在于,包括:獲取滿足第一預設條件的視頻數據;將所述視頻數據中的視頻序列進行對齊處理;將對齊處理后的視頻序列進行處理,得到不同曝光時長下滿足第二預設條件的視頻序列;將所述滿足第二預設條件的視頻序列和所述滿足第一預設條件的視頻數據輸入深度卷積神經網絡模型進行訓練,得到目標模型。4.根據權利要求3所述的方法,其特征在于,在得到不同曝光時長下滿足第二預設條件的視頻序列之后,所述方法還包括:從所述滿足第二預設條件的視頻序列中進行采樣,得到訓練樣本數據;將所述滿足第二預設條件的視頻序列和所述滿足第一預設條件的視頻數據輸入深度卷積神經網絡模型進行訓練,得到目標模型包括:將所述訓練樣本數據和所述滿足第一預設條件的視頻數據輸入深度卷積神經網絡模型進行訓練,得到所述目標模型。5.根據權利要求4所述的方法,其特征在于,將所述訓練樣本數據和所述滿足第一預設條件的視頻數據輸入深度卷積神經網絡模型進行訓練,得到所述目標模型包括:從所述訓練樣本數據中選取第一組相鄰三幀圖片輸入所述深度卷積神經網絡模型,得到中間幀的HDR圖像一;將所述中間幀的HDR圖像一與對應的滿足所述第一預設條件的圖像一進行對比,得到誤差一;從所述訓練樣本數據中選取第二組相鄰三幀圖片輸入所述深度卷積神經網絡模型,得到中間幀的HDR圖像二,其中,所述第一組相鄰三幀圖片的中間幀與所述第二組相鄰三幀圖片的中間幀相鄰;將所述中間幀的HDR圖像二與對應的滿足所述第一預設條件的圖像二進行對比,得到誤差二;基于所述誤差一和所述誤差二確定損失函數;將所述損失函數計算出的估計誤差通過反向傳播算法傳回所述深度卷積神經網絡模型以梯度下降算法訓練模型,得到所述目標模型。6.根據權利要求5所述的方法,其特征在于,所述方法還包...
【專利技術屬性】
技術研發人員:陳冠英,
申請(專利權)人:阿里巴巴集團控股有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。