System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及智能座艙交互,特別是涉及一種場景分類模型訓練方法、裝置、計算機設備和存儲介質。
技術介紹
1、隨著車輛技術的發展,車載觀影逐漸流行,用戶在車中便可實現觀看影視的需求。目前,用戶觀看影視的方式,主要是投屏式影視,由于車輛無法實時對視頻場景進行識別,從而無法根據視頻場景提供相應的座艙環境,不能為用戶提供更加沉浸式的觀影體驗。
技術實現思路
1、基于此,提供一種場景分類模型訓練方法、裝置、計算機設備和存儲介質,解決現有技術中由于車輛無法實時對視頻場景進行識別,從而無法根據視頻場景提供相應的座艙環境,不能為用戶提供更加沉浸式的觀影體驗的問題。
2、第一方面,本申請提供了一種場景分類模型訓練方法,所述方法包括:
3、對歷史視頻數據進行預處理,得到樣本圖像集合;其中,所述樣本圖像集合中包含樣本圖像對應的場景維度標簽,所述場景維度標簽包括環境類別維度標簽和冷暖維度標簽,所述環境類別維度標簽與香氛釋放指令,所述冷暖維度標簽與空調冷暖風指令關聯;
4、將所述樣本圖像集合輸入初始場景分類模型進行訓練,得到每個所述樣本圖像各自對應的歷史分類特征向量;
5、根據每個所述樣本圖像各自對應的歷史分類特征向量、每個所述樣本圖像各自對應的場景維度標簽以及帶有標簽平滑的交叉熵損失函數,確定每個所述樣本圖像各自對應的第一損失;其中,所述第一損失中包含不同場景維度各自對應的損失;
6、按照預設調節方法對每個所述樣本圖像各自對應的第一損失進行調節,得到
7、通過上述方法,基于歷史視頻數據對初始場景分類模型進行模型訓練,得到目標場景分類模型,并按照預設調節方法進行損失調節,可以提高目標場景分類模型的判別能力和準確性,從而可以通過目標場景分類模型在用戶觀看視頻時,準確識別出視頻場景,并根據視頻場景提供相應的座艙環境,為用戶提供更加沉浸式的觀影體驗。
8、在一個實施例中,所述將所述樣本圖像集合輸入初始場景分類模型進行訓練,得到每個所述樣本圖像各自對應的歷史分類特征向量,包括:
9、分別對每個所述樣本圖像進行卷積處理,得到每個所述樣本圖像各自對應的多尺度局部特征圖,并基于自注意力機制分別對每個所述樣本圖像進行特征提取,得到每個所述樣本圖像各自對應的全局特征圖;
10、對每個所述樣本圖像各自對應的多尺度局部特征圖與每個所述樣本圖像各自對應的全局特征圖進行融合處理,得到每個所述樣本圖像各自對應的融合特征圖;
11、分別對每個所述融合特征圖進行上采樣處理,得到每個目標融合特征圖;
12、將每個所述目標融合特征圖輸入所述初始場景分類模型中的全連接層,輸出每個所述樣本圖像各自對應的歷史分類特征向量。
13、通過上述方法,融合由cnn和transformer學習的樣本圖像的局部特征和全局特征,得到融合特征圖,并基于融合特征圖進行訓練,可以有效提高目標場景分類模型的準確性和泛化能力。
14、在一個實施例中,所述按照預設調節方法對每個所述樣本圖像各自對應的第一損失進行調節,得到目標損失,包括:
15、基于每個所述樣本圖像各自對應的第一損失,生成每個所述樣本圖像各自對應的損失向量;
16、按照預設選擇方法從每個所述樣本圖像各自對應的損失向量中,選擇出不同場景維度各自對應的k個損失分量;其中,k為大于0的整數;
17、根據預設調節矩陣,對不同場景維度各自對應的k個損失分量進行自適應權重調節,得到不同場景維度各自對應的k個目標損失分量;
18、基于不同場景維度各自對應的k個目標損失分量,生成不同場景維度各自對應的第二損失;
19、對不同場景維度各自對應的第二損失進行損失平衡處理,得到所述目標損失。
20、通過上述方法,選擇出不同場景維度各自對應的k個損失分量,作為不同場景維度各自對應的困難樣本,從而對這些困難樣本進行自適應權重調節,可以提升模型對困難樣本的判別能力,并引入了損失平衡策略,改善了各個場景維度損失計算不平衡的問題。
21、在一個實施例中,所述根據預設調節矩陣,對不同場景維度各自對應的k個損失分量進行自適應權重調節,得到不同場景維度各自對應的k個目標損失分量,包括:
22、根據預設調節矩陣,生成k個所述損失分量各自對應的損失貢獻權重;
23、對k個所述損失分量各自對應的損失貢獻權重進行歸一化處理,得到k個所述損失分量各自對應的目標損失貢獻權重;
24、基于k個所述損失分量各自的目標損失貢獻權重,對k個所述損失分量進行加權處理,得到k個目標損失分量。
25、通過上述方法,基于預設調節矩陣,來調節不同場景維度各自對應的k個目標損失分量的權重,可以提升模型的判別能力。
26、在一個實施例中,所述對不同場景維度各自對應的第二損失進行損失平衡處理,得到所述目標損失,包括:
27、按照不同場景維度各自對應的預設平衡權重,對不同場景維度各自對應的第二損失進行加權處理,得到不同場景維度各自對應的第三損失;
28、對不同場景維度各自對應的第三損失進行平均值計算,得到所述目標損失。
29、通過上述方法,基于不同場景維度各自對應的預設平衡權重,對不同場景維度各自對應的第二損失進行損失平衡處理,從而降低樣本不均衡所帶來的損失計算影響,可以幫助模型更好地學習到數據的真實分布,提升模型的泛化能力。
30、第二方面,本申請提供了一種座艙環境調整方法,采用了上述第一方面中的目標場景分類模型,所述方法包括:
31、對待識別視頻數據進行預處理,得到目標圖像集合;
32、將所述目標圖像集合輸入所述目標場景分類模型,得到所述目標圖像集合中每個目標圖像各自對應的目標分類特征向量;
33、確定每個所述目標分類特征向量各自對應的目標指令;
34、基于每個所述目標分類特征向量各自對應的目標指令,調整車輛的座艙環境。
35、通過上述方法,基于目標場景分類模型準確識別出待識別視頻數據對應的場景維度,并根據識別結果確定對應的目標指令,從而根據目標指令調整座艙環境,為用戶提供更加沉浸式的觀影體驗。
36、在一個實施例中,所述確定每個所述目標分類特征向量各自對應的目標指令,包括:
37、在所述目標分類特征向量對應的場景維度為環境類別維度時,確定所述目標指令為所述環境類別維度對應的香氛釋放指令;
38、在所述目標分類特征向量對應的場景維度為冷暖維度時,確定所述目標指令為所述冷暖維度對應的空調冷暖風指令。
39、通過上述方法,基于目標指令控制香氛釋放或空調冷暖風,為用戶提供更加沉浸式的觀影體驗。
40、第三方面,本申請提供了一種場景分類模型訓練裝置,所述裝置包括:
4本文檔來自技高網...
【技術保護點】
1.一種場景分類模型訓練方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述將所述樣本圖像集合輸入初始場景分類模型進行訓練,得到每個所述樣本圖像各自對應的歷史分類特征向量,包括:
3.根據權利要求1所述的方法,其特征在于,所述按照預設調節方法對每個所述樣本圖像各自對應的第一損失進行調節,得到目標損失,包括:
4.根據權利要求3所述的方法,其特征在于,所述根據預設調節矩陣,對不同場景維度各自對應的K個損失分量進行自適應權重調節,得到不同場景維度各自對應的K個目標損失分量,包括:
5.根據權利要求3所述的方法,其特征在于,所述對不同場景維度各自對應的第二損失進行損失平衡處理,得到所述目標損失,包括:
6.一種座艙環境調整方法,采用了權利要求1-5中任一項所述的目標場景分類模型,其特征在于,所述方法包括:
7.根據權利要求6所述的方法,其特征在于,所述確定每個所述目標分類特征向量各自對應的目標指令,包括:
8.一種場景分類模型訓練裝置,其特征在于,所述裝置包括:
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至7中任一項所述的方法。
...【技術特征摘要】
1.一種場景分類模型訓練方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述將所述樣本圖像集合輸入初始場景分類模型進行訓練,得到每個所述樣本圖像各自對應的歷史分類特征向量,包括:
3.根據權利要求1所述的方法,其特征在于,所述按照預設調節方法對每個所述樣本圖像各自對應的第一損失進行調節,得到目標損失,包括:
4.根據權利要求3所述的方法,其特征在于,所述根據預設調節矩陣,對不同場景維度各自對應的k個損失分量進行自適應權重調節,得到不同場景維度各自對應的k個目標損失分量,包括:
5.根據權利要求3所述的方法,其特征在于,所述對不同場景維度各自對應的第二損失進行損失平衡處理...
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。