System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及數據處理,具體涉及一種數據標簽確定方法、裝置、電子設備及存儲介質。
技術介紹
1、隨著汽車工業的飛速發展,基于汽車零部件的故障預警成為汽車行業里的一大研究熱點。應用中,一般利用有監督的機器學習和深度學習的汽車零部件故障預警模型,實現對汽車零部件的故障預警。這種故障預警方式需要大量的有標簽數據集進行訓練。
2、目前,一般是根據汽車零部件的維修時間對汽車數據進行打標,來實現有標簽數據集的獲取,具體的,將維修時間之前一段時間的汽車數據打標為故障數據,將維修時間之后的汽車數據打標為無故障數據,由此得到汽車零部件的有標簽數據集。
3、然而,這種基于維修時間直接打標的方式,容易將維修時間之前一段時間里無故障的汽車數據,也打標為故障數據,不夠準確,影響后續模型訓練的效果。
技術實現思路
1、為了解決上述技術問題或者至少部分地解決上述技術問題,本申請提供了一種數據標簽確定方法、裝置、電子設備及存儲介質。
2、第一方面,本申請提供了一種數據標簽確定方法,包括:
3、獲取汽車零部件對應的多個駕駛循環數據,其中,每個所述駕駛循環數據包括汽車單次啟停過程中采集的、與所述汽車零部件相關的車輛數據;
4、確定所述汽車零部件對應的維修時間;
5、從對應采集時間在所述維修時間之前的駕駛循環數據中,確定第一數量的駕駛循環數據作為一個正樣本,以及,從對應采集時間在所述維修時間之后的駕駛循環數據中,確定第二數量的駕駛循環數據作為n個負
6、利用所述正樣本和所述負樣本,訓練標簽標注模型;
7、基于訓練好的所述標簽標注模型,對采集時間在所述維修時間之前的所有所述駕駛循環數據進行標簽預測,得到每個所述駕駛循環數據對應的故障標簽。
8、在一個可能的實施方式中,所述基于訓練好的所述標簽標注模型,對采集時間在所述維修時間之前的所有所述駕駛循環數據進行標簽預測,得到每個所述駕駛循環數據對應的故障標簽之后,還包括:
9、利用每個所述駕駛循環數據以及每個所述駕駛循環數據對應的故障標簽,訓練故障預測模型,直至所述故障預測模型收斂;
10、利用訓練好的所述故障預測模型,對所述汽車零部件對應的單個駕駛循環數據進行故障預測。
11、在一個可能的實施方式中,所述從對應采集時間在所述維修時間之前的駕駛循環數據中,確定第一數量的駕駛循環數據作為一個正樣本,包括:
12、將對應采集時間在所述維修時間之前的所有駕駛循環數據,按照對應采集時間由后到先的順序進行排序,得到第一數據序列;
13、在所述第一數據序列中截取排序靠前的、第一數量的駕駛循環數據,得到第一樣本序列,將所述第一樣本序列作為一個所述正樣本。
14、在一個可能的實施方式中,所述從對應采集時間在所述維修時間之后的駕駛循環數據中,確定第二數量的駕駛循環數據作為n個負樣本,包括:
15、將對應采集時間在所述維修時間之后的所有駕駛循環數據,按照對應采集時間由先到后的順序進行排序,得到第二數據序列;
16、以第一數量的駕駛循環數據為單位,依次在所述第二數據序列中截取n個第二樣本序列,將每個所述第二樣本序列作為一個所述負樣本。
17、在一個可能的實施方式中,所述標簽標注模型包括:特征提取網絡和故障識別網絡,所述利用所述正樣本和所述負樣本,訓練標簽標注模型,包括:
18、針對每個樣本,基于所述樣本的樣本類型設置所述樣本的粗標簽,其中,所述樣本類型用于表征對應樣本為正樣本或負樣本;
19、對所有樣本進行批次劃分得到多個樣本批次,其中,每個樣本批次包含預設數量的樣本;
20、針對每個樣本批次,利用所述特征提取網絡提取所述樣本批次中每個樣本的樣本特征序列向量;
21、將所述樣本批次中每個樣本的樣本特征序列向量輸入至所述故障識別網絡,以由所述故障識別網絡輸出對應的整體異常狀態;
22、基于所述樣本批次中每個樣本對應的所述粗標簽和所述整體異常狀態,計算對應的損失值;
23、在所述損失值小于預設閾值的情況下結束訓練過程,得到訓練好的標簽標注模型。
24、在一個可能的實施方式中,所述基于訓練好的所述標簽標注模型,對采集時間在所述維修時間之前的所有所述駕駛循環數據進行標簽預測,得到每個所述駕駛循環數據對應的故障標簽,包括:
25、將對應采集時間在所述維修時間之前的所有駕駛循環數據,按照對應采集時間由先到后的順序進行排序,得到第三數據序列;
26、以第一數量的駕駛循環數據為單位,從所述第三數據序列中由后向前依次截取待處理序列,以及將所述待處理序列輸入至訓練好的所述標簽標注模型,以由所述標簽標注模型輸出所述待處理序列中每個駕駛循環數據對應的故障標簽,直至所述待處理序列中每個駕駛循環數據的標簽為無故障的情況下,將所述待處理序列確定為目標序列,并停止處理;
27、將所述第三數據序列中排在所述目標序列之前的駕駛循環數據,確定為目標數據;
28、將所述目標數據對應的故障標簽,確定為無故障。
29、在一個可能的實施方式中,每個所述駕駛循環數據中包括所述汽車一次啟停過程中,所述汽車零部件本身的can信號數據、所述汽車零部件負載的can信號數據、所述汽車的車輛行駛外部環境的can信號數據,以及,所述汽車的車輛駕駛行為的can信號數據。
30、第二方面,本申請提供了一種數據標簽確定裝置,包括:
31、數據獲取模塊,用于獲取汽車零部件對應的多個駕駛循環數據,其中,每個所述駕駛循環數據包括汽車單次啟停過程中采集的、與所述汽車零部件相關的車輛數據;
32、時間確定模塊,用于確定所述汽車零部件對應的維修時間;
33、樣本確定模塊,用于從對應采集時間在所述維修時間之前的駕駛循環數據中,確定第一數量的駕駛循環數據作為一個正樣本,以及,從對應采集時間在所述維修時間之后的駕駛循環數據中,確定第二數量的駕駛循環數據作為n個負樣本,所述第二數量為所述第一數量的n倍;
34、模型訓練模塊,用于利用所述正樣本和所述負樣本,訓練標簽標注模型;
35、標簽預測模塊,用于基于訓練好的所述標簽標注模型,對采集時間在所述維修時間之前的所有所述駕駛循環數據進行標簽預測,得到每個所述駕駛循環數據對應的故障標簽。
36、在一個可能的實施方式中,所述裝置還包括故障預測模塊,用于:
37、利用每個所述駕駛循環數據以及每個所述駕駛循環數據對應的故障標簽,訓練故障預測模型,直至所述故障預測模型收斂;
38、利用訓練好的所述故障預測模型,對所述汽車零部件對應的單個駕駛循環數據進行故障預測。
39、在一個可能的實施方式中,所述樣本確定模塊,具體用于:
40、將對應采集時間在所述維修時間之前本文檔來自技高網...
【技術保護點】
1.一種數據標簽確定方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述基于訓練好的所述標簽標注模型,對采集時間在所述維修時間之前的所有所述駕駛循環數據進行標簽預測,得到每個所述駕駛循環數據對應的故障標簽之后,還包括:
3.根據權利要求1所述的方法,其特征在于,所述從對應采集時間在所述維修時間之前的駕駛循環數據中,確定第一數量的駕駛循環數據作為一個正樣本,包括:
4.根據權利要求1所述的方法,其特征在于,所述從對應采集時間在所述維修時間之后的駕駛循環數據中,確定第二數量的駕駛循環數據作為n個負樣本,包括:
5.根據權利要求1所述的方法,其特征在于,所述標簽標注模型包括:特征提取網絡和故障識別網絡,所述利用所述正樣本和所述負樣本,訓練標簽標注模型,包括:
6.根據權利要求1所述的方法,其特征在于,所述基于訓練好的所述標簽標注模型,對采集時間在所述維修時間之前的所有所述駕駛循環數據進行標簽預測,得到每個所述駕駛循環數據對應的故障標簽,包括:
7.根據權利要求1所述的方法,其特征在于,每
8.一種數據標簽確定裝置,其特征在于,所述裝置包括:
9.一種電子設備,其特征在于,包括處理器、通信接口、存儲器和通信總線,其中,處理器,通信接口,存儲器通過通信總線完成相互間的通信;
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有數據標簽確定方法程序,所述數據標簽確定方法程序被處理器執行時實現權利要求1-7任一所述的數據標簽確定方法的步驟。
...【技術特征摘要】
1.一種數據標簽確定方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述基于訓練好的所述標簽標注模型,對采集時間在所述維修時間之前的所有所述駕駛循環數據進行標簽預測,得到每個所述駕駛循環數據對應的故障標簽之后,還包括:
3.根據權利要求1所述的方法,其特征在于,所述從對應采集時間在所述維修時間之前的駕駛循環數據中,確定第一數量的駕駛循環數據作為一個正樣本,包括:
4.根據權利要求1所述的方法,其特征在于,所述從對應采集時間在所述維修時間之后的駕駛循環數據中,確定第二數量的駕駛循環數據作為n個負樣本,包括:
5.根據權利要求1所述的方法,其特征在于,所述標簽標注模型包括:特征提取網絡和故障識別網絡,所述利用所述正樣本和所述負樣本,訓練標簽標注模型,包括:
6.根據權利要求1所述的方法,其特征在于,所述基于訓練好...
【專利技術屬性】
技術研發人員:范有才,李昌,江婉榕,羅浩田,施暄宣,
申請(專利權)人:重慶長安汽車股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。