System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術是關于汽車故障智能診斷,特別是關于一種基于雙模型故障診斷信息智能提取方法及裝置。
技術介紹
1、診斷數據作為記錄車輛實際行駛過程中發生過的故障診斷、維修、保養信息載體,其中包含了大量不同故障現象情形以及所對應的故障原因信息。通過對大量診斷數據進行信息提取、故障原理分析是實現故障診斷智能化推薦的一種有效途徑,然而,現有診斷信息提取方法不精準、效率低,且無法保證信息提取過程中的質量一致性。
2、公開于該
技術介紹
部分的信息僅僅旨在增加對本專利技術的總體背景的理解,而不應當被視為承認或以任何形式暗示該信息構成已為本領域一般技術人員所公知的現有技術。
技術實現思路
1、本專利技術的目的在于提供一種基于雙模型故障診斷信息智能提取方法及裝置,其不僅能夠在龐雜的診斷數據中,精準、高效的提取有效診斷信息,還能保證信息提取過程中質量一致性。
2、為實現上述目的,第一方面,本專利技術提供了一種基于雙模型故障診斷信息智能提取方法,包括:
3、基于歷史診斷數據庫,對所述歷史診斷數據庫中的歷史故障診斷數據進行提取、標準化、清洗,生成診斷數據;
4、對所述診斷數據進行標記,篩選出非dtc類診斷數據;
5、基于所述非dtc類診斷數據,對所述非dtc類診斷數據進行抽樣,生成樣本診斷數據;
6、對所述樣本診斷數據進行提取,生成基準診斷數據;
7、基于所述基準診斷數據,生成訓練模型學習語料;
8、基于所述訓練模型學
9、基于所述訓練模型學習預料,訓練生成第二訓練模型;
10、基于所述樣本診斷數據,分別通過所述第一訓練模型和所述第二訓練模型提取所述樣本診斷數據中的有效診斷信息。
11、在本專利技術的一實施方式中,所述基于歷史診斷數據庫,對所述歷史診斷數據庫中的歷史故障診斷數據進行提取、標準化、清洗,生成診斷數據包括:
12、基于所述歷史診斷數據庫,提取所述歷史診斷數據庫中的診斷數據;
13、對所述診斷數據中的故障原因件名稱進行標準化處理;
14、對所述診斷數據中的故障現象描述內容進行識別,并清洗預設標簽類型數據,生成所述診斷數據。
15、在本專利技術的一實施方式中,所述對所述診斷數據進行標記,篩選出非dtc類診斷數據包括:
16、根據預設dtc類診斷數據識別規則,對所述診斷數據進行標記,生成dtc類診斷數據;
17、去除所述診斷數據中的所述dtc類診斷數據,篩選出所述非dtc類診斷數據。
18、在本專利技術的一實施方式中,所述基于所述非dtc類診斷數據,對所述非dtc類診斷數據進行抽樣,生成樣本診斷數據包括:
19、基于所述非dtc類診斷數據,通過預設抽樣規則對所述非dtc類診斷數據進行抽樣,生成所述樣本診斷數據。
20、在本專利技術的一實施方式中,所述對所述樣本診斷數據進行提取,生成基準診斷數據包括:
21、對所述樣本診斷數據中的用于描述故障現象、故障原因的關鍵詞信息進行提取,得到故障現象關鍵詞和故障原因關鍵詞;
22、根據所述故障現象關鍵詞和所述故障原因關鍵詞,分別創建對應跨車型通用的通用現象詞和通用原因詞;
23、基于所述樣本診斷數據、所述故障現象關鍵詞、所述故障原因關鍵詞、所述通用現象詞和所述通用原因詞,生成所述基準診斷數據。
24、在本專利技術的一實施方式中,所述基于所述訓練模型學習語料,訓練生成第一訓練模型包括:
25、安裝調用信息抽取模型,將所述訓練模型學習預料轉換為所述信息抽取模型所需要的數據格式的第一數據集,并將所述第一數據集按照預設比例拆分為第一訓練數據集和第一驗證數據集;
26、載入第一預訓練模塊,并加載所述第一訓練數據集進行模型訓練,生成第一微調后的模型;
27、加載所述第一微調后的模型進行結果預測,生成第一訓練模型。
28、在本專利技術的一實施方式中,所述基于所述訓練模型學習預料,訓練生成第二訓練模型包括:
29、安裝調用知識增強模型,將所述訓練模型學習預料轉換為所述知識增強模型所需要的數據格式的第二數據集,并將所述第二數據集按照預設比例拆分為第二訓練數據集和第二驗證數據集;
30、載入第二預訓練模塊,并加載所述第二訓練數據集進行模型訓練,生成第二微調后的模型;
31、加載所述第二微調后的模型進行結果預測,生成第二訓練模型。
32、第二方面,本專利技術提供了一種基于雙模型故障診斷信息智能提取裝置,包括:第一生成模塊、第二生成模塊、第三生成模塊、第四生成模塊、第五生成模塊、第一訓練模塊、第二訓練模塊、第六生成模塊以及第七生成模塊。第一生成模塊用于基于歷史診斷數據庫,對所述歷史診斷數據庫中的歷史故障診斷數據進行提取、標準化、清洗,生成診斷數據;第二生成模塊用于對所述診斷數據進行標記,篩選出非dtc類診斷數據;第三生成模塊用于基于所述非dtc類診斷數據,對所述非dtc類診斷數據進行抽樣,生成樣本診斷數據;第四生成模塊用于對所述樣本診斷數據進行提取,生成基準診斷數據;第五生成模塊用于基于所述基準診斷數據,生成訓練模型學習語料;第一訓練模塊用于基于所述訓練模型學習語料,訓練生成第一訓練模型;第二訓練模塊用于基于所述訓練模型學習預料,訓練生成第二訓練模型;第六生成模塊用于將所述樣本診斷數據輸入至所述第一訓練模型,生成第一有效診斷信息;以及第七生成模塊用于將所述第一有效診斷信息輸入至所述第二訓練模型,生成第二有效診斷信息。
33、在本專利技術的一實施方式中,所述第一生成模塊包括:第一提取單元、處理單元以及第一生成單元。第一提取單元用于基于所述歷史診斷數據庫,提取所述歷史診斷數據庫中的診斷數據;處理單元用于對所述診斷數據中的故障原因件名稱進行標準化處理;以及第一生成單元用于對所述診斷數據中的故障現象描述內容進行識別,并清洗預設標簽類型數據,生成所述診斷數據。
34、在本專利技術的一實施方式中,所述第二生成模塊包括:第二生成單元以及第三生成單元。第二生成單元用于根據預設dtc類診斷數據識別規則,對所述診斷數據進行標記,生成dtc類診斷數據;以及第三生成單元用于去除所述診斷數據中的所述dtc類診斷數據,篩選出所述非dtc類診斷數據。
35、與現有技術相比,根據本專利技術的基于雙模型故障診斷信息智能提取方法及裝置,其不僅能夠在龐雜的診斷數據中,精準、高效的提取有效診斷信息,還能保證信息提取過程中質量一致性。
本文檔來自技高網...【技術保護點】
1.一種基于雙模型故障診斷信息智能提取方法,其特征在于,包括:
2.如權利要求1所述的基于雙模型故障診斷信息智能提取方法,其特征在于,所述基于歷史診斷數據庫,對所述歷史診斷數據庫中的歷史故障診斷數據進行提取、標準化、清洗,生成診斷數據包括:
3.如權利要求1所述的基于雙模型故障診斷信息智能提取方法,其特征在于,所述對診斷數據進行標記,篩選出非DTC類診斷數據包括:
4.如權利要求1所述的基于雙模型故障診斷信息智能提取方法,其特征在于,所述基于非DTC類診斷數據,對所述非DTC類診斷數據進行抽樣,生成樣本診斷數據包括:
5.如權利要求1所述的基于雙模型故障診斷信息智能提取方法,其特征在于,所述對樣本診斷數據進行提取,生成基準診斷數據包括:
6.如權利要求1所述的基于雙模型故障診斷信息智能提取方法,其特征在于,所述基于訓練模型學習語料,訓練生成第一訓練模型包括:
7.如權利要求1所述的基于雙模型故障診斷信息智能提取方法,其特征在于,所述基于訓練模型學習預料,訓練生成第二訓練模型包括:
8.一種基于雙模
9.如權利要求8所述的基于雙模型故障診斷信息智能提取裝置,其特征在于,所述第一生成模塊包括:
10.如權利要求8所述的基于雙模型故障診斷信息智能提取裝置,其特征在于,所述第二生成模塊包括:
...【技術特征摘要】
1.一種基于雙模型故障診斷信息智能提取方法,其特征在于,包括:
2.如權利要求1所述的基于雙模型故障診斷信息智能提取方法,其特征在于,所述基于歷史診斷數據庫,對所述歷史診斷數據庫中的歷史故障診斷數據進行提取、標準化、清洗,生成診斷數據包括:
3.如權利要求1所述的基于雙模型故障診斷信息智能提取方法,其特征在于,所述對診斷數據進行標記,篩選出非dtc類診斷數據包括:
4.如權利要求1所述的基于雙模型故障診斷信息智能提取方法,其特征在于,所述基于非dtc類診斷數據,對所述非dtc類診斷數據進行抽樣,生成樣本診斷數據包括:
5.如權利要求1所述的基于雙模型故障診斷信息智能提取方法...
【專利技術屬性】
技術研發人員:阮鵬飛,查精學,段沛楠,汪家旺,沈建飛,
申請(專利權)人:武漢品致汽車技術有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。