System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開的實施例涉及計算機,具體涉及數據異常識別模型訓練方法、數據異常識別方法和裝置。
技術介紹
1、隨著人工智能的普及,通過價值生成數據(例如計費數據)異常識別技術可以及時檢測存在異常的價值生成數據。目前,在對價值生成數據進行異常識別時,通常采用的方式為:通過預先訓練的lightgbm(light?gradient?boosting?machine)機器學習模型進行異常識別。
2、然而,專利技術人發(fā)現,當采用上述方式對價值生成數據進行異常識別時,經常會存在如下技術問題:實際應用場景多樣,lightgbm機器學習模型預先通過訓練樣本得到固定的閾值或規(guī)則進行異常識別,造成適用的應用場景較少,導致識別異常價值生成數據的準確性較低,從而造成異常價值數據誤報或漏報的次數較多。
3、該
技術介紹
部分中所公開的以上信息僅用于增強對本公開構思的背景的理解,并因此,其可包含并不形成本國的本領域普通技術人員已知的現有技術的信息。
技術實現思路
1、本公開的內容部分用于以簡要的形式介紹構思,這些構思將在后面的具體實施方式部分被詳細描述。本公開的內容部分并不旨在標識要求保護的技術方案的關鍵特征或必要特征,也不旨在用于限制所要求的保護的技術方案的范圍。
2、本公開的一些實施例提出了數據異常識別模型訓練方法、數據異常識別方法和裝置、電子設備、計算機可讀介質和程序產品,來解決以上
技術介紹
部分提到的技術問題中的一項或多項。
3、第一方面,本公開的一些實施例提供了一種數
4、可選地,上述初始數據異常識別模型包括原因信息生成子模型和對應初始異常識別配置信息的異常類型生成子模型;以及上述根據對應初始異常識別配置信息的初始數據異常識別模型,對上述樣本數據異常特征信息進行異常識別處理,得到樣本數據異常信息,包括:將上述樣本數據異常特征信息輸入上述異常類型生成子模型,得到樣本數據異常類型;響應于確定上述樣本數據異常類型滿足預設異常類型條件,將上述樣本數據異常特征信息輸入原因信息生成子模型,得到樣本異常原因信息;將上述樣本數據異常類型和上述樣本異常原因信息確定為樣本數據異常信息。
5、可選地,上述初始數據異常識別模型包括各個異常類型生成子模型;以及上述根據對應初始異常識別配置信息的初始數據異常識別模型,對上述樣本數據異常特征信息進行異常識別處理,得到樣本數據異常信息,包括:將上述各個異常類型生成子模型中對應初始異常識別配置信息的各個異常類型生成子模型確定為各個目標異常類型生成子模型;將上述樣本數據異常特征信息分別輸入各個目標異常類型生成子模型中,得到樣本異常識別結果信息集;根據上述樣本異常識別結果信息集,確定樣本數據異常類型。
6、可選地,上述訓練步驟還包括:響應于確定上述比較結果不滿足上述訓練完成條件,執(zhí)行以下步驟:根據上述比較結果和上述選取的樣本價值生成數據,對初始異常特征識別引導信息、初始異常特征信息生成模型、初始異常識別配置信息和初始數據異常識別模型進行更新處理;從上述樣本價值生成數據集中重新選取樣本價值生成數據;基于更新后的初始異常識別配置信息、初始異常特征識別引導信息、初始異常特征信息生成模型和初始數據異常識別模型,以及重新選取的樣本價值生成數據,再次執(zhí)行上述訓練步驟。
7、可選地,上述根據上述比較結果和上述選取的樣本價值生成數據,對初始異常特征識別引導信息、初始異常特征信息生成模型、初始異常識別配置信息和初始數據異常識別模型進行更新處理,包括:對對應初始異常特征識別引導信息的初始異常特征信息生成模型和初始數據異常識別模型進行調參處理;對上述選取的樣本價值生成數據對應的各個訂單信息進行編碼處理,得到至少一個訂單狀態(tài)向量;對初始異常識別配置信息和上述比較結果進行編碼處理,得到元數據狀態(tài)向量;對于上述至少一個訂單狀態(tài)向量包括的每個訂單狀態(tài)向量,將上述訂單狀態(tài)向量和上述元數據狀態(tài)向量進行拼接處理,得到目標狀態(tài)向量;將所得到的各個目標狀態(tài)向量輸入預先訓練的更新異常識別配置信息生成模型,得到更新異常識別配置信息;根據上述更新異常識別配置信息,對初始異常識別配置信息進行更新處理。
8、可選地,在上述基于所獲取的每個樣本價值生成數據,執(zhí)行以下訓練步驟之前,上述方法還包括:獲取樣本價值生成數據集作為初始樣本價值生成數據集;對上述初始樣本價值生成數據集中的各個初始樣本價值生成數據進行解析處理;對解析后的各個初始樣本價值生成數據進行轉換處理,得到樣本價值生成數據集。
9、可選地,上述方法還包括:獲取對應上述異常特征信息生成模型和上述數據異常識別模型的反饋數據異常信息集;根據上述反饋數據異常信息集,生成模型評估信息;根據上述模型評估信息,對上述異常特征信息生成模型和上述數據異常識別模型進行更新處理。
10、第二方面,本公開的一些實施例提供了一種數據異常識別方法,該方法包括:將價值生成數據輸入對應異常特征識別引導信息的異常特征信息生成模型,得到數據異常特征信息,其中,上述異常特征識別引導信息和上述異常特征信息生成模型是通過如上述第一方面任一實現方式所描述的方法確定的;將上述數據異常特征信息輸入對應異常識別配置信息的數據異常識別模型得到數據異常信息,其中,上述異常識別配置信息和上述數據異常識別模型是通過上述第一方面任一實現方式所描述的方法確定的。
11、可選地,上述方法還包括:控制相關聯的顯示設備顯示上述數據異常信息。
12、第三方面,本公開的一些實施例提供了一種數據異常識別模型訓練裝置,裝置包括:確定單元,被配置成確定對應價值生成業(yè)務的初始異常識別配置信息和初始異常特征識別引導信息;執(zhí)行單元,被配置成基于從樣本價值生成數據集中選取的樣本價值生成數據,執(zhí)行以下訓練步驟:將樣本價值生成數據輸入對應初始異常特征識別引導信息的初始異常特征信息生成模型,得到樣本數據異常特征信息,其中,上述樣本價值生成數據集對應上述價值生成業(yè)務;根據對應初始異常識別配置信息的初始數據異常識別模型,對上述樣本數據異常特征信息進行異常識別處理,得到樣本數據異常信息;將對應樣本價值生成數據的數據異常標簽信息和本文檔來自技高網...
【技術保護點】
1.一種數據異常識別模型訓練方法,包括:
2.根據權利要求1所述的方法,其中,所述初始數據異常識別模型包括原因信息生成子模型和對應初始異常識別配置信息的異常類型生成子模型;以及所述根據對應初始異常識別配置信息的初始數據異常識別模型,對所述樣本數據異常特征信息進行異常識別處理,得到樣本數據異常信息,包括:
3.根據權利要求1所述的方法,其中,所述初始數據異常識別模型包括各個異常類型生成子模型;以及所述根據對應初始異常識別配置信息的初始數據異常識別模型,對所述樣本數據異常特征信息進行異常識別處理,得到樣本數據異常信息,包括:
4.根據權利要求1所述的方法,其中,所述訓練步驟還包括:
5.根據權利要求4所述的方法,其中,所述根據所述比較結果和所選取的樣本價值生成數據,對初始異常特征識別引導信息、初始異常特征信息生成模型、初始異常識別配置信息和初始數據異常識別模型進行更新處理,包括:
6.根據權利要求1所述的方法,其中,在所述基于所獲取的每個樣本價值生成數據,執(zhí)行以下訓練步驟之前,所述方法還包括:
7.根據權利要求1
8.一種數據異常識別方法,包括:
9.根據權利要求8所述的方法,其中,所述方法還包括:
10.一種數據異常識別模型訓練裝置,包括:
11.一種數據異常識別裝置,包括:
12.一種電子設備,包括:
13.一種計算機可讀介質,其上存儲有計算機程序,其中,所述計算機程序被處理器執(zhí)行時實現如權利要求1-7或8-9中任一所述的方法。
14.一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執(zhí)行時實現根據權利要求1-7或8-9中任一項所述的方法。
...【技術特征摘要】
1.一種數據異常識別模型訓練方法,包括:
2.根據權利要求1所述的方法,其中,所述初始數據異常識別模型包括原因信息生成子模型和對應初始異常識別配置信息的異常類型生成子模型;以及所述根據對應初始異常識別配置信息的初始數據異常識別模型,對所述樣本數據異常特征信息進行異常識別處理,得到樣本數據異常信息,包括:
3.根據權利要求1所述的方法,其中,所述初始數據異常識別模型包括各個異常類型生成子模型;以及所述根據對應初始異常識別配置信息的初始數據異常識別模型,對所述樣本數據異常特征信息進行異常識別處理,得到樣本數據異常信息,包括:
4.根據權利要求1所述的方法,其中,所述訓練步驟還包括:
5.根據權利要求4所述的方法,其中,所述根據所述比較結果和所選取的樣本價值生成數據,對初始異常特征識別引導信息、初始異常特征信息生成模型、初始異常識別配...
【專利技術屬性】
技術研發(fā)人員:郝素雅,
申請(專利權)人:北京京東遠升科技有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。