System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于信貸,特別是涉及一種基于shap理論的特征歸因解釋提升樹的方法。
技術介紹
1、提升樹模型,如xgboost、lightgbm等,在許多領域都展現出了強大的預測能力。然而,這些復雜的模型通常被視為黑箱模型,其內部決策過程難以理解。這給模型的應用帶來了一些限制和風險:
2、缺乏可解釋性:持牌金融決策透明度要求較高,僅僅知道模型的預測結果是不夠的,還需要了解模型是如何做出決策的,哪些特征對預測結果起到了關鍵作用。提升樹模型的復雜結構使得很難直觀地解釋每個特征的貢獻。
3、難以診斷問題:當模型出現錯誤預測或性能不佳時,由于缺乏可解釋性,很難確定問題出在哪里,也難以進行有效的調整和改進。
技術實現思路
1、為解決上述技術問題,本專利技術采用的一個技術方案是:
2、一種基于shap理論的特征歸因解釋提升樹的方法,包括以下步驟:
3、s1):數據預處理:對模型涉及的內部數據進行預處理操作,用于提高數據的質量和可用性;
4、所述數據預處理具體包括以下步驟:
5、s11):格式內容錯誤清洗;
6、s12):邏輯錯誤清洗;
7、s13):異常值處理;
8、s14):歸一化;
9、s2):模型訓練:使用提升樹算法對預處理后的數據進行訓練,得到一個提升樹模型,用于識別高風險客戶群;
10、s3):shap值計算:使用shap值理論計算每個樣本中每個特征的sha
11、s4):特征歸因:根據計算得到的shap值,確定每個特征對預測結果的貢獻程度;
12、s5):可視化:通過特征影響圖,將特征歸因結果進行可視化展示;
13、s6):模型解釋:通過分析每個特征的shap值分布,以及特征之間的交互作用,展示模型之間的決策機理;
14、s7):模型調試和優化:根據模型解釋和特征歸因結果,對提升樹模型進行調試和優化。
15、進一步的,所述步驟4中,
16、當特征shap值大于0,該特征提升了預測值;
17、當特征shap值小于0,該特征降低了預測值。
18、進一步的,所述步驟5中,特征影響圖橫軸為shap值,縱軸為特征參數,當特征shap值為正值時,為紅色,當特征shap值為負值時,為藍色。
19、進一步的,所述步驟7中,當入模變量的貢獻與常規認識存在偏差時,可以通過調整已構建的提升樹模型參數、剔除有異議的變量、樹模型,選擇不同的特征組合方式,來提高模型的性能和準確性。
20、進一步的,所述步驟3中的shap值計算使用第三方庫函數計算。
21、進一步的,所述第三方庫函數為python中的shap庫。
22、本專利技術的有益效果:
23、本專利技術讓用戶能夠理解提升樹模型的決策過程和預測結果;實現特征歸因,準確地確定每個特征對預測結果的貢獻程度;為模型調試和優化提供依據,幫助用戶更好地調整模型參數,提高模型的性能和準確性。
本文檔來自技高網...【技術保護點】
1.一種基于shap理論的特征歸因解釋提升樹的方法,其特征在于:包括以下步驟:
2.根據權利要求1所述的一種基于shap理論的特征歸因解釋提升樹的方法,其特征在于:所述步驟4中,
3.根據權利要求1所述的一種基于shap理論的特征歸因解釋提升樹的方法,其特征在于:所述步驟5中,特征影響圖橫軸為shap值,縱軸為特征參數,當特征shap值為正值時,為紅色,當特征shap值為負值時,為藍色。
4.根據權利要求1所述的一種基于shap理論的特征歸因解釋提升樹的方法,其特征在于:所述步驟7中,當入模變量的貢獻與常規認識存在偏差時,可以通過調整已構建的提升樹模型參數、剔除有異議的變量、樹模型,選擇不同的特征組合方式,來提高模型的性能和準確性。
5.根據權利要求1所述的一種基于shap理論的特征歸因解釋提升樹的方法,其特征在于:所述步驟3中的shap值計算使用第三方庫函數計算。
6.根據權利要求1所述的一種基于shap理論的特征歸因解釋提升樹的方法,其特征在于:所述第三方庫函數為python中的shap庫。
【技術特征摘要】
1.一種基于shap理論的特征歸因解釋提升樹的方法,其特征在于:包括以下步驟:
2.根據權利要求1所述的一種基于shap理論的特征歸因解釋提升樹的方法,其特征在于:所述步驟4中,
3.根據權利要求1所述的一種基于shap理論的特征歸因解釋提升樹的方法,其特征在于:所述步驟5中,特征影響圖橫軸為shap值,縱軸為特征參數,當特征shap值為正值時,為紅色,當特征shap值為負值時,為藍色。
4.根據權利要求1所述的一種基于shap理論的特征歸因解...
【專利技術屬性】
技術研發人員:杜夢嬌,劉濤,袁慧,常楠,王宇達,
申請(專利權)人:蘇銀凱基消費金融有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。