本申請涉及人工智能技術領域,提供一種銀行客戶流失風險預測模型生成方法、裝置、設備及介質,所述方法包括:獲取銀行客戶留存數(shù)據(jù);對所述銀行客戶留存數(shù)據(jù)進行預處理,以得到與客戶流失相關的特征數(shù)據(jù);基于所述特征數(shù)據(jù)、所述特征數(shù)據(jù)對應的標簽以及預設的模型參數(shù)對待訓練的XGboost模型進行訓練,得到所述銀行客戶流失風險預測模型。由于XGboost模型是一種機器學習模型,且本申請所采用的訓練集為與客戶流失相關的特征數(shù)據(jù),因此,通過訓練,本申請實施例生成的模型能夠有效預測出銀行客戶流失風險。戶流失風險。戶流失風險。
【技術實現(xiàn)步驟摘要】
銀行客戶流失風險預測模型生成方法、裝置、設備及介質
[0001]本申請涉及人工智能
,尤其涉及一種銀行客戶流失風險預測模型生成方法、裝置、設備及介質。
技術介紹
[0002]對于銀行來說,由于種種原因,客戶的流失是無法避免的。但是,如果在客戶有流失傾向時,能夠及時發(fā)現(xiàn),則能夠通過各種方法挽留客戶,從而降低客戶流失率。因此,有效預測客戶的流失風險尤為重要。然而,在銀行領域里,目前還沒有一種能夠有效預測出客戶流失風險工具。
技術實現(xiàn)思路
[0003]針對上述技術問題,本申請的目的在于提供一種銀行客戶流失風險預測模型生成方法、裝置、設備及介質,旨在解決目前還沒有一種工具能夠有效預測出銀行客戶流失風險的技術問題。
[0004]為了解決上述技術問題,第一方面,本申請實施例提供一種銀行客戶流失風險預測模型生成方法,包括:
[0005]獲取銀行客戶留存數(shù)據(jù);
[0006]對所述銀行客戶留存數(shù)據(jù)進行預處理,得到與客戶流失相關的特征數(shù)據(jù);
[0007]基于所述特征數(shù)據(jù)、所述特征數(shù)據(jù)對應的標簽以及預設的模型參數(shù)對待訓練的XGboost模型進行訓練,得到所述銀行客戶流失風險預測模型;其中,所述特征數(shù)據(jù)對應的標簽表示所述特征數(shù)據(jù)對應的客戶是否已流失。
[0008]進一步的,所述客戶留存數(shù)據(jù)包括多種屬性數(shù)據(jù),所述屬性包括客戶ID、客戶姓名、客戶信用分、性別、年齡、區(qū)域、存款/貸款情況、是否有信用卡、金融產品購買/使用數(shù)量、是否為活躍用戶、估計收入、使用金融產品時長以及是否已流失。<br/>[0009]進一步的,所述對所述銀行客戶留存數(shù)據(jù)進行預處理,得到與客戶流失相關的特征數(shù)據(jù),包括:
[0010]依次對所述銀行客戶留存數(shù)據(jù)進行數(shù)據(jù)清洗處理、數(shù)據(jù)轉換處理和特征篩選處理,得到所述與客戶流失相關的特征數(shù)據(jù)。
[0011]進一步的,所述依次對所述銀行客戶留存數(shù)據(jù)進行數(shù)據(jù)清洗處理、數(shù)據(jù)轉換處理和特征篩選處理,得到所述與客戶流失相關的特征數(shù)據(jù),包括:
[0012]刪除所述銀行客戶留存數(shù)據(jù)中與客戶流失無關的數(shù)據(jù),得到第一特征數(shù)據(jù);
[0013]對所述第一特征數(shù)據(jù)中的異常值進行處理,得到第二特征數(shù)據(jù);
[0014]將所述第二特征數(shù)據(jù)轉換為符合所述XGboost的輸入格式,得到第三特征數(shù)據(jù);
[0015]對所述第三特征數(shù)據(jù)進行離散化處理,得到第四特征數(shù)據(jù);
[0016]從所述第四特征數(shù)據(jù)中篩選出弱相關性的特征數(shù)據(jù),得到所述與客戶流失相關的特征數(shù)據(jù)。
[0017]進一步的,所述與客戶流失相關的特征包括:客戶信用分、性別、年齡、區(qū)域、存款/貸款情況、是否有信用卡、金融產品購買/使用數(shù)量、是否為活躍用戶、估計收入以及使用金融產品時長。
[0018]進一步的,所述基于所述特征數(shù)據(jù)、所述特征數(shù)據(jù)對應的標簽以及預設的模型參數(shù)對待訓練的XGboost模型進行訓練,得到所述銀行客戶流失風險預測模型,包括:
[0019]基于所述特征數(shù)據(jù)、所述特征數(shù)據(jù)對應的標簽以及預設的模型參數(shù)對所述待訓練XGboost模型進行訓練,并在訓練過程中根據(jù)預設的調參策略對所述模型參數(shù)進行調整,得到所述銀行客戶流失風險預測模型。
[0020]進一步的,所述調參策略為以下調參策略中的任意一種:
[0021]第一調參策略:只調樹的個數(shù);
[0022]第二調參策略:只調樹的深度;
[0023]第三調參策略:同時調樹的個數(shù)和深度;
[0024]第四調參策略:只調學習率;
[0025]第五調參策略:同時調樹的個數(shù)和學習率;
[0026]第六調參策略:只調行采樣比特率;
[0027]第七調參策略:只調列采樣比特率。
[0028]第二方面,本申請實施例提供一種銀行客戶流失風險預測模型生成裝置,包括:
[0029]獲取模塊,用于獲取銀行客戶留存數(shù)據(jù);
[0030]預處理模塊,用于對所述銀行客戶留存數(shù)據(jù)進行預處理,得到與客戶流失相關的特征數(shù)據(jù);
[0031]訓練模塊,用于基于所述特征數(shù)據(jù)、所述特征數(shù)據(jù)對應的標簽以及預設的模型參數(shù)對待訓練的XGboost模型進行訓練,得到所述銀行客戶流失風險預測模型;其中,所述特征數(shù)據(jù)對應的標簽表示所述特征數(shù)據(jù)對應的客戶是否已流失。
[0032]第三方面,本申請實施例提供一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述任一項所述方法的步驟。
[0033]第四方面,本申請實施例提供一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述任一項所述的方法的步驟。
[0034]本申請實施例提供的一種銀行客戶流失風險預測模型生成方法,包括:獲取銀行客戶留存數(shù)據(jù),對所述銀行客戶留存數(shù)據(jù)進行預處理,以得到與客戶流失相關的特征數(shù)據(jù);基于所述特征數(shù)據(jù)、所述特征數(shù)據(jù)對應的標簽以及預設的模型參數(shù)對待訓練的XGboost模型進行訓練,得到所述銀行客戶流失風險預測模型。由于本申請實施例所采用的XGboost模型是一種機器學習模型,且本申請所采用的訓練集為與客戶流失相關的特征數(shù)據(jù),因此,通過訓練,本申請實施例生成的模型能夠有效預測出銀行客戶流失風險。此外,由于XGboost具有在處理大規(guī)模數(shù)據(jù)時速度效果好,對內存等硬件資源要求不高的優(yōu)點,因此,本申請實施例所生成的銀行客戶流失風險預測模型能夠快速、準確地預測銀行客戶的流失風險。
附圖說明
[0035]為了更清楚地說明本申請的技術方案,下面將對實施方式中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施方式,對于本領域普
通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0036]圖1是本申請第一實施例提供的銀行客戶流失風險預測模型生成方法的流程示意圖;
[0037]圖2是本申請第一實施例提供的得到與客戶流失相關的特征數(shù)據(jù)的方法流程圖;
[0038]圖3是本申請第二實施例提供的銀行客戶流失風險預測模型生成裝置結構圖;
[0039]圖4是本申請第二實施例提供的預處理模塊的結構圖;
[0040]圖5為本申請第三實施例提供的計算機設備的結構示意框圖。
具體實施方式
[0041]下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例。基于本申請中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本申請保護的范圍。
[0042]實施例一:
[0043]本申請第一實施例提供一種銀行客戶流失風險預測模型生成方法,其可由的計算機設備來執(zhí)行,該計算機設備可以是桌上型計算機、筆記本、掌上電腦及云端服務器等計算設備。
[0044]請參閱圖1,本申請實施例提供的一種銀行客戶流失風險預測模型生成方法,包本文檔來自技高網(wǎng)...
【技術保護點】
【技術特征摘要】
1.一種銀行客戶流失風險預測模型生成方法,其特征在于,包括:獲取銀行客戶留存數(shù)據(jù);對所述銀行客戶留存數(shù)據(jù)進行預處理,得到與客戶流失相關的特征數(shù)據(jù);基于所述特征數(shù)據(jù)、所述特征數(shù)據(jù)對應的標簽以及預設的模型參數(shù)對待訓練的XGboost模型進行訓練,得到所述銀行客戶流失風險預測模型;其中,所述特征數(shù)據(jù)對應的標簽表示所述特征數(shù)據(jù)對應的客戶是否已流失。2.根據(jù)權利要求1所述的銀行客戶流失風險預測模型生成方法,其特征在于,所述客戶留存數(shù)據(jù)包括多種屬性數(shù)據(jù),所述屬性包括客戶ID、客戶姓名、客戶信用分、性別、年齡、區(qū)域、存款/貸款情況、是否有信用卡、金融產品購買/使用數(shù)量、是否為活躍用戶、估計收入、使用金融產品時長以及是否已流失。3.根據(jù)權利要求1所述的銀行客戶流失風險預測模型生成方法,其特征在于,所述對所述銀行客戶留存數(shù)據(jù)進行預處理,得到與客戶流失相關的特征數(shù)據(jù),包括:依次對所述銀行客戶留存數(shù)據(jù)進行數(shù)據(jù)清洗處理、數(shù)據(jù)轉換處理和特征篩選處理,得到所述與客戶流失相關的特征數(shù)據(jù)。4.根據(jù)權利要求3所述的銀行客戶流失風險預測模型生成方法,其特征在于,所述依次對所述銀行客戶留存數(shù)據(jù)進行數(shù)據(jù)清洗處理、數(shù)據(jù)轉換處理和特征篩選處理,得到所述與客戶流失相關的特征數(shù)據(jù),包括:刪除所述銀行客戶留存數(shù)據(jù)中與客戶流失無關的數(shù)據(jù),得到第一特征數(shù)據(jù);對所述第一特征數(shù)據(jù)中的異常值進行處理,得到第二特征數(shù)據(jù);將所述第二特征數(shù)據(jù)轉換為符合所述XGboost的輸入格式,得到第三特征數(shù)據(jù);對所述第三特征數(shù)據(jù)進行離散化處理,得到第四特征數(shù)據(jù);從所述第四特征數(shù)據(jù)中篩選出弱相關性的特征數(shù)據(jù),得到所述與客戶流失相關的特征數(shù)據(jù)。5.根據(jù)權利要求2所述的銀行客戶流失風險預測模型生成方法,其特征在于,所述與客戶流失相關的特征包括:客戶信用分、性別、年齡、區(qū)域、存款/...
【專利技術屬性】
技術研發(fā)人員:劉鍇靖,
申請(專利權)人:平安科技深圳有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。