System.ArgumentOutOfRangeException: 索引和長(zhǎng)度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及經(jīng)營(yíng)性貸款需求預(yù)測(cè),更為具體的,涉及一種基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法及系統(tǒng)。
技術(shù)介紹
1、現(xiàn)有技術(shù)中,集成學(xué)習(xí)算法基模型選取基本準(zhǔn)則為:“好而不同”,既有準(zhǔn)確性,又有差異性。但如何才能具體的選出適合應(yīng)用場(chǎng)景本身情況的基模型組合,目前還未有統(tǒng)一的標(biāo)準(zhǔn)。
2、傳統(tǒng)構(gòu)建機(jī)器學(xué)習(xí)方法往往是單一樹(shù)模型或者其他單一機(jī)器學(xué)習(xí)算法,維度單一,因客戶貸款需求傾向特征隱蔽且復(fù)雜,單一算法往往僅能提取某方面的特征,并受到算法本身缺點(diǎn)所限,需求傾向預(yù)測(cè)效果不佳。鑒于上述現(xiàn)狀,本領(lǐng)域亟待發(fā)展更好的解決方案。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)的目的在于克服現(xiàn)有技術(shù)的不足,提供一種基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法及系統(tǒng),首次結(jié)合二分類模型差異性度量、模型有效性評(píng)估指標(biāo)及基模型篩選,提出了基于預(yù)測(cè)類別相關(guān)性的集成學(xué)習(xí)基模型篩選方法,可以應(yīng)用于預(yù)測(cè)真實(shí)性經(jīng)營(yíng)性貸款,提高識(shí)別效率,優(yōu)化經(jīng)營(yíng)性貸款需求的預(yù)測(cè)精度。
2、本專利技術(shù)的目的是通過(guò)以下方案實(shí)現(xiàn)的:
3、一種基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法,包括如下步驟:
4、步驟一,基模型篩選:選擇m個(gè)個(gè)體學(xué)習(xí)器,在驗(yàn)證集上用m個(gè)個(gè)體學(xué)習(xí)器做預(yù)測(cè),形成每個(gè)個(gè)體學(xué)習(xí)器在驗(yàn)證集每個(gè)樣本上的二分類預(yù)測(cè)結(jié)果數(shù)據(jù)集,m為整數(shù);然后,用auc指標(biāo)計(jì)算方法在所述二分類預(yù)測(cè)結(jié)果數(shù)據(jù)集上,計(jì)算每個(gè)個(gè)體學(xué)習(xí)器的模型評(píng)估指標(biāo)auc,得到m個(gè)個(gè)體學(xué)習(xí)器各自的auc指標(biāo);然后,進(jìn)行m個(gè)個(gè)體學(xué)習(xí)器的auc指標(biāo)排
5、步驟二,利用多個(gè)篩選得到的基模型加上auc值最大的個(gè)體學(xué)習(xí)器模型構(gòu)成融合模型分類器,再采用多數(shù)投票規(guī)則融合所述融合模型分類器的預(yù)測(cè)結(jié)果;其中,所述融合模型分類器的預(yù)測(cè)結(jié)果為二分類數(shù)據(jù),二分類數(shù)據(jù)具體為類別一和類別二;如果超過(guò)設(shè)定數(shù)量值的基模型預(yù)測(cè)結(jié)果都為二分類中的類別一,則將第一類別作為融合模型分類器的最終預(yù)測(cè)結(jié)果;否則,融合模型分類器的最終預(yù)測(cè)結(jié)果為類別二;最后,根據(jù)融合模型分類器的最終預(yù)測(cè)結(jié)果進(jìn)行真實(shí)經(jīng)營(yíng)性貸款需求預(yù)測(cè)。
6、進(jìn)一步地,在步驟二中,所述利用多個(gè)篩選得到的基模型加上auc值最大的個(gè)體學(xué)習(xí)器模型構(gòu)成融合模型分類器,再采用多數(shù)投票規(guī)則融合所述融合模型分類器的預(yù)測(cè)結(jié)果,具體包括如下子步驟:
7、步驟s1,選擇好t個(gè)基模型后,獲得t個(gè)基模型個(gè)體學(xué)習(xí)器,t為整數(shù);
8、步驟s2,每個(gè)基模型采用特征序列前后雙向選擇方法,選出各自的特征子集;
9、步驟s3,每個(gè)特征子集上,對(duì)應(yīng)模型采用k折交叉驗(yàn)證,生成k個(gè)參數(shù)調(diào)優(yōu)模型并同時(shí)預(yù)測(cè)驗(yàn)證集,接著k個(gè)標(biāo)簽預(yù)測(cè)結(jié)果做多數(shù)投票,k為整數(shù);
10、步驟s4,t個(gè)基模型采用多數(shù)投票規(guī)則預(yù)測(cè)最終標(biāo)簽值,即:
11、
12、其中,x表示待預(yù)測(cè)樣本,j表示第j個(gè)基模型,ci為預(yù)測(cè)類別標(biāo)簽,t為整數(shù),argmax為數(shù)學(xué)函數(shù),hj(x)為基模型預(yù)測(cè)結(jié)果。
13、進(jìn)一步地,所述參考值的取值范圍在0~0.6之間。
14、進(jìn)一步地,在基模型篩選之前,還包括步驟:數(shù)據(jù)接入整合,以形成訓(xùn)練集數(shù)據(jù)。
15、進(jìn)一步地,所述根據(jù)融合模型分類器的最終預(yù)測(cè)結(jié)果進(jìn)行真實(shí)經(jīng)營(yíng)性貸款需求預(yù)測(cè),具體包括子步驟:將融合模型分類器的最終預(yù)測(cè)結(jié)果采用計(jì)算auc模型性能評(píng)估指標(biāo)的方法進(jìn)行評(píng)估,且在auc模型性能評(píng)估指標(biāo)達(dá)到或高于預(yù)期評(píng)估指標(biāo)后,才執(zhí)行融合模型分類器上線步驟,上線后用于真實(shí)經(jīng)營(yíng)性貸款需求預(yù)測(cè);如果評(píng)估值低于預(yù)期評(píng)估指標(biāo),則不執(zhí)行融合模型分類器上線步驟。
16、進(jìn)一步地,所述采用計(jì)算auc模型性能評(píng)估指標(biāo)的方法進(jìn)行評(píng)估,具體通過(guò)計(jì)算假正率與真正類曲線下面積得到auc模型性能評(píng)估指標(biāo);所述假正率對(duì)應(yīng)判斷為有需求,實(shí)際無(wú)需求的概率;所述真正類對(duì)應(yīng)判斷為有需求,實(shí)際有需求的概率。
17、進(jìn)一步地,所述預(yù)期評(píng)估指標(biāo)包括0.85。
18、一種基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)系統(tǒng),包括計(jì)算機(jī)設(shè)備,在計(jì)算機(jī)設(shè)備的存儲(chǔ)介質(zhì)中存儲(chǔ)有程序,當(dāng)程序被處理器加載時(shí)執(zhí)行如上任一項(xiàng)所述的基于集成學(xué)習(xí)的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法。
19、本專利技術(shù)的有益效果包括:
20、本專利技術(shù)首次結(jié)合二分類模型差異性度量、模型有效性評(píng)估指標(biāo)及基模型篩選,提出了基于預(yù)測(cè)類別相關(guān)性的集成學(xué)習(xí)基模型篩選方法,具有所選取的基模型“好而不同”的優(yōu)勢(shì),構(gòu)建了基模型篩選具體評(píng)判標(biāo)準(zhǔn)與篩選執(zhí)行步驟,即創(chuàng)新了理論支撐,又實(shí)際操作可行。現(xiàn)有的pearson相關(guān)系數(shù)計(jì)算方法來(lái)計(jì)算兩個(gè)連續(xù)樣本之間的線性相關(guān)性,本專利技術(shù)改進(jìn)后選用類別樣本相關(guān)性計(jì)算方法,具有如下優(yōu)點(diǎn):減少了樣本異常點(diǎn)的干擾,相關(guān)系數(shù)能更準(zhǔn)確的反映樣本本身的相關(guān)關(guān)系,基模型篩選結(jié)果更具魯棒性;適用性更廣,當(dāng)對(duì)樣本類別極度不平衡時(shí),現(xiàn)有方法大多數(shù)樣本預(yù)測(cè)概率非常相近,這使得相關(guān)性系數(shù)值不敏感于預(yù)測(cè)結(jié)果的輕微改變,因此現(xiàn)有pearson相關(guān)系數(shù)并不適用,而本專利技術(shù)的方法可行,因此適用性更廣。
21、本專利技術(shù)將多個(gè)基礎(chǔ)模型整合為一個(gè)最終的預(yù)測(cè)結(jié)果,從而對(duì)用戶的相關(guān)特征進(jìn)行自動(dòng)識(shí)別,最終實(shí)現(xiàn)多模型組合識(shí)別方法對(duì)用戶類型的分類,提高了識(shí)別效率,模型可以定時(shí)更新特征,定時(shí)優(yōu)化預(yù)測(cè)精度。
22、本專利技術(shù)即使在建模樣本類別不平衡的情況下依然能客觀識(shí)別出較好的分類器,提高預(yù)測(cè)精準(zhǔn)度。
23、本專利技術(shù)不同于單一算法,可以提取不同方面的特征,利用集成學(xué)習(xí)方法,可有效融合不同單一算法的優(yōu)點(diǎn),提升預(yù)測(cè)效果。
本文檔來(lái)自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法,其特征在于,在步驟二中,所述利用多個(gè)篩選得到的基模型加上AUC值最大的個(gè)體學(xué)習(xí)器模型構(gòu)成融合模型分類器,再采用多數(shù)投票規(guī)則融合所述融合模型分類器的預(yù)測(cè)結(jié)果,具體包括如下子步驟:
3.根據(jù)權(quán)利要求1所述的基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法,其特征在于,所述參考值的取值范圍在0~0.6之間。
4.根據(jù)權(quán)利要求1所述的基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法,其特征在于,在基模型篩選之前,還包括步驟:數(shù)據(jù)接入整合,以形成訓(xùn)練集數(shù)據(jù)。
5.根據(jù)權(quán)利要求1所述的基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法,其特征在于,所述根據(jù)融合模型分類器的最終預(yù)測(cè)結(jié)果進(jìn)行真實(shí)經(jīng)營(yíng)性貸款需求預(yù)測(cè),具體包括子步驟:將融合模型分類器的最終預(yù)測(cè)結(jié)果采用計(jì)算AUC模型性能評(píng)估指標(biāo)的方法進(jìn)行評(píng)估,且在AUC模型性能評(píng)估指標(biāo)達(dá)到或高于預(yù)期評(píng)估指標(biāo)后,才執(zhí)行融合模型分類器上線步驟,上線后用于真實(shí)經(jīng)營(yíng)性貸款需求預(yù)測(cè);如果
6.根據(jù)權(quán)利要求5所述的基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法,其特征在于,所述采用計(jì)算AUC模型性能評(píng)估指標(biāo)的方法進(jìn)行評(píng)估,具體通過(guò)計(jì)算假正率與真正類曲線下面積得到AUC模型性能評(píng)估指標(biāo);所述假正率對(duì)應(yīng)判斷為有需求,實(shí)際無(wú)需求的概率;所述真正類對(duì)應(yīng)判斷為有需求,實(shí)際有需求的概率。
7.根據(jù)權(quán)利要求5所述的基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法,其特征在于,所述預(yù)期評(píng)估指標(biāo)包括0.85。
8.一種基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)系統(tǒng),其特征在于,包括計(jì)算機(jī)設(shè)備,在計(jì)算機(jī)設(shè)備的存儲(chǔ)介質(zhì)中存儲(chǔ)有程序,當(dāng)程序被處理器加載時(shí)執(zhí)行權(quán)利要求1~7任一項(xiàng)所述的基于集成學(xué)習(xí)的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法。
...【技術(shù)特征摘要】
1.一種基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法,其特征在于,在步驟二中,所述利用多個(gè)篩選得到的基模型加上auc值最大的個(gè)體學(xué)習(xí)器模型構(gòu)成融合模型分類器,再采用多數(shù)投票規(guī)則融合所述融合模型分類器的預(yù)測(cè)結(jié)果,具體包括如下子步驟:
3.根據(jù)權(quán)利要求1所述的基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法,其特征在于,所述參考值的取值范圍在0~0.6之間。
4.根據(jù)權(quán)利要求1所述的基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法,其特征在于,在基模型篩選之前,還包括步驟:數(shù)據(jù)接入整合,以形成訓(xùn)練集數(shù)據(jù)。
5.根據(jù)權(quán)利要求1所述的基于預(yù)測(cè)類別相關(guān)性的經(jīng)營(yíng)性貸款需求預(yù)測(cè)方法,其特征在于,所述根據(jù)融合模型分類器的最終預(yù)測(cè)結(jié)果進(jìn)行真實(shí)經(jīng)營(yíng)性貸款需求預(yù)測(cè),具體包括子步驟:將融合模型分類器的最終預(yù)測(cè)結(jié)果采用計(jì)算auc模型...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:宋疆,鄧鵬,瞿清華,李磊,劉冠蔚,代雄,周薇,王海淘,
申請(qǐng)(專利權(quán))人:四川農(nóng)村商業(yè)聯(lián)合銀行股份有限公司,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。