System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及電數(shù)字?jǐn)?shù)據(jù)處理,特別是涉及一種基于線性回歸模型的用戶處理方法。
技術(shù)介紹
1、現(xiàn)有技術(shù)中通常由人工根據(jù)待投保的用戶的個(gè)人信息確定待投保的用戶的保費(fèi),不同的待投保用戶的保費(fèi)會(huì)因?yàn)榇侗5挠脩舻膫€(gè)人信息的不同而產(chǎn)生差異,一般而言,不同的個(gè)人信息對(duì)應(yīng)不同的理賠風(fēng)險(xiǎn),為了提高理賠風(fēng)險(xiǎn)較低的人群投保的意愿和降低理賠風(fēng)險(xiǎn)較高的人群的賠付成本,通常為理賠風(fēng)險(xiǎn)較高的待投保的用戶設(shè)置較高的保費(fèi),為理賠風(fēng)險(xiǎn)較低的待投保的用戶設(shè)置較低的保費(fèi)。但是,由人工根據(jù)待投保的用戶的個(gè)人信息確定待投保的用戶的保費(fèi)時(shí)可能出現(xiàn)錯(cuò)誤的情況,即出現(xiàn)待投保的用戶的個(gè)人信息與人工確定的待投保的用戶的保費(fèi)不匹配的情況,如何對(duì)人工確定的待投保的用戶的保費(fèi)進(jìn)行異常判斷,是亟待解決的問題。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)目的在于,提供一種基于線性回歸模型的用戶處理方法,以對(duì)人工確定的待投保的用戶的保費(fèi)進(jìn)行異常判斷。
2、根據(jù)本專利技術(shù),提供了一種基于線性回歸模型的用戶處理方法,所述處理方法包括以下步驟:
3、s100,獲取訓(xùn)練用戶集;所述訓(xùn)練用戶集包括若干訓(xùn)練用戶,每一訓(xùn)練用戶的標(biāo)準(zhǔn)化數(shù)據(jù)包括對(duì)應(yīng)的訓(xùn)練用戶的經(jīng)標(biāo)準(zhǔn)化處理后的年齡、用于表征性別的第一標(biāo)簽、經(jīng)標(biāo)準(zhǔn)化處理后的體重指數(shù)、用于表征有無慢性病的第二標(biāo)簽、經(jīng)標(biāo)準(zhǔn)化處理后的吸煙頻率、經(jīng)標(biāo)準(zhǔn)化處理后的飲酒頻率、經(jīng)標(biāo)準(zhǔn)化處理后的鍛煉頻率、用于表征職業(yè)是否為高風(fēng)險(xiǎn)職業(yè)的第三標(biāo)簽和經(jīng)標(biāo)準(zhǔn)化處理后的收入;每一訓(xùn)練用戶的保費(fèi)根據(jù)對(duì)用的訓(xùn)練用戶的實(shí)際理賠次數(shù)和理
4、s200,獲取預(yù)設(shè)的線性回歸模型a=a0+w1×a1+w2×a2+w3×a3+w4×a4+w5×a5+w6×a6+w7×a7+w8×a8+w9×a9+b0,a為保費(fèi),a0為截距,w1、w2、w3、w4、w5、w6、w7、w8和w9分別為第一系數(shù)、第二系數(shù)、第三系數(shù)、第四系數(shù)、第五系數(shù)、第六系數(shù)、第七系數(shù)、第八系數(shù)和第九系數(shù),a1、a2、a3、a4、a5、a6、a7、a8和a9分別為經(jīng)標(biāo)準(zhǔn)化處理后的年齡、用于表征性別的第一標(biāo)簽、經(jīng)標(biāo)準(zhǔn)化處理后的體重指數(shù)、用于表征有無慢性病的第二標(biāo)簽、經(jīng)標(biāo)準(zhǔn)化處理后的吸煙頻率、經(jīng)標(biāo)準(zhǔn)化處理后的飲酒頻率、經(jīng)標(biāo)準(zhǔn)化處理后的鍛煉頻率、用于表征職業(yè)是否為高風(fēng)險(xiǎn)職業(yè)的第三標(biāo)簽和經(jīng)標(biāo)準(zhǔn)化處理后的收入,b0為誤差。
5、s300,使用訓(xùn)練用戶集包括的訓(xùn)練用戶的標(biāo)準(zhǔn)化數(shù)據(jù)和保費(fèi)對(duì)預(yù)設(shè)的線性回歸模型進(jìn)行求解,得到a0、w1、w2、w3、w4、w5、w6、w7、w8和w9。
6、s400,獲取待投保的用戶的初始數(shù)據(jù);初始數(shù)據(jù)包括年齡、性別、體重指數(shù)、慢性病歷史、吸煙習(xí)慣、飲酒習(xí)慣、鍛煉頻率、職業(yè)種類和收入。
7、s500,對(duì)待投保的用戶的初始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,得到待投保的用戶的標(biāo)準(zhǔn)化數(shù)據(jù)。
8、s600,根據(jù)待投保的用戶的標(biāo)準(zhǔn)化數(shù)據(jù)以及求解得到的a0、w1、w2、w3、w4、w5、w6、w7、w8和w9預(yù)測待投保的用戶的保費(fèi)。
9、s700,如果預(yù)測的待投保的用戶的保費(fèi)與待投保的用戶的目標(biāo)保費(fèi)的差異值大于等于預(yù)設(shè)的差異閾值,則輸出用于指示異常的預(yù)設(shè)信息。
10、本專利技術(shù)與現(xiàn)有技術(shù)相比至少具有以下有益效果:
11、本專利技術(shù)中每一訓(xùn)練用戶的標(biāo)準(zhǔn)化數(shù)據(jù)包括與年齡、性別、體重指數(shù)、有無慢性病、吸煙頻率、飲酒頻率、鍛煉頻率、職業(yè)和收入相關(guān)的信息,預(yù)設(shè)的線性回歸模型中包括與這些信息對(duì)應(yīng)的自變量,基于訓(xùn)練用戶集的標(biāo)準(zhǔn)化數(shù)據(jù)和對(duì)應(yīng)的保費(fèi)能夠獲取預(yù)設(shè)的線性回歸模型中的未知截距和系數(shù),在此基礎(chǔ)上,基于待投保的用戶的標(biāo)準(zhǔn)化數(shù)據(jù)和獲取的截距和系數(shù)就可以預(yù)測待投保的用戶的保費(fèi);本專利技術(shù)中上述信息與理賠的風(fēng)險(xiǎn)較為相關(guān),基于上述信息獲取的用戶的保費(fèi)的準(zhǔn)確性較高,與用戶更為匹配,如果預(yù)測的待投保的用戶的保費(fèi)與目標(biāo)保費(fèi)(即人工確定的該待投保的用戶的保費(fèi))差異較大,則輸出用于指示異常的預(yù)設(shè)信息,以提示人工確定的保費(fèi)可能與對(duì)應(yīng)的個(gè)人信息不匹配。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種基于線性回歸模型的用戶處理方法,其特征在于,所述處理方法包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于線性回歸模型的用戶處理方法,其特征在于,所述訓(xùn)練用戶集的獲取過程包括:
3.根據(jù)權(quán)利要求2所述的基于線性回歸模型的用戶處理方法,其特征在于,根據(jù)每一簇內(nèi)歷史用戶的保費(fèi)對(duì)簇內(nèi)的異常保費(fèi)的歷史用戶進(jìn)行篩除包括:
4.根據(jù)權(quán)利要求2所述的基于線性回歸模型的用戶處理方法,其特征在于,根據(jù)組內(nèi)歷史用戶的標(biāo)準(zhǔn)化數(shù)據(jù)的距離將每一組內(nèi)的歷史用戶劃分為若干簇包括:
5.根據(jù)權(quán)利要求4所述的基于線性回歸模型的用戶處理方法,其特征在于,預(yù)設(shè)的第一權(quán)重、預(yù)設(shè)的第二權(quán)重、預(yù)設(shè)的第三權(quán)重、預(yù)設(shè)的第四權(quán)重、預(yù)設(shè)的第五權(quán)重、預(yù)設(shè)的第六權(quán)重、預(yù)設(shè)的第七權(quán)重、預(yù)設(shè)的第八權(quán)重和預(yù)設(shè)的第九權(quán)重的獲取過程包括:
6.根據(jù)權(quán)利要求5所述的基于線性回歸模型的用戶處理方法,其特征在于,歸一化處理后的第一皮爾遜相關(guān)系數(shù)的絕對(duì)值為第一皮爾遜相關(guān)系數(shù)的絕對(duì)值與所有皮爾遜相關(guān)系數(shù)的絕對(duì)值之和的比值,歸一化處理后的第二皮爾遜相關(guān)系數(shù)的絕對(duì)值為第二皮爾遜相關(guān)系數(shù)的絕對(duì)值與所
7.根據(jù)權(quán)利要求3所述的基于線性回歸模型的用戶處理方法,其特征在于,S044還包括判斷是否匹配成功的過程,該過程包括:如果預(yù)設(shè)的篩除比例表中某一條目包括的數(shù)量范圍包括第一簇內(nèi)歷史用戶的數(shù)量,該條目包括的平均數(shù)量范圍包括所有簇的歷史用戶的平均數(shù)量,該條目包括的方差范圍包括第一簇內(nèi)歷史用戶的保費(fèi)的方差且該條目包括的平均方差范圍包括所有簇的歷史用戶的保費(fèi)的平均方差,則判定匹配成功,并將該條目判定為匹配成功的條目。
...【技術(shù)特征摘要】
1.一種基于線性回歸模型的用戶處理方法,其特征在于,所述處理方法包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于線性回歸模型的用戶處理方法,其特征在于,所述訓(xùn)練用戶集的獲取過程包括:
3.根據(jù)權(quán)利要求2所述的基于線性回歸模型的用戶處理方法,其特征在于,根據(jù)每一簇內(nèi)歷史用戶的保費(fèi)對(duì)簇內(nèi)的異常保費(fèi)的歷史用戶進(jìn)行篩除包括:
4.根據(jù)權(quán)利要求2所述的基于線性回歸模型的用戶處理方法,其特征在于,根據(jù)組內(nèi)歷史用戶的標(biāo)準(zhǔn)化數(shù)據(jù)的距離將每一組內(nèi)的歷史用戶劃分為若干簇包括:
5.根據(jù)權(quán)利要求4所述的基于線性回歸模型的用戶處理方法,其特征在于,預(yù)設(shè)的第一權(quán)重、預(yù)設(shè)的第二權(quán)重、預(yù)設(shè)的第三權(quán)重、預(yù)設(shè)的第四權(quán)重、預(yù)設(shè)的第五權(quán)重、預(yù)設(shè)的第六權(quán)重、預(yù)設(shè)的第七權(quán)重、預(yù)設(shè)的第八權(quán)重和預(yù)設(shè)的第九權(quán)重的獲取過程包括:
6.根據(jù)權(quán)利要求5所述的基于線性回歸模型的用戶處理方法,其特征在于,歸一化處理后的第一皮爾遜相關(guān)系數(shù)的絕對(duì)值為第一皮爾遜相關(guān)系數(shù)的絕對(duì)值與所有皮爾遜相關(guān)系數(shù)的絕對(duì)值之和的比值,歸一化處理后的第二皮爾遜相關(guān)系數(shù)的絕對(duì)值為第二皮爾遜相關(guān)系數(shù)的絕對(duì)值與所有皮爾遜相關(guān)系數(shù)的絕對(duì)值之和的比值,歸一化處理后的第三皮爾遜相關(guān)系數(shù)的絕對(duì)值為第三皮爾遜相關(guān)系數(shù)的絕對(duì)值與所有皮...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:俞鋒鋒,方毅,王志豪,
申請(qǐng)(專利權(quán))人:每日互動(dòng)股份有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。