本發(fā)明專利技術(shù)涉及人工智能,揭露一種欺詐行為識(shí)別方法,包括:計(jì)算多個(gè)歷史行為數(shù)據(jù)對(duì)應(yīng)的權(quán)重值,根據(jù)權(quán)重值從多個(gè)歷史行為數(shù)據(jù)中篩選出目標(biāo)行為數(shù)據(jù);對(duì)經(jīng)過(guò)數(shù)據(jù)清洗得到的標(biāo)準(zhǔn)行為數(shù)據(jù)對(duì)應(yīng)的用戶進(jìn)行異常檢測(cè),得到異常檢測(cè)結(jié)果,根據(jù)異常檢測(cè)結(jié)果將用戶劃分為用戶分類,得到正常用戶集和異常用戶集并進(jìn)行線性組合,得到多組用戶訓(xùn)練集,基于多組用戶訓(xùn)練集進(jìn)行模型訓(xùn)練,得到欺詐行為識(shí)別模型;將待識(shí)別用戶對(duì)應(yīng)的用戶數(shù)據(jù)輸入至欺詐行為識(shí)別模型中,得到待識(shí)別用戶的欺詐判定結(jié)果。此外,本發(fā)明專利技術(shù)還涉及區(qū)塊鏈技術(shù),權(quán)重值可存儲(chǔ)于區(qū)塊鏈的節(jié)點(diǎn)。本發(fā)明專利技術(shù)還提出一種欺詐行為識(shí)別裝置、電子設(shè)備以及存儲(chǔ)介質(zhì)。本發(fā)明專利技術(shù)可以提高欺詐行為識(shí)別的準(zhǔn)確度。別的準(zhǔn)確度。別的準(zhǔn)確度。
【技術(shù)實(shí)現(xiàn)步驟摘要】
欺詐行為識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
[0001]本專利技術(shù)涉及人工智能領(lǐng)域,尤其涉及一種欺詐行為識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
技術(shù)介紹
[0002]在當(dāng)前行業(yè)欺詐對(duì)金融行業(yè)造成了巨大的損失,有著業(yè)務(wù)環(huán)節(jié)多,手段多樣化,隱秘性強(qiáng)的特點(diǎn),行業(yè)欺詐會(huì)導(dǎo)致用戶的安全受到影響,進(jìn)而導(dǎo)致行業(yè)發(fā)展越來(lái)越差。
[0003]在過(guò)去,很多金融企業(yè)通過(guò)規(guī)則引擎和線下調(diào)查來(lái)識(shí)別詐騙,能攔截到發(fā)標(biāo)后觸碰到規(guī)則的用戶,但是覆蓋范圍小,準(zhǔn)確率不高。因此亟待提出一種準(zhǔn)確度更高的欺詐行為識(shí)別方法。
技術(shù)實(shí)現(xiàn)思路
[0004]本專利技術(shù)提供一種欺詐行為識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),其主要目的在于提高欺詐行為識(shí)別的準(zhǔn)確度。
[0005]為實(shí)現(xiàn)上述目的,本專利技術(shù)提供的一種欺詐行為識(shí)別方法,包括:
[0006]獲取多個(gè)不同維度的歷史行為數(shù)據(jù),基于預(yù)設(shè)的權(quán)重計(jì)算方法計(jì)算多個(gè)所述歷史行為數(shù)據(jù)對(duì)應(yīng)的權(quán)重值,并根據(jù)所述權(quán)重值從多個(gè)所述歷史行為數(shù)據(jù)中篩選出目標(biāo)行為數(shù)據(jù);
[0007]對(duì)所述目標(biāo)行為數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗處理,得到標(biāo)準(zhǔn)行為數(shù)據(jù);
[0008]基于預(yù)設(shè)隔離森林算法對(duì)所述標(biāo)準(zhǔn)行為數(shù)據(jù)對(duì)應(yīng)的用戶進(jìn)行異常檢測(cè),得到異常檢測(cè)結(jié)果,并根據(jù)所述異常檢測(cè)結(jié)果將用戶劃分為用戶分類,得到正常用戶集和異常用戶集;
[0009]對(duì)所述正常用戶集和所述異常用戶集進(jìn)行線性組合,得到多組用戶訓(xùn)練集,基于多組所述用戶訓(xùn)練集進(jìn)行模型訓(xùn)練,得到欺詐行為識(shí)別模型;
[0010]獲取待識(shí)別用戶及所述待識(shí)別用戶對(duì)應(yīng)的用戶數(shù)據(jù),將所述待識(shí)別用戶對(duì)應(yīng)的用戶數(shù)據(jù)輸入至所述欺詐行為識(shí)別模型中,得到所述待識(shí)別用戶的欺詐判定結(jié)果。
[0011]可選地,所述基于預(yù)設(shè)的權(quán)重計(jì)算方法計(jì)算多個(gè)所述歷史行為數(shù)據(jù)對(duì)應(yīng)的權(quán)重值,包括:
[0012]對(duì)所述歷史行為數(shù)據(jù)進(jìn)行分箱處理,得到分組數(shù)據(jù)集;
[0013]利用預(yù)設(shè)的權(quán)重值公式分別計(jì)算所述分組數(shù)據(jù)集中多個(gè)分組數(shù)據(jù)對(duì)應(yīng)的權(quán)重值。
[0014]可選地,所述預(yù)設(shè)的權(quán)重值公式為:
[0015][0016]其中,WOE
i
為多個(gè)權(quán)重值,py
i
為歷史行為數(shù)據(jù)取值為“是”的個(gè)體數(shù)目,pn
i
為歷史行為數(shù)據(jù)取值為“否”的個(gè)體數(shù)目。
[0017]可選地,所述對(duì)所述目標(biāo)行為數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗處理,包括:
[0018]對(duì)所述目標(biāo)行為數(shù)據(jù)進(jìn)行缺失值檢測(cè)處理,并根據(jù)缺失值檢測(cè)處理得到的檢測(cè)結(jié)果計(jì)算缺失比例;
[0019]判斷所述缺失比例與預(yù)設(shè)的缺失閾值之間的大小,當(dāng)所述缺失比例大于或者等于所述缺失閾值時(shí),將所述缺失比例對(duì)應(yīng)的目標(biāo)行為數(shù)據(jù)執(zhí)行剔除處理,得到標(biāo)準(zhǔn)行為數(shù)據(jù);
[0020]當(dāng)所述缺失比例小于所述缺失閾值時(shí),對(duì)所述缺失比例對(duì)應(yīng)的目標(biāo)行為數(shù)據(jù)執(zhí)行均值填充處理,得到標(biāo)準(zhǔn)行為數(shù)據(jù)。
[0021]可選地,所述根據(jù)缺失值檢測(cè)處理得到的檢測(cè)結(jié)果計(jì)算缺失比例,包括:
[0022]統(tǒng)計(jì)所述目標(biāo)行為數(shù)據(jù)的數(shù)據(jù)長(zhǎng)度,并將所述目標(biāo)行為數(shù)據(jù)的數(shù)據(jù)長(zhǎng)度作為第一數(shù)據(jù)長(zhǎng)度;
[0023]識(shí)別所述檢測(cè)結(jié)果的數(shù)據(jù)長(zhǎng)度,并將所述檢測(cè)結(jié)果的數(shù)據(jù)長(zhǎng)度作為第二數(shù)據(jù)長(zhǎng)度;
[0024]將所述第二數(shù)據(jù)長(zhǎng)度作為分子,所述第一數(shù)據(jù)長(zhǎng)度作為分母計(jì)算得到缺失比例。
[0025]可選地,所述基于多組所述用戶訓(xùn)練集進(jìn)行模型訓(xùn)練,得到欺詐行為識(shí)別模型,包括:
[0026]獲取標(biāo)準(zhǔn)決策樹,將多組所述用戶訓(xùn)練集輸入至所述標(biāo)準(zhǔn)決策樹,得到得分?jǐn)?shù)據(jù)集;
[0027]根據(jù)所述得分?jǐn)?shù)據(jù)集和預(yù)設(shè)的損失函數(shù)計(jì)算所述標(biāo)準(zhǔn)決策樹的損失值;
[0028]當(dāng)所述損失值大于或者等于預(yù)設(shè)的損失閾值時(shí),再次執(zhí)行所述對(duì)所述初始決策樹進(jìn)行決策樹添加處理的操作,直至所述損失值小于所述損失閾值時(shí),輸出當(dāng)前的標(biāo)準(zhǔn)決策樹為欺詐行為識(shí)別模型。
[0029]可選地,所述獲取標(biāo)準(zhǔn)決策樹,包括:
[0030]獲取特征信息集,任意選取所述特征信息集中的一個(gè)特征信息作為根節(jié)點(diǎn),在所述根節(jié)點(diǎn)上分裂左節(jié)點(diǎn)和右節(jié)點(diǎn);
[0031]將所述特征信息集分配至所述左節(jié)點(diǎn)和所述右節(jié)點(diǎn),得到基本決策樹;
[0032]對(duì)所述基本決策樹進(jìn)行決策樹增添處理,得到標(biāo)準(zhǔn)決策樹。
[0033]為了解決上述問(wèn)題,本專利技術(shù)還提供一種欺詐行為識(shí)別裝置,所述裝置包括:
[0034]數(shù)據(jù)清洗模塊,用于獲取多個(gè)不同維度的歷史行為數(shù)據(jù),基于預(yù)設(shè)的權(quán)重計(jì)算方法計(jì)算多個(gè)所述歷史行為數(shù)據(jù)對(duì)應(yīng)的權(quán)重值,并根據(jù)所述權(quán)重值從多個(gè)所述歷史行為數(shù)據(jù)中篩選出目標(biāo)行為數(shù)據(jù),對(duì)所述目標(biāo)行為數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗處理,得到標(biāo)準(zhǔn)行為數(shù)據(jù);
[0035]異常檢測(cè)模塊,用于基于預(yù)設(shè)隔離森林算法對(duì)所述標(biāo)準(zhǔn)行為數(shù)據(jù)對(duì)應(yīng)的用戶進(jìn)行異常檢測(cè),得到異常檢測(cè)結(jié)果,并根據(jù)所述異常檢測(cè)結(jié)果將用戶劃分為用戶分類,得到正常用戶集和異常用戶集;
[0036]模型訓(xùn)練模塊,用于對(duì)所述正常用戶集和所述異常用戶集進(jìn)行線性組合,得到多組用戶訓(xùn)練集,基于多組所述用戶訓(xùn)練集進(jìn)行模型訓(xùn)練,得到欺詐行為識(shí)別模型;
[0037]欺詐判定模塊,用于獲取待識(shí)別用戶及所述待識(shí)別用戶對(duì)應(yīng)的用戶數(shù)據(jù),將所述待識(shí)別用戶對(duì)應(yīng)的用戶數(shù)據(jù)輸入至所述欺詐行為識(shí)別模型中,得到所述待識(shí)別用戶的欺詐判定結(jié)果。
[0038]為了解決上述問(wèn)題,本專利技術(shù)還提供一種電子設(shè)備,所述電子設(shè)備包括:
[0039]至少一個(gè)處理器;以及,
[0040]與所述至少一個(gè)處理器通信連接的存儲(chǔ)器;其中,
[0041]所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行上述所述的欺詐行為識(shí)別方法。
[0042]為了解決上述問(wèn)題,本專利技術(shù)還提供一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)中存儲(chǔ)有至少一個(gè)計(jì)算機(jī)程序,所述至少一個(gè)計(jì)算機(jī)程序被電子設(shè)備中的處理器執(zhí)行以實(shí)現(xiàn)上述所述的欺詐行為識(shí)別方法。
[0043]本專利技術(shù)實(shí)施例中,通過(guò)權(quán)重計(jì)算方法計(jì)算多個(gè)歷史行為數(shù)據(jù)對(duì)應(yīng)的權(quán)重值,并根據(jù)所述權(quán)重值從多個(gè)所述歷史行為數(shù)據(jù)中篩選出目標(biāo)行為數(shù)據(jù),可以選擇出占比較高的目標(biāo)行為數(shù)據(jù),并對(duì)目標(biāo)行為數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗處理,得到標(biāo)準(zhǔn)行為數(shù)據(jù),數(shù)據(jù)清理可以保證數(shù)據(jù)的準(zhǔn)確性進(jìn)而避免數(shù)據(jù)冗余,基于預(yù)設(shè)隔離森林算法對(duì)所述標(biāo)準(zhǔn)行為數(shù)據(jù)對(duì)應(yīng)的用戶進(jìn)行異常檢測(cè),得到異常檢測(cè)結(jié)果,并根據(jù)異常檢測(cè)結(jié)果進(jìn)行訓(xùn)練數(shù)據(jù)集的構(gòu)建,再訓(xùn)練得到欺詐行為識(shí)別模型,使得通過(guò)欺詐行為識(shí)別模型得到的待識(shí)別用戶的欺詐判定結(jié)果更加準(zhǔn)確。因此本專利技術(shù)提出的欺詐行為識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),可以解決欺詐行為識(shí)別的準(zhǔn)確度較低的問(wèn)題。
附圖說(shuō)明
[0044]圖1為本專利技術(shù)一實(shí)施例提供的欺詐行為識(shí)別方法的流程示意圖;
[0045]圖2為圖1中其中一個(gè)步驟的詳細(xì)實(shí)施流程示意圖;
[0046]圖3為圖1中其中一個(gè)步驟的詳細(xì)實(shí)施流程示意圖;
[0047]圖4為圖1中其中一個(gè)步驟的詳細(xì)實(shí)施流程示意圖;
[00本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
【技術(shù)特征摘要】
1.一種欺詐行為識(shí)別方法,其特征在于,所述方法包括:獲取多個(gè)不同維度的歷史行為數(shù)據(jù),基于預(yù)設(shè)的權(quán)重計(jì)算方法計(jì)算多個(gè)所述歷史行為數(shù)據(jù)對(duì)應(yīng)的權(quán)重值,并根據(jù)所述權(quán)重值從多個(gè)所述歷史行為數(shù)據(jù)中篩選出目標(biāo)行為數(shù)據(jù);對(duì)所述目標(biāo)行為數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗處理,得到標(biāo)準(zhǔn)行為數(shù)據(jù);基于預(yù)設(shè)隔離森林算法對(duì)所述標(biāo)準(zhǔn)行為數(shù)據(jù)對(duì)應(yīng)的用戶進(jìn)行異常檢測(cè),得到異常檢測(cè)結(jié)果,并根據(jù)所述異常檢測(cè)結(jié)果將用戶劃分為用戶分類,得到正常用戶集和異常用戶集;對(duì)所述正常用戶集和所述異常用戶集進(jìn)行線性組合,得到多組用戶訓(xùn)練集,基于多組所述用戶訓(xùn)練集進(jìn)行模型訓(xùn)練,得到欺詐行為識(shí)別模型;獲取待識(shí)別用戶及所述待識(shí)別用戶對(duì)應(yīng)的用戶數(shù)據(jù),將所述待識(shí)別用戶對(duì)應(yīng)的用戶數(shù)據(jù)輸入至所述欺詐行為識(shí)別模型中,得到所述待識(shí)別用戶的欺詐判定結(jié)果。2.如權(quán)利要求1所述的欺詐行為識(shí)別方法,其特征在于,所述基于預(yù)設(shè)的權(quán)重計(jì)算方法計(jì)算多個(gè)所述歷史行為數(shù)據(jù)對(duì)應(yīng)的權(quán)重值,包括:對(duì)所述歷史行為數(shù)據(jù)進(jìn)行分箱處理,得到分組數(shù)據(jù)集;利用預(yù)設(shè)的權(quán)重值公式分別計(jì)算所述分組數(shù)據(jù)集中多個(gè)分組數(shù)據(jù)對(duì)應(yīng)的權(quán)重值。3.如權(quán)利要求2所述的欺詐行為識(shí)別方法,其特征在于,所述預(yù)設(shè)的權(quán)重值公式為:其中,WOE
i
為多個(gè)權(quán)重值,py
i
為歷史行為數(shù)據(jù)取值為“是”的個(gè)體數(shù)目,pn
i
為歷史行為數(shù)據(jù)取值為“否”的個(gè)體數(shù)目。4.如權(quán)利要求1所述的欺詐行為識(shí)別方法,其特征在于,所述對(duì)所述目標(biāo)行為數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗處理,包括:對(duì)所述目標(biāo)行為數(shù)據(jù)進(jìn)行缺失值檢測(cè)處理,并根據(jù)缺失值檢測(cè)處理得到的檢測(cè)結(jié)果計(jì)算缺失比例;判斷所述缺失比例與預(yù)設(shè)的缺失閾值之間的大小,當(dāng)所述缺失比例大于或者等于所述缺失閾值時(shí),將所述缺失比例對(duì)應(yīng)的目標(biāo)行為數(shù)據(jù)執(zhí)行剔除處理,得到標(biāo)準(zhǔn)行為數(shù)據(jù);當(dāng)所述缺失比例小于所述缺失閾值時(shí),對(duì)所述缺失比例對(duì)應(yīng)的目標(biāo)行為數(shù)據(jù)執(zhí)行均值填充處理,得到標(biāo)準(zhǔn)行為數(shù)據(jù)。5.如權(quán)利要求4所述的欺詐行為識(shí)別方法,其特征在于,所述根據(jù)缺失值檢測(cè)處理得到的檢測(cè)結(jié)果計(jì)算缺失比例,包括:統(tǒng)計(jì)所述目標(biāo)行為數(shù)據(jù)的數(shù)據(jù)長(zhǎng)度,并將所述目標(biāo)行為數(shù)據(jù)的數(shù)據(jù)長(zhǎng)度作為第一數(shù)據(jù)長(zhǎng)度;識(shí)別所述檢測(cè)結(jié)果的數(shù)據(jù)長(zhǎng)度,并將所述檢測(cè)結(jié)果的數(shù)據(jù)長(zhǎng)度作為第二數(shù)據(jù)長(zhǎng)度;將所述第二數(shù)據(jù)長(zhǎng)度作為分子,所述第一數(shù)據(jù)長(zhǎng)度作為...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:李方園,
申請(qǐng)(專利權(quán))人:未鯤上海科技服務(wù)有限公司,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。