本發(fā)明專利技術(shù)公開了一種非法信息的處理方法和裝置。該方法包括:采用邏輯回歸算法建立號碼識別模型;利用樣本數(shù)據(jù)訓(xùn)練號碼識別模型,獲得非法號碼的特征參數(shù);實(shí)時(shí)捕獲來自主叫終端的呼叫事件;利用訓(xùn)練后的號碼識別模型挖掘呼叫事件,并依據(jù)非法號碼的特征參數(shù)識別主叫終端的號碼;當(dāng)主叫終端的號碼是非法號碼時(shí),攔截主叫終端的信令數(shù)據(jù)流和/或向被叫終端發(fā)送警告提醒。由此,本實(shí)施例通過號碼識別模型可以主動、精確地識別出非法號碼,在精確識別非法號碼的基礎(chǔ)上,可以提高后續(xù)攔截非法信息和發(fā)送警告提醒的可靠性,改善了用戶的體驗(yàn)。
【技術(shù)實(shí)現(xiàn)步驟摘要】
非法信息的處理方法和裝置
本專利技術(shù)涉及網(wǎng)絡(luò)通信
,尤其涉及一種非法信息的處理方法和裝置。
技術(shù)介紹
隨著科技的發(fā)展以及人們生活水平的日漸提高,電信產(chǎn)業(yè)發(fā)展迅猛。目前,手機(jī)等通信工具的普及率持續(xù)提升,非法分子通過通信工具散布非法信息的活動也日益猖獗起來。例如,通過手機(jī)對詐騙意識薄弱的手機(jī)用戶進(jìn)行詐騙。詐騙手段越來越多,讓人防不勝防,用戶蒙受了很大的財(cái)產(chǎn)損失,這嚴(yán)重?cái)_亂了正常的社會秩序,社會反響十分強(qiáng)烈。目前,通過將詐騙的電話號碼列入攔截號碼表內(nèi),當(dāng)監(jiān)測到攔截號碼表內(nèi)的電話號碼呼叫連接時(shí),攔截詐騙電話,或者以發(fā)送信息提醒的方式來防止詐騙電話。然而,攔截號碼表內(nèi)的詐騙電話號碼的來源不可靠,且詐騙電話號碼的數(shù)量也非常有限。隨著網(wǎng)絡(luò)電話技術(shù)的快速發(fā)展,詐騙電話號碼變更的速度和方式越來越快、越來越復(fù)雜。現(xiàn)有的防止電話詐騙的方法存在漏攔截、錯誤攔截等問題。如何提高非法信息的處理準(zhǔn)確性成為業(yè)界亟待解決的問題。
技術(shù)實(shí)現(xiàn)思路
為了提高非法信息的處理準(zhǔn)確性,改善用戶體驗(yàn),本專利技術(shù)實(shí)施例提供了一種非法信息的處理方法和裝置。第一方面,提供了一種非法信息的處理方法。該方法包括以下步驟:采用邏輯回歸算法建立號碼識別模型;利用樣本數(shù)據(jù)訓(xùn)練號碼識別模型,獲得非法號碼的特征參數(shù);實(shí)時(shí)捕獲來自主叫終端的呼叫事件;利用訓(xùn)練后的號碼識別模型挖掘呼叫事件,并依據(jù)非法號碼的特征參數(shù)識別主叫終端的號碼;當(dāng)主叫終端的號碼是非法號碼時(shí),攔截主叫終端的信令數(shù)據(jù)流和/或向被叫終端發(fā)送警告提醒。第二方面,提供了一種非法信息的處理裝置。該裝置包括:模型建立單元,采用邏輯回歸算法建立號碼識別模型;參數(shù)獲得單元,利用樣本數(shù)據(jù)訓(xùn)練號碼識別模型,獲得非法號碼的特征參數(shù);事件捕獲單元,用于實(shí)時(shí)捕獲來自主叫終端的呼叫事件;號碼識別單元,用于利用訓(xùn)練后的號碼識別模型挖掘呼叫事件,并依據(jù)非法號碼的特征參數(shù)識別主叫終端的號碼;信息處理單元,用于當(dāng)主叫終端的號碼是非法號碼時(shí),攔截主叫終端的信令數(shù)據(jù)流和/或向被叫終端發(fā)送警告提醒。由此,本實(shí)施例通過邏輯回歸算法建立號碼識別模型,可以提高模型識別的有效性和識別結(jié)果的易用性;通過利用樣本數(shù)據(jù)訓(xùn)練號碼識別模型,獲得非法號碼的特征參數(shù);并依據(jù)非法號碼的特征參數(shù)可以主動、精確地識別出非法號碼;通過在精確識別非法號碼的基礎(chǔ)上,可以提高后續(xù)攔截非法信息和發(fā)送警告提醒的可靠性,改善了用戶的體驗(yàn)。附圖說明為了更清楚地說明本專利技術(shù)實(shí)施例的技術(shù)方案,下面將對本專利技術(shù)實(shí)施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面所描述的附圖僅僅是本專利技術(shù)的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本專利技術(shù)一實(shí)施例的非法信息的處理方法的流程示意圖。圖2是本專利技術(shù)另一實(shí)施例的非法信息的處理方法的流程示意圖。圖3是本專利技術(shù)又一實(shí)施例的非法信息的處理方法的流程示意圖。圖4是本專利技術(shù)一實(shí)施例的捕獲呼叫事件的流程示意圖。圖5是本專利技術(shù)一實(shí)施例的規(guī)則引擎處理信息的流程示意圖。圖6是本專利技術(shù)一實(shí)施例的非法信息的處理裝置的結(jié)構(gòu)示意圖。具體實(shí)施方式為使本專利技術(shù)實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本專利技術(shù)實(shí)施例中的附圖,對本專利技術(shù)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本專利技術(shù)一部分實(shí)施例,而不是全部的實(shí)施例。基于本專利技術(shù)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本專利技術(shù)保護(hù)的范圍。需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本申請。圖1是本專利技術(shù)一實(shí)施例的非法信息的處理方法的流程示意圖。如圖1所示,該方法包括以下步驟:S110,采用邏輯回歸算法建立號碼識別模型;S120,利用樣本數(shù)據(jù)訓(xùn)練號碼識別模型,獲得非法號碼的特征參數(shù);S130,實(shí)時(shí)捕獲來自主叫終端的呼叫事件;S140,利用訓(xùn)練后的號碼識別模型挖掘呼叫事件,并依據(jù)非法號碼的特征參數(shù)識別主叫終端的號碼;S150,當(dāng)主叫終端的號碼是非法號碼時(shí),攔截主叫終端的信令數(shù)據(jù)流和/或向被叫終端發(fā)送警告提醒。在步驟S110中,本實(shí)施例可以依托大數(shù)據(jù)平臺,以海量數(shù)據(jù)為基礎(chǔ),采用邏輯回歸算法建立號碼識別模型,用于對非法號碼(例如詐騙分子的電話號碼)進(jìn)行全面、準(zhǔn)確、有效地識別。由于決策樹模型的穩(wěn)定性不夠,神經(jīng)網(wǎng)絡(luò)模型的應(yīng)用性不強(qiáng)(可解釋性差),采用邏輯回歸算法建立號碼識別模型相對于決策樹和神經(jīng)網(wǎng)絡(luò)的分類模型具有更強(qiáng)的有效性和結(jié)果的易用性的優(yōu)點(diǎn)。在步驟S120中,本實(shí)施例可以采用邏輯回歸算法來建模,對樣本數(shù)據(jù)進(jìn)行訓(xùn)練并輸出模型。例如,號碼識別模型可以利用客服中心所提供的正負(fù)詐騙號碼樣本數(shù)據(jù),隨機(jī)從中抽取例如5998個非詐騙用戶、100個惡意詐騙用戶的數(shù)據(jù)進(jìn)行訓(xùn)練。結(jié)合現(xiàn)有的標(biāo)簽體系進(jìn)行特征變量篩選。經(jīng)過對標(biāo)簽平臺的1256個標(biāo)簽進(jìn)行統(tǒng)計(jì)分析,通過各屬性與是否詐騙號碼的散點(diǎn)圖分析、相關(guān)性分析,獲得疑似詐騙號碼重要特征指標(biāo)(特征參數(shù))。號碼識別模型可以基于R語言進(jìn)行邏輯回歸建模,為確保模型能夠?qū)崿F(xiàn)算法的調(diào)度以及按月迭代更新(自學(xué)習(xí))的功能。本實(shí)施例可以將該模型部署在終端服務(wù)器上,定時(shí)進(jìn)行模型調(diào)度,模型會根據(jù)最新的數(shù)據(jù)周期進(jìn)行訓(xùn)練,并將參數(shù)結(jié)果傳回?cái)?shù)據(jù)庫中。LOGISTIC回歸模型的一種二分類變量LOGISTIC回歸模型,其相應(yīng)變量是類如是否的二分類變量(如是用戶否流失、是否購買業(yè)務(wù)等)。該模型的連續(xù)概率轉(zhuǎn)換函數(shù)可以為如下的LOGISTIC函數(shù):其中,X可以是二分類變量。在在本實(shí)施例中,號碼識別模型可以為:其中,p為識別概率,p/(1+p)為概率發(fā)生比,b0是常量,n為自然數(shù),bn為非法號碼的特征參數(shù),xn為非法號碼的特征參數(shù)的相關(guān)系數(shù)。其中,特征參數(shù)和相關(guān)系數(shù)可以如下面表(1)所示:特征參數(shù)相關(guān)系數(shù)用戶網(wǎng)齡-0.1223689是否高危地區(qū)0.11176124是否170/171/400號頭0.11134476主要呼叫類型占比0.110641終端類型-0.0975582主被叫次數(shù)比-0.0954917主叫通話對象占比0.08629615短信發(fā)送條數(shù)占比0.08248682短信通話對象占比0.08239345漫游基站數(shù)0.08238249是否偏好客戶0.07871442消費(fèi)金額0.07710572表(1)例如,號碼識別模型計(jì)算的公式可以如下所示:1/(1+exp((-6.782e-01+用戶網(wǎng)齡*1.187e-02+是否高危地區(qū)*-3.963e-03+是否170/171/400號頭*7.043e-06+主要呼叫類型占比*2.178e-03+主被叫次數(shù)比*-1.698e-01+(主叫通話對象占比+短信通話對象占比)*1.613e-01+短信發(fā)送條數(shù)占比*5.728e-01+消費(fèi)金額*3.656e-07+漫游基站數(shù)*-1.119e+00+終端類型*1.342e-01+是否偏好客戶*-1.872e-01+主要呼叫類型占比*3.388e-03)*-1))。例如,主叫號碼是170、171、400時(shí),該號碼的是詐騙號碼的可能性比較高,因此,相關(guān)系數(shù)達(dá)到0.11134476;又例如,主叫號碼經(jīng)常呼叫被叫號碼,卻很少被其他號碼呼叫,這種號碼是詐騙號碼的可能性也比較高;還例如,主叫號碼漫本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種非法信息的處理方法,其特征在于,包括以下步驟:采用邏輯回歸算法建立號碼識別模型;利用樣本數(shù)據(jù)訓(xùn)練所述號碼識別模型,獲得所述非法號碼的特征參數(shù);實(shí)時(shí)捕獲來自主叫終端的呼叫事件;利用訓(xùn)練后的號碼識別模型挖掘所述呼叫事件,并依據(jù)所述非法號碼的特征參數(shù)識別所述主叫終端的號碼;當(dāng)所述主叫終端的號碼是非法號碼時(shí),攔截所述主叫終端的信令數(shù)據(jù)流和/或向被叫終端發(fā)送警告提醒。
【技術(shù)特征摘要】
1.一種非法信息的處理方法,其特征在于,包括以下步驟:采用邏輯回歸算法建立號碼識別模型;利用樣本數(shù)據(jù)訓(xùn)練所述號碼識別模型,獲得所述非法號碼的特征參數(shù);實(shí)時(shí)捕獲來自主叫終端的呼叫事件;利用訓(xùn)練后的號碼識別模型挖掘所述呼叫事件,并依據(jù)所述非法號碼的特征參數(shù)識別所述主叫終端的號碼;當(dāng)所述主叫終端的號碼是非法號碼時(shí),攔截所述主叫終端的信令數(shù)據(jù)流和/或向被叫終端發(fā)送警告提醒。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述號碼識別模型為:其中,p為識別概率,p/(1+p)為概率發(fā)生比,b0是常量,n為自然數(shù),bn為非法號碼的特征參數(shù),xn為非法號碼的特征參數(shù)的相關(guān)系數(shù)。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)所述非法號碼的特征參數(shù)識別所述主叫終端的號碼之后,還包括:將識別出的非法號碼的特征參數(shù)添加至所述樣本數(shù)據(jù),生成更新的樣本數(shù)據(jù);利用所述更新的樣本數(shù)據(jù)對所述非法號碼識別模型進(jìn)行訓(xùn)練,獲取更新的非法號碼的特征參數(shù)。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述實(shí)時(shí)捕獲來自主叫終端的呼叫事件,包括:加載呼叫事件規(guī)則;分析所述呼叫事件規(guī)則,得到待捕獲的呼叫事件清單及參數(shù);接收所述被叫終端的信令數(shù)據(jù)流;基于所述待捕獲的呼叫事件清單及參數(shù),在所述信令數(shù)據(jù)流中捕獲所述呼叫事件。5.根據(jù)權(quán)利要求1-4中任一項(xiàng)所述的方法,其特征在于,還包括:判斷所述被叫終端是否具有受非法攻擊特征;當(dāng)所述被叫終端具有受非法攻擊特征時(shí),判斷所述具有受非法攻擊特征的被叫終端的被叫號碼是否符合防非法攻擊的推送規(guī)則;向符合防非法攻擊的推送規(guī)則的被叫終端推送防非法攻擊的業(yè)務(wù)。6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述推送規(guī)則包括:當(dāng)所述被叫終端的相關(guān)數(shù)據(jù)與參考數(shù)據(jù)匹配時(shí),向所述被叫終端推送防非法攻擊的業(yè)務(wù)。7.一種非法信息的處理裝置,其特征在于,包括:模型建立單元,采用...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:黃慶榮,彭家華,謝志崇,鄭志歡,
申請(專利權(quán))人:中國移動通信集團(tuán)福建有限公司,中國移動通信集團(tuán)公司,
類型:發(fā)明
國別省市:福建,35
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。