System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及通信服務與云通信,尤其涉及一種基于機器學習大模型與asr的隱私號反詐系統和方法。
技術介紹
1、隨著平臺型客戶對用戶隱私信息的越發重視,隱私號碼運營平臺業務量突破到每日千萬級的維度。面對千萬級的數據,對業務風險把控,異常通話發掘和通話鏈路追蹤都提出了巨大的挑戰。詐騙分子利用可乘之機,在隱私號碼平臺對用戶實施詐騙,通話話術隱蔽,讓業務運營人員難以甄別。現有技術手段,缺乏對異常話單做有效分組,對異常通話鏈路追蹤處于空缺狀態。
2、現有反詐手段,主要通過事后下發詐騙工單,人工回溯可疑通話,然后再對相應通話中主被叫號碼進行拉黑和客戶賬號凍結管控。現有方法效率低下且滯后,無法及時有效攔截詐騙通話,存在巨大安全隱患漏洞。
技術實現思路
1、本專利技術旨在至少解決上述所提及的技術問題之一,提供一種基于機器學習大模型與asr的隱私號反詐系統和方法,能夠主動挖掘涉詐通話行為特征,全自動攔截高危涉詐號碼,有效遏制詐騙分子利用隱私號平臺實施詐騙的行為。
2、為了實現上述目的,本專利技術采用的技術方案為:一種基于機器學習大模型與asr的隱私號反詐系統,包括:
3、數據統計預處理模塊,負責對數據庫基礎的話單數據做提煉,完成整個數據的抽取、轉換以及加載過程,以實現對數據的預處理;
4、機器學習模塊:負責將預處理好的數據做聚類分析,根據關鍵指標數據進行通話組的預測分類,將通話分為正常通話組和異常通話組;
5、語音自動識別模塊,將機器學習模
6、自動巡檢模塊,具有創建定時任務功能,并能夠將機器學習模塊中分類是涉詐通話組的通話錄音拉取到語音自動識別模塊中,后將識別出的文本內容調度到關鍵詞識別和大模型判斷任務中,使關鍵詞識別和大模型判斷兩個模型可以定期執行任務,對文本內容進行學習;
7、通話內容識別和判斷模塊,具有關鍵詞識別功能和大模型判斷功能,關鍵詞識別功能能夠識別異常通話組對話文本內容,判斷對話是否存在高危涉詐相關內容,大模型判斷功能能夠對語音自動識別模塊輸出的文本結果做語義理解,判斷是否符合涉詐通話的特征;
8、業務告警模塊,通過流程引擎將聚合后的機器學習數據與內容識別結果,評估風險等級與分類,之后將告警內容推送到業務管控模塊;
9、業務管控模塊,根據業務告警模塊的告警級別和告警分類,做不同的管控策略響應,同時對客戶畫像體系做補充維護。
10、優選的,所述關鍵指標數據包括通話時長、接通率、短通話占比,將通話時長小于10s、接通率小于40%、短通話占比超過50%的為異常通話組。
11、優選的,所述風險等級分為一級風險、二級風險、三級風險,一級風險為違禁違規、二級風險為涉嫌詐騙、三級風險為高危業務、四級風險為惡意騷擾。
12、優選的,所述管控策略包括:當運營收到各級別告警后,按照風險等級安排業務人工復核優先級,即優先復核一級風險和二級風險業務,如復核結果無誤,一級風險和二級風險客戶直接凍結業務并下線,三級風險和四級風險如復核結果無誤則與所負責銷售溝通酌情下線。
13、本申請還公開了一種基于機器學習大模型與asr的隱私號反詐方法,采用上述的反詐系統,包括以下步驟:
14、(1)通過數據統計預處理模塊將基礎話單信息做數據抽取、轉換和加載,輸出關鍵性的通話特征指標數據給機器學習模塊;
15、(2)通過機器學習模塊對數據預處理模塊輸出的通話特征指標數據做聚類分析,將通話組分為正常通話組和異常通話組;
16、(3)通過語音自動識別模塊將機器學習輸出的異常通話組通話錄音文件識別成文本內容;
17、(4)通過通話內容識別和判斷模塊的關鍵詞識別功能對文本內容進行關鍵詞識別,若文本內容命中關鍵詞,則抽取命中的關鍵詞,若文本內容未命中關鍵詞,則通過人工復核分類是否正確,若分類不正確,則進行模型調優,若分類正確,則標注新關鍵詞;以及通過通話內容識別和判斷模塊的大模型判斷功能判斷文本內容是否符合異常通話,若文本內容符合異常通話,則輸出判斷結果,若文本內容不符合異常通話,則通過人工復核判斷是否正確,若判斷錯誤,則進行模型調優,然后聚合文本學習結果和機器學習結果。
18、(5)通過業務告警模塊對機器學習和內容識別后的聚合結果做告警等級判斷,輸出告警等級和類別,業務管控模塊根據告警等級和類別做出相應的策略管控,同時對客戶畫像體系做補充維護。
19、優選的,所述模型調優方法為人工復核不準確的通話案例,判斷通話案例具體通話場景是否與實際報備場景一致,如一致則人工篩選該場景下關鍵詞,將新的關鍵詞維護到對應場景關鍵詞庫,如不一致則將關鍵詞維護到報備與實際不符關鍵詞庫。
20、有益效果是:與現有技術相比,本專利技術的一種基于機器學習大模型與asr的隱私號反詐系統和方法基于指標數據的機器學習和大模型對自動語音識別技術的支撐,雙管齊下,對異常通話組的篩選效率高,對異常通話內容的識別和判斷更準確,通過對千萬級話單的預處理,機器學習模塊根據通話組的呼叫特征進行分類,快速篩選出疑似涉詐的通話組,關鍵詞識別和大模型判斷對篩選出的這些疑似涉詐通話組通話內容做二次校驗判斷,這樣能更精準的識別出涉詐通話號碼加快對異常通組的管控響應速度,從而遏制詐騙案件發生。
本文檔來自技高網...【技術保護點】
1.一種基于機器學習大模型與ASR的隱私號反詐系統,其特征在于,包括:
2.根據權利要求1所述的一種基于機器學習大模型與ASR的隱私號反詐系統,其特征在于,所述關鍵指標數據包括通話時長、接通率、短通話占比,將通話時長小于10s、接通率小于40%、短通話占比超過50%的為異常通話組。
3.根據權利要求1所述的一種基于機器學習大模型與ASR的隱私號反詐系統,其特征在于,所述風險等級分為一級風險、二級風險、三級風險,一級風險為違禁違規、二級風險為涉嫌詐騙、三級風險為高危業務、四級風險為惡意騷擾。
4.根據權利要求1所述的一種基于機器學習大模型與ASR的隱私號反詐系統,其特征在于,所述管控策略包括:當運營收到各級別告警后,按照風險等級安排業務人工復核優先級,即優先復核一級風險和二級風險業務,如復核結果無誤,一級風險和二級風險客戶直接凍結業務并下線,三級風險和四級風險如復核結果無誤則與所負責銷售溝通酌情下線。
5.一種基于機器學習大模型與ASR的隱私號反詐方法,其特征在于,采用權利要求1至4任一所述的反詐系統,包括以下步驟:
6.
...【技術特征摘要】
1.一種基于機器學習大模型與asr的隱私號反詐系統,其特征在于,包括:
2.根據權利要求1所述的一種基于機器學習大模型與asr的隱私號反詐系統,其特征在于,所述關鍵指標數據包括通話時長、接通率、短通話占比,將通話時長小于10s、接通率小于40%、短通話占比超過50%的為異常通話組。
3.根據權利要求1所述的一種基于機器學習大模型與asr的隱私號反詐系統,其特征在于,所述風險等級分為一級風險、二級風險、三級風險,一級風險為違禁違規、二級風險為涉嫌詐騙、三級風險為高危業務、四級風險為惡意騷擾。
4.根據權利要求1所述的一種基于機器學習大模型與asr的隱私號反詐系統,其特征在于,所述管控策略包括:當運營收...
【專利技術屬性】
技術研發人員:勞珍珍,呂周童,覃炳深,黃嘉才,羅曉,周美鳳,江冰,黃蘊鈺,
申請(專利權)人:廣西東信易通科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。