System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及人工智能,尤其涉及一種基于人工智能的投訴數據識別方法、裝置、設備及介質。
技術介紹
1、隨著互聯網和移動技術的發展,代理投訴現象逐漸成為各行業,尤其是金融行業中的一個突出問題。代理投訴團伙通過有償方式為金融業客戶向金融公司和監管機構發起投訴,借此進行威脅、敲詐等不法行為,嚴重擾亂了正常的市場秩序。而這些投訴往往以非直接關系人身份進行,造成了識別和取證上的巨大困難,導致金融公司面臨大量無效投訴,從而消耗了大量的客服資源,影響了正常的客戶服務和公司聲譽。
2、傳統的應對方式,如通過聲紋識別技術來識別投訴數據中的投訴工單是否為非真實代理投訴工單(例如,同一人為多個人代理投訴的情況),但由于聲紋識別技術受限于多種因素的影響,如噪音干擾、語音質量變化、說話人情緒狀態等,導致識別準確率較低。
技術實現思路
1、本專利技術實施例提供一種基于人工智能的投訴數據識別方法、裝置、設備及介質,以解決現有技術對非真實代理投訴工單的識別準確率較低的問題。
2、第一方面,提供了一種基于人工智能的投訴數據識別方法,包括:
3、獲取投訴數據,將所述投訴數據中的投訴工單分別標定為正樣本或灰色樣本,其中,所述正樣本表征非真實代理投訴工單,所述灰色樣本表征待確認的代理投訴工單;
4、將所述灰色樣本劃分為n份子樣本集,選取其中一份子樣本集作為負樣本,其余n-1份子樣本集中的灰色樣本作為待預測樣本;
5、將所述負樣本與所述正樣本輸入至預測模型進行訓練
6、基于所述訓練好的預測模型,對所述待預測樣本進行預測,獲得每個所述待預測樣本的預測概率;重復進行n輪,其中,在每一輪訓練和預測中,選取一個不同的子樣本集作為負樣本,其余n-1份子樣本集中的灰色樣本作為當前輪的待預測樣本,直至所有灰色樣本均作為待預測樣本參與n-1次預測,獲得每個所述灰色樣本的n-1個預測概率;
7、計算每個所述灰色樣本的平均預測概率;
8、將所述平均預測概率超過預設風險閾值的所述灰色樣本,判定為非真實代理投訴工單。
9、第二方面,提供了一種基于人工智能的投訴數據識別裝置,包括:
10、獲取模塊,用于獲取投訴數據,將所述投訴數據中的投訴工單分別標定為正樣本或灰色樣本,其中,所述正樣本表征非真實代理投訴工單,所述灰色樣本表征待確認的代理投訴工單;
11、劃分模塊,用于將所述灰色樣本劃分為n份子樣本集,選取其中一份子樣本集作為負樣本,其余n-1份子樣本集中的灰色樣本作為待預測樣本;
12、訓練模塊,用于將所述負樣本與所述正樣本輸入至預測模型進行訓練,得到訓練好的預測模型;
13、預測模塊,用于基于所述訓練好的預測模型,對所述待預測樣本進行預測,獲得每個所述待預測樣本的預測概率;重復進行n輪,其中,在每一輪訓練和預測中,選取一個不同的子樣本集作為負樣本,其余n-1份子樣本集中的灰色樣本作為當前輪的待預測樣本,直至所有灰色樣本均作為待預測樣本參與n-1次預測,獲得每個所述灰色樣本的n-1個預測概率;
14、計算模塊,用于計算每個所述灰色樣本的平均預測概率;
15、第一判定模塊,用于將所述平均預測概率超過預設風險閾值的所述灰色樣本,判定為非真實代理投訴工單。
16、第三方面,提供了一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現上述第一方面所述基于人工智能的投訴數據識別方法。
17、第四方面,提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現上述第一方面所述基于人工智能的投訴數據識別方法。
18、上述基于人工智能的投訴數據識別方法、裝置、設備及介質所實現的一個方案中,通過獲取投訴數據,將投訴數據中的投訴工單標定分別為正樣本或灰色樣本,其中,正樣本表征非真實代理投訴工單,灰色樣本表征待確認的代理投訴工單;將灰色樣本劃分為n份子樣本集,選取其中一份子樣本集作為負樣本,其余n-1份子樣本集中的灰色樣本作為待預測樣本;將負樣本與正樣本輸入至預測模型進行訓練,得到訓練好的預測模型;基于訓練好的預測模型,對待預測樣本進行預測,獲得每個待預測樣本的預測概率;重復進行n輪,其中,在每一輪訓練和預測中,選取一個不同的子樣本集作為負樣本,其余n-1份子樣本集中的灰色樣本作為當前輪的待預測樣本,直至所有灰色樣本均作為待預測樣本參與n-1次預測,獲得每個灰色樣本的n-1個預測概率;計算每個灰色樣本的平均預測概率;將平均預測概率超過預設風險閾值的灰色樣本,判定為非真實代理投訴工單。本專利技術中,通過對投訴數據中的多個投訴工單進行標定,區分出正樣本(非真實代理投訴工單)與灰色樣本(待確認的代理投訴工單),接著,采用多輪推舉的方式,得到每個灰色樣本的n-1個預測概率,進而通過計算每個灰色樣本的平均預測概率,并與預設風險閾值進行比較,可以有效地識別出非真實代理投訴工單,不僅提高了識別準確率,還降低了誤判的風險。
本文檔來自技高網...【技術保護點】
1.一種基于人工智能的投訴數據識別方法,其特征在于,包括:
2.如權利要求1所述的基于人工智能的投訴數據識別方法,其特征在于,所述將所述投訴數據中的投訴工單分別標定為正樣本或灰色樣本,包括:
3.如權利要求2所述的基于人工智能的投訴數據識別方法,其特征在于,所述根據所述投訴數量與預設數據,將所述投訴工單標定為正樣本或負樣本,包括:
4.如權利要求1所述的基于人工智能的投訴數據識別方法,其特征在于,所述將所述負樣本與所述正樣本輸入至預測模型進行訓練,得到訓練好的預測模型,包括:
5.如權利要求4所述的基于人工智能的投訴數據識別方法,其特征在于,所述第一特征信息包括客戶基本情況、投訴點、投訴理由、威脅性言論以及投訴要求。
6.如權利要求1所述的基于人工智能的投訴數據識別方法,其特征在于,所述基于所述訓練好的預測模型,對其余N-1份待預測樣本中的灰色樣本進行預測,獲得每個所述灰色樣本對應的預測概率,包括:
7.如權利要求1所述的基于人工智能的投訴數據識別方法,其特征在于,所述方法還包括:
8.一種基于人
9.一種計算機設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現如權利要求1至7任一項所述基于人工智能的投訴數據識別方法。
10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至7任一項所述基于人工智能的投訴數據識別方法。
...【技術特征摘要】
1.一種基于人工智能的投訴數據識別方法,其特征在于,包括:
2.如權利要求1所述的基于人工智能的投訴數據識別方法,其特征在于,所述將所述投訴數據中的投訴工單分別標定為正樣本或灰色樣本,包括:
3.如權利要求2所述的基于人工智能的投訴數據識別方法,其特征在于,所述根據所述投訴數量與預設數據,將所述投訴工單標定為正樣本或負樣本,包括:
4.如權利要求1所述的基于人工智能的投訴數據識別方法,其特征在于,所述將所述負樣本與所述正樣本輸入至預測模型進行訓練,得到訓練好的預測模型,包括:
5.如權利要求4所述的基于人工智能的投訴數據識別方法,其特征在于,所述第一特征信息包括客戶基本情況、投訴點、投訴理由、威脅性言論以及投訴要求。
6.如權利要求1所述的基于人工智能...
【專利技術屬性】
技術研發人員:周高峰,
申請(專利權)人:平安銀行股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。