System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于通信,涉及信息安全技術,具體是一種自動識別手機號的方法及系統。
技術介紹
1、在通信技術迅猛發展的當下,手機號碼已成為人們日常溝通不可或缺的工具。其中手機號碼自動識別技術作為一項關鍵技術,已廣泛應用于多個領域,尤其在現代化客服聊天系統中扮演著至關重要的角色。例如,當客服人員處理用戶咨詢時,經常需要獲取用戶的聯系方式以便后續跟進。自動識別手機號碼技術能夠快速從聊天記錄中提取有效手機號,減少人工輸入和校驗的時間,顯著提升客服工作效率。此外,自動識別手機號碼還能使客服系統自動為用戶生成服務工單,或通過短信、電話等方式主動聯系用戶,提供更加便捷和個性化的服務體驗。
2、然而,現有的自動識別方法通常基于正則表達式庫進行匹配,但這些庫往往只考慮了部分國家和地區的手機號格式,未能全面覆蓋全球信息,導致識別結果不夠廣泛。同時,在處理用戶聊天記錄時,客服系統必須確保數據的安全性和隱私保護。但現有方法常常忽視了對聊天記錄內容的加密處理,存在信息泄露的風險。一旦用戶數據被非法獲取或濫用,將給用戶和企業帶來嚴重的損失。因此,開發一種既高效又安全的手機號碼自動識別方法顯得尤為重要。
技術實現思路
1、本專利技術旨在至少解決現有技術中存在的技術問題之一;為此,本專利技術提出了一種自動識別手機號的方法及系統,用于解決現有客服聊天系統中自動識別方法準確性不夠、數據安全和隱私保護不足的技術問題。
2、為實現上述目的,本專利技術的第一方面提供了一種自動識別手機號的方法及系統,包括
3、s1,根據不同國家或地區的標準手機號格式建立全球標準手機號碼正則表達式庫;其中,所述全球標準手機號碼正則表達式庫分為國內號碼正則表達式庫和國外號碼正則表達式庫;
4、s2,獲取若干聊天記錄文本并進行加密,將加密后的若干聊天記錄文本傳輸至解密端進行解密,根據解密后的若干聊天記錄文本得到若干手機號碼相關字符序列;
5、s3,對若干手機號碼相關字符序列中非數字的字符進行字符過濾,得到若干手機號碼列表;
6、s4,利用所述全球標準手機號碼正則表達式庫對若干手機號碼列表進行匹配,得到若干手機號碼;
7、s5,判斷若干手機號碼是否在號碼數據庫;是,則從號碼數據庫中得到若干手機號碼的歸屬地和運營商信息;否,則通過安全的api接口向運營商發起查詢請求,得到若干手機號碼的歸屬地和運營商信息,并更新至號碼數據庫;其中,所述號碼數據庫部署在本地端或者云端;
8、需要說明的是,若干聊天記錄文本是由聊天系統導出,并轉化成txt文本格式得到的,并且聊天記錄的導出與處理利用,是通過用戶許可的。
9、通過建立全球標準手機號碼正則表達式庫,提高了手機號碼識別的廣泛性和準確性;在處理聊天記錄文本時,首先對其進行了加密保護,確保用戶數據在傳輸和解密過程中的安全性,有效維護用戶隱私;利用字符串搜索算法和字符過濾技術,從解密后的聊天記錄中快速提取出手機號碼;通過匹配全球標準手機號碼正則表達式庫,能夠迅速識別出手機號碼,并在必要時通過安全的api接口向運營商發起查詢請求,以獲取并更新手機號碼的歸屬地和運營商信息。
10、進一步地,所述獲取若干聊天記錄文本并進行加密,包括:
11、a1,根據預設周期設置數字編碼序列,并記錄所述數字編碼序列中的每一個數字標識符的位置,得到若干數字標識符和一一對應的若干編碼位置;其中,所述數字編碼序列包含若干唯一數字標識符,且相鄰數字標識符間互不連續;
12、a2,獲取并遍歷若干聊天記錄文本,將當前聊天記錄文本中的字符按照預設字符長度分割成若干文本片段,并記錄所述若干文本片段在當前聊天記錄文本中的位置,得到一一對應的若干文本片段和若干片段位置;
13、a3,將若干編碼位置與若干片段位置進行一一對應,將編碼位置對應的數字標識符賦給片段位置對應的文本片段,得到帶有數字標識符的若干文本片段;
14、a4,將帶有數字標識符的若干文本片段進行隨機打亂,得到亂序的若干文本片段,完成當前聊天記錄文本的加密;
15、a5,將下一聊天記錄文本標記為當前聊天記錄文本,重復a2至a5,直到遍歷完若干聊天記錄文本,得到加密后的若干聊天記錄文本。
16、進一步地,所述將加密后的若干聊天記錄文本傳輸至解密端進行解密,包括:
17、b1,遍歷加密后的若干聊天記錄文本,提取當前聊天記錄文本中的若干文本片段和對應的若干數字標識符;
18、b2,將若干數字標識符根據所述數字編碼序列中的順序進行排序,將若干文本片段按照若干數字標識符的順序進行重新組合,得到解密后的當前聊天記錄文本;
19、b3,將下一聊天記錄文本標記為當前聊天記錄文本,重復b1至b3,直到遍歷完加密后的若干聊天記錄文本,得到解密后的若干聊天記錄文本。
20、通過預設周期定期設置唯一且不連續的數字編碼序列,對聊天記錄文本中的字符進行分割并編碼,并通過打亂分割片段的順序,確保了加密數據的高安全性,增加了破解難度,在預設周期到達之后再次進行上述步驟,進一步提高數據的安全性。
21、進一步地,所述根據解密后的若干聊天記錄文本得到若干手機號碼相關字符序列,包括:
22、s2-1,將聯系提示詞及各自對應的英文詞匯標記為手機號碼相關詞匯;其中所述聯系提示詞包括“手機號”“電話號”“號碼”“聯系方式”;
23、s2-2,從解密后的若干聊天記錄文本中得到當前聊天文本數據,利用字符串搜索算法判斷當前聊天文本數據中是否存在所述手機號碼相關詞匯;是,則獲取所述手機號碼相關詞匯在當前聊天記錄文本中的起始索引和結束索引,并跳轉至s2-3;否,則刪除當前聊天記錄文本,并將下一個聊天記錄文本標記為當前聊天記錄文本,重復s2-2;
24、s2-3,獲取所述起始索引前若干個字符和所述結束索引后若干個字符,得到當前聊天記錄文本的手機號碼相關字符序列,并將當前聊天記錄文本的非手機號碼相關字符序列剔除;
25、s2-4,將下一個聊天記錄文本標記為當前聊天記錄文本,并重復s2-2至s2-3,直到遍歷完若干聊天記錄文本,得到若干手機號碼相關字符序列。
26、進一步地,所述對若干手機號碼相關字符序列中非數字的字符進行字符過濾,包括:
27、s3-1,遍歷若干手機號碼相關字符序列中的若干字符,獲取當前手機號碼相關字符序列中的若干連續數字片段;
28、s3-2,判斷所述若干連續數字片段的字符長度是否處于手機號碼長度閾值范圍內;是,則保留若干連續數字片段,得到當前手機號碼的號碼列表;否,則所述若干連續數字片段進行忽略處理;其中,忽略處理為將連續數字片段從當前手機號碼相關字符序列中剔除;
29、s3-3,將下一手機號碼相關字符序列標記為當前手機號碼相關字符序列,重復s3-1至s3-3,直到遍歷完若干手機號碼相關字符序列,得到若干手機號碼列表。
30、進本文檔來自技高網...
【技術保護點】
1.一種自動識別手機號的方法,其特征在于,包括:
2.根據權利要求1所述的一種自動識別手機號的方法,其特征在于,所述獲取若干聊天記錄文本并進行加密,包括:
3.根據權利要求1所述的一種自動識別手機號的方法,其特征在于,所述將加密后的若干聊天記錄文本傳輸至解密端進行解密,包括:
4.根據權利要求1所述的一種自動識別手機號的方法,其特征在于,所述根據解密后的若干聊天記錄文本得到若干手機號碼相關字符序列,包括:
5.根據權利要求1所述的一種自動識別手機號的方法,其特征在于,所述對若干手機號碼相關字符序列中非數字的字符進行字符過濾,包括:
6.根據權利要求5所述的一種自動識別手機號的方法,其特征在于,所述獲取當前手機號碼相關字符序列中的若干連續數字片段,包括:
7.根據權利要求1所述的一種自動識別手機號的方法,其特征在于,利用所述全球標準手機號碼正則表達式庫對若干手機號碼列表進行匹配,包括:
8.根據權利要求7所述的一種自動識別手機號的方法,其特征在于,所述利用決策樹分類模型和所述全球標準手機號碼正則表達
9.一種自動識別手機號的系統,其特征在于,包括:
...【技術特征摘要】
1.一種自動識別手機號的方法,其特征在于,包括:
2.根據權利要求1所述的一種自動識別手機號的方法,其特征在于,所述獲取若干聊天記錄文本并進行加密,包括:
3.根據權利要求1所述的一種自動識別手機號的方法,其特征在于,所述將加密后的若干聊天記錄文本傳輸至解密端進行解密,包括:
4.根據權利要求1所述的一種自動識別手機號的方法,其特征在于,所述根據解密后的若干聊天記錄文本得到若干手機號碼相關字符序列,包括:
5.根據權利要求1所述的一種自動識別手機號的方法,其特征在于,所述對若干手機號碼相關字符...
【專利技術屬性】
技術研發人員:劉傳勇,桂勇,王友振,
申請(專利權)人:八度云計算安徽有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。