System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及數據安全,具體地說,涉及一種自適應脫敏方法、系統、設備及介質。
技術介紹
1、現有技術的自適應數據脫敏方法,包括如下步驟:步驟一,數據抽取利用sqoop技術從常用數據庫、時序數據庫、以及文件或ftp接口進行抽取,數據抽取過程保證原始數據的完整性,以及數據之間的邏輯關系完整;步驟二,數據脫敏通過數據脫敏算法庫中的脫敏算法實現對敏感數據的轉換,在脫敏過程中保持數據的關聯性和完整性,確保數據在同一系統中的一致性;步驟三,數據分發數據脫敏后,通過數據庫、文件、ftp接口進行分發。本專利技術以應用需求為導向,以脫敏策略驅動脫敏規則動態生成的方法,使脫敏結果有據可依且具有可重復性。使用成本低,并且便于算法和應用的擴展。
2、該脫敏方法是基于脫敏規則庫,在文件傳輸前,通過正則匹配等方式檢索定位敏感詞的位置,然后根據脫敏規則庫中的對應規則,對敏感字段進行截斷、移位、替換等操作。針對于數字類型數據,現有的截斷,移位等操作,無法應對暴力枚舉攻擊。針對于字符類型數據,現有的替換操作均缺乏抗共謀攻擊的能力,多個攻擊者通過聯合審視其脫敏后的文檔,可以猜解出真實的敏感字段。
技術實現思路
1、本專利技術針對現有的數據脫敏方法無法抵抗共媒攻擊、暴利枚舉攻擊的問題,提出一種自適應脫敏方法、系統、設備及介質,首先獲取發送方用戶的當前待脫敏文件的關鍵詞;然后根據關鍵詞增刪改當前敏感詞庫,得到新的敏感詞庫;最后根據新的敏感詞庫生成正則表達式,并根據正則表達式定位敏感詞位置得到敏感詞,脫敏得到脫
2、本專利技術具體實現內容如下:
3、一種自適應脫敏方法,具體包括以下步驟:
4、步驟s1:獲取發送方用戶的當前待脫敏文件的關鍵詞;
5、步驟s2:根據所述關鍵詞增刪改當前敏感詞庫,得到新的敏感詞庫;
6、步驟s3:根據新的敏感詞庫生成正則表達式,并根據所述正則表達式定位敏感詞位置得到敏感詞,根據所述敏感詞脫敏得到脫敏文件。
7、為了更好地實現本專利技術,進一步地,在所述步驟s1前,所述自適應脫敏方法包括:
8、判斷當前用戶是否為已注冊用戶,若是已注冊用戶,則判斷當前用戶輸入的用戶信息與后臺管理的用戶信息是否匹配,若匹配則輸出登錄成功彈窗,若不匹配則輸出用戶名/密碼錯誤彈窗;若不是已注冊用戶,則輸出注冊界面引導當前用戶注冊。
9、為了更好地實現本專利技術,進一步地,在所述步驟s2具體包括以下步驟:
10、步驟s21:根據所述關鍵詞增刪改當前敏感詞庫,得到新的敏感詞庫;
11、步驟s22:獲取發送方用戶輸入的接收方id,判斷所述接收方id是否屬于后臺管理的用戶id,若是則執行步驟s3,否則輸出當前用戶id無效彈窗。
12、為了更好地實現本專利技術,進一步地,所述步驟s3具體包括以下步驟:
13、步驟s31:以字符流形式讀取當前待脫敏文件,得到字符串;
14、步驟s32:根據所述新的敏感詞庫,生成正則表達式;
15、步驟s33:根據所述字符串和所述正則表達式定位敏感詞位置,并保存至預設文件列表中;
16、步驟s34:并發循環掃描預設文件列表,根據所述敏感詞位置獲取敏感詞;
17、步驟s35:將所述敏感詞轉換為進制串,并將所述進制串轉換為矩陣;
18、步驟s36:根據發送方用戶的類型和接收方角色的類型,確定脫敏算法迭代的輪數;
19、步驟s37:將所述矩陣作為脫敏算法的輸入,根據所述輪數進行迭代處理,得到迭代結果secret;
20、步驟s38:根據所述迭代結果secret替換當前待脫敏文件的敏感詞位置;
21、步驟s39:重復步驟s31-步驟s38,直至當前待脫敏文件的所有敏感詞替換完成,得到與當前待脫敏文件對應的脫敏文件。
22、為了更好地實現本專利技術,進一步地,所述步驟s31的具體操作為:讀取當前待脫敏文件的后綴,若當前待脫敏文件的后綴為txt,則根據bufferreader解析輸入流,若當前待脫敏文件的后綴為doc/docx,則調用poi庫的wordextractor類解析輸入流,然后將解析的輸入流結果以行為單位讀入字符串s,得到字符串s。
23、為了更好地實現本專利技術,進一步地,所述步驟s37具體包括以下步驟:
24、步驟s371:以所述矩陣的行為單位,將每行元素循環左移特定的位數,得到移位后的矩陣;
25、步驟s372:將移位后的矩陣和設定的特征值矩陣進行乘法運算,得到輸出矩陣;
26、步驟s373:將所述輸出矩陣作為作為脫敏算法的輸入,返回步驟s371,直至完成輪數循環,并將最后一輪的輸出矩陣作為迭代結果secret。
27、為了更好地實現本專利技術,進一步地,步驟s372中所述設定的特征值矩陣為每一列相加都為1的矩陣。
28、為了更好地實現本專利技術,進一步地,步驟s33中所述敏感詞位置包括敏感詞起始位置和敏感詞終止位置。
29、基于上述提出的自適應脫敏方法,為了更好地實現本專利技術,進一步地,提出一種自適應脫敏系統,包括獲取單元、增刪改單元、脫敏單元;
30、所述獲取單元,用于獲取發送方用戶的當前待脫敏文件的關鍵詞;
31、所述增刪改查單元,用于根據所述關鍵詞增刪改當前敏感詞庫,得到新的敏感詞庫;
32、所述脫敏單元,用于根據新的敏感詞庫生成正則表達式,并根據所述正則表達式定位敏感詞位置得到敏感詞,根據所述敏感詞脫敏得到脫敏文件。
33、基于上述提出的自適應脫敏方法,為了更好地實現本專利技術,進一步地,提出一種電子設備,包括存儲器和處理器;所述存儲器上存儲有計算機程序;當所述計算機程序在所述處理器上執行時,實現上述的自適應脫敏方法。
34、基于上述提出的自適應脫敏方法,為了更好地實現本專利技術,進一步地,提出一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機指令;當所述計算機指令在上述的電子設備上執行時,實現上述的自適應脫敏方法。
35、本專利技術具有以下有益效果:
36、(1)本專利技術同時適用于多種類型的數據脫敏,并且脫敏前后數據類型保持不變,保障了數據脫敏安全性的同時也確保了脫敏文件的可讀性。
37、(2)本專利技術根據收發用戶角色的不同,自適應的選擇脫敏強度,防止重要信息外泄給不可信人員,解決了現有的脫敏算法無法抵抗共謀攻擊、暴力枚舉攻擊的缺點。
38、(3)本專利技術采用多線程并發處理敏感詞檢索和敏感詞脫敏操作,大大加快了脫敏速度。
本文檔來自技高網...【技術保護點】
1.一種自適應脫敏方法,其特征在于,具體包括以下步驟:
2.根據權利要求1所述的一種自適應脫敏方法,其特征在于,在所述步驟S1前,所述自適應脫敏方法包括:
3.根據權利要求1所述的一種自適應脫敏方法,其特征在于,在所述步驟S2具體包括以下步驟:
4.根據權利要求3所述的一種自適應脫敏方法,其特征在于,所述步驟S3具體包括以下步驟:
5.根據權利要求4所述的一種自適應脫敏方法,其特征在于,所述步驟S31的具體操作為:讀取當前待脫敏文件的后綴,若當前待脫敏文件的后綴為txt,則根據BufferReader解析輸入流,若當前待脫敏文件的后綴為doc或docx,則調用poi庫的WordExtractor類解析輸入流,然后將解析的輸入流結果以行為單位讀入字符串s,得到字符串s。
6.根據權利要求4所述的一種自適應脫敏方法,其特征在于,所述步驟S37具體包括以下步驟:
7.根據權利要求6所述的一種自適應脫敏方法,其特征在于,步驟S372中所述設定的特征值矩陣為每一列相加都為1的矩陣。
8.根據權利要求4所述的
9.一種自適應脫敏系統,其特征在于,包括獲取單元、增刪改單元、脫敏單元;
10.一種電子設備,其特征在于,包括存儲器和處理器;所述存儲器上存儲有計算機程序;當所述計算機程序在所述處理器上執行時,實現如權利要求1-8任一項所述的自適應脫敏方法。
11.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機指令;當所述計算機指令在如權利要求10所述的電子設備上執行時,實現如權利要求1-8任一項所述的自適應脫敏方法。
...【技術特征摘要】
1.一種自適應脫敏方法,其特征在于,具體包括以下步驟:
2.根據權利要求1所述的一種自適應脫敏方法,其特征在于,在所述步驟s1前,所述自適應脫敏方法包括:
3.根據權利要求1所述的一種自適應脫敏方法,其特征在于,在所述步驟s2具體包括以下步驟:
4.根據權利要求3所述的一種自適應脫敏方法,其特征在于,所述步驟s3具體包括以下步驟:
5.根據權利要求4所述的一種自適應脫敏方法,其特征在于,所述步驟s31的具體操作為:讀取當前待脫敏文件的后綴,若當前待脫敏文件的后綴為txt,則根據bufferreader解析輸入流,若當前待脫敏文件的后綴為doc或docx,則調用poi庫的wordextractor類解析輸入流,然后將解析的輸入流結果以行為單位讀入字符串s,得到字符串s。
6.根據權利要求4所述的一種自適應脫敏方法...
【專利技術屬性】
技術研發人員:劉大煒,羅佳麗,劉翔鋒,歐陽森山,趙煒煜,王攀,雷靄荻,劉志波,高信,
申請(專利權)人:成都飛機工業集團有限責任公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。