• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    數據處理方法、裝置、設備及存儲介質制造方法及圖紙

    技術編號:36928485 閱讀:18 留言:0更新日期:2023-03-22 18:51
    本申請公開了一種數據處理方法、裝置、設備及存儲介質。該方法包括獲取包括N種類型的資源的待識別資源和待識別資源的資源信息;將待識別資源和資源信息輸入敏感數據識別模型,通過敏感數據識別模型對待識別資源進行特征抽取,得到N種類型的資源的隱藏特征;根據N種類型的資源的隱藏特征中任意兩種類型的資源的隱藏特征,計算任意兩種類型中每種類型的資源的注意力隱藏特征;基于N種類型的資源的注意力隱藏特征,從敏感數據識別模型中輸出待識別資源的識別結果。如此,既可以識別到資源中的文本敏感數據,也可以識別到非文本敏感數據,在提高識別資源類型的同時,還可以提高敏感數據的識別效率。感數據的識別效率。感數據的識別效率。

    【技術實現步驟摘要】
    數據處理方法、裝置、設備及存儲介質


    [0001]本申請屬于計算機
    ,具體涉及一種數據處理方法、裝置、電子設備及存儲介質。

    技術介紹

    [0002]隨著信息技術的飛速發展,人們在生產、生活中產生的各類數據呈指數級增長,如何在海量數據中識別敏感數據,以對其進行保護成為亟需關注的問題。
    [0003]在相關技術中,雖然可以通過文本識別的方式識別海量數據中的文本敏感數據,但是,該方式無法識別海量數據中非文本如圖像、音頻等敏感數據,如此,識別敏感數據的方式較為單一,無法識別多種類型的敏感數據。

    技術實現思路

    [0004]本申請實施例提供一種數據處理方法、裝置、設備及存儲介質,能夠解決現有技術中識別敏感數據的方式較為單一,導致無法識別多種類型的敏感數據的問題。
    [0005]第一方面,本申請實施例提供一種數據處理方法,該方法可以包括:
    [0006]獲取待識別資源和待識別資源的資源信息,待識別資源包括N種類型的資源,資源信息包括N種類型的資源中每種類型的資源的類型標識和位置向量,N為大于1的整數;
    [0007]將待識別資源和資源信息輸入敏感數據識別模型,通過敏感數據識別模型對待識別資源進行特征抽取,得到N種類型的資源的隱藏特征;
    [0008]根據N種類型的資源的隱藏特征中任意兩種類型的資源的隱藏特征,計算任意兩種類型中每種類型的資源的注意力隱藏特征,注意力隱藏特征用于表征任意兩種類型的資源中的一種類型的資源的隱藏特征對另一種類型的資源的隱藏特征的注意力分布;
    [0009]基于N種類型的資源的注意力隱藏特征,從敏感數據識別模型中輸出待識別資源的識別結果。
    [0010]第二方面,本申請實施例提供了一種數據處理裝置,該裝置可以包括:
    [0011]獲取模塊,用于獲取待識別資源和待識別資源的資源信息,待識別資源包括N種類型的資源,資源信息包括N種類型的資源中每種類型的資源的類型標識和位置向量,N為大于1的整數;
    [0012]處理模塊,用于將待識別資源和資源信息輸入敏感數據識別模型,通過敏感數據識別模型對待識別資源進行特征抽取,得到N種類型的資源的隱藏特征;
    [0013]計算模塊,用于根據N種類型的資源的隱藏特征中任意兩種類型的資源的隱藏特征,計算任意兩種類型中每種類型的資源的注意力隱藏特征,注意力隱藏特征用于表征任意兩種類型的資源中的一種類型的資源的隱藏特征對另一種類型的資源的隱藏特征的注意力分布;
    [0014]輸出模塊,用于基于N種類型的資源的注意力隱藏特征,從敏感數據識別模型中輸出待識別資源的識別結果。
    [0015]第三方面,本申請實施例提供了一種計算設備,該計算設備包括:處理器以及存儲有計算機程序指令的存儲器;
    [0016]處理器執行計算機程序指令時實現如第一方面所示的數據處理方法。
    [0017]第四方面,本申請實施例提供了一種計算機存儲介質,計算機存儲介質上存儲有計算機程序指令,計算機程序指令被處理器執行時實現如第一方面所示的數據處理方法。
    [0018]第五方面,本申請實施例提供了一種芯片,芯片包括處理器和通信接口,通信接口和處理器耦合,處理器用于運行程序或指令,實現如第一方面所示的數據處理方法。
    [0019]第六方面,本申請實施例提供一種計算機程序產品,該程序產品被存儲在存儲介質中,該程序產品被至少一個處理器執行以實現如第一方面所示的數據處理方法。
    [0020]本申請實施例的數據處理方法、裝置、設備及存儲介質,獲取包括N種類型的資源的待識別資源和待識別資源的資源信息,資源信息包括N種類型的資源中每種類型的資源的類型標識和位置向量,N為大于1的整數;接著,將待識別資源和資源信息輸入敏感數據識別模型,通過敏感數據識別模型對待識別資源進行特征抽取,得到N種類型的資源的隱藏特征,然后,根據N種類型的資源的隱藏特征中任意兩種類型的資源的隱藏特征,計算任意兩種類型中每種類型的資源的注意力隱藏特征,注意力隱藏特征用于表征任意兩種類型的資源中的一種類型的資源的隱藏特征對另一種類型的資源的隱藏特征的注意力分布,并基于N種類型的資源的注意力隱藏特征,從敏感數據識別模型中輸出待識別資源的識別結果。如此,通過上述方式既可以識別到資源中的文本敏感數據,也可以識別到資源中的非文本敏感數據如圖像、音頻等,無需針對具有多種類型的資源采用不同的識別方式分別識別,在提高敏感數據的識別效率的同時,避免了分別識別沒有關聯多種類型的資源之間的關聯關系,導致識別準確度低的問題,另外,還可以通過上述方式確定待識別資源中敏感數據的敏感級別,方便用戶基于敏感級別對待識別的資源進行處理。
    附圖說明
    [0021]為了更清楚地說明本申請實施例的技術方案,下面將對本申請實施例中所需要使用的附圖作簡單的介紹,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
    [0022]圖1為本申請實施例提供的一種數據處理方法的流程圖;
    [0023]圖2為本申請實施例提供的一種數據處理方法的訓練初始敏感數據識別模型的結構示意圖之一;
    [0024]圖3為本申請實施例提供的一種數據處理方法的訓練初始敏感數據識別模型的結構示意圖之二;
    [0025]圖4為本申請實施例提供的一種數據處理方法的訓練初始敏感數據識別模型的結構示意圖之三;
    [0026]圖5為本申請實施例提供的一種數據處理方法的訓練初始敏感數據識別模型的結構示意圖之四;
    [0027]圖6是本申請一個實施例提供的數據處理裝置的結構示意圖;
    [0028]圖7是本申請一個實施例提供的數據處理設備的結構示意圖。
    具體實施方式
    [0029]下面將詳細描述本申請的各個方面的特征和示例性實施例,為了使本申請的目的、技術方案及優點更加清楚明白,以下結合附圖及具體實施例,對本申請進行進一步詳細描述。應理解,此處所描述的具體實施例僅意在解釋本申請,而不是限定本申請。對于本領域技術人員來說,本申請可以在不需要這些具體細節中的一些細節的情況下實施。下面對實施例的描述僅僅是為了通過示出本申請的示例來提供對本申請更好的理解。
    [0030]需要說明的是,在本文中,諸如第一和第二等之類的關系術語僅僅用來將一個實體或者操作與另一個實體或操作區分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關系或者順序。而且,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設備所固有的要素。在沒有更多限制的情況下,由語句“包括
    ……”
    限定的要素,并不排除在包括要素的過程、方法、物品或者設備中還存在另外的相同要素。
    [0031]近些年,有很多用戶或商戶的敏感數據(如用戶個人信息、商戶涉密資料)被泄漏而損失慘重,因此,數據安全越來越重要。要保護數據安全,首先要了解哪本文檔來自技高網
    ...

    【技術保護點】

    【技術特征摘要】
    1.一種數據處理方法,其特征在于,包括:獲取待識別資源和所述待識別資源的資源信息,所述待識別資源包括N種類型的資源,所述資源信息包括所述N種類型的資源中每種類型的資源的類型標識和位置向量,N為大于1的整數;將所述待識別資源和所述資源信息輸入敏感數據識別模型,通過所述敏感數據識別模型對所述待識別資源進行特征抽取,得到所述N種類型的資源的隱藏特征;根據所述N種類型的資源的隱藏特征中任意兩種類型的資源的隱藏特征,計算所述任意兩種類型中每種類型的資源的注意力隱藏特征,所述注意力隱藏特征用于表征所述任意兩種類型的資源中的一種類型的資源的隱藏特征對另一種類型的資源的隱藏特征的注意力分布;基于所述N種類型的資源的注意力隱藏特征,從所述敏感數據識別模型中輸出所述待識別資源的識別結果。2.根據權利要求1所述的方法,其特征在于,所述將所述待識別資源和所述資源信息輸入敏感數據識別模型,通過所述敏感數據識別模型對所述待識別資源進行特征抽取,得到所述N種類型的資源的隱藏特征,包括:通過所述敏感數據識別模型,根據預設類型標識和預設映射算法的關聯信息,獲取所述資源信息中N種類型標識的每種類型標識對應的映射算法;通過所述每種類型標識對應的映射算法,對所述N種類型的資源中與所述每種類型標識對應的資源和位置向量進行映射,得到N個映射向量,所述N個映射向量的向量格式與所述敏感數據識別模型中編碼器的輸入格式對應:通過所述編碼器對所述N個映射向量中每個映射向量進行特征提取,得到所述N種類型的資源的隱藏特征。3.根據權利要求2所述的方法,其特征在于,所述N種類型標識包括第一種類型標識和第二種類型標識,所述第一種類型標識對應第一映射算法,所述第二種類型標識對應第二映射算法,所述N個映射向量包括多維向量和二維矩陣;所述通過所述每種類型標識對應的映射算法,對所述N種類型的資源中與所述每種類型標識對應的資源和位置向量進行映射,得到N個映射向量,包括:通過所述第一映射算法,將所述N種類型的資源中與第一種類型標識對應的資源和位置向量映射到預設空間,得到所述多維向量;以及,通過所述第二映射算法將所述第二種類型標識對應的資源映射到一維向量,并將所述第二種類型標識對應的資源的位置向量轉換為二維矩陣。4.根據權利要求1所述的方法,其特征在于,所述根據所述N種類型的資源的隱藏特征中任意兩種類型的資源的隱藏特征,計算所述任意兩種類型中每種類型的資源的注意力隱藏特征,包括:根據所述N種類型的資源的隱藏特征,生成所述N種類型的資源的隱藏特征中每種類型的資源的隱藏特征的第一向量集合,所述第一向量集合包括查詢向量、關鍵向量和內容向量;將所述任意兩種類型的資源的隱藏特征的向量集合中的查詢向量進行交叉互換,得到所述任意兩種類型中每種類型的資源的隱藏特征的第二向量集合,所述第二向量集合包括
    所述任意兩種類型中第一種類型的關鍵向量、內容向量和第二種類型的資源對應的查詢向量;通過多頭注意計算算法,對所述任意兩種類型中每種類型的資源的隱藏特征的第二向量集合進行處理,得到第一處理結果;對所述第一處理結果依次進行殘差連接和歸一化處理,得到第二處理結果;通過所述敏感數據識別模型中前饋神經網絡,對所述第二處理結果再進行殘差連接和歸一化處理,得到所述每種類型的資源的注意力隱藏特征。5.根據權利要求1所述的方法,其特征在于,所述識別結果包括所述每種類型的資源的敏感等級;所述基于所述N種類型的資源的注意力隱藏特征,從所述敏感數據識別模型中輸出所述待識別資源的識別結果,包括:合并所述N種類型的資源的注意力隱藏特征,得到注意力隱藏特征集合;對所述注意力隱藏特征集合依次進行池化和全連接處理,得到所述每種類型的資源中的敏感數據的敏感等級。6.根據權利要求1所述的方法,其特征在于,所述計算所述任意兩種類型中每種類型的資源的注意力隱藏特征之后,所述方法還包括:在所述每種類型的資源包括異常資源的情況下,通過所述敏感數據識別模型中的多層感知器,對所述每種類型的資源的注意力隱藏特征進行重構,得到與所述異常資源對應的重構特征的概率值;根據所述重構特征的概率值,確定所述異常資源的敏感等級;其中,所述異常資源包括下述中的至少一種:被刪除的資源、被修改的...

    【專利技術屬性】
    技術研發人員:丁鵬勇,劉斌,蘇慧蘭,劉旸旭,馬珺浩呂正林,鄭瑞剛,周莉,劉瑋,張歆孫敏,梁恩磊李莉,汪帆
    申請(專利權)人:中國移動通信集團有限公司,
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲一区爱区精品无码| 久久精品成人无码观看56| 国产午夜激无码av毛片| 东京热av人妻无码专区| 2019亚洲午夜无码天堂| 日韩AV高清无码| 亚洲av成本人无码网站| 潮喷大喷水系列无码久久精品| 手机永久无码国产AV毛片| 潮喷失禁大喷水aⅴ无码| 精品无码久久久久久国产| 无码毛片视频一区二区本码| 免费无码又爽又刺激网站直播| 中日韩精品无码一区二区三区| 国产AV无码专区亚洲AWWW| 亚洲AV无码一区二区三区鸳鸯影院| 亚洲中文字幕无码爆乳AV| 日韩精品无码Av一区二区| 亚洲AV成人片无码网站| 亚洲爆乳少妇无码激情| 久久综合精品国产二区无码| 亚洲精品无码久久久影院相关影片| 一区二区三区无码高清| 国产免费AV片无码永久免费 | 亚洲国产精品无码中文lv| 色情无码WWW视频无码区小黄鸭| 日韩人妻无码一区二区三区久久99| 国产莉萝无码AV在线播放 | 好了av第四综合无码久久| 亚洲av无码一区二区三区观看| 无码人妻AⅤ一区二区三区| 东京无码熟妇人妻AV在线网址| 精品久久久久久无码中文字幕 | 无码AV动漫精品一区二区免费| 精品久久久久久无码中文字幕一区 | 无码av人妻一区二区三区四区 | 国产aⅴ激情无码久久| 亚洲人成人无码网www电影首页| 一区二区三区人妻无码| 熟妇无码乱子成人精品| 无码人妻精品一区二区蜜桃网站|