System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實現(xiàn)步驟摘要】
本專利技術(shù)涉及信息,具體地說,涉及一種隱私數(shù)據(jù)泄露風(fēng)險控制方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品。
技術(shù)介紹
1、近年來,隨著移動通信結(jié)束、物聯(lián)網(wǎng)技術(shù)與地理信息系統(tǒng)的發(fā)展,基于位置的服務(wù)的應(yīng)用越來越多。通俗來講,基于位置的服務(wù)(location?based?service,lbs)就是用戶通過一組定位技術(shù)獲得移動終端的位置信息(例如經(jīng)緯度坐標),利用移動通信網(wǎng)絡(luò)進行位置相關(guān)的服務(wù)請求,得到位置服務(wù)廠商提供給移動用戶本人或他人以及通信系統(tǒng)的各種與位置相關(guān)的服務(wù)。位置服務(wù)在位置定位、路徑導(dǎo)航、查詢、識別、檢測等方面有著廣泛的應(yīng)用,被譽為移動互聯(lián)網(wǎng)最耀眼的服務(wù)模式之一。
2、然而位置服務(wù)的商業(yè)化普及給人們生活帶來巨大便利的同時,其中隱藏的安全隱私泄露問題也逐漸顯露出來。位置數(shù)據(jù)等隱私數(shù)據(jù)的生命周期內(nèi)的隱私泄露風(fēng)險控制中,面臨著海量數(shù)據(jù),如何從海量異構(gòu)數(shù)據(jù)中快速準確地識別關(guān)鍵隱私數(shù)據(jù),成為隱私保護工作的一大技術(shù)瓶頸。
技術(shù)實現(xiàn)思路
1、為了解決上述問題,本專利技術(shù)提出一種隱私數(shù)據(jù)泄露風(fēng)險控制方法、裝置、設(shè)備、介質(zhì)及產(chǎn)品,提供一種能夠快速準確地實現(xiàn)關(guān)鍵隱私數(shù)據(jù)的識別模型。
2、本專利技術(shù)實施例提供一種隱私數(shù)據(jù)泄露風(fēng)險控制方法,所述方法包括:
3、根據(jù)隱私泄露風(fēng)險主題的關(guān)鍵詞,對隱私數(shù)據(jù)生命周期內(nèi)的泄露數(shù)據(jù)進行主題聚類和提取,得到不同泄露事件的主題分布的概率矩陣;
4、通過計算不同泄露事件的概率矩陣的相似度,分析不同隱私泄露事件之間的關(guān)聯(lián)性,確定隱私泄露風(fēng)
5、根據(jù)所述共性特征向量,構(gòu)建隱私泄露風(fēng)險分類的數(shù)據(jù)集進行模型泄露風(fēng)險概率的訓(xùn)練,得到泄露風(fēng)險識別模型。
6、優(yōu)選地,根據(jù)泄露風(fēng)險主題的關(guān)鍵詞,對隱私數(shù)據(jù)生命周期內(nèi)的泄露數(shù)據(jù)進行主題聚類和提取,得到不同泄露事件的主題分布的概率矩陣,包括:
7、通過預(yù)設(shè)的提取參數(shù)采用潛在狄利克雷分配主題模型算法對所述泄露數(shù)據(jù)進行主題的代表詞提取,計算不同主題下關(guān)鍵詞的概率分布;
8、根據(jù)代表詞的語義相似度,對不同主題進行合并和優(yōu)化,得到不同類別的主題;
9、計算不同泄露事件的主題分布的概率矩陣。
10、優(yōu)選地,通過計算不同泄露事件的概率矩陣的相似度,分析不同隱私泄露事件之間的關(guān)聯(lián)性,確定隱私泄露風(fēng)險的共性特征向量,包括:
11、對不同事件的概率矩陣進行歸一化處理,得到單位化的特征向量;
12、通過概率舉證之間的點積計算,確定不同泄露事件的概率矩陣的余弦相似度值;
13、根據(jù)計算的余弦相似度,采用預(yù)設(shè)的降維算法提取隱私泄露風(fēng)險特征的主成分,形成隱私泄露風(fēng)險特征子空間;
14、將原始數(shù)據(jù)映射到所述隱私泄露風(fēng)險特征子空間中,確定隱私泄露風(fēng)險的共性特征向量。
15、作為一種優(yōu)選方案,根據(jù)所述共性特征向量,構(gòu)建隱私泄露風(fēng)險分類的數(shù)據(jù)集進行模型泄露風(fēng)險概率的訓(xùn)練,得到泄露風(fēng)險識別模型,包括:
16、根據(jù)共性特征向量,采用支持向量機算法對隱私數(shù)據(jù)生命周期內(nèi)的隱私泄露數(shù)據(jù)進行分類和標注,獲取一部分隱私泄露數(shù)據(jù)的標注信息,作為訓(xùn)練樣本集的基礎(chǔ);
17、對于未標注的數(shù)據(jù),使用支持向量機的轉(zhuǎn)導(dǎo)學(xué)習(xí)方法,利用已標注樣本的結(jié)構(gòu)信息和樣本之間的相似度,將已標注樣本的標簽信息傳播到未標注樣本上,構(gòu)建隱私泄露風(fēng)險分類的數(shù)據(jù)集;
18、采用交叉驗證的方案,將所述數(shù)據(jù)集隨機劃分為若干互斥子集,每次選擇其中一個子集作為驗證集,其余子集作為訓(xùn)練集,重復(fù)驗證,取若干次驗證結(jié)果的平均值作為支持向量機模型的性能估計;
19、通過網(wǎng)格搜索或隨機搜索對模型參數(shù)進行遍歷和優(yōu)化,選擇期待值最高的參數(shù)組合作為最優(yōu)參數(shù),得到所述泄露風(fēng)險識別模型。
20、優(yōu)選地,所述方法還包括:
21、采用預(yù)設(shè)的關(guān)聯(lián)規(guī)則挖掘算法,分析位置數(shù)據(jù)生命周期內(nèi)不同類別隱私泄露風(fēng)險之間的關(guān)聯(lián)規(guī)則,確定隱私泄露風(fēng)險在位置數(shù)據(jù)生命周期內(nèi)的傳播路徑和影響范圍。
22、優(yōu)選地,采用預(yù)設(shè)的關(guān)聯(lián)規(guī)則挖掘算法,分析位置數(shù)據(jù)生命周期內(nèi)不同類別隱私泄露風(fēng)險之間的關(guān)聯(lián)規(guī)則,確定隱私泄露風(fēng)險在位置數(shù)據(jù)生命周期內(nèi)的傳播路徑和影響范圍,包括:
23、采用apriori關(guān)聯(lián)規(guī)則挖掘算法,通過交叉驗證確定支持度和置信度閾值;
24、通過預(yù)設(shè)放入評估指標,分析隱私數(shù)據(jù)生命周期內(nèi)不同類別隱私泄露風(fēng)險之間的關(guān)聯(lián)規(guī)則,篩選出頻繁項集和強關(guān)聯(lián)規(guī)則,形成隱私泄露風(fēng)險關(guān)聯(lián)規(guī)則集;
25、根據(jù)所述隱私泄露風(fēng)險關(guān)聯(lián)規(guī)則集,構(gòu)建隱私泄露風(fēng)險關(guān)聯(lián)圖,將不同類別的隱私泄露風(fēng)險節(jié)點根據(jù)關(guān)聯(lián)規(guī)則連接起來,形成一個有向無環(huán)圖;
26、對所述有向無環(huán)圖采用預(yù)設(shè)的挖掘算法,計算每個隱私泄露風(fēng)險節(jié)點的重要性、權(quán)威性和中心性,識別出關(guān)鍵的隱私泄露風(fēng)險節(jié)點和傳播路徑,確定隱私泄露風(fēng)險在隱私數(shù)據(jù)生命周期內(nèi)的影響范圍。
27、進一步地,所述方法還包括:
28、根據(jù)所述傳播路徑和所述影響范圍構(gòu)建隱私泄露風(fēng)險的傳播網(wǎng)絡(luò)拓撲圖,識別隱私泄露風(fēng)險的關(guān)鍵節(jié)點和脆弱環(huán)節(jié)。
29、進一步地,根據(jù)所述傳播路徑和所述影響范圍構(gòu)建隱私泄露風(fēng)險的傳播網(wǎng)絡(luò)拓撲圖,識別隱私泄露風(fēng)險的關(guān)鍵節(jié)點和脆弱環(huán)節(jié),包括:
30、采用圖數(shù)據(jù)庫技術(shù),將隱私泄露風(fēng)險事件作為節(jié)點,將不同事件之間的關(guān)聯(lián)關(guān)系作為邊,形成一個有向加權(quán)圖作為所述傳播網(wǎng)絡(luò)拓撲圖;
31、根據(jù)所述傳播網(wǎng)絡(luò)拓撲圖采用標簽傳播算法進行社區(qū)發(fā)現(xiàn),通過迭代更新節(jié)點的標簽,直到標簽分布收斂為止;
32、將所述傳播網(wǎng)絡(luò)拓撲圖劃分為若干個隱私泄露風(fēng)險社區(qū);
33、根據(jù)隱私泄露風(fēng)險社區(qū)的特征,采用預(yù)設(shè)的評估指標,計算每個隱私泄露風(fēng)險節(jié)點在社區(qū)內(nèi)部和社區(qū)之間的重要性指標,確定所述傳播網(wǎng)絡(luò)拓撲圖中節(jié)點的重要性排序,確定隱私泄露風(fēng)險的關(guān)鍵節(jié)點;
34、采用最短路徑算法求解任意兩個節(jié)點之間的最短路徑,并統(tǒng)計中介節(jié)點的出現(xiàn)頻次,識別出網(wǎng)絡(luò)中的結(jié)構(gòu)洞,確定隱私泄露風(fēng)險傳播的脆弱環(huán)節(jié)。
35、優(yōu)選地,所述方法還包括:
36、根據(jù)所述關(guān)鍵節(jié)點和脆弱環(huán)節(jié),采用信息熵風(fēng)險評估模型計算隱私數(shù)據(jù)生命周期內(nèi)不同節(jié)點和環(huán)節(jié)的隱私泄露風(fēng)險值,得到風(fēng)險評估結(jié)果。
37、進一步地,根據(jù)所述關(guān)鍵節(jié)點和脆弱環(huán)節(jié),采用信息熵風(fēng)險評估模型計算隱私數(shù)據(jù)生命周期內(nèi)不同節(jié)點和環(huán)節(jié)的隱私泄露風(fēng)險值,得到風(fēng)險評估結(jié)果,包括:
38、將所述隱私數(shù)據(jù)的生命周期劃分為多個階段,采用故障樹分析法,將隱私泄露事件逐步分解為多個中間事件和基本事件,并用邏輯門表示事件之間的因果關(guān)系,形成一個倒立的樹形結(jié)構(gòu)圖;
39、篩選出重要度較高的基本事件作為隱私泄露風(fēng)險評估的對象集合;
40、對每個風(fēng)險評估對象,從隱私泄露事件的發(fā)生概率和影響程度兩個維度,采用層次分析法,對同一層次的每對因素進行兩兩比較和重要性打分,得到成對比較矩陣;
...【技術(shù)保護點】
1.一種隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,根據(jù)泄露風(fēng)險主題的關(guān)鍵詞,對隱私數(shù)據(jù)生命周期內(nèi)的泄露數(shù)據(jù)進行主題聚類和提取,得到不同泄露事件的主題分布的概率矩陣,包括:
3.根據(jù)權(quán)利要求1所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,通過計算不同泄露事件的概率矩陣的相似度,分析不同隱私泄露事件之間的關(guān)聯(lián)性,確定隱私泄露風(fēng)險的共性特征向量,包括:
4.根據(jù)權(quán)利要求1所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,根據(jù)所述共性特征向量,構(gòu)建隱私泄露風(fēng)險分類的數(shù)據(jù)集進行模型泄露風(fēng)險概率的訓(xùn)練,得到泄露風(fēng)險識別模型,包括:
5.根據(jù)權(quán)利要求1所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,所述方法還包括:
6.根據(jù)權(quán)利要求5所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,采用預(yù)設(shè)的關(guān)聯(lián)規(guī)則挖掘算法,分析位置數(shù)據(jù)生命周期內(nèi)不同類別隱私泄露風(fēng)險之間的關(guān)聯(lián)規(guī)則,確定隱私泄露風(fēng)險在位置數(shù)據(jù)生命周期內(nèi)的傳播路徑和影響范圍,包括:
7.根據(jù)權(quán)利要求5所述的隱私數(shù)據(jù)泄露
8.根據(jù)權(quán)利要求7所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,根據(jù)所述傳播路徑和所述影響范圍構(gòu)建隱私泄露風(fēng)險的傳播網(wǎng)絡(luò)拓撲圖,識別隱私泄露風(fēng)險的關(guān)鍵節(jié)點和脆弱環(huán)節(jié),包括:
9.根據(jù)權(quán)利要求7所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,所述方法還包括:
10.根據(jù)權(quán)利要求9所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,根據(jù)所述關(guān)鍵節(jié)點和脆弱環(huán)節(jié),采用信息熵風(fēng)險評估模型計算隱私數(shù)據(jù)生命周期內(nèi)不同節(jié)點和環(huán)節(jié)的隱私泄露風(fēng)險值,得到風(fēng)險評估結(jié)果,包括:
11.根據(jù)權(quán)利要求9所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,所述方法還包括:
12.根據(jù)權(quán)利要求11所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,根據(jù)所述風(fēng)險評估結(jié)果采用模糊綜合評判法確定隱私數(shù)據(jù)生命周期內(nèi)隱私泄露風(fēng)險的優(yōu)先級,匹配對應(yīng)的隱私保護策略,包括:
13.根據(jù)權(quán)利要求11所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,所述方法還包括:
14.根據(jù)權(quán)利要求13所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,通過持續(xù)監(jiān)測隱私數(shù)據(jù)生命周期內(nèi)的隱私泄露數(shù)據(jù),動態(tài)更新隱私泄露風(fēng)險的主題分布、關(guān)聯(lián)規(guī)則和傳播網(wǎng)絡(luò),包括:
15.一種隱私數(shù)據(jù)泄露風(fēng)險控制裝置,其特征在于,所述裝置包括:
16.一種終端設(shè)備,其特征在于,包括處理器、存儲器以及存儲在所述存儲器中且被配置為由所述處理器執(zhí)行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如權(quán)利要求1至14中任意一項所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法。
17.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)包括存儲的計算機程序,其中,在所述計算機程序運行時控制所述計算機可讀存儲介質(zhì)所在設(shè)備執(zhí)行如權(quán)利要求1至14中任意一項所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法。
18.一種計算機程序產(chǎn)品,包括計算機程序/指令,其特征在于,該計算機程序/指令被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至14中任一所述方法的步驟。
...【技術(shù)特征摘要】
1.一種隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,根據(jù)泄露風(fēng)險主題的關(guān)鍵詞,對隱私數(shù)據(jù)生命周期內(nèi)的泄露數(shù)據(jù)進行主題聚類和提取,得到不同泄露事件的主題分布的概率矩陣,包括:
3.根據(jù)權(quán)利要求1所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,通過計算不同泄露事件的概率矩陣的相似度,分析不同隱私泄露事件之間的關(guān)聯(lián)性,確定隱私泄露風(fēng)險的共性特征向量,包括:
4.根據(jù)權(quán)利要求1所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,根據(jù)所述共性特征向量,構(gòu)建隱私泄露風(fēng)險分類的數(shù)據(jù)集進行模型泄露風(fēng)險概率的訓(xùn)練,得到泄露風(fēng)險識別模型,包括:
5.根據(jù)權(quán)利要求1所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,所述方法還包括:
6.根據(jù)權(quán)利要求5所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,采用預(yù)設(shè)的關(guān)聯(lián)規(guī)則挖掘算法,分析位置數(shù)據(jù)生命周期內(nèi)不同類別隱私泄露風(fēng)險之間的關(guān)聯(lián)規(guī)則,確定隱私泄露風(fēng)險在位置數(shù)據(jù)生命周期內(nèi)的傳播路徑和影響范圍,包括:
7.根據(jù)權(quán)利要求5所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,所述方法還包括:
8.根據(jù)權(quán)利要求7所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,根據(jù)所述傳播路徑和所述影響范圍構(gòu)建隱私泄露風(fēng)險的傳播網(wǎng)絡(luò)拓撲圖,識別隱私泄露風(fēng)險的關(guān)鍵節(jié)點和脆弱環(huán)節(jié),包括:
9.根據(jù)權(quán)利要求7所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,其特征在于,所述方法還包括:
10.根據(jù)權(quán)利要求9所述的隱私數(shù)據(jù)泄露風(fēng)險控制方法,...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:姚華超,張仙竹,陳宇恒,范敏,鄒鵬,
申請(專利權(quán))人:中移物聯(lián)網(wǎng)有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。