System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及信息安全,具體涉及基于本地化差分隱私的鍵值數據安全采集方法和系統。
技術介紹
1、在大數據時代,服務提供商熱衷于收集和分析用戶數據以輔助決策或改進服務。然而,數據采集操作伴隨著隱私風險,這必然引發用戶對隱私泄露的擔憂。隨著數據采集安全需求的持續增長,差分隱私(differential?privacy,dp)已成為保護用戶隱私數據的關鍵技術。無論攻擊者具備何種先驗知識,差分隱私都能夠提供可證明的隱私保護。本地化差分隱私(local?differential?privacy,ldp)部署在數據收集階段,其隱私化處理過程從服務提供方轉移至用戶端,從而降低了不可信的數據收集者泄露用戶數據的風險。
2、鍵值數據是一種典型的非結構化查詢語言(non?structured?query?language,non-sql)混合數據類型,在實踐中得到了廣泛應用,實現鍵值數據的安全采集需要ldp的介入。目前,基于一元編碼和通用隨機響應機制的ldp采集方案在鍵值數據采集中得到了應用,其代表性的方案包括privkv(privacy?key-value),pckv(private?correlated?key-value)和mlpkv(multi-layer?private?key-value)。
3、然而,privkv方案由于采用了多次迭代的方法,計算復雜度較高,多輪迭代會分割隱私預算并擴大方差。采用一元編碼實現鍵擾動的pckv,在大型鍵域中會導致巨大的通信開銷。mlpkv方案存在由于填充長度過大而導致估計精度急劇下
技術實現思路
1、為了解決現有技術中的上述問題,本專利技術提供了一種基于本地化差分隱私的鍵值數據安全采集方法和系統。具體包括:
2、第一方面,本專利技術提供了一種基于本地化差分隱私的鍵值數據安全采集方法,適用于鍵值數據安全采集系統,系統包括通信連接的服務器和多個用戶端;
3、該方法包括:
4、服務器,向各用戶端下發預設的鍵值數據采集參數,參數包括鍵域、值域、鍵擾動隱私預算和值擾動隱私預算;
5、各用戶端,根據接收到的鍵域,填充本地鍵值數據集,生成混淆后的鍵值數據集,并按照預設概率從混淆后的鍵值數據集中抽取一個鍵值數據,基于預設的評分函數,根據接收到的鍵域、鍵擾動隱私預算和值擾動隱私預算,對抽取的鍵值數據進行擾動,得到擾動結果,并將擾動結果發送至服務器;
6、服務器,根據鍵域、鍵擾動隱私預算、值擾動隱私預算和接收到的擾動結果,校準得到所抽取的各鍵值數據的鍵的頻率估計和均值估計。
7、第二方面,本專利技術還提供了一種鍵值數據安全采集系統,包括:通信連接的服務器和多個用戶端;
8、服務器,用于向各用戶端下發預設的鍵值數據采集參數,參數包括鍵域、值域、鍵擾動隱私預算和值擾動隱私預算;
9、各用戶端,用于根據接收到的鍵域,填充本地鍵值數據集,生成混淆后的鍵值數據集,并按照預設概率從混淆后的鍵值數據集中抽取一個鍵值數據。基于預設的評分函數,根據接收到的鍵域、鍵擾動隱私預算和值擾動隱私預算,對抽取的鍵值數據進行擾動,生成擾動結果,并將擾動結果發送至服務器;
10、服務器,用于根據鍵域、鍵擾動隱私預算、值擾動隱私預算和接收到的各擾動結果,校準得到所抽取的各鍵值數據的鍵的頻率估計和均值估計。
11、第三方面,本專利技術提供了一種計算機可讀存儲介質,計算機可讀存儲介質內存儲有計算機程序,計算機程序被處理器執行時實現第一方面所提供的任一方法。
12、本專利技術的有益效果:
13、本專利技術提供的基于本地化差分隱私的鍵值數據安全采集方法和系統,通過服務器向各用戶端下發預設的鍵值數據采集參數;各用戶端根據接收到的鍵域,填充本地鍵值數據集,生成混淆后的鍵值數據集,并按照預設概率從混淆后的鍵值數據集中抽取一個鍵值數據。基于預設的評分函數,根據接收到的鍵域、鍵擾動隱私預算和值擾動隱私預算,對抽取的鍵值數據進行擾動,得到擾動結果,并將該擾動結果發送至服務器;服務器根據鍵域、鍵擾動隱私預算、值擾動隱私預算和接收到的擾動結果,校準得到所抽取的各鍵值數據的鍵的頻率估計和均值估計。本專利技術能夠有效減少通信開銷,提升執行速度和估計結果的準確性,特別針對互聯網海量數據的數據安全采集問題,能夠有效地完成收集任務,提升隱私保護的數據收集統計結果的精準度。以下將結合附圖及實施例對本專利技術做進一步詳細說明。
本文檔來自技高網...【技術保護點】
1.一種基于本地化差分隱私的鍵值數據安全采集方法,其特征在于,應用于鍵值數據采集系統,所述系統包括通信連接的服務器和多個用戶端;
2.根據權利要求1所述的方法,其特征在于,各所述用戶端根據接收到的所述鍵域,填充本地鍵值數據集,得到混淆后的鍵值數據集,包括:
3.根據權利要求1或2所述的方法,其特征在于,各所述用戶端按照預設概率從所述混淆后的鍵值數據集中抽取一個鍵值數據,包括:
4.根據權利要求1或2所述的方法,其特征在于,各所述用戶端基于預設的評分函數,根據接收到的所述鍵域、所述鍵擾動隱私預算和所述值擾動隱私預算,對抽取的鍵值數據進行擾動,得到擾動結果,包括:
5.根據權利要求4所述的方法,其特征在于,擾動為原始鍵的鍵擾動概率表示為:
6.根據權利要求5所述的方法,其特征在于,
7.根據權利要求1或2所述的方法,其特征在于,所抽取的鍵值數據的鍵的頻率估計表示為:
8.根據權利要求1或2所述的方法,其特征在于,所抽取的鍵值數據的鍵的均值估計表示為:
9.一種鍵值數據安全采集系統,其特征在
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質內存儲有計算機程序,所述計算機程序被處理器執行時實現權利要求1-8中任一所述的方法。
...【技術特征摘要】
1.一種基于本地化差分隱私的鍵值數據安全采集方法,其特征在于,應用于鍵值數據采集系統,所述系統包括通信連接的服務器和多個用戶端;
2.根據權利要求1所述的方法,其特征在于,各所述用戶端根據接收到的所述鍵域,填充本地鍵值數據集,得到混淆后的鍵值數據集,包括:
3.根據權利要求1或2所述的方法,其特征在于,各所述用戶端按照預設概率從所述混淆后的鍵值數據集中抽取一個鍵值數據,包括:
4.根據權利要求1或2所述的方法,其特征在于,各所述用戶端基于預設的評分函數,根據接收到的所述鍵域、所述鍵擾動隱私預算和所述值擾動隱私預算,對抽取的鍵值數據進行擾動,得到擾動結果,包...
【專利技術屬性】
技術研發人員:張軍鵬,汪旭,解濱,李夢倩,曾水光,杜曉輝,張曉飛,
申請(專利權)人:河北師范大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。