System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術涉及辦公信息發布,具體涉及基于大數據的辦公信息發布方法。
技術介紹
1、在信息爆炸的時代,信息的傳播速度和范圍都在不斷擴展。傳統的信息發布方式,如紙質文件、會議通知等,不僅效率低下,而且無法滿足信息實時性和準確性的要求。此外,隨著企業規模的擴大和業務范圍的拓展,信息量急劇增加,傳統的處理方式已經無法滿足現代企業的需求。
2、大數據技術的崛起為企業提供了全新的信息處理手段。通過對海量數據的收集、存儲、分析和挖掘,企業可以更加準確地把握市場動態和客戶需求,從而制定更加科學合理的決策。在辦公信息發布領域,大數據技術同樣具有廣泛的應用前景。
3、現有技術中,在對辦公信息的發布時,往往沒有對待發布的辦公信息中內部業務數據進行對敏感信息識別與審核,導致一些重要信息輕易地流出,再者,對待發布的辦公信息中外部公共數據也沒有進行安全性評估,導致待發布的辦公信息存在信息安全隱患。
4、因此,亟需基于大數據的辦公信息發布方法來解決上述問題。
技術實現思路
1、本專利技術的目的在于提供基于大數據的辦公信息發布方法:解決現有方案中,在對辦公信息的發布時,往往沒有對待發布的辦公信息中內部業務數據進行對敏感信息識別與審核,導致一些重要信息輕易地流出,對待發布的辦公信息中外部公共數據也沒有進行安全性評估,導致待發布的辦公信息存在信息安全隱患的技術問題。
2、本專利技術的目的可以通過以下技術方案實現:
3、基于大數據的辦公信息發布方法,方法包括:
4、獲取待發布的辦公信息,其中,待發布的辦公信息包括內部業務數據和外部公共數據;
5、對內部業務數據進行屬性敏感度計算,得到內部業務數據的屬性敏感度,并基于層次聚類算法對屬性敏感度進行構建敏感特征屬性集,通過apriori算法分析敏感特征屬性集的屬性間的關聯規則,計算出有強關聯的屬性之間的互信息量,并以關聯屬性為頂點,屬性間的關聯關系為邊,屬性間互信息量為權值,構建屬性依賴圖;
6、基于外部公共數據計算外部公共數據的安全指數;
7、基于屬性依賴圖對內部業務數據進行敏感等級分級,得到內部業務數據的敏感等級,并基于敏感等級和安全指數判斷待發布的辦公信息是否滿足發布條件,若是,發布待發布的辦公信息,若否,拒絕發布待發布的辦公信息。
8、進一步地,對內部業務數據進行屬性敏感度計算,得到內部業務數據的屬性敏感度包括以下過程:
9、將內部業務數據的每條數據作為一個信源x,每個信源x包含n個不同的離散信息(x1,x2,...xn),基于離散信息計算信源x的屬性信息熵h(x),屬性信息熵的計算公式如下:
10、
11、其中,p(xi)表示離散信息為敏感信息的概率,0≤p(xi)≤1,且概率之和為1,離散信息為敏感信息的概率由離散信息中的關鍵詞來確定;
12、設定一個敏感屬性的極大離散熵為hmax(x),計算信源x的屬性信息熵h(x和極大離散熵為hmax(x)的歐氏距離di:
13、di=hmax(x)-h(x)
14、計算屬性敏感度sni:
15、
16、其中,0≤sni<1,敏感度值越小,其敏感程度越高。
17、進一步地,離散信息為敏感信息的概率由離散信息中的關鍵詞來確定包括:
18、基于自然語言處理技術對離散信息中的關鍵詞進行識別,并通過搜索引擎獲取每個關鍵詞的敏感參數,將每個關鍵詞的敏感參數相加之后得到的和值作為敏感信息的概率,其中,每個關鍵詞的敏感參數存儲于辦公信息發布系統的數據庫中,經由搜索引擎搜索獲取。
19、進一步地,基于層次聚類算法對屬性敏感度進行構建敏感特征屬性集包括以下過程:
20、步驟一:將屬性敏感度作為輸入樣本,并將輸入樣本視為一個類;
21、步驟二:根據樣本之間的相似度找到最合適的劃分位置,使劃分的子類之間的相似性最小;
22、步驟三:判斷是否滿足算法的結束條件,若是,則轉到步驟四,否則,轉到步驟二,其中,結束條件為是否達到迭代次數。
23、步驟四:算法結束,得到若干個子類組,計算每組的平均敏感度,將平均敏感度最小的子類組記為敏感特征屬性集。
24、進一步地,通過apriori算法分析敏感特征屬性集的屬性間的關聯規則,計算出有強關聯的屬性之間的互信息量,并以關聯屬性為頂點,屬性間的關聯關系為邊,屬性間互信息量為權值,構建屬性依賴圖包括以下過程:
25、基于定義支持度閾值為ε和置信度閾值γ,使用apriori算法從敏感特征屬性集找出所有滿足最小支持度閾值的頻繁項集,若sup(a→b)>γ且con(a→b)>ε,稱屬性a和屬性b之間存在強關聯關系,sup(a→b)表示屬性a和屬性b的關聯規則支持度,con(a→b)表示屬性a和屬性b的關聯規則置信度;
26、計算出有強關聯的屬性之間的互信息量i(a;b):
27、i(a;b)=h(a)-h(a|b
28、其中,h(a)為屬性a對應的信息熵,h(a|b)為屬性a、屬性b的條件熵;
29、在以關聯屬性為頂點,屬性間的關聯關系為邊,屬性間互信息量為權值,構建屬性依賴圖之前包括以鄰接矩陣的形式來描述屬性關聯關系,鄰接矩陣的形式:
30、
31、其中,μ互信息量閾值,v,j為矩陣的元素;
32、根據鄰接矩陣z[v][j]生成構建屬性依賴圖g,其中,關系屬性構成圖中的頂點集合v{v1,v2...vk},屬性間關聯關系構成圖中邊集合e{e1,e2...eb},圖中邊的權值為屬性間的互信息量,表示屬性間的相關強度。
33、進一步地,基于外部公共數據計算外部公共數據的安全指數包括:
34、獲取外部公共數據中的數據來源ip地址,對比已登記的數據來源ip地址,得到外部公共數據中的數據來源ip地址中不屬于已登記的數據來源ip地址的ip地址個數r;
35、獲取外部公共數據中的數據已加密條數,計算數據已加密條數占數據應加密條數比例t;
36、獲取外部公共數據的數據上傳率l,外部公共數據的數據上傳率g為該公共數據被上傳至公共區域網絡的概率;
37、將ip地址個數r、比例t和數據上傳率l代入到安全指數關聯公式中,得到安全指數lms,該安全指數關聯公式如下:
38、
39、其中,z為安全驗證參數,權重因子δ、θ,m為常數系數,由辦公信息發布系統設置。
40、進一步地,基于屬性依賴圖對內部業務數據進行敏感等級分級,得到內部業務數據的敏感等級包括:
41、基于屬性依賴圖識別出敏感屬性,并基于敏感屬性獲取對應的屬性敏感度,依據屬性敏感度進行分級:當敏感屬性對應的屬性敏感度小于第一預設閾值時,該內部業務數據為敏感一級,當敏感屬性對應的屬性敏感度大于第一預設閾值且小本文檔來自技高網...
【技術保護點】
1.基于大數據的辦公信息發布方法,其特征在于,方法包括:
2.根據權利要求1所述的基于大數據的辦公信息發布方法,其特征在于,對內部業務數據進行屬性敏感度計算,得到內部業務數據的屬性敏感度包括以下過程:
3.根據權利要求2所述的基于大數據的辦公信息發布方法,其特征在于,離散信息為敏感信息的概率由離散信息中的關鍵詞來確定包括:
4.根據權利要求1所述的基于大數據的辦公信息發布方法,其特征在于,基于層次聚類算法對屬性敏感度進行構建敏感特征屬性集包括以下過程:
5.根據權利要求1所述的基于大數據的辦公信息發布方法,其特征在于,通過Apriori算法分析敏感特征屬性集的屬性間的關聯規則,計算出有強關聯的屬性之間的互信息量,并以關聯屬性為頂點,屬性間的關聯關系為邊,屬性間互信息量為權值,構建屬性依賴圖包括以下過程:
6.根據權利要求1所述的基于大數據的辦公信息發布方法,其特征在于,基于外部公共數據計算外部公共數據的安全指數包括:
7.根據權利要求1所述的基于大數據的辦公信息發布方法,其特征在于,基于屬性依賴圖對內部業務數
8.根據權利要求1所述的基于大數據的辦公信息發布方法,其特征在于,基于敏感等級和安全指數判斷待發布的辦公信息是否滿足發布條件包括:
...【技術特征摘要】
1.基于大數據的辦公信息發布方法,其特征在于,方法包括:
2.根據權利要求1所述的基于大數據的辦公信息發布方法,其特征在于,對內部業務數據進行屬性敏感度計算,得到內部業務數據的屬性敏感度包括以下過程:
3.根據權利要求2所述的基于大數據的辦公信息發布方法,其特征在于,離散信息為敏感信息的概率由離散信息中的關鍵詞來確定包括:
4.根據權利要求1所述的基于大數據的辦公信息發布方法,其特征在于,基于層次聚類算法對屬性敏感度進行構建敏感特征屬性集包括以下過程:
5.根據權利要求1所述的基于大數據的辦公信息發布方法,其特征在于,通過apriori算法分...
【專利技術屬性】
技術研發人員:李運鋒,王燕霞,
申請(專利權)人:深圳市佳鑫產業發展有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。