System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開涉及網絡資產管理,尤其涉及一種網絡資產屬性標注方法。
技術介紹
1、網絡資產是支撐各類信息系統運行的基礎設施,網絡資產屬性的精準標注,作為提升資產管理效率、加固網絡安全防線的重要手段,受到業界的廣泛關注。
2、在現有技術中,通常采用人工標注方式進行網絡資產屬性的標注,這種方式對于小規模、結構相對簡單的網絡環境而言尚能勉強應對網絡資產屬性的收集與整理工作,然而,隨著網絡規模的不斷擴大和復雜度提升,需要較多的人工參與,導致標注效率低、成本高,并且無法保證大批量要求的準確性,無法滿足現代網絡資產管理對于時效性和經濟性的雙重需求。
技術實現思路
1、有鑒于此,本公開實施例提供了一種網絡資產屬性標注方法,能夠解決現有技術中人工標注效率低、成本高、無法滿足不同網絡資產管理需求等的問題。
2、第一方面,本公開實施例提供了一種網絡資產屬性標注方法,該方法包括具體包括以下方案:
3、采集預設周期內網絡資產目標站點的若干份目標圖像信息,每份所述目標圖像信息均包括資產圖像以及對應的圖像文件編號、網絡資產標識;
4、基于預設處理策略對所述資產圖像進行處理,獲得樣本圖像;
5、基于所有的所述樣本圖像,創建樣本集合;創建簇中心點集合,所述簇中心點集合在初始狀態下為空集;
6、基于預設聚類策略對所述樣本集合、所述簇中心點集合進行聚類,獲得代表圖像集合;
7、基于相似度策略、所述代表圖像集合、預設聚類簇集合信息,獲取所述樣本
8、基于每張所述樣本圖像對應的網絡資產標識,在預設已標注網絡資產信息庫中獲取相關聯的已標注標簽信息;其中,獲取的所述已標注標簽信息的標簽總量小于所有的所述樣本圖像的總量;
9、將所述已標注標簽信息中標注標簽作為相關聯的樣本圖像對應的資產屬性標簽進行標注;對所述已標注標簽信息進行分析,調用對應的標注策略進行未關聯的樣本圖像對應資產屬性的標注。
10、可選的,所述基于預設處理策略對所述資產圖像進行處理,獲得樣本圖像,包括:
11、對每張所述資產圖像進行處理,獲得初始四維圖像數據矩陣;
12、所述初始四維圖像數據矩陣包括紅色維度圖像數據矩陣、綠色維度數據圖像矩陣、藍色維度圖像數據矩陣和透明度維度圖像數據矩陣;
13、所有的所述初始四維圖像數據矩陣具有相同的數據類型和通道順序;
14、基于預設縮放算法對所有的所述初始四維圖像數據矩陣進行縮放處理,將處理后的所述初始四維圖像數據矩陣記為第一圖像數據矩陣;
15、所有的所述第一圖像數據矩陣具有相同的尺寸;
16、對所述第一圖像數據矩陣進行多級閾值化處理,獲得樣本圖像。
17、可選的,所述對所述第一圖像數據矩陣進行多級閾值化處理,獲得樣本圖像,包括:
18、對所述第一圖像數據矩陣中每個維度矩陣中的像素點數值均進行多級閾值化處理,獲得第二圖像數據矩陣;
19、所述多級閾值化處理包括:d表示每個維度矩陣中對應的像素點數值,d'是像素點經過多級閾值化處理后的結果,%為取余計算,e為預設閾值參數;
20、基于所述第二圖像數據矩陣獲取樣本圖像。
21、可選的,所述基于預設聚類策略對所述樣本集合、所述簇中心點集合進行聚類,獲得代表圖像集合,包括:
22、s410,從所述樣本集合中隨機抽取一個樣本圖像作為當前代表圖像并存儲至簇中心點集合中,獲得更新后的所述簇中心點集合;
23、s420,獲取所述當前代表圖像與所述樣本集合中剩余的每個樣本圖像的相似度,并從所述樣本集合中刪除相似度不小于預設相似度閾值的圖像對象,獲取更新后的所述樣本集合;
24、s430,判斷更新后的所述樣本集合是否為空集,若是,將更新后的所述簇中心點集合作為代表圖像集合;
25、若否,從更新后的所述樣本集合中隨機抽取一個樣本圖像作為當前代表圖像并存儲至所述簇中心點集合中,獲得更新后的所述簇中心點集合,然后返回執行s420。
26、可選的,所述基于相似度策略、所述代表圖像集合、預設聚類簇集合信息,獲取所述樣本集合中每個樣本圖像的所屬聚類簇,包括:
27、基于所述代表圖像集合獲取聚類簇集合信息;
28、獲取所述樣本集合中每個樣本圖像與所述代表圖像集合中所有代表圖像的相似度;
29、基于所述聚類簇集合信息獲取相似度最高的當前代表圖像對應的所屬聚類簇,并將所述所屬聚類簇作為對應的樣本圖像的所屬聚類簇。
30、可選的,所述對所述已標注標簽信息進行分析,調用對應的標注策略進行未關聯的樣本圖像對應資產屬性的標注,包括:
31、基于獲取的相關聯的已標注標簽信息,確定相同類型票數最多的已標注標簽,作為目標標注標簽;
32、當所述目標標注標簽的票數、票數占比滿足第一預設條件時,執行第一標注策略;
33、當所述目標標注標簽的票數、票數占比不滿足第一預設條件、且滿足第二預設條件時,執行第二標注策略;
34、當所述目標標注標簽的票數、票數占比不滿足第一預設條件、且不滿足第二預設條件時,執行第三標注策略。
35、可選的,所述第一預設條件包括:所述目標標注標簽的票數大于第一票數閾值、且所述目標標注標簽的票數占比大于第一占比閾值;
36、所述第一標注策略為自動標注策略,包括:將滿足條件的所述已標注標簽作為對應聚類簇中未關聯的樣本圖像對應資產屬性的標注;
37、所述第二預設條件包括:所述目標標注標簽的票數大于第二票數閾值、且所述目標標注標簽的票數占比大于第二占比閾值;
38、所述第二標注策略為半自動標注策略,包括:基于獲取的相關聯的已標注標簽信息,獲取票數排名top?n的已標注標簽,并將top?n的已標注標簽作為推薦標簽,由人工對所述推薦標簽進行核查并從所述推薦標簽中確定出唯一的期望標簽,將所述期望標簽作為對應聚類簇中所有未關聯的樣本圖像對應資產屬性的標簽;
39、所述第三標注策略為人工標注,包括:基于獲取的相關聯的已標注標簽信息,獲取票數排名top?n的已標注標簽,并將top?n的已標注標簽作為推薦標簽,由人工對所述推薦標簽進行分析,并基于實際預設數據庫,確定出唯一的期望標簽,將所述期望標簽作為對應聚類簇中所有未關聯的樣本圖像對應資產屬性的標簽;
40、其中,n≥2。
41、可選的,還包括:若獲取的最高所述相似度不大于預設相似度閾值,新增所述樣本圖像的所屬聚類簇,并將所述所屬聚類簇更新添加至所述聚類簇集合信息。
42、可選的,還包括:對所述代表圖像集合的簇中心點進行更新;
43、所述對所述代表圖像集合進行更新,包括:
44、計算同一類聚類簇中所有樣本對應數值的均值;
45、若所述均值與所述代表圖像本文檔來自技高網...
【技術保護點】
1.一種網絡資產屬性標注方法,其特征在于,包括:
2.根據權利要求1所述的網絡資產屬性標注方法,其特征在于,所述基于預設處理策略對所述資產圖像進行處理,獲得樣本圖像,包括:
3.根據權利要求2所述的網絡資產屬性標注方法,其特征在于,所述對所述第一圖像數據矩陣進行多級閾值化處理,獲得樣本圖像,包括:
4.根據權利要求1所述的網絡資產屬性標注方法,其特征在于,所述基于預設聚類策略對所述樣本集合、所述簇中心點集合進行聚類,獲得代表圖像集合,包括:
5.根據權利要求1所述的網絡資產屬性標注方法,其特征在于,所述基于相似度策略、所述代表圖像集合、預設聚類簇集合信息,獲取所述樣本集合中每個樣本圖像的所屬聚類簇,包括:
6.根據權利要求5所述的網絡資產屬性標注方法,其特征在于,所述對所述已標注標簽信息進行分析,調用對應的標注策略進行未關聯的樣本圖像對應資產屬性的標注,包括:
7.根據權利要求6所述的網絡資產屬性標注方法,其特征在于,所述第一預設條件包括:所述目標標注標簽的票數大于第一票數閾值、且所述目標標注標簽的票數占比大
8.根據權利要求5所述的網絡資產屬性標注方法,其特征在于,還包括:若獲取的最高所述相似度不大于預設相似度閾值,新增所述樣本圖像的所屬聚類簇,并將所述所屬聚類簇更新添加至所述聚類簇集合信息。
9.根據權利要求4所述的網絡資產屬性標注方法,其特征在于,還包括:對所述代表圖像集合的簇中心點進行更新;
10.根據權利要求2所述的網絡資產屬性標注方法,其特征在于,所述基于預設處理策略對所述資產圖像進行處理,獲得樣本圖像,還包括:采用模糊化算法對所述第一圖像進行處理,對處理后的所述第一圖像進行多級閾值化處理,獲得樣本圖像。
...【技術特征摘要】
1.一種網絡資產屬性標注方法,其特征在于,包括:
2.根據權利要求1所述的網絡資產屬性標注方法,其特征在于,所述基于預設處理策略對所述資產圖像進行處理,獲得樣本圖像,包括:
3.根據權利要求2所述的網絡資產屬性標注方法,其特征在于,所述對所述第一圖像數據矩陣進行多級閾值化處理,獲得樣本圖像,包括:
4.根據權利要求1所述的網絡資產屬性標注方法,其特征在于,所述基于預設聚類策略對所述樣本集合、所述簇中心點集合進行聚類,獲得代表圖像集合,包括:
5.根據權利要求1所述的網絡資產屬性標注方法,其特征在于,所述基于相似度策略、所述代表圖像集合、預設聚類簇集合信息,獲取所述樣本集合中每個樣本圖像的所屬聚類簇,包括:
6.根據權利要求5所述的網絡資產屬性標注方法,其特征在于,所述對所述已標注標簽信息進行分析,調用對應的標注策...
【專利技術屬性】
技術研發人員:鄒凱,陳凱楓,曾浩,李子陽,
申請(專利權)人:廣州天懋信息系統股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。