System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及計(jì)算機(jī),具體涉及一種自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、數(shù)據(jù)是社會(huì)活動(dòng)中重要生產(chǎn)資料之一,全面掌握組織數(shù)據(jù)資產(chǎn)已成為首要任務(wù),其中開展數(shù)據(jù)識(shí)別、數(shù)據(jù)分類、數(shù)據(jù)分級(jí)更是全面掌握組織數(shù)據(jù)資產(chǎn)的基本前提。
2、但是,通過人工梳理資產(chǎn)管理臺(tái)賬的方式往往存在效率低下的問題,且難以應(yīng)對(duì)人員崗位調(diào)變更;通過對(duì)接信息系統(tǒng)接口的方式往往存在資產(chǎn)采集過于粗放,容易導(dǎo)致數(shù)據(jù)資源不完整或數(shù)據(jù)使用過程繁雜的問題;簡單將通過人工梳理資產(chǎn)管理臺(tái)賬的方式與通過對(duì)接信息系統(tǒng)接口的方式相結(jié)合,又極易導(dǎo)致數(shù)據(jù)識(shí)別分類分級(jí)所投入的精力和成本過高。
3、其中,針對(duì)商業(yè)秘密數(shù)據(jù)的識(shí)別更加需要融合行業(yè)特性,比如要綜合考量多行業(yè)屬性的數(shù)據(jù),如技術(shù)專利、研發(fā)成果、產(chǎn)品設(shè)計(jì)、商業(yè)計(jì)劃、銷售策略、市場(chǎng)調(diào)研報(bào)告、客戶清單、供應(yīng)鏈信息等。
4、商業(yè)秘密數(shù)據(jù)表現(xiàn)出比個(gè)人信息更加復(fù)雜的數(shù)據(jù)屬性,一直導(dǎo)致其數(shù)據(jù)識(shí)別分類分級(jí)工作效率低下,可能導(dǎo)致組織數(shù)據(jù)資產(chǎn)管理變成空中樓閣,進(jìn)而可能導(dǎo)致組織缺乏對(duì)數(shù)據(jù)資產(chǎn)態(tài)勢(shì)整體,甚至數(shù)據(jù)資產(chǎn)保值增值陷入困境。
5、因此,亟需一種能夠能夠準(zhǔn)確進(jìn)行自動(dòng)化數(shù)據(jù)識(shí)別分類分級(jí)的方法。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)實(shí)施例的目的在于提供一種自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的方法、系統(tǒng)、電子設(shè)備和存儲(chǔ)介質(zhì),用以解決現(xiàn)有技術(shù)中無法準(zhǔn)確對(duì)數(shù)據(jù)進(jìn)行自動(dòng)化識(shí)別分類分級(jí)的問題。
2、為實(shí)現(xiàn)上述目的,本專利技術(shù)實(shí)施例提供一種自動(dòng)化進(jìn)
3、響應(yīng)于數(shù)據(jù)源的輸入請(qǐng)求,輸入數(shù)據(jù)源;
4、對(duì)所述數(shù)據(jù)源進(jìn)行預(yù)處理,以確定數(shù)據(jù)資源;
5、基于識(shí)別模型對(duì)所述數(shù)據(jù)資源進(jìn)行識(shí)別,得到識(shí)別數(shù)據(jù);
6、基于分類模型對(duì)所述識(shí)別數(shù)據(jù)進(jìn)行分類,得到分類數(shù)據(jù);
7、基于分級(jí)模型對(duì)所述分類數(shù)據(jù)進(jìn)行分級(jí),得到分級(jí)數(shù)據(jù);
8、為每個(gè)所述分級(jí)數(shù)據(jù)建立標(biāo)簽,得到標(biāo)簽數(shù)據(jù);
9、對(duì)所述標(biāo)簽數(shù)據(jù)進(jìn)行目錄管理。
10、在上述技術(shù)方案的基礎(chǔ)上,本專利技術(shù)還可以做如下改進(jìn):
11、進(jìn)一步地,所述對(duì)所述數(shù)據(jù)源進(jìn)行預(yù)處理,以確定數(shù)據(jù)資源,包括;
12、對(duì)實(shí)時(shí)業(yè)務(wù)埋點(diǎn)數(shù)據(jù)、離線導(dǎo)入數(shù)據(jù)、批量匯聚數(shù)據(jù)中一種或多種數(shù)據(jù)源進(jìn)行抽??;
13、將語音數(shù)據(jù)轉(zhuǎn)化為文字?jǐn)?shù)據(jù),將視頻數(shù)據(jù)轉(zhuǎn)化為圖像數(shù)據(jù);
14、對(duì)原始文件、索引值中的其中一種或多種數(shù)據(jù)源進(jìn)行存儲(chǔ)。
15、進(jìn)一步地,所述識(shí)別模型為融入卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型;
16、通過所述識(shí)別模型提取所述數(shù)據(jù)資源的整體特征和局部特征;
17、基于自動(dòng)數(shù)據(jù)識(shí)別規(guī)則、自動(dòng)數(shù)據(jù)識(shí)別策略和樣本對(duì)所述數(shù)據(jù)資源進(jìn)行識(shí)別;
18、所述自動(dòng)數(shù)據(jù)識(shí)別規(guī)則包括關(guān)鍵字識(shí)別、正則表達(dá)式、數(shù)字指紋技術(shù)和自然語言處理;
19、所述自動(dòng)數(shù)據(jù)識(shí)別策略包括精確數(shù)據(jù)識(shí)別、指紋文檔識(shí)別和向量機(jī)分類識(shí)別;
20、所述樣本包括結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)和微特征數(shù)據(jù)。
21、進(jìn)一步地,所述基于分類模型對(duì)所述識(shí)別數(shù)據(jù)進(jìn)行分類,得到分類數(shù)據(jù),包括:
22、將所述識(shí)別數(shù)據(jù)基于數(shù)據(jù)屬性劃分為靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù);
23、將靜態(tài)數(shù)據(jù)注入樹結(jié)構(gòu)區(qū)進(jìn)行約束條件判斷,當(dāng)不滿足約束條件時(shí),進(jìn)行丟棄處理,當(dāng)滿足約束條件時(shí),流入分級(jí)流程;
24、將動(dòng)態(tài)數(shù)據(jù)注入圖結(jié)構(gòu)區(qū)進(jìn)行屬性條件判斷,當(dāng)不滿足屬性條件時(shí),進(jìn)行丟棄處理,當(dāng)滿足屬性條件時(shí),流入分級(jí)流程。
25、進(jìn)一步地,所述基于分級(jí)模型對(duì)所述分類數(shù)據(jù)進(jìn)行分級(jí),得到分級(jí)數(shù)據(jù),包括:
26、判斷所述分類數(shù)據(jù)是否滿足策略判斷條件,當(dāng)不滿足策略判斷條件時(shí),進(jìn)行丟棄處理,當(dāng)滿足策略判斷條件時(shí),執(zhí)行一種或多種分級(jí)策略,以完成偏離分析;其中,所述分級(jí)策略包括對(duì)照法、對(duì)標(biāo)法和計(jì)算法。
27、進(jìn)一步地,所述基于分級(jí)模型對(duì)所述分類數(shù)據(jù)進(jìn)行分級(jí),得到分級(jí)數(shù)據(jù),還包括:
28、通過公式(1)計(jì)算k:
29、
30、式中,i為分項(xiàng)要素占比,j為分項(xiàng)分值,k為數(shù)據(jù)級(jí)別。
31、進(jìn)一步地,所述為每個(gè)所述分級(jí)數(shù)據(jù)建立標(biāo)簽,得到標(biāo)簽數(shù)據(jù),包括:
32、通過分類模型和所述數(shù)據(jù)分級(jí)模型提取所述數(shù)據(jù)資源的數(shù)據(jù)屬性;
33、對(duì)所述數(shù)據(jù)屬性進(jìn)行數(shù)據(jù)標(biāo)簽預(yù)測(cè),其中,所述數(shù)據(jù)標(biāo)簽包括普通標(biāo)簽、屬性標(biāo)簽和商業(yè)秘密標(biāo)簽;
34、至少通過普通標(biāo)簽和屬性標(biāo)簽為每個(gè)所述分級(jí)數(shù)據(jù)建立標(biāo)簽,并結(jié)合業(yè)務(wù)場(chǎng)景選擇標(biāo)記字段或映射表,以得到標(biāo)簽數(shù)據(jù)。
35、一種自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的系統(tǒng),包括:
36、數(shù)據(jù)源獲取模塊,用于響應(yīng)于數(shù)據(jù)源的輸入請(qǐng)求,輸入數(shù)據(jù)源;
37、預(yù)處理模塊,用于對(duì)所述數(shù)據(jù)源進(jìn)行預(yù)處理,以確定數(shù)據(jù)資源;
38、數(shù)據(jù)識(shí)別模塊,用于基于識(shí)別模型對(duì)所述數(shù)據(jù)資源進(jìn)行識(shí)別,得到識(shí)別數(shù)據(jù);
39、數(shù)據(jù)分類模塊,用于基于分類模型對(duì)所述識(shí)別數(shù)據(jù)進(jìn)行分類,得到分類數(shù)據(jù);
40、數(shù)據(jù)分級(jí)模塊,用于基于分級(jí)模型對(duì)所述分類數(shù)據(jù)進(jìn)行分級(jí),得到分級(jí)數(shù)據(jù);
41、建立標(biāo)簽?zāi)K,用于為每個(gè)所述分級(jí)數(shù)據(jù)建立標(biāo)簽,得到標(biāo)簽數(shù)據(jù);
42、目錄管理模塊,用于對(duì)所述標(biāo)簽數(shù)據(jù)進(jìn)行目錄管理。
43、一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如所述方法的步驟。
44、一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)所述方法的步驟。
45、本專利技術(shù)實(shí)施例具有如下優(yōu)點(diǎn):
46、本專利技術(shù)中自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的方法,響應(yīng)于數(shù)據(jù)源的輸入請(qǐng)求,輸入數(shù)據(jù)源;對(duì)所述數(shù)據(jù)源進(jìn)行預(yù)處理,以確定數(shù)據(jù)資源;基于識(shí)別模型對(duì)所述數(shù)據(jù)資源進(jìn)行識(shí)別,得到識(shí)別數(shù)據(jù);基于分類模型對(duì)所述識(shí)別數(shù)據(jù)進(jìn)行分類,得到分類數(shù)據(jù);基于分級(jí)模型對(duì)所述分類數(shù)據(jù)進(jìn)行分級(jí),得到分級(jí)數(shù)據(jù);為每個(gè)所述分級(jí)數(shù)據(jù)建立標(biāo)簽,得到標(biāo)簽數(shù)據(jù);對(duì)所述標(biāo)簽數(shù)據(jù)進(jìn)行目錄管理;解決了現(xiàn)有技術(shù)中無法準(zhǔn)確對(duì)數(shù)據(jù)進(jìn)行自動(dòng)化識(shí)別分類分級(jí)的問題。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的方法,其特征在于,所述方法具體包括:
2.根據(jù)權(quán)利要求1所述自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的方法,其特征在于,所述對(duì)所述數(shù)據(jù)源進(jìn)行預(yù)處理,以確定數(shù)據(jù)資源,包括;
3.根據(jù)權(quán)利要求1所述自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的方法,其特征在于,所述識(shí)別模型為融入卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型;
4.根據(jù)權(quán)利要求1所述自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的方法,其特征在于,所述基于分類模型對(duì)所述識(shí)別數(shù)據(jù)進(jìn)行分類,得到分類數(shù)據(jù),包括:
5.根據(jù)權(quán)利要求1所述自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的方法,其特征在于,所述基于分級(jí)模型對(duì)所述分類數(shù)據(jù)進(jìn)行分級(jí),得到分級(jí)數(shù)據(jù),包括:
6.根據(jù)權(quán)利要求5所述自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的方法,其特征在于,所述基于分級(jí)模型對(duì)所述分類數(shù)據(jù)進(jìn)行分級(jí),得到分級(jí)數(shù)據(jù),還包括:
7.根據(jù)權(quán)利要求1所述自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的方法,其特征在于,所述為每個(gè)所述分級(jí)數(shù)據(jù)建立標(biāo)簽,得到標(biāo)簽數(shù)據(jù),包括:
8.一種自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的系統(tǒng),其特征在于,包括:
10.一種非暫態(tài)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中的任一項(xiàng)所述的方法的步驟。
...【技術(shù)特征摘要】
1.一種自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的方法,其特征在于,所述方法具體包括:
2.根據(jù)權(quán)利要求1所述自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的方法,其特征在于,所述對(duì)所述數(shù)據(jù)源進(jìn)行預(yù)處理,以確定數(shù)據(jù)資源,包括;
3.根據(jù)權(quán)利要求1所述自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的方法,其特征在于,所述識(shí)別模型為融入卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型;
4.根據(jù)權(quán)利要求1所述自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的方法,其特征在于,所述基于分類模型對(duì)所述識(shí)別數(shù)據(jù)進(jìn)行分類,得到分類數(shù)據(jù),包括:
5.根據(jù)權(quán)利要求1所述自動(dòng)化進(jìn)行數(shù)據(jù)識(shí)別分類分級(jí)的方法,其特征在于,所述基于分級(jí)模型對(duì)所述分類數(shù)據(jù)進(jìn)行分級(jí),得到分級(jí)數(shù)據(jù),包括:
6.根據(jù)權(quán)利要求5所述...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:劉曉光,
申請(qǐng)(專利權(quán))人:北京煉石網(wǎng)絡(luò)技術(shù)有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。