本發(fā)明專利技術(shù)提供了一種空間大數(shù)據(jù)治理方法及系統(tǒng),該方法包括以下步驟:S1:根據(jù)不同類型的空間大數(shù)據(jù)的數(shù)據(jù)特征,構(gòu)建元數(shù)據(jù)模型;S2:構(gòu)建半監(jiān)督學(xué)習(xí)模型,獲取歷史空間大數(shù)據(jù)作為訓(xùn)練集,并對(duì)半監(jiān)督學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到空間大數(shù)據(jù)分類模型;S3:根據(jù)空間大數(shù)據(jù)模型對(duì)空間大數(shù)據(jù)進(jìn)行分類,并根據(jù)元數(shù)據(jù)模型,對(duì)空間大數(shù)據(jù)進(jìn)行重新定義。本發(fā)明專利技術(shù)提供的一種空間大數(shù)據(jù)治理方法及系統(tǒng),能夠利用半監(jiān)督學(xué)習(xí)訓(xùn)練一個(gè)空間大數(shù)據(jù)標(biāo)簽分類模型,從而對(duì)無(wú)標(biāo)簽的空間大數(shù)據(jù)進(jìn)行標(biāo)簽分類,進(jìn)而在統(tǒng)一的空間大數(shù)據(jù)的元數(shù)據(jù)模型的基礎(chǔ)上,生成相應(yīng)的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲(chǔ)。
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)屬于國(guó)土空間數(shù)據(jù)處理,具體涉及一種空間大數(shù)據(jù)治理方法及系統(tǒng)。
技術(shù)介紹
1、我國(guó)空間數(shù)據(jù)治理在實(shí)踐中存在諸多困難和問(wèn)題,主要表現(xiàn)在以下2個(gè)方面。
2、一是目錄局限性問(wèn)題,目前尚未形成科學(xué)、法定的全域、全要素、全局性、全過(guò)程的國(guó)土空間數(shù)據(jù)目錄體系。目前尚未形成科學(xué)、法定的全域、全要素、全局性、全過(guò)程的國(guó)土空間數(shù)據(jù)目錄體系。國(guó)土空間數(shù)據(jù)目錄編制是數(shù)據(jù)統(tǒng)一管理的基礎(chǔ)也是進(jìn)行數(shù)據(jù)治理的依據(jù),在明確數(shù)據(jù)血緣關(guān)系上發(fā)揮著不可替代的作用。
3、二是數(shù)據(jù)關(guān)聯(lián)性問(wèn)題。空間數(shù)據(jù)特別是土地等核心數(shù)據(jù),在隨業(yè)務(wù)流轉(zhuǎn)過(guò)程中,由于業(yè)務(wù)內(nèi)容和使用需求不同,遵循的業(yè)務(wù)標(biāo)準(zhǔn)規(guī)范不同,導(dǎo)致數(shù)據(jù)結(jié)構(gòu)、屬性內(nèi)容不斷變化,數(shù)據(jù)不斷再加工,從而產(chǎn)生了同一國(guó)土空間數(shù)據(jù)在不同業(yè)務(wù)條線中信息不同的問(wèn)題,甚至存在相同業(yè)務(wù)不同年份數(shù)據(jù)由于數(shù)據(jù)結(jié)構(gòu)和業(yè)務(wù)鏈條變化,無(wú)法支撐長(zhǎng)時(shí)間序列數(shù)據(jù)聯(lián)動(dòng)應(yīng)用等情況。?在這一問(wèn)題影響下,單個(gè)部門的信息化程度越高、標(biāo)準(zhǔn)規(guī)范執(zhí)行越嚴(yán)格,與其他部門的數(shù)據(jù)協(xié)同應(yīng)用就越存在困難。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)提供的一種空間大數(shù)據(jù)治理方法及系統(tǒng),能夠利用半監(jiān)督學(xué)習(xí)訓(xùn)練一個(gè)空間大數(shù)據(jù)標(biāo)簽分類模型,從而對(duì)無(wú)標(biāo)簽的空間大數(shù)據(jù)進(jìn)行標(biāo)簽分類,進(jìn)而在統(tǒng)一的空間大數(shù)據(jù)的元數(shù)據(jù)模型的基礎(chǔ)上,生成相應(yīng)的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲(chǔ),能夠克服上述現(xiàn)有技術(shù)中存在的問(wèn)題。
2、本專利技術(shù)解決上述技術(shù)問(wèn)題的技術(shù)方案如下:
3、第一方面,本專利技術(shù)提供了一種空間大數(shù)據(jù)治理方法,包括以下步驟:p>4、s1:根據(jù)不同類型的空間大數(shù)據(jù)的數(shù)據(jù)特征,構(gòu)建元數(shù)據(jù)模型;
5、s2:構(gòu)建半監(jiān)督學(xué)習(xí)模型,獲取歷史空間大數(shù)據(jù)作為訓(xùn)練集,并對(duì)半監(jiān)督學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到空間大數(shù)據(jù)分類模型;
6、s3:根據(jù)空間大數(shù)據(jù)模型對(duì)空間大數(shù)據(jù)進(jìn)行分類,并根據(jù)元數(shù)據(jù)模型,對(duì)空間大數(shù)據(jù)進(jìn)行重新定義。
7、在一些實(shí)施例中,所述s1包括:
8、s11:提取空間大數(shù)據(jù)的數(shù)據(jù)特征;
9、s12:將數(shù)據(jù)特征中的時(shí)空信息作為固有性元數(shù)據(jù),空間數(shù)據(jù)的來(lái)源以及數(shù)據(jù)類型作為管理性元數(shù)據(jù),空間數(shù)據(jù)的業(yè)務(wù)內(nèi)容作為描述性元數(shù)據(jù),構(gòu)建元數(shù)據(jù)模型。
10、在一些實(shí)施例中,所述s2還包括:
11、s21:將歷史空間大數(shù)據(jù)中帶有時(shí)空信息標(biāo)簽的數(shù)據(jù)作為初始訓(xùn)練集,對(duì)初始分類模型進(jìn)行訓(xùn)練;
12、s22:利用初始分類模型對(duì)無(wú)標(biāo)簽的空間大數(shù)據(jù)進(jìn)行預(yù)測(cè),計(jì)算無(wú)標(biāo)簽的空間大數(shù)據(jù)中各數(shù)據(jù)屬于每個(gè)標(biāo)簽的概率;
13、s23:預(yù)設(shè)一個(gè)概率閾值,對(duì)高于概率閾值的無(wú)標(biāo)簽數(shù)據(jù)賦予一個(gè)標(biāo)簽,并添加到初始訓(xùn)練集,形成自學(xué)習(xí)訓(xùn)練集;
14、s24:利用自學(xué)習(xí)訓(xùn)練集對(duì)初始分類模型重新訓(xùn)練,獲得空間大數(shù)據(jù)分類模型。
15、在一些實(shí)施例中,所述“對(duì)高于概率閾值的無(wú)標(biāo)簽數(shù)據(jù)賦予一個(gè)標(biāo)簽”包括:
16、s231:預(yù)設(shè)一個(gè)概率閾值,將所述s22中獲取的各數(shù)據(jù)對(duì)應(yīng)每個(gè)標(biāo)簽的概率與概率閾值進(jìn)行比較,并將各數(shù)據(jù)對(duì)應(yīng)每個(gè)標(biāo)簽的概率中大于概率閾值且概率最大的標(biāo)簽分配到對(duì)應(yīng)的數(shù)據(jù);
17、s232:將分配到標(biāo)簽的數(shù)據(jù)添加到初始訓(xùn)練集,形成自學(xué)習(xí)訓(xùn)練集。
18、第二方面,本專利技術(shù)提供了一種空間大數(shù)據(jù)治理系統(tǒng),包括:
19、元數(shù)據(jù)模型構(gòu)建模塊,用于根據(jù)不同類型的空間大數(shù)據(jù)的數(shù)據(jù)特征,構(gòu)建元數(shù)據(jù)模型;
20、分類模型構(gòu)建模塊,用于構(gòu)建半監(jiān)督學(xué)習(xí)模型,獲取歷史空間大數(shù)據(jù)作為訓(xùn)練集,并對(duì)半監(jiān)督學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到空間大數(shù)據(jù)分類模型;
21、數(shù)據(jù)分類定義模塊,用于根據(jù)空間大數(shù)據(jù)模型對(duì)空間大數(shù)據(jù)進(jìn)行分類,并根據(jù)元數(shù)據(jù)模型,對(duì)空間大數(shù)據(jù)進(jìn)行重新定義。
22、在一些實(shí)施例中,所述元數(shù)據(jù)模型構(gòu)建模塊包括:
23、數(shù)據(jù)特征提取子模塊,用于提取空間大數(shù)據(jù)的數(shù)據(jù)特征;
24、元數(shù)據(jù)定義子模塊,用于將數(shù)據(jù)特征中的時(shí)空信息作為固有性元數(shù)據(jù),空間數(shù)據(jù)的來(lái)源以及數(shù)據(jù)類型作為管理性元數(shù)據(jù),空間數(shù)據(jù)的業(yè)務(wù)內(nèi)容作為描述性元數(shù)據(jù),構(gòu)建元數(shù)據(jù)模型。
25、在一些實(shí)施例中,所述分類模型構(gòu)建模塊包括:
26、初始分類模型訓(xùn)練子模塊,用于將歷史空間大數(shù)據(jù)中帶有時(shí)空信息標(biāo)簽的數(shù)據(jù)作為初始訓(xùn)練集,對(duì)初始分類模型進(jìn)行訓(xùn)練;
27、標(biāo)簽預(yù)測(cè)子模塊,用于利用初始分類模型對(duì)無(wú)標(biāo)簽的空間大數(shù)據(jù)進(jìn)行預(yù)測(cè),計(jì)算無(wú)標(biāo)簽的空間大數(shù)據(jù)中各數(shù)據(jù)屬于每個(gè)標(biāo)簽的概率;
28、訓(xùn)練集擴(kuò)充子模塊,用于選擇一個(gè)概率閾值,對(duì)高于概率閾值的無(wú)標(biāo)簽數(shù)據(jù)賦予一個(gè)標(biāo)簽,并添加到初始訓(xùn)練集,形成自學(xué)習(xí)訓(xùn)練集;
29、自訓(xùn)練子模塊,用于利用自學(xué)習(xí)訓(xùn)練集對(duì)初始分類模型重新訓(xùn)練,獲得空間大數(shù)據(jù)分類模型。
30、在一些實(shí)施例中,所述訓(xùn)練集擴(kuò)充子模塊包括:
31、標(biāo)簽分配單元,用于預(yù)設(shè)一個(gè)概率閾值,將所述標(biāo)簽預(yù)測(cè)子模塊中獲取的各數(shù)據(jù)對(duì)應(yīng)每個(gè)標(biāo)簽的概率與概率閾值進(jìn)行比較,并將各數(shù)據(jù)對(duì)應(yīng)每個(gè)標(biāo)簽的概率中大于概率閾值且概率最大的標(biāo)簽分配到對(duì)應(yīng)的數(shù)據(jù);
32、自學(xué)習(xí)訓(xùn)練集生成單元,用于將分配到標(biāo)簽的數(shù)據(jù)添加到初始訓(xùn)練集,形成自學(xué)習(xí)訓(xùn)練集。
33、第三方面,本專利技術(shù)提供了一種計(jì)算機(jī),包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上述任意一項(xiàng)所述的計(jì)算方法。
34、第四方面,本專利技術(shù)提供了一種可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上述任意一項(xiàng)所述的計(jì)算方法。
35、本申請(qǐng)的有益效果是:
36、本申請(qǐng)?zhí)峁┑囊环N空間大數(shù)據(jù)治理方法及系統(tǒng),能夠利用半監(jiān)督學(xué)習(xí)訓(xùn)練一個(gè)空間大數(shù)據(jù)標(biāo)簽分類模型,從而對(duì)無(wú)標(biāo)簽的空間大數(shù)據(jù)進(jìn)行標(biāo)簽分類,進(jìn)而在統(tǒng)一的空間大數(shù)據(jù)的元數(shù)據(jù)模型的基礎(chǔ)上,生成相應(yīng)的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲(chǔ)。
本文檔來(lái)自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種空間大數(shù)據(jù)治理方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種空間大數(shù)據(jù)治理方法,其特征在于,所述S1包括:
3.根據(jù)權(quán)利要求1所述的一種空間大數(shù)據(jù)治理方法,其特征在于,所述S2還包括:
4.根據(jù)權(quán)利要求3所述的一種空間大數(shù)據(jù)治理方法,其特征在于,所述“對(duì)高于概率閾值的無(wú)標(biāo)簽數(shù)據(jù)賦予一個(gè)標(biāo)簽”包括:
5.一種空間大數(shù)據(jù)治理系統(tǒng),其特征在于,包括:
6.根據(jù)權(quán)利要求5所述的一種空間大數(shù)據(jù)治理系統(tǒng),其特征在于,所述元數(shù)據(jù)模型構(gòu)建模塊包括:
7.根據(jù)權(quán)利要求5所述的一種空間大數(shù)據(jù)治理系統(tǒng),其特征在于,所述分類模型構(gòu)建模塊包括:
8.根據(jù)權(quán)利要求7所述的一種空間大數(shù)據(jù)治理系統(tǒng),其特征在于,所述訓(xùn)練集擴(kuò)充子模塊包括:
9.一種計(jì)算機(jī),包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至4中任意一項(xiàng)所述的計(jì)算方法。
10.一種可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至4中任意一項(xiàng)所述的計(jì)算方法。
...
【技術(shù)特征摘要】
1.一種空間大數(shù)據(jù)治理方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種空間大數(shù)據(jù)治理方法,其特征在于,所述s1包括:
3.根據(jù)權(quán)利要求1所述的一種空間大數(shù)據(jù)治理方法,其特征在于,所述s2還包括:
4.根據(jù)權(quán)利要求3所述的一種空間大數(shù)據(jù)治理方法,其特征在于,所述“對(duì)高于概率閾值的無(wú)標(biāo)簽數(shù)據(jù)賦予一個(gè)標(biāo)簽”包括:
5.一種空間大數(shù)據(jù)治理系統(tǒng),其特征在于,包括:
6.根據(jù)權(quán)利要求5所述的一種空間大數(shù)據(jù)治理系統(tǒng),其特征在于,所述元數(shù)據(jù)模型構(gòu)建模塊包括:
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:張婕,向煜,華媛媛,韓熙,黃志,黃令,何波,唐時(shí)蕎,孟云豪,李奎君,向譚先,宦臣,周林秋,黃國(guó)洪,胡長(zhǎng)青,
申請(qǐng)(專利權(quán))人:重慶數(shù)字城市科技有限公司,
類型:發(fā)明
國(guó)別省市:
還沒(méi)有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。