【技術實現(xiàn)步驟摘要】
一種城市體檢指標知識圖譜構建方法及系統(tǒng)
[0001]本專利技術涉及知識圖譜領域,尤其涉及一種城市體檢指標知識圖譜構建方法及系統(tǒng)。
技術介紹
[0002]國土空間規(guī)劃城市體檢評估(以下簡稱“城市體檢”),是指按照“一年一體檢、五年一評估”的方式,對城市發(fā)展階段特征及總體規(guī)劃實施效果定期進行分析和評價。傳統(tǒng)的通過關系數(shù)據(jù)庫存儲城市體檢資源條目的方式,難以準確表達指標與安全、創(chuàng)新、協(xié)調(diào)、綠色、開放、共享城市體檢六大維度間的關聯(lián)強度,不便于指標間關聯(lián)關系計算。且關系數(shù)據(jù)庫在進行多層嵌套連接檢索時,存在耗時長,性能低等問題。
[0003]上述內(nèi)容僅用于輔助理解本專利技術的技術方案,并不代表承認上述內(nèi)容是現(xiàn)有技術。
技術實現(xiàn)思路
[0004]本專利技術的主要目的在于,解決現(xiàn)有技術中,關系數(shù)據(jù)庫存儲城市體檢資源條目檢索性能低,難以挖掘指標間關聯(lián)性的問題。
[0005]為實現(xiàn)上述目的,本專利技術提供一種城市體檢指標知識圖譜構建方法,包括:S1:獲取城市體檢指標數(shù)據(jù),抽取所述城市體檢指標數(shù)據(jù)中的知識三元組,對所述知識三元組進行第一次融合,獲得指標實體集合、指標類目實體集合和指標屬于指標類目關系集合;S2:對所述指標類目實體集合進行第二次融合,獲得融合后的指標類目實體集合;步驟S2具體為:S21:計算獲取所述指標實體集合的第一分類向量和第二分類向量;S22:通過所述第一分類向量、所述第二分類向量和所述指標屬于指標類目關系集合,計算獲得所述指標類目實體集合的所有第一向量和所有第二向量;S23:通過所有所述第 ...
【技術保護點】
【技術特征摘要】
1.一種城市體檢指標知識圖譜構建方法,其特征在于,包括:S1:獲取城市體檢指標數(shù)據(jù),抽取所述城市體檢指標數(shù)據(jù)中的知識三元組,對所述知識三元組進行第一次融合,獲得指標實體集合、指標類目實體集合和指標屬于指標類目關系集合;S2:對所述指標類目實體集合進行第二次融合,獲得融合后的指標類目實體集合;步驟S2具體為:S21:計算獲取所述指標實體集合的第一分類向量和第二分類向量;S22:通過所述第一分類向量、所述第二分類向量和所述指標屬于指標類目關系集合,計算獲得所述指標類目實體集合的所有第一向量和所有第二向量;S23:通過所有所述第一向量和所有所述第二向量,對所述指標類目實體集合進行第二次融合,獲得所述融合后的指標類目實體集合;S3:建立所述指標實體集合中,各指標實體之間的關聯(lián)關系;S4:通過所述指標實體集合、所述融合后的指標類目實體集合、指標實體之間的關聯(lián)關系集合和所述指標屬于指標類目關系集合,構建城市體檢指標知識圖譜。2.根據(jù)權利要求1所述的城市體檢指標知識圖譜構建方法,其特征在于,步驟S21具體為:S211:所述指標實體集合中的各項指標實體的屬性包括:指標名稱屬性、數(shù)值大小屬性和數(shù)值單位屬性,將所述指標實體的指標名稱屬性值分為n=6個分類進行標注;S212:對標注后的指標實體的指標名稱屬性值進行深度學習訓練和模型調(diào)優(yōu),獲得訓練好的指標名稱分類模型;S213:去除所述訓練好的指標名稱分類模型的頂層softmax層,對所述指標實體集合中各指標實體的指標名稱進行推理,獲得第一分類向量=[x
i1, x
i2
……
x
in
],其中i表示指標實體的編號,x
ij
表示指標實體是第j分類的概率,j為[1,n]之間的整數(shù),n表示分類的總數(shù);S214:獲取所述第一分類向量中的最大項,將所述最大項x
ij
對應的j的分類記作第一分類,將所述第一分類向量和第一分類保存至指標實體的屬性中;S215:將n設置為23,重復步驟S211
?
S214,獲得所述第二分類向量和第二分類,將所述第二分類向量和第二分類保存至指標實體的屬性中。3.根據(jù)權利要求1所述的城市體檢指標知識圖譜構建方法,其特征在于,步驟S22具體為:S221:所述指標類目實體集合記為M(item),包含的指標類目實體個數(shù)為N(item),選取某一指標類目實體,通過所述指標屬于指標類目關系,獲取屬于該指標類目實體的所有指標實體及該指標實體的第一分類向量;S222:將所述第一分類向量按行排列為矩陣A,表達式為:其中,m表示指標實體的總數(shù),n表示分類的總數(shù),x
mn
表示指標實體m是第n分類的概率,表示指標實體m的第一分類向量;
S223:將該指標類目實體的第一向量記為,表達式為:其中,k表示指標實體的編號的計數(shù);S224:將步驟S221
?
S223共迭代N(item)次,獲取所述指標類目實體集合的所有第一向量;S225:選取某一指標類目實體,通過所述指標屬于指標類目關系,獲取屬于該指標類目實體的指標實體及該指標實體的第二分類向量,重復步驟S222
?
S224,獲取所述指標類目實體集合的所有第二向量。4.根據(jù)權利要求1所述的城市體檢指標知識圖譜構建方法,其特征在于,步驟S23具體為:S231:計算各所述第二向量間的余弦相似度,共執(zhí)行次余弦相似度計算,獲得個指標類目實體之間的第二相似度;S232:對于所述第二相似度大于預設閾值k1的兩個指標類目實體,計算兩者的第一向量間的余弦相似度作為第一相似度,對于所述第一相似度大于預設閾值k2的兩個指標類目實體進行合并,完成所述第二次融合。5.根據(jù)權利要求1所述的城市體檢指標知識圖譜構建方法,其特征在于,步驟S3具體為:S31:將所述指標實體集合記為M(indicator),包含的指標實體的數(shù)量記為N(indicator),計算各所述指標實體之間的關聯(lián)強度;S32:通過所述關聯(lián)強度獲取關聯(lián)指標對集合M(pair)
’
;S33:對所述關聯(lián)指標對集合M(pair)
’
進行簡化,獲得簡化后的關聯(lián)指標對集合M(pair);S34:通過所述簡化后的關聯(lián)指標對集合M(pair)建立各所述指標實體之間的關聯(lián)關系。6.根據(jù)權利要求5所述的城市體檢指標知識圖譜構建方法,其特征在于,步驟S31具體為:S311:對于編號為x和y的兩個指標實體,通過深度學習模型獲取指標實體x和指標實體y的指標名稱語義相似度;獲得指標實體x的第一分類向量和第二分類向量,以及指標實體y的第一分類向量和第二分類向量;S312:若指標實體x與指標實體y具有相同的第二分類向量,則指標分類相似度為1;若指標實體x和指標實體y的第二分類向量不同,但第一分類向量相同,則指標分類相似度為0.5;若指標實體x和指標實體y的第一分類向量和第二分類向量均不同,則指標分類相似度為0;S313:將指標實體x的數(shù)值大小屬性值記為val(x),將指標實體y的數(shù)值大小屬性值記
為val(y),x與y的指標數(shù)值大小相似度的計算公式如下:S314:建立中英文映射表,將指標實體x和指標實體y的數(shù)值單位屬性值轉(zhuǎn)換為中文,將所述轉(zhuǎn)換為中文的數(shù)值單位標記為領域,若指標實體x的數(shù)值單位和指標實體y的數(shù)值單位屬于同一領域,則指標數(shù)值單位相似度為指標實體x和指標實體y的轉(zhuǎn)換為中文的數(shù)值單位間的字符相似度;否則指標數(shù)值單位相似度為0;S315:計算獲得所述關聯(lián)強度,計算公式如下:...
【專利技術屬性】
技術研發(fā)人員:李穎,陳勝鵬,劉高,
申請(專利權)人:武大吉奧信息技術有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。