• 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種城市體檢指標知識圖譜構建方法及系統(tǒng)技術方案

    技術編號:31814076 閱讀:47 留言:0更新日期:2022-01-08 11:17
    本發(fā)明專利技術涉及知識圖譜領域,提供一種城市體檢指標知識圖譜構建方法及系統(tǒng),包括:對知識三元組進行第一次融合,獲得指標實體集合、指標類目實體集合和指標屬于指標類目關系集合;對指標類目實體集合進行第二次融合,獲得融合后的指標類目實體集合;建立指標實體集合中,各指標實體之間的關聯(lián)關系;通過指標實體集合、融合后的指標類目實體集合、指標實體之間的關聯(lián)關系集合和指標屬于指標類目關系集合,構建城市體檢指標知識圖譜。本發(fā)明專利技術通過圖結構存儲城市體檢指標,提高了城市體檢指標檢索效率,便于指標推薦,有助于城市體檢工作開展;通過對關聯(lián)指標對集合的簡化,去除了指標實體間的冗余關系,極大提高圖數(shù)據(jù)庫關系搜索效率。極大提高圖數(shù)據(jù)庫關系搜索效率。極大提高圖數(shù)據(jù)庫關系搜索效率。

    【技術實現(xiàn)步驟摘要】
    一種城市體檢指標知識圖譜構建方法及系統(tǒng)


    [0001]本專利技術涉及知識圖譜領域,尤其涉及一種城市體檢指標知識圖譜構建方法及系統(tǒng)。

    技術介紹

    [0002]國土空間規(guī)劃城市體檢評估(以下簡稱“城市體檢”),是指按照“一年一體檢、五年一評估”的方式,對城市發(fā)展階段特征及總體規(guī)劃實施效果定期進行分析和評價。傳統(tǒng)的通過關系數(shù)據(jù)庫存儲城市體檢資源條目的方式,難以準確表達指標與安全、創(chuàng)新、協(xié)調(diào)、綠色、開放、共享城市體檢六大維度間的關聯(lián)強度,不便于指標間關聯(lián)關系計算。且關系數(shù)據(jù)庫在進行多層嵌套連接檢索時,存在耗時長,性能低等問題。
    [0003]上述內(nèi)容僅用于輔助理解本專利技術的技術方案,并不代表承認上述內(nèi)容是現(xiàn)有技術。

    技術實現(xiàn)思路

    [0004]本專利技術的主要目的在于,解決現(xiàn)有技術中,關系數(shù)據(jù)庫存儲城市體檢資源條目檢索性能低,難以挖掘指標間關聯(lián)性的問題。
    [0005]為實現(xiàn)上述目的,本專利技術提供一種城市體檢指標知識圖譜構建方法,包括:S1:獲取城市體檢指標數(shù)據(jù),抽取所述城市體檢指標數(shù)據(jù)中的知識三元組,對所述知識三元組進行第一次融合,獲得指標實體集合、指標類目實體集合和指標屬于指標類目關系集合;S2:對所述指標類目實體集合進行第二次融合,獲得融合后的指標類目實體集合;步驟S2具體為:S21:計算獲取所述指標實體集合的第一分類向量和第二分類向量;S22:通過所述第一分類向量、所述第二分類向量和所述指標屬于指標類目關系集合,計算獲得所述指標類目實體集合的所有第一向量和所有第二向量;S23:通過所有所述第一向量和所有所述第二向量,對所述指標類目實體集合進行第二次融合,獲得所述融合后的指標類目實體集合;S3:建立所述指標實體集合中,各指標實體之間的關聯(lián)關系;S4:通過所述指標實體集合、所述融合后的指標類目實體集合、指標實體之間的關聯(lián)關系集合和所述指標屬于指標類目關系集合,構建城市體檢指標知識圖譜。
    [0006]優(yōu)選地,步驟S21具體為:S211:所述指標實體集合中的各項指標實體的屬性包括:指標名稱屬性、數(shù)值大小屬性和數(shù)值單位屬性,將所述指標實體的指標名稱屬性值分為n=6個分類進行標注;S212:對標注后的指標實體的指標名稱屬性值進行深度學習訓練和模型調(diào)優(yōu),獲得訓練好的指標名稱分類模型;S213:去除所述訓練好的指標名稱分類模型的頂層softmax層,對所述指標實體集
    合中各指標實體的指標名稱進行推理,獲得第一分類向量=[x
    i1, x
    i2
    ……
    x
    in
    ],其中i表示指標實體的編號,x
    ij
    表示指標實體是第j分類的概率,j為[1,n]之間的整數(shù),n表示分類的總數(shù);S214:獲取所述第一分類向量中的最大項,將所述最大項x
    ij
    對應的j的分類記作第一分類,將所述第一分類向量和第一分類保存至指標實體的屬性中;S215:將n設置為23,重復步驟S211
    ?
    S214,獲得所述第二分類向量和第二分類,將所述第二分類向量和第二分類保存至指標實體的屬性中。
    [0007]優(yōu)選地,步驟S22具體為:S221:所述指標類目實體集合記為M(item),包含的指標類目實體個數(shù)為N(item),選取某一指標類目實體,通過所述指標屬于指標類目關系,獲取屬于該指標類目實體的所有指標實體及該指標實體的第一分類向量;S222:將所述第一分類向量按行排列為矩陣A,表達式為:其中,m表示指標實體的總數(shù),n表示分類的總數(shù),x
    mn
    表示指標實體m是第n分類的概率,表示指標實體m的第一分類向量;S223:將該指標類目實體的第一向量記為,表達式為:其中,k表示指標實體的編號的計數(shù);S224:將步驟S221
    ?
    S223共迭代N(item)次,獲取所述指標類目實體集合的所有第一向量;S225:選取某一指標類目實體,通過所述指標屬于指標類目關系,獲取屬于該指標類目實體的指標實體及該指標實體的第二分類向量,重復步驟S222
    ?
    S224,獲取所述指標類目實體集合的所有第二向量。
    [0008]優(yōu)選地,步驟S23具體為:S231:計算各所述第二向量間的余弦相似度,共執(zhí)行次余弦相似度計算,獲得個指標類目實體之間的第二相似度;S232:對于所述第二相似度大于預設閾值k1的兩個指標類目實體,計算兩者的第一向量間的余弦相似度作為第一相似度,對于所述第一相似度大于預設閾值k2的兩個指標類目實體進行合并,完成所述第二次融合。
    [0009]優(yōu)選地,步驟S3具體為:S31:將所述指標實體集合記為M(indicator),包含的指標實體的數(shù)量記為N(indicator),計算各所述指標實體之間的關聯(lián)強度;S32:通過所述關聯(lián)強度獲取關聯(lián)指標對集合M(pair)


    S33:對所述關聯(lián)指標對集合M(pair)

    進行簡化,獲得簡化后的關聯(lián)指標對集合M(pair);S34:通過所述簡化后的關聯(lián)指標對集合M(pair)建立各所述指標實體之間的關聯(lián)關系。
    [0010]優(yōu)選地,步驟S31具體為:S311:對于編號為x和y的兩個指標實體,通過深度學習模型獲取指標實體x和指標實體y的指標名稱語義相似度;獲得指標實體x的第一分類向量和第二分類向量,以及指標實體y的第一分類向量和第二分類向量;S312:若指標實體x與指標實體y具有相同的第二分類向量,則指標分類相似度為1;若指標實體x和指標實體y的第二分類向量不同,但第一分類向量相同,則指標分類相似度為0.5;若指標實體x和指標實體y的第一分類向量和第二分類向量均不同,則指標分類相似度為0;S313:將指標實體x的數(shù)值大小屬性值記為val(x),將指標實體y的數(shù)值大小屬性值記為val(y),x與y的指標數(shù)值大小相似度的計算公式如下:S314:建立中英文映射表,將指標實體x和指標實體y的數(shù)值單位屬性值轉(zhuǎn)換為中文,將所述轉(zhuǎn)換為中文的數(shù)值單位標記為領域,若指標實體x的數(shù)值單位和指標實體y的數(shù)值單位屬于同一領域,則指標數(shù)值單位相似度為指標實體x和指標實體y的轉(zhuǎn)換為中文的數(shù)值單位間的字符相似度;否則指標數(shù)值單位相似度為0;S315:計算獲得所述關聯(lián)強度,計算公式如下:關聯(lián)強度S(x,y) = a*指標名稱語義相似度+b*指標分類相似度+c*指標數(shù)值大小相似度+d*指標數(shù)值單位相似度其中,a、b、c和d均為預設的權重,a+b+c+d=1,且a,b,c,d∈(0,1)。
    [0011]優(yōu)選地,步驟S32具體為:S321:將關聯(lián)指標對集合記為M(pair)

    ,M(pair)

    為若干個指標實體集合M(indicator)的子集的集合,將M(pair)

    中包含的M(indicator)的子集個數(shù)記作N(M(pair)

    );令指標實體的編號為z,z的初始值為1,將第z項指標實體記為Mz,Mz∈M(indicator);S322:若z的值小于N(indicator)則進入步驟S323,否則輸本文檔來自技高網(wǎng)
    ...

    【技術保護點】

    【技術特征摘要】
    1.一種城市體檢指標知識圖譜構建方法,其特征在于,包括:S1:獲取城市體檢指標數(shù)據(jù),抽取所述城市體檢指標數(shù)據(jù)中的知識三元組,對所述知識三元組進行第一次融合,獲得指標實體集合、指標類目實體集合和指標屬于指標類目關系集合;S2:對所述指標類目實體集合進行第二次融合,獲得融合后的指標類目實體集合;步驟S2具體為:S21:計算獲取所述指標實體集合的第一分類向量和第二分類向量;S22:通過所述第一分類向量、所述第二分類向量和所述指標屬于指標類目關系集合,計算獲得所述指標類目實體集合的所有第一向量和所有第二向量;S23:通過所有所述第一向量和所有所述第二向量,對所述指標類目實體集合進行第二次融合,獲得所述融合后的指標類目實體集合;S3:建立所述指標實體集合中,各指標實體之間的關聯(lián)關系;S4:通過所述指標實體集合、所述融合后的指標類目實體集合、指標實體之間的關聯(lián)關系集合和所述指標屬于指標類目關系集合,構建城市體檢指標知識圖譜。2.根據(jù)權利要求1所述的城市體檢指標知識圖譜構建方法,其特征在于,步驟S21具體為:S211:所述指標實體集合中的各項指標實體的屬性包括:指標名稱屬性、數(shù)值大小屬性和數(shù)值單位屬性,將所述指標實體的指標名稱屬性值分為n=6個分類進行標注;S212:對標注后的指標實體的指標名稱屬性值進行深度學習訓練和模型調(diào)優(yōu),獲得訓練好的指標名稱分類模型;S213:去除所述訓練好的指標名稱分類模型的頂層softmax層,對所述指標實體集合中各指標實體的指標名稱進行推理,獲得第一分類向量=[x
    i1, x
    i2
    ……
    x
    in
    ],其中i表示指標實體的編號,x
    ij
    表示指標實體是第j分類的概率,j為[1,n]之間的整數(shù),n表示分類的總數(shù);S214:獲取所述第一分類向量中的最大項,將所述最大項x
    ij
    對應的j的分類記作第一分類,將所述第一分類向量和第一分類保存至指標實體的屬性中;S215:將n設置為23,重復步驟S211
    ?
    S214,獲得所述第二分類向量和第二分類,將所述第二分類向量和第二分類保存至指標實體的屬性中。3.根據(jù)權利要求1所述的城市體檢指標知識圖譜構建方法,其特征在于,步驟S22具體為:S221:所述指標類目實體集合記為M(item),包含的指標類目實體個數(shù)為N(item),選取某一指標類目實體,通過所述指標屬于指標類目關系,獲取屬于該指標類目實體的所有指標實體及該指標實體的第一分類向量;S222:將所述第一分類向量按行排列為矩陣A,表達式為:其中,m表示指標實體的總數(shù),n表示分類的總數(shù),x
    mn
    表示指標實體m是第n分類的概率,表示指標實體m的第一分類向量;
    S223:將該指標類目實體的第一向量記為,表達式為:其中,k表示指標實體的編號的計數(shù);S224:將步驟S221
    ?
    S223共迭代N(item)次,獲取所述指標類目實體集合的所有第一向量;S225:選取某一指標類目實體,通過所述指標屬于指標類目關系,獲取屬于該指標類目實體的指標實體及該指標實體的第二分類向量,重復步驟S222
    ?
    S224,獲取所述指標類目實體集合的所有第二向量。4.根據(jù)權利要求1所述的城市體檢指標知識圖譜構建方法,其特征在于,步驟S23具體為:S231:計算各所述第二向量間的余弦相似度,共執(zhí)行次余弦相似度計算,獲得個指標類目實體之間的第二相似度;S232:對于所述第二相似度大于預設閾值k1的兩個指標類目實體,計算兩者的第一向量間的余弦相似度作為第一相似度,對于所述第一相似度大于預設閾值k2的兩個指標類目實體進行合并,完成所述第二次融合。5.根據(jù)權利要求1所述的城市體檢指標知識圖譜構建方法,其特征在于,步驟S3具體為:S31:將所述指標實體集合記為M(indicator),包含的指標實體的數(shù)量記為N(indicator),計算各所述指標實體之間的關聯(lián)強度;S32:通過所述關聯(lián)強度獲取關聯(lián)指標對集合M(pair)

    ;S33:對所述關聯(lián)指標對集合M(pair)

    進行簡化,獲得簡化后的關聯(lián)指標對集合M(pair);S34:通過所述簡化后的關聯(lián)指標對集合M(pair)建立各所述指標實體之間的關聯(lián)關系。6.根據(jù)權利要求5所述的城市體檢指標知識圖譜構建方法,其特征在于,步驟S31具體為:S311:對于編號為x和y的兩個指標實體,通過深度學習模型獲取指標實體x和指標實體y的指標名稱語義相似度;獲得指標實體x的第一分類向量和第二分類向量,以及指標實體y的第一分類向量和第二分類向量;S312:若指標實體x與指標實體y具有相同的第二分類向量,則指標分類相似度為1;若指標實體x和指標實體y的第二分類向量不同,但第一分類向量相同,則指標分類相似度為0.5;若指標實體x和指標實體y的第一分類向量和第二分類向量均不同,則指標分類相似度為0;S313:將指標實體x的數(shù)值大小屬性值記為val(x),將指標實體y的數(shù)值大小屬性值記
    為val(y),x與y的指標數(shù)值大小相似度的計算公式如下:S314:建立中英文映射表,將指標實體x和指標實體y的數(shù)值單位屬性值轉(zhuǎn)換為中文,將所述轉(zhuǎn)換為中文的數(shù)值單位標記為領域,若指標實體x的數(shù)值單位和指標實體y的數(shù)值單位屬于同一領域,則指標數(shù)值單位相似度為指標實體x和指標實體y的轉(zhuǎn)換為中文的數(shù)值單位間的字符相似度;否則指標數(shù)值單位相似度為0;S315:計算獲得所述關聯(lián)強度,計算公式如下:...

    【專利技術屬性】
    技術研發(fā)人員:李穎陳勝鵬劉高
    申請(專利權)人:武大吉奧信息技術有限公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 精品无码一区二区三区爱欲| 亚洲精品无码久久久久| 日韩精品无码一区二区三区免费 | 无码精品人妻一区二区三区免费 | 手机在线观看?v无码片| 亚洲国产精品无码久久久蜜芽| 亚洲av无码专区在线电影天堂| 亚洲AV无码乱码在线观看牲色| 亚洲AV无码一区二区三区牲色| 国产亚洲大尺度无码无码专线| 日韩精品无码成人专区| 亚洲精品无码av片| 一夲道dvd高清无码| 亚洲AV无码久久精品蜜桃| 午夜福利av无码一区二区| 国产精品亚洲а∨无码播放麻豆| 亚洲中文无码线在线观看| 久久亚洲精品成人无码网站| 中文字幕在线无码一区| 久久久久亚洲av无码尤物| 一本大道无码日韩精品影视_| av无码免费一区二区三区| 亚洲AV无码AV吞精久久| 日韩精品久久无码人妻中文字幕| 免费A级毛片无码久久版 | 亚洲动漫精品无码av天堂| 久久久91人妻无码精品蜜桃HD| 免费看无码特级毛片| 麻豆人妻少妇精品无码专区| 亚洲中文字幕久久无码| 亚洲av无码专区国产不乱码 | 亚洲午夜成人精品无码色欲| 亚洲AV无码乱码在线观看富二代 | 亚洲ⅴ国产v天堂a无码二区| 亚洲一区二区三区无码中文字幕| 亚洲v国产v天堂a无码久久| 国产精品无码无卡无需播放器| 亚洲精品无码av天堂| 人妻少妇无码精品视频区| 国产V亚洲V天堂无码久久久| 亚洲av永久无码精品古装片|