System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 夜夜精品无码一区二区三区,国产精品无码免费专区午夜,久久久久成人精品无码中文字幕
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法、系統(tǒng)、設備及介質(zhì)技術方案

    技術編號:44375491 閱讀:2 留言:0更新日期:2025-02-25 09:51
    本發(fā)明專利技術一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法、系統(tǒng)、設備及介質(zhì);所述方法包括,獲取面向能源數(shù)字網(wǎng)絡的各能源數(shù)字對象;將各能源數(shù)字對象的元數(shù)據(jù)中提取的特征屬性進行合并,得到各能源數(shù)字對象的文本語句集合;利用預訓練語言模型,根據(jù)所述文本語句集合提取能源數(shù)字對象的語義特征,并生成對應的語義特征向量;將語義特征向量進行聚類,對最優(yōu)聚類結果中每個簇內(nèi)的能源數(shù)字對象進行兩兩相似性計算,對存在相似性的能源數(shù)字對象組合形成相似能源數(shù)字對象組合集;將相似能源數(shù)字對象組合集中每一個組合內(nèi)的能源數(shù)字對象進行融合構建新的能源數(shù)字對象;實現(xiàn)了跨域能源數(shù)據(jù)的互補。

    【技術實現(xiàn)步驟摘要】

    本專利技術涉及能源數(shù)字處理領域,具體為一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法、系統(tǒng)、設備及介質(zhì)


    技術介紹

    1、數(shù)字對象體系結構(digital?object?architecture,?doa)是現(xiàn)有internet體系結構的一個邏輯擴展,它支持不同系統(tǒng)之間的數(shù)據(jù)互操作需求,而不僅僅是將數(shù)字形式的信息從internet的一個位置傳送到另一個位置。數(shù)字對象體系結構中的基本元素是數(shù)字對象(digital?object),是對任意信息系統(tǒng)數(shù)據(jù)資源的統(tǒng)一抽象。一個完整的數(shù)字對象可以被分為三個部分:標識、元數(shù)據(jù)、實體。其中,標識是數(shù)字對象的唯一身份標記,元數(shù)據(jù)是對數(shù)字對象和應用、業(yè)務相關的描述信息,數(shù)字對象實體是數(shù)據(jù)資源實際的內(nèi)容。基于數(shù)字對象的能源數(shù)字網(wǎng)絡通過設計跨主體數(shù)字對象統(tǒng)一訪問協(xié)議,形成跨主體、跨異構網(wǎng)絡的新型能源數(shù)字網(wǎng)絡,建立了多主體能源數(shù)字對象之間的訪問鏈路,實現(xiàn)能源數(shù)字對象主動接入與尋址訪問,提供平臺化、技術化數(shù)據(jù)流通支撐能力。

    2、能源數(shù)據(jù)規(guī)模大、分布廣、變化快,具有多源異構、數(shù)據(jù)孤島等特征,不同數(shù)據(jù)之間的聯(lián)合查找耗時長、效果差。基于能源數(shù)字對象的封裝,解決了多主體能源數(shù)據(jù)的多源異構問題,能源數(shù)字網(wǎng)絡的構建,解決了多主體能源數(shù)據(jù)之間的數(shù)據(jù)孤島問題,面向能源數(shù)字對象的知識圖譜技術,能夠將能源數(shù)字網(wǎng)絡上的能源數(shù)字對象以及對象間的鏈接關系聚集為知識,使能源數(shù)字對象更易于理解、計算以及應用,并能實現(xiàn)能源數(shù)據(jù)的快速響應和推理。

    3、但在此基礎上,無法解決在能源數(shù)字網(wǎng)絡中進行相似數(shù)據(jù)集識別與融合,從而無法實現(xiàn)能源數(shù)據(jù)的自動發(fā)現(xiàn),極大的影響了能源數(shù)據(jù)的處理和分析效率,尤其是在跨域能源數(shù)據(jù)之間的查找,無法滿足目前準確性和效率的需求。


    技術實現(xiàn)思路

    1、針對現(xiàn)有技術中存在的問題,本專利技術提供一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法、系統(tǒng)、設備及介質(zhì),實現(xiàn)相似能源數(shù)字對象的自動辨識,并以相似能源數(shù)字對象為基礎構建新的能源數(shù)字對象,提供面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)。

    2、本專利技術是通過以下技術方案來實現(xiàn):

    3、本專利技術提供一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法,包括,

    4、獲取面向能源數(shù)字網(wǎng)絡的各能源數(shù)字對象;

    5、將各能源數(shù)字對象的元數(shù)據(jù)中提取的特征屬性進行合并,得到各能源數(shù)字對象的文本語句集合;

    6、利用預訓練語言模型,根據(jù)所述文本語句集合提取能源數(shù)字對象的語義特征,并生成對應的語義特征向量;

    7、將語義特征向量進行聚類,對最優(yōu)聚類結果中每個簇內(nèi)的能源數(shù)字對象進行兩兩相似性計算,對存在相似性的能源數(shù)字對象組合形成相似能源數(shù)字對象組合集;

    8、將相似能源數(shù)字對象組合集中每一個組合內(nèi)的能源數(shù)字對象進行融合構建新的能源數(shù)字對象。

    9、本專利技術還提供一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)系統(tǒng),包括,

    10、獲取模塊,用于獲取面向能源數(shù)字網(wǎng)絡的各能源數(shù)字對象;

    11、特征屬性提取模塊,用于將各能源數(shù)字對象的元數(shù)據(jù)中提取的特征屬性進行合并,得到各能源數(shù)字對象的文本語句集合;

    12、語義特征提取模塊,利用預訓練語言模型,根據(jù)所述文本語句集合提取能源數(shù)字對象的語義特征,并生成對應的語義特征向量;

    13、聚類模塊,將語義特征向量進行聚類,對最優(yōu)聚類結果中每個簇內(nèi)的能源數(shù)字對象進行兩兩相似性計算,對存在相似性的能源數(shù)字對象組合形成相似能源數(shù)字對象組合集;

    14、融合發(fā)現(xiàn)模塊,將相似能源數(shù)字對象組合集中每一個組合內(nèi)的能源數(shù)字對象進行融合構建新的能源數(shù)字對象。

    15、本專利技術還提供一種計算機設備,包括:

    16、存儲器,用于存儲計算機程序;

    17、處理器,用于執(zhí)行所述計算機程序時實現(xiàn)所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法。

    18、本專利技術還提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法。

    19、本專利技術還提供一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時實現(xiàn)所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法的步驟。

    20、與現(xiàn)有技術相比,本專利技術具有以下有益的技術效果:

    21、本專利技術所述數(shù)據(jù)融合發(fā)現(xiàn)方法,面向能源數(shù)字網(wǎng)絡,提取能源數(shù)字對象及其屬性特征,利用自然語言處理技術提取語義特征,配合機器學習技術分析了能源數(shù)字對象之間的語義相似性,并通過相似能源數(shù)字對象的融合進行新的能源數(shù)字對象的構建,最后注冊到能源數(shù)字網(wǎng)絡中,實現(xiàn)了能源數(shù)據(jù)的自動發(fā)現(xiàn)。本專利技術所述方法優(yōu)化了數(shù)據(jù)查找與探索流程,實現(xiàn)了跨域能源數(shù)據(jù)的互補,提高了能源數(shù)據(jù)處理和分析的效率與準確性,促進了能源數(shù)據(jù)價值釋放,支撐了能源領域的智能決策。

    本文檔來自技高網(wǎng)...

    【技術保護點】

    1.一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法,其特征在于,包括,

    2.根據(jù)權利要求1所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法,其特征在于,所述各能源數(shù)字對象的元數(shù)據(jù)中提取的特征屬性,依據(jù)元數(shù)據(jù)對能源數(shù)據(jù)對象特征辨識的貢獻度選取,包括所屬主體、主題分類、行業(yè)大類、行業(yè)小類、業(yè)務關鍵字、用途關鍵字、所屬位置和時間信息。

    3.根據(jù)權利要求1所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法,其特征在于,所述各能源數(shù)字對象的文本語句集合包括每個能源數(shù)字對象的文本語句,所述每個能源數(shù)字對象的文本語句表征如下,

    4.根據(jù)權利要求1所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法,其特征在于,所述的預訓練語言模型為輕量化雙向編碼器表征法ALBERT預訓練模型,并采用如下方法進行訓練:

    5.根據(jù)權利要求1所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法,其特征在于,所述將語義特征向量進行聚類,具體包括:利用K均值K-means算法進行聚類,通過計算平均輪廓系數(shù)法確定K-means聚類中的聚類值,得到最優(yōu)聚類結果;

    6.根據(jù)權利要求1所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法,其特征在于,所述對最優(yōu)聚類結果中每個簇內(nèi)的能源數(shù)字對象進行兩兩相似性計算,對存在相似性的能源數(shù)字對象組合形成相似能源數(shù)字對象組合集,具體包括,

    7.根據(jù)權利要求1所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法,其特征在于,所述將相似能源數(shù)字對象組合集中每一個組合內(nèi)的能源數(shù)字對象進行融合構建新的能源數(shù)字對象,具體包括,

    8.一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)系統(tǒng),其特征在于,包括,

    9.根據(jù)權利要求8所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)系統(tǒng),其特征在于,所述聚類模塊,還用于利用K-means算法進行聚類,通過計算平均輪廓系數(shù)法確定K-means聚類中的聚類值,得到最優(yōu)聚類結果;

    10.根據(jù)權利要求8所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)系統(tǒng),其特征在于,所述聚類模塊,還用于根據(jù)如下公式計算任意兩個能源數(shù)字對象的語義特征向量的余弦相似度:

    11.根據(jù)權利要求8所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)系統(tǒng),其特征在于,所述融合發(fā)現(xiàn)模塊,還用于,

    12.一種計算機設備,其特征在于,包括:

    13.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如權利要求1至7中任一項所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法。

    14.一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,該計算機程序被處理器執(zhí)行時實現(xiàn)權利要求1至7中任一項所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法的步驟。

    ...

    【技術特征摘要】

    1.一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法,其特征在于,包括,

    2.根據(jù)權利要求1所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法,其特征在于,所述各能源數(shù)字對象的元數(shù)據(jù)中提取的特征屬性,依據(jù)元數(shù)據(jù)對能源數(shù)據(jù)對象特征辨識的貢獻度選取,包括所屬主體、主題分類、行業(yè)大類、行業(yè)小類、業(yè)務關鍵字、用途關鍵字、所屬位置和時間信息。

    3.根據(jù)權利要求1所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法,其特征在于,所述各能源數(shù)字對象的文本語句集合包括每個能源數(shù)字對象的文本語句,所述每個能源數(shù)字對象的文本語句表征如下,

    4.根據(jù)權利要求1所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法,其特征在于,所述的預訓練語言模型為輕量化雙向編碼器表征法albert預訓練模型,并采用如下方法進行訓練:

    5.根據(jù)權利要求1所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法,其特征在于,所述將語義特征向量進行聚類,具體包括:利用k均值k-means算法進行聚類,通過計算平均輪廓系數(shù)法確定k-means聚類中的聚類值,得到最優(yōu)聚類結果;

    6.根據(jù)權利要求1所述的一種面向能源數(shù)字網(wǎng)絡的數(shù)據(jù)融合發(fā)現(xiàn)方法,其特征在于,所述對最優(yōu)聚類結果中每個簇內(nèi)的能源數(shù)字對象進行兩兩相似性計算,對存在相似性的能源數(shù)字對象組合形成相似能源數(shù)字對象組合集,具體包括,

    7...

    【專利技術屬性】
    技術研發(fā)人員:潘森宋繼勐朱力鵬吳桂棟李井泉宣東海張肖杰喬俊峰裘洪彬趙偉
    申請(專利權)人:中國電力科學研究院有限公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評論
    • 還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 人妻无码一区二区三区四区| 亚洲欧洲日产国码无码网站 | 国产激情无码视频在线播放性色| 国产乱人无码伦av在线a| 国产成人无码一区二区三区| 在线观看无码不卡AV| 亚洲国产精品无码久久一线| 色欲aⅴ亚洲情无码AV蜜桃| 亚洲av无码乱码国产精品| 亚洲AV无码成H人在线观看| 亚洲国产精品无码久久九九大片| 免费无码又爽又刺激网站 | 亚洲AV无码之国产精品| 亚洲成a人片在线观看无码| 亚洲色偷拍区另类无码专区| 国产精品无码2021在线观看| 无码国内精品久久综合88| 免费A级毛片无码专区| 亚洲精品无码久久久久| 久久国产三级无码一区二区| 无码av大香线蕉伊人久久 | 波多野结衣AV无码久久一区 | 亚洲日韩乱码中文无码蜜桃 | 最新亚洲人成无码网站| 亚洲成av人无码亚洲成av人| 白嫩少妇激情无码| 无码毛片视频一区二区本码 | 亚洲精品无码不卡在线播放| 日韩精品无码一区二区三区 | 久久无码人妻一区二区三区 | 亚洲av无码一区二区三区观看| 亚洲AV无码专区国产乱码电影 | 18禁无遮挡无码国产免费网站| 久久久久久人妻无码| 在线观看成人无码中文av天堂 | 国产精品成人无码久久久久久| 国产午夜激无码av毛片| 免费无码黄网站在线看| 国精品无码一区二区三区左线| 午夜不卡久久精品无码免费| 无码人妻丰满熟妇区BBBBXXXX|