System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 天堂Aⅴ无码一区二区三区,中文字幕人妻三级中文无码视频 ,精品人妻系列无码人妻漫画
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法及系統(tǒng)技術(shù)方案

    技術(shù)編號(hào):44500243 閱讀:4 留言:0更新日期:2025-03-04 18:08
    本發(fā)明專利技術(shù)涉及電力數(shù)據(jù)治理技術(shù)領(lǐng)域,提供了一種基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法及系統(tǒng)。該方法包括,提取數(shù)據(jù)中臺(tái)中的表信息,包括表的元數(shù)據(jù)信息和歷史sql信息;基于提取到的元數(shù)據(jù)信息和歷史sql信息構(gòu)建多模態(tài)融合的特征向量;針對(duì)初始數(shù)據(jù)中臺(tái)中已有的數(shù)據(jù)庫表,基于其特征向量,計(jì)算每個(gè)表特征向量間的距離,采用層次聚類法,對(duì)數(shù)據(jù)表進(jìn)行聚類分析;針對(duì)聚類結(jié)果中的每一類數(shù)據(jù)表,為其指定存儲(chǔ)方案,形成已有數(shù)據(jù)庫表的存儲(chǔ)方案結(jié)果;基于已有數(shù)據(jù)庫表的存儲(chǔ)方案結(jié)果,構(gòu)建基于注意力的分類模型;采用分類模型對(duì)新加入數(shù)據(jù)中臺(tái)的數(shù)據(jù)庫中的表進(jìn)行分類,確定新加入表的存儲(chǔ)方案結(jié)果。本發(fā)明專利技術(shù)能夠自動(dòng)為表分配最合理的存儲(chǔ)方案。

    【技術(shù)實(shí)現(xiàn)步驟摘要】

    本專利技術(shù)涉及電力數(shù)據(jù)治理,尤其涉及一種基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法及系統(tǒng)


    技術(shù)介紹

    1、本部分的陳述僅僅是提供了與本專利技術(shù)相關(guān)的
    技術(shù)介紹
    信息,不必然構(gòu)成在先技術(shù)。

    2、隨著信息技術(shù)的迅猛發(fā)展,數(shù)據(jù)中臺(tái)在電力行業(yè)中的應(yīng)用日益廣泛,逐漸成為提升企業(yè)競爭力的關(guān)鍵因素。數(shù)據(jù)中臺(tái)作為集中管理和利用數(shù)據(jù)資源的綜合性平臺(tái),不僅極大地增強(qiáng)了電力公司處理復(fù)雜數(shù)據(jù)的能力,而且顯著提高了其數(shù)據(jù)分析水平和決策效率,為電力企業(yè)的智能化轉(zhuǎn)型提供了堅(jiān)實(shí)的基礎(chǔ)。然而,隨著數(shù)字化轉(zhuǎn)型的深入,電力行業(yè)產(chǎn)生的數(shù)據(jù)量呈現(xiàn)出爆炸性增長的趨勢(shì),這對(duì)數(shù)據(jù)管理提出了前所未有的挑戰(zhàn)。傳統(tǒng)的基于單一關(guān)系型數(shù)據(jù)庫的數(shù)據(jù)管理方式,由于其在擴(kuò)展性、處理速度和成本效益方面的局限性,已難以應(yīng)對(duì)現(xiàn)代數(shù)據(jù)中臺(tái)所面臨的海量數(shù)據(jù)存儲(chǔ)與實(shí)時(shí)分析的需求。因此,探索和實(shí)踐更加高效的數(shù)據(jù)管理技術(shù)和架構(gòu),成為了當(dāng)前電力行業(yè)數(shù)據(jù)中臺(tái)建設(shè)中亟待解決的核心問題。

    3、由于電力行業(yè)的業(yè)務(wù)數(shù)據(jù)種類繁多,包括用戶信息、用電數(shù)據(jù)、設(shè)備信息等,這些數(shù)據(jù)具有不同的數(shù)據(jù)規(guī)模和訪問需求。因此,采用多類型存儲(chǔ)系統(tǒng)可以根據(jù)數(shù)據(jù)的特點(diǎn)將其存儲(chǔ)在不同的存儲(chǔ)設(shè)備中,以提高數(shù)據(jù)的訪問效率和管理效果。例如,可以將數(shù)據(jù)規(guī)模小,變更頻繁的數(shù)據(jù)(如用戶信息數(shù)據(jù)、設(shè)備信息數(shù)據(jù))存儲(chǔ)在如oracle這類的傳統(tǒng)的關(guān)系數(shù)據(jù)庫中,將數(shù)據(jù)規(guī)模大、變更少、訪問需求低的數(shù)據(jù)(如歷史用電數(shù)據(jù))存儲(chǔ)在如hive這類基于分布式文件存儲(chǔ)的數(shù)據(jù)。

    4、具體而言,針對(duì)數(shù)據(jù)規(guī)模較小但更新頻繁的信息,比如用戶的個(gè)人信息及設(shè)備的狀態(tài)信息,最適合使用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫系統(tǒng)(如oracle)。這類系統(tǒng)以其強(qiáng)大的事務(wù)處理能力著稱,能夠確保數(shù)據(jù)的一致性和完整性,同時(shí)提供高效的查詢性能,非常適合處理需要頻繁讀寫的小規(guī)模數(shù)據(jù)集。而對(duì)于那些數(shù)據(jù)量龐大、更新較少且訪問需求相對(duì)較低的數(shù)據(jù),例如歷史用電數(shù)據(jù),則更適合采用基于分布式文件系統(tǒng)的數(shù)據(jù)倉庫技術(shù)(如hive)。這樣的系統(tǒng)設(shè)計(jì)之初便考慮到了大規(guī)模數(shù)據(jù)的存儲(chǔ)與分析需求,能夠提供優(yōu)秀的擴(kuò)展性和高性價(jià)比的數(shù)據(jù)存儲(chǔ)解決方案。通過將這些歷史數(shù)據(jù)存儲(chǔ)在分布式環(huán)境中,可以實(shí)現(xiàn)數(shù)據(jù)的高效管理和深度分析,從而為電力公司提供有價(jià)值的洞察,幫助其優(yōu)化資源配置、預(yù)測未來趨勢(shì)并制定更加科學(xué)的決策。此外,隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,電力行業(yè)還面臨著越來越多的非結(jié)構(gòu)化數(shù)據(jù)處理需求,例如視頻監(jiān)控資料、傳感器數(shù)據(jù)等。對(duì)于此類數(shù)據(jù),可以考慮使用nosql數(shù)據(jù)庫或?qū)ο蟠鎯?chǔ)等更為靈活的存儲(chǔ)方案,以滿足其特殊的數(shù)據(jù)結(jié)構(gòu)和訪問模式。

    5、然而在實(shí)際應(yīng)用過程中,由于數(shù)據(jù)庫中數(shù)據(jù)表規(guī)模龐大,通過人工分析的方式為每個(gè)表選擇合適的存儲(chǔ)方案不可行的。


    技術(shù)實(shí)現(xiàn)思路

    1、為了解決上述
    技術(shù)介紹
    中存在的技術(shù)問題,本專利技術(shù)提供一種基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法及系統(tǒng),本專利技術(shù)能夠自動(dòng)為表分配最合理的存儲(chǔ)方案,幫助數(shù)據(jù)庫管理人員實(shí)現(xiàn)智能化的數(shù)據(jù)分類治理,提升數(shù)據(jù)訪問和分析的效率。

    2、為了實(shí)現(xiàn)上述目的,本專利技術(shù)采用如下技術(shù)方案:

    3、本專利技術(shù)的第一個(gè)方面提供一種基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法。

    4、一種基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法,包括:

    5、提取數(shù)據(jù)中臺(tái)中的表信息,包括表的元數(shù)據(jù)信息和歷史sql信息;

    6、基于提取到的元數(shù)據(jù)信息和歷史sql信息構(gòu)建多模態(tài)融合的特征向量;

    7、針對(duì)初始數(shù)據(jù)中臺(tái)中已有的數(shù)據(jù)庫表,基于其特征向量,計(jì)算每個(gè)表特征向量間的距離,采用層次聚類法,對(duì)數(shù)據(jù)表進(jìn)行聚類分析;

    8、針對(duì)聚類結(jié)果中的每一類數(shù)據(jù)表,為其指定存儲(chǔ)方案,形成已有數(shù)據(jù)庫表的存儲(chǔ)方案結(jié)果;

    9、基于已有數(shù)據(jù)庫表的存儲(chǔ)方案結(jié)果,構(gòu)建基于注意力的分類模型;采用分類模型對(duì)新加入數(shù)據(jù)中臺(tái)的數(shù)據(jù)庫中的表進(jìn)行分類,確定新加入表的存儲(chǔ)方案結(jié)果。

    10、進(jìn)一步地,所述表的元數(shù)據(jù)信息包括:表名稱、表的描述信息、表的字段信息、表的大小以及表的外鍵;表的歷史sql信息包括:表的增刪改查語句的數(shù)量以及關(guān)聯(lián)查詢的表信息。

    11、進(jìn)一步地,所述特征向量分別通過數(shù)值和序列表示不同類型的信息,其中:

    12、表的唯一標(biāo)識(shí)、表的大小、歷史sql信息中select語句的占比、insert語句的占比以及update語句和delete語句的占比為數(shù)值型;

    13、表的外鍵通過長度不固定的序列表示,序列中的值為存在依賴關(guān)系的表id;

    14、表注釋及字段名稱通過長度不固定的編碼序列表示,序列中的每個(gè)值都為數(shù)值型;

    15、關(guān)聯(lián)查詢的表信息通過長度不固定的序列表示,序列中的每個(gè)值都為鍵值對(duì)型。

    16、進(jìn)一步地,所述基于其特征向量,計(jì)算每個(gè)表特征向量間的距離,方法包括:

    17、針對(duì)數(shù)值型特征向量,采用減法計(jì)算該向量在維度的距離;

    18、針對(duì)非數(shù)值型特征向量,采用特定的處理方法計(jì)算向量在該維度的距離;

    19、其中,所述采用特定的處理方法計(jì)算向量在該維度的距離,方法包括:針對(duì)表的依賴關(guān)系特征,若兩個(gè)表存在依賴關(guān)系,其值置為0,否則置為1;針對(duì)表注釋及字段名稱,以最短的序列為基準(zhǔn),在長序列中選擇與其最相近的數(shù)值構(gòu)成同等長度的序列,然后計(jì)算其余弦相似度;針對(duì)關(guān)聯(lián)查詢的表信息,若兩個(gè)表間存在關(guān)聯(lián)查詢,則以其查詢次數(shù)作為其距離值,否則置為0。

    20、進(jìn)一步地,所述采用層次聚類法,對(duì)數(shù)據(jù)表進(jìn)行聚類分析,方法包括:

    21、將每個(gè)表視作一個(gè)類,通過基于權(quán)重的距離公式計(jì)算每個(gè)類間的距離,并存儲(chǔ);

    22、將距離最小的兩個(gè)類合并為一個(gè)類,并基于平均值法計(jì)算合并后的新類與剩余類的距離;

    23、重復(fù)上一步過程,直到最后只剩余所需的n個(gè)類。

    24、進(jìn)一步地,所述分類模型通過基于注意力的循環(huán)神經(jīng)網(wǎng)絡(luò)構(gòu)建。

    25、本專利技術(shù)的第二個(gè)方面提供一種基于多模態(tài)融合的數(shù)據(jù)庫表分類治理系統(tǒng)。

    26、一種基于多模態(tài)融合的數(shù)據(jù)庫表分類治理系統(tǒng),包括:

    27、數(shù)據(jù)信息提取模塊,其被配置為:提取數(shù)據(jù)中臺(tái)中的表信息,包括表的元數(shù)據(jù)信息和歷史sql信息;

    28、特征向量構(gòu)建模塊,其被配置為:基于提取到的元數(shù)據(jù)信息和歷史sql信息構(gòu)建多模態(tài)融合的特征向量;

    29、層次聚類模塊,其被配置為:針對(duì)初始數(shù)據(jù)中臺(tái)中已有的數(shù)據(jù)庫表,基于其特征向量,計(jì)算每個(gè)表特征向量間的距離,采用層次聚類法,對(duì)數(shù)據(jù)表進(jìn)行聚類分析;

    30、分類模塊,其被配置為:針對(duì)聚類結(jié)果中的每一類數(shù)據(jù)表,為其指定存儲(chǔ)方案,形成已有數(shù)據(jù)庫表的存儲(chǔ)方案結(jié)果;

    31、多類型存儲(chǔ)模塊,其被配置為:基于已有數(shù)據(jù)庫表的存儲(chǔ)方案結(jié)果,構(gòu)建基于注意力的分類模型;采用分類模型對(duì)新加入數(shù)據(jù)中臺(tái)的數(shù)據(jù)庫中的表進(jìn)行分類,確定新加入表的存儲(chǔ)方案結(jié)果。

    32、本專利技術(shù)的第三個(gè)方面提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。

    33、一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)本文檔來自技高網(wǎng)...

    【技術(shù)保護(hù)點(diǎn)】

    1.一種基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法,其特征在于,所述表的元數(shù)據(jù)信息包括:表名稱、表的描述信息、表的字段信息、表的大小以及表的外鍵;表的歷史sql信息包括:表的增刪改查語句的數(shù)量以及關(guān)聯(lián)查詢的表信息。

    3.根據(jù)權(quán)利要求1所述的基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法,其特征在于,所述特征向量分別通過數(shù)值和序列表示不同類型的信息,其中:

    4.根據(jù)權(quán)利要求3所述的基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法,其特征在于,所述基于其特征向量,計(jì)算每個(gè)表特征向量間的距離,方法包括:

    5.根據(jù)權(quán)利要求1所述的基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法,其特征在于,所述采用層次聚類法,對(duì)數(shù)據(jù)表進(jìn)行聚類分析,方法包括:

    6.根據(jù)權(quán)利要求1所述的基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法,其特征在于,所述分類模型通過基于注意力的循環(huán)神經(jīng)網(wǎng)絡(luò)構(gòu)建。

    7.一種基于多模態(tài)融合的數(shù)據(jù)庫表分類治理系統(tǒng),其特征在于,包括:

    8.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-6中任一項(xiàng)所述的基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法中的步驟。

    9.一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如權(quán)利要求1-6中任一項(xiàng)所述的基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法中的步驟。

    10.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)如權(quán)利要求1-6中任一項(xiàng)所述的基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法中的步驟。

    ...

    【技術(shù)特征摘要】

    1.一種基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法,其特征在于,包括:

    2.根據(jù)權(quán)利要求1所述的基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法,其特征在于,所述表的元數(shù)據(jù)信息包括:表名稱、表的描述信息、表的字段信息、表的大小以及表的外鍵;表的歷史sql信息包括:表的增刪改查語句的數(shù)量以及關(guān)聯(lián)查詢的表信息。

    3.根據(jù)權(quán)利要求1所述的基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法,其特征在于,所述特征向量分別通過數(shù)值和序列表示不同類型的信息,其中:

    4.根據(jù)權(quán)利要求3所述的基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法,其特征在于,所述基于其特征向量,計(jì)算每個(gè)表特征向量間的距離,方法包括:

    5.根據(jù)權(quán)利要求1所述的基于多模態(tài)融合的數(shù)據(jù)庫表分類治理方法,其特征在于,所述采用層次聚類法,對(duì)數(shù)據(jù)表進(jìn)行聚類分析,方法包括:

    6.根據(jù)權(quán)利要求1所...

    【專利技術(shù)屬性】
    技術(shù)研發(fā)人員:趙鵬曲延盛常英賢馬超邵志敏劉蔭樊靜雨胡恒瑞劉函湯琳琳朱韶松潘法定張聞彬呼海林王高洲周潔徐浩黃振鄭海杰趙曉湯耀庭孟祥鹿
    申請(qǐng)(專利權(quán))人:國網(wǎng)山東省電力公司信息通信公司
    類型:發(fā)明
    國別省市:

    網(wǎng)友詢問留言 已有0條評(píng)論
    • 還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。

    1
    主站蜘蛛池模板: 日韩精品无码一区二区三区不卡 | 国产精品成人无码久久久| 亚洲热妇无码AV在线播放 | 男男AV纯肉无码免费播放无码| 日韩少妇无码喷潮系列一二三| 无码人妻一区二区三区免费看 | 久久久g0g0午夜无码精品| 成人无码a级毛片免费| 好爽毛片一区二区三区四无码三飞| 东京热人妻无码人av| 精品无码专区亚洲| 精品国产一区二区三区无码| 中文字幕在线无码一区二区三区| 人妻少妇看A偷人无码精品| 人妻中文字幕无码专区| 亚洲日韩精品无码专区网址| 成年男人裸j照无遮挡无码| 久久午夜无码鲁丝片| 无码人妻AV一二区二区三区| 狠狠躁天天躁无码中文字幕| 日韩久久无码免费毛片软件| 久久久久久99av无码免费网站 | 亚洲精品无码专区在线播放 | 在线观看免费无码专区| 五月天无码在线观看| 青春草无码精品视频在线观| 少妇爆乳无码专区| 亚洲精品无码专区| 无码中文在线二区免费| 亚洲中文字幕无码久久2020| 亚洲中文无码永久免费| 亚洲人AV在线无码影院观看| 亚洲日韩国产二区无码| 久久亚洲精品无码av| 无码视频在线播放一二三区| 亚洲精品97久久中文字幕无码| 国产乱子伦精品无码专区| 狠狠躁狠狠躁东京热无码专区| 亚洲一区爱区精品无码| 人妻无码αv中文字幕久久| 无码成人精品区在线观看|