本發(fā)明專利技術(shù)實(shí)施例提供一種用于電力數(shù)據(jù)樣本綜合管理的信息檢索方法及系統(tǒng),屬于互聯(lián)網(wǎng)與計(jì)算技術(shù)領(lǐng)域。所述信息檢索方法包括:獲取用戶輸入的檢索文本和檢索圖片;對所述檢索文本進(jìn)行特征提取,以得到元標(biāo)簽特征;根據(jù)所述元標(biāo)簽特征進(jìn)行搜索,以得到第一搜索結(jié)果;對所述檢索圖片進(jìn)行特征提取,以得到場景特征;根據(jù)所述場景特征進(jìn)行搜索,以得到第二搜索結(jié)果;計(jì)算所述第一搜索結(jié)果和第二搜索結(jié)果的相似程度;判斷所述相似程度是否大于或等于預(yù)設(shè)的閾值;在判斷所述相似程度大于或等于所述閾值的情況下,顯示所述第一搜索結(jié)果和第二搜索結(jié)果。該信息檢索方法及系統(tǒng)能夠提高對電力數(shù)據(jù)庫的訪問效率。
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及互聯(lián)網(wǎng)與計(jì)算,具體地涉及一種用于電力數(shù)據(jù)樣本綜合管理的信息檢索方法及系統(tǒng)。
技術(shù)介紹
1、在電力系統(tǒng)中,圖像數(shù)據(jù)扮演著至關(guān)重要的角色。它們廣泛應(yīng)用于設(shè)備狀態(tài)監(jiān)控、故障診斷以及日常運(yùn)維中,為保障電網(wǎng)安全高效運(yùn)行提供了直觀的信息支持。隨著智能電網(wǎng)技術(shù)的發(fā)展和信息化水平的提升,表示電力設(shè)備實(shí)時(shí)狀態(tài)的圖像的電力數(shù)據(jù)樣本的數(shù)據(jù)量呈現(xiàn)出爆炸式增長。這些圖像包括但不限于輸電線路的巡線照片、變電站設(shè)備的紅外熱像圖、以及各類儀表的讀數(shù)照片等。
2、由于存儲(chǔ)了大量電力相關(guān)的圖像與照片,而由于電力設(shè)備圖標(biāo)等的相似性較高,使得傳統(tǒng)的圖像檢索方法難以實(shí)現(xiàn)較高高精度的檢索,從而降低了電力數(shù)據(jù)庫的訪問效率。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)實(shí)施例的目的是提供一種用于電力數(shù)據(jù)樣本綜合管理的信息檢索方法及系統(tǒng),該信息檢索方法及系統(tǒng)能夠提高對電力數(shù)據(jù)庫的訪問效率。
2、為了實(shí)現(xiàn)上述目的,本專利技術(shù)實(shí)施例提供一種用于電力數(shù)據(jù)樣本綜合管理的信息檢索方法,包括:
3、獲取用戶輸入的檢索文本和檢索圖片;
4、對所述檢索文本進(jìn)行特征提取,以得到元標(biāo)簽特征;
5、根據(jù)所述元標(biāo)簽特征進(jìn)行搜索,以得到第一搜索結(jié)果;
6、對所述檢索圖片進(jìn)行特征提取,以得到場景特征;
7、根據(jù)所述場景特征進(jìn)行搜索,以得到第二搜索結(jié)果;
8、計(jì)算所述第一搜索結(jié)果和第二搜索結(jié)果的相似程度;
9、判斷所述相似程度是否大于或等于預(yù)設(shè)的閾值;p>10、在判斷所述相似程度大于或等于所述閾值的情況下,顯示所述第一搜索結(jié)果和第二搜索結(jié)果。
11、可選地,對所述檢索文本進(jìn)行特征提取,以得到元標(biāo)簽特征,包括:
12、對所述檢索文本進(jìn)行預(yù)處理操作;
13、獲取預(yù)處理操作后的所述檢索文本的候選關(guān)鍵詞圖;
14、在所述候選關(guān)鍵詞圖中獲取檢索關(guān)鍵詞。
15、可選地,根據(jù)所述元標(biāo)簽特征進(jìn)行搜索,以得到第一搜索結(jié)果,包括:
16、采用word2vec模型將所述檢索關(guān)鍵詞映射至低維向量空間中,以得到對應(yīng)的第一低維向量;
17、采用doc2vec模型將待搜索文本映射至所述低維向量空間中,以得到對應(yīng)的第二低維向量;
18、計(jì)算所述第一低維向量和第二低維向量的距離;
19、采用pagerank算法在所述候選關(guān)鍵詞圖中計(jì)算所述檢索關(guān)鍵詞的權(quán)重;
20、根據(jù)所述權(quán)重和所述距離從所述待搜索文本中篩選出所述第一搜索結(jié)果。
21、可選地,采用pagerank算法在所述候選關(guān)鍵詞圖中計(jì)算所述檢索關(guān)鍵詞的權(quán)重,包括:
22、根據(jù)公式(1)計(jì)算所述權(quán)重:
23、,(1)
24、其中,為關(guān)鍵詞的權(quán)重,為阻尼系數(shù),為圖中所有節(jié)點(diǎn)的總數(shù),為所有節(jié)點(diǎn)的集合,為關(guān)鍵詞的邊的數(shù)量,為關(guān)鍵詞的權(quán)重,為關(guān)鍵詞和關(guān)鍵詞之間的邊的權(quán)重,為關(guān)鍵詞和關(guān)鍵詞之間的邊的權(quán)重。
25、可選地,計(jì)算所述第一低維向量和第二低維向量的距離,包括:
26、根據(jù)公式(2)計(jì)算所述距離:
27、,(2)
28、其中,為第個(gè)第一低維向量與第個(gè)第二低維向量的距離,為低維向量空間的維度,為中間序號變量,為第一低維向量中的第個(gè)元素,為第二低維向量中的第個(gè)元素。
29、可選地,對所述檢索圖片進(jìn)行特征提取,以得到場景特征,包括:
30、將所述檢索圖片進(jìn)行圖像塊嵌入操作,以得到由多個(gè)圖像塊組合得到的特征圖;
31、為每個(gè)所述圖像塊增加對應(yīng)的可學(xué)習(xí)嵌入函數(shù);
32、為每個(gè)所述圖像塊增加對應(yīng)的位置嵌入函數(shù);
33、將包括所述圖像塊、可學(xué)習(xí)嵌入函數(shù)、位置嵌入函數(shù)的所述特征圖輸入預(yù)設(shè)的特征提取網(wǎng)絡(luò)中,以得到所述場景特征。
34、可選地,所述特征提取網(wǎng)絡(luò)包括:
35、多個(gè)msa單元,包括:
36、多頭注意力機(jī)制,用于對輸入的特征圖中的所述圖像塊、可學(xué)習(xí)嵌入函數(shù)、位置嵌入函數(shù)進(jìn)行加權(quán)操作;
37、層歸一化網(wǎng)絡(luò),用于對加權(quán)后的所述特征圖進(jìn)行標(biāo)準(zhǔn)化操作;
38、跳躍連接網(wǎng)絡(luò),用于對標(biāo)準(zhǔn)化操作后的所述特征圖進(jìn)行特征提取,以得到對應(yīng)的特征向量;
39、多個(gè)mlp單元,包括:
40、前饋網(wǎng)絡(luò),用于對所述特征向量進(jìn)行處理和轉(zhuǎn)換,以得到對應(yīng)的提取特征;
41、層歸一化單元,用于對所述提取特征進(jìn)行標(biāo)準(zhǔn)化操作;
42、分類頭網(wǎng)絡(luò),用于對標(biāo)準(zhǔn)化操作后的所述提取特征進(jìn)行分類操作,以得到所述場景特征。
43、可選地,計(jì)算所述第一搜索結(jié)果和第二搜索結(jié)果的相似程度,包括:
44、分別采用lbp算法和rlbp算法在所述第一搜索結(jié)果上提取出對應(yīng)的特征直方圖;
45、將兩個(gè)所述特征直方圖融合,以得到第一特征直方圖;
46、分別采用lbp算法和rlbp算法在所述第二搜索結(jié)果上提取出對應(yīng)的特征直方圖;
47、將兩個(gè)所述特征直方圖融合,以得到第二特征直方圖;
48、計(jì)算所述第一特征直方圖和第二特征直方圖之間的交叉距離,以得到所述相似程度。
49、可選地,計(jì)算所述第一特征直方圖和第二特征直方圖之間的交叉距離,以得到所述相似程度,包括:
50、根據(jù)公式(3)計(jì)算所述交叉距離:
51、,(3)
52、其中,為第一特征直方圖和第二特征直方圖之間的交叉距離,為融合子圖像的數(shù)量,為所生成融合特征向量的長度,為特征直方圖中被劃分出的區(qū)間的數(shù)量,為中間序號變量。
53、另一方面,本專利技術(shù)還提供一種用于電力數(shù)據(jù)樣本綜合管理的信息檢索系統(tǒng),所述系統(tǒng)包括處理器,所述處理器被配置成執(zhí)行如任一所述的方法。
54、通過上述技術(shù)方案,本專利技術(shù)提供了一種用于電力數(shù)據(jù)樣本綜合管理的信息檢索方法及系統(tǒng),該信息檢索方法及系統(tǒng)通過同時(shí)采用關(guān)鍵詞檢索和圖片檢索的結(jié)果,再結(jié)合兩者檢索結(jié)果的比對來實(shí)現(xiàn)精準(zhǔn)的檢索定位。相較于現(xiàn)有技術(shù)的單一檢索方式而言,本專利技術(shù)提供的信息檢索方法及系統(tǒng)提高了對電力數(shù)據(jù)庫的數(shù)據(jù)訪問效率。
55、本專利技術(shù)實(shí)施例的其它特征和優(yōu)點(diǎn)將在隨后的具體實(shí)施方式部分予以詳細(xì)說明。
本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種用于電力數(shù)據(jù)樣本綜合管理的信息檢索方法,其特征在于,所述信息檢索方法包括:
2.根據(jù)權(quán)利要求1所述的信息檢索方法,其特征在于,對所述檢索文本進(jìn)行特征提取,以得到元標(biāo)簽特征,包括:
3.根據(jù)權(quán)利要求2所述的信息檢索方法,其特征在于,根據(jù)所述元標(biāo)簽特征進(jìn)行搜索,以得到第一搜索結(jié)果,包括:
4.根據(jù)權(quán)利要求3所述的信息檢索方法,其特征在于,采用pagerank算法在所述候選關(guān)鍵詞圖中計(jì)算所述檢索關(guān)鍵詞的權(quán)重,包括:
5.根據(jù)權(quán)利要求3所述的信息檢索方法,其特征在于,計(jì)算所述第一低維向量和第二低維向量的距離,包括:
6.根據(jù)權(quán)利要求1所述的信息檢索方法,其特征在于,對所述檢索圖片進(jìn)行特征提取,以得到場景特征,包括:
7.根據(jù)權(quán)利要求6所述的信息檢索方法,其特征在于,所述特征提取網(wǎng)絡(luò)包括:
8.根據(jù)權(quán)利要求1所述的信息檢索方法,其特征在于,計(jì)算所述第一搜索結(jié)果和第二搜索結(jié)果的相似程度,包括:
9.根據(jù)權(quán)利要求8所述的信息檢索方法,其特征在于,計(jì)算所述第一特征直方圖和第二特征直方圖之間的交叉距離,以得到所述相似程度,包括:
10.一種用于電力數(shù)據(jù)樣本綜合管理的信息檢索系統(tǒng),其特征在于,所述系統(tǒng)包括處理器,所述處理器被配置成執(zhí)行如權(quán)利要求1至9任一所述的方法。
...
【技術(shù)特征摘要】
1.一種用于電力數(shù)據(jù)樣本綜合管理的信息檢索方法,其特征在于,所述信息檢索方法包括:
2.根據(jù)權(quán)利要求1所述的信息檢索方法,其特征在于,對所述檢索文本進(jìn)行特征提取,以得到元標(biāo)簽特征,包括:
3.根據(jù)權(quán)利要求2所述的信息檢索方法,其特征在于,根據(jù)所述元標(biāo)簽特征進(jìn)行搜索,以得到第一搜索結(jié)果,包括:
4.根據(jù)權(quán)利要求3所述的信息檢索方法,其特征在于,采用pagerank算法在所述候選關(guān)鍵詞圖中計(jì)算所述檢索關(guān)鍵詞的權(quán)重,包括:
5.根據(jù)權(quán)利要求3所述的信息檢索方法,其特征在于,計(jì)算所述第一低維向量和第二低維向量的距離,包括:
6.根據(jù)...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:楊維,劉識,陳振宇,李博,皮志賢,王耀影,任俊達(dá),王海陸,李明,邱鎮(zhèn),黃曉光,劉璟,張琳瑜,劉園園,梁翀,薛濛,浦正國,汪子航,
申請(專利權(quán))人:國網(wǎng)信息通信產(chǎn)業(yè)集團(tuán)有限公司,
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會(huì)獲得科技券。