System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)屬于一種知識圖譜嵌入方法,具體是涉及到一種模糊知識圖譜對比嵌入方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
技術(shù)介紹
1、知識圖譜(knowledge?graph,kg)在不同的領(lǐng)域都有十分重要的應(yīng)用,例如,在金融領(lǐng)域,kg能夠深度感知和廣泛互聯(lián)孤立數(shù)據(jù),進(jìn)行高度智能共享分析,幫助客戶擴(kuò)展現(xiàn)有數(shù)字資源的廣度和深度,支撐智能應(yīng)用。示例性地,銀行可以利用知識圖譜在金融全場景中的重要應(yīng)用價(jià)值,進(jìn)行風(fēng)險(xiǎn)評估、信用評級和欺詐檢測等。除此之外,知識圖譜還在公共安全、醫(yī)療、電商等領(lǐng)域發(fā)揮著重要作用。在公共安全領(lǐng)域,知識圖譜用于處理海量數(shù)據(jù),打破數(shù)據(jù)孤島問題,挖掘數(shù)據(jù)背后的有價(jià)值信息。在醫(yī)療領(lǐng)域,它能夠建立系統(tǒng)完善的知識庫,提供高效檢索,推進(jìn)海量數(shù)據(jù)的智能處理,輔助診療。在電商領(lǐng)域,知識圖譜用于商品推薦和用戶畫像分析,提高個(gè)性化推薦能力。
2、知識圖譜嵌入的核心目標(biāo)是為每個(gè)實(shí)體和關(guān)系學(xué)習(xí)一個(gè)低維向量表示,從而在保持原有圖結(jié)構(gòu)信息的前提下進(jìn)行各種下游任務(wù),如實(shí)體分類、鏈接預(yù)測、關(guān)系推理等。因此無論是知識圖譜在不同領(lǐng)域執(zhí)行各類復(fù)雜的下游任務(wù),還是對知識圖譜本身進(jìn)行優(yōu)化或補(bǔ)全操作都需要獲取知識圖譜嵌入,知識圖譜嵌入的質(zhì)量對下游任務(wù)的執(zhí)行效果有著至關(guān)重要的影響。
3、資源描述框架(resource?description?framework,rdf)正迅速成為元數(shù)據(jù)管理的標(biāo)準(zhǔn)數(shù)據(jù)模型,由于其在開放信息提取環(huán)境中進(jìn)行語義數(shù)據(jù)建模的適用性,以及環(huán)境的開放性和各用戶分散維護(hù)的特性,rdf數(shù)據(jù)在規(guī)模顯著增加的同時(shí)不可避免地包含錯(cuò)誤、過時(shí)和
4、rdf建模的知識圖譜(knowledge?graph,kg)是人工智能應(yīng)用中極其有用的資源,為了快速構(gòu)建并持續(xù)豐富知識圖譜,通常使用自動(dòng)構(gòu)建和更新機(jī)制,這不可避免地帶來了模糊性或不確定性,忽略其存在會(huì)嚴(yán)重影響下游任務(wù)。由于kg圖結(jié)構(gòu)、語義鏈接、實(shí)時(shí)更新和跨領(lǐng)域的特性,模糊(fuzzy)rdf?kg已成為最新的研究熱點(diǎn)。
5、當(dāng)前關(guān)于fuzzy?rdf?kg的研究面臨來自三個(gè)主要方面的挑戰(zhàn):(1)現(xiàn)實(shí)世界的固有模糊性。人類知識中有很大一部分本質(zhì)上是不精確的,例如,在工業(yè)領(lǐng)域,產(chǎn)品設(shè)計(jì)通常基于經(jīng)驗(yàn)和概率信息。不能僅僅考慮關(guān)系事實(shí)的存在性,還應(yīng)該度量相應(yīng)的可能性,這在生物、智能制造等實(shí)際應(yīng)用中尤其有價(jià)值。(2)構(gòu)建過程引入的噪聲。為了處理大量數(shù)據(jù),大多數(shù)kg是通過使用啟發(fā)式算法從網(wǎng)絡(luò)語料庫中自動(dòng)提取的,自動(dòng)化構(gòu)建過程通常會(huì)導(dǎo)致包含不準(zhǔn)確事實(shí)的模糊知識圖譜,這些事實(shí)的有效性需要通過模糊度、置信度等指標(biāo)進(jìn)行量化。(3)三元組的固有性質(zhì)。盡管fuzzy?rdf?kg在表示結(jié)構(gòu)化數(shù)據(jù)方面有效,但其三元組的符號性質(zhì)常常使得知識圖譜難以操作。
6、針對此問題,很多研究基于隨機(jī)替換現(xiàn)有三元組實(shí)體生成的負(fù)樣本進(jìn)行模糊知識圖譜的嵌入,然而真實(shí)世界的模糊知識圖譜是十分復(fù)雜的,即存在很多三元組的元素雖然并不匹配但是具有相關(guān)性的情況,采用隨機(jī)替換現(xiàn)有三元組實(shí)體生成的負(fù)樣本進(jìn)行模糊知識圖譜的嵌入不足以原型化實(shí)際的kg模糊性,從而導(dǎo)致知識圖譜嵌入生成質(zhì)量較差。
技術(shù)實(shí)現(xiàn)思路
1、本專利技術(shù)要解決的技術(shù)問題是現(xiàn)有技術(shù)常用的上述方法采用隨機(jī)替換現(xiàn)有三元組實(shí)體生成的負(fù)樣本進(jìn)行模糊知識圖譜的嵌入不足以原型化實(shí)際的kg模糊性,從而導(dǎo)致知識圖譜嵌入生成質(zhì)量較差,為了解決上述問題,本專利技術(shù)提供一種模糊知識圖譜對比嵌入方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
2、本專利技術(shù)的內(nèi)容包括:
3、第一方面,本專利技術(shù)實(shí)施例提供了一種模糊知識圖譜對比嵌入方法,包括:
4、基于模糊知識圖譜構(gòu)建第一視圖和第二視圖,所述模糊知識圖譜包括多個(gè)三元組,所述第一視圖用于從頭實(shí)體的視角表示所述多個(gè)三元組之間的相關(guān)性,所述第二視圖用于從尾實(shí)體的視角表示所述多個(gè)三元組之間的相關(guān)性;
5、利用知識圖譜嵌入模型對所述第一視圖中的三元組進(jìn)行編碼,得到第一嵌入,以及利用所述知識圖譜嵌入模型對所述第二視圖中的三元組進(jìn)行編碼,得到第二嵌入;
6、基于模糊rdf?kg嵌入損失和對比學(xué)習(xí)損失對所述知識圖譜嵌入模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的知識圖譜嵌入模型;
7、基于所述訓(xùn)練好的知識圖譜嵌入模型獲取知識圖譜嵌入。
8、可選地,所述基于模糊知識圖譜構(gòu)建第一視圖和第二視圖,包括:
9、將所述多個(gè)三元組中的每一個(gè)三元組作為一個(gè)節(jié)點(diǎn);
10、將第一節(jié)點(diǎn)和第二節(jié)點(diǎn)連接得到所述第一視圖,將第三節(jié)點(diǎn)和第四節(jié)點(diǎn)連接得到所述第二視圖,所述第一節(jié)點(diǎn)和所述第二節(jié)點(diǎn)對應(yīng)的三元組具有相同的頭實(shí)體,所述第三節(jié)點(diǎn)和所述第四節(jié)點(diǎn)對應(yīng)的三元組具有相同的尾實(shí)體。
11、可選地,所述利用知識圖譜嵌入模型對所述第一視圖中的三元組進(jìn)行編碼,得到第一嵌入,包括:
12、對于所述第一視圖中的每一個(gè)第一三元組,獲取所述第一三元組的第一初始嵌入;
13、基于所述第一三元組的鄰近三元組的注意力系數(shù)更新所述第一初始嵌入,得到所述第一嵌入。
14、可選地,所述利用所述知識圖譜嵌入模型對所述第二視圖中的三元組進(jìn)行編碼,得到第二嵌入,包括:
15、對于所述第二視圖中的每一個(gè)第二三元組,獲取所述第二三元組的第二初始嵌入;
16、基于所述第二三元組的鄰近三元組的注意力系數(shù)更新所述第二初始嵌入,得到所述第二嵌入。
17、可選地,所述基于模糊rdf?kg嵌入損失和對比學(xué)習(xí)損失對所述知識圖譜嵌入模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的知識圖譜嵌入模型之前,所述方法還包括:
18、將所述模糊知識圖譜中的三元組作為正例三元組;
19、將所述正例三元組的實(shí)體關(guān)系和關(guān)系隨機(jī)替換為其他實(shí)體和關(guān)系,得到負(fù)例三元組;
20、基于所述正例三元組的差異度分值和所述負(fù)例三元組的差異度分值計(jì)算所述模糊rdf?kg嵌入損失。
21、可選地,所述對比學(xué)習(xí)損失基于所述模糊知識圖譜中三元組對應(yīng)的所述第一嵌入和所述第二嵌入之間的相似度確定。
22、可選地,所述對比學(xué)習(xí)損失為:
23、
24、其中,{x1,x2,...,xn}表示所述模糊知識圖譜中n個(gè)三元組對應(yīng)的所述第一嵌入,{z1,z2,...,zn}表示所述模糊知識圖譜中n個(gè)三元組對應(yīng)的所述第二嵌入,(xi,zi)表示所述模糊知識圖譜中第i個(gè)三元組對應(yīng)的第一嵌入和所述模糊知識圖譜中第i個(gè)三元組對應(yīng)的第二嵌入,τ表示溫度參數(shù),sim(xi,zi)表示xi和zi的余弦相似度,n為大于2的整數(shù),i為小于或等于n的整數(shù)。
25、第二方面,本專利技術(shù)實(shí)施例還提供了一種模糊知識圖譜對比嵌入裝置,包括:
26、構(gòu)建模塊,用于基于模糊知識圖譜構(gòu)建第一視圖和第二視圖,所述模糊知識圖譜包括多個(gè)三元組,所述第一視圖用于從頭實(shí)體的視角表示所述多個(gè)三元組之間的相關(guān)性,所述第二視圖用于從尾實(shí)體的視角表示所述多個(gè)三元組之間的相關(guān)性;
27、本文檔來自技高網(wǎng)...
【技術(shù)保護(hù)點(diǎn)】
1.一種模糊知識圖譜對比嵌入方法,其特征是,包括:
2.如權(quán)利要求1所述的方法,其特征是,所述基于模糊知識圖譜構(gòu)建第一視圖和第二視圖,包括:
3.如權(quán)利要求1所述的方法,其特征是,所述利用知識圖譜嵌入模型對所述第一視圖中的三元組進(jìn)行編碼,得到第一嵌入,包括:
4.如權(quán)利要求1所述的方法,其特征是,所述利用所述知識圖譜嵌入模型對所述第二視圖中的三元組進(jìn)行編碼,得到第二嵌入,包括:
5.如權(quán)利要求1所述的方法,其特征是,所述基于模糊RDF?KG嵌入損失和對比學(xué)習(xí)損失對所述知識圖譜嵌入模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的知識圖譜嵌入模型之前,所述方法還包括:
6.如權(quán)利要求1-5中任一項(xiàng)所述的方法,其特征是,所述對比學(xué)習(xí)損失基于所述模糊知識圖譜中三元組對應(yīng)的所述第一嵌入和所述第二嵌入之間的相似度確定。
7.如權(quán)利要求6所述的方法,其特征是,所述對比學(xué)習(xí)損失為:
8.一種模糊知識圖譜對比嵌入裝置,其特征是,包括:
9.一種電子設(shè)備,包括:存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的程序;其
10.一種可讀存儲(chǔ)介質(zhì),用于存儲(chǔ)程序,其特征是,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的模糊知識圖譜對比嵌入方法中的步驟。
...【技術(shù)特征摘要】
1.一種模糊知識圖譜對比嵌入方法,其特征是,包括:
2.如權(quán)利要求1所述的方法,其特征是,所述基于模糊知識圖譜構(gòu)建第一視圖和第二視圖,包括:
3.如權(quán)利要求1所述的方法,其特征是,所述利用知識圖譜嵌入模型對所述第一視圖中的三元組進(jìn)行編碼,得到第一嵌入,包括:
4.如權(quán)利要求1所述的方法,其特征是,所述利用所述知識圖譜嵌入模型對所述第二視圖中的三元組進(jìn)行編碼,得到第二嵌入,包括:
5.如權(quán)利要求1所述的方法,其特征是,所述基于模糊rdf?kg嵌入損失和對比學(xué)習(xí)損失對所述知識圖譜嵌入模型進(jìn)行訓(xùn)練,得到訓(xùn)練好的知識圖譜嵌入模型之前,所述方法還包括:
6.如權(quán)利要求1-...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:豆亞杰,馬玉鳳,戴昱龍,賈清揚(yáng),仇彪彪,王紀(jì)凱,袁仁鵬,歐陽偉俊,陳航,劉曦,姜江,楊克巍,李明浩,于海躍,唐帥文,譚躍進(jìn),
申請(專利權(quán))人:中國人民解放軍國防科技大學(xué),
類型:發(fā)明
國別省市:
還沒有人留言評論。發(fā)表了對其他瀏覽者有用的留言會(huì)獲得科技券。