System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內(nèi)的位置。 參數(shù)名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術(shù)實(shí)現(xiàn)步驟摘要】
本專利技術(shù)涉及圖神經(jīng)網(wǎng)絡(luò),更具體地說,本專利技術(shù)涉及一種基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)學(xué)者表示方法及系統(tǒng)。
技術(shù)介紹
1、學(xué)術(shù)論文蘊(yùn)含著巨大的知識(shí)價(jià)值,但學(xué)術(shù)論文網(wǎng)絡(luò)往往包含論文、學(xué)者、機(jī)構(gòu)、引文、領(lǐng)域等多種異構(gòu)實(shí)體和復(fù)雜關(guān)系,給知識(shí)挖掘帶來了新的挑戰(zhàn)與難題。異構(gòu)圖神經(jīng)網(wǎng)絡(luò)作為圖表示學(xué)習(xí)的新興技術(shù),主要利用半監(jiān)督方法實(shí)現(xiàn)異構(gòu)圖的表征學(xué)習(xí)和分類等下游任務(wù),在社交網(wǎng)絡(luò)、生物醫(yī)學(xué)網(wǎng)絡(luò)等異構(gòu)圖上取得了較好的效果。學(xué)術(shù)論文網(wǎng)絡(luò)作為一種典型的異構(gòu)圖網(wǎng)絡(luò),現(xiàn)有模型在學(xué)習(xí)該網(wǎng)絡(luò)的表征時(shí)存在標(biāo)簽依賴、魯棒性差等問題;同時(shí),現(xiàn)有方法在異構(gòu)學(xué)者網(wǎng)絡(luò)社區(qū)檢測(cè)中大多忽略社區(qū)重疊性和聚類特征信息,存在社區(qū)邊界模糊、準(zhǔn)確度低等問題,為了解決上述問題,現(xiàn)提供一種技術(shù)方案。
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有技術(shù)的上述缺陷,本專利技術(shù)提供一種基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)學(xué)者表示方法及系統(tǒng),通過使用提出的自適應(yīng)對(duì)比學(xué)習(xí)的學(xué)術(shù)異構(gòu)圖神經(jīng)網(wǎng)絡(luò)模型進(jìn)行節(jié)點(diǎn)嵌入,基于重疊集群和深度聚類的學(xué)者社區(qū)檢測(cè)算法進(jìn)行學(xué)者社區(qū)檢測(cè),在這兩者的基礎(chǔ)上開發(fā)了學(xué)者領(lǐng)域社區(qū)檢測(cè)系統(tǒng),最終實(shí)現(xiàn)了領(lǐng)域核心學(xué)者推薦和學(xué)者關(guān)聯(lián)多重社區(qū)檢測(cè)的功能,并進(jìn)行了可視化展示,以解決上述
技術(shù)介紹
中提出的問題。
2、為實(shí)現(xiàn)上述目的,本專利技術(shù)提供如下技術(shù)方案:
3、一種基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)學(xué)者表示方法,包括如下步驟:
4、步驟1,基于對(duì)比學(xué)習(xí)構(gòu)建異構(gòu)圖表示學(xué)習(xí)模型,通過使用對(duì)比學(xué)習(xí)構(gòu)建自監(jiān)督異構(gòu)圖神經(jīng)網(wǎng)絡(luò)模型并改進(jìn)擾動(dòng)視圖和對(duì)比機(jī)制;
5、步驟2
6、步驟3,使用聚類信息作為高置信軟標(biāo)簽監(jiān)督屬性和結(jié)構(gòu)信息的融合,使生成的學(xué)者特征向量具有更凝聚的集群分布和準(zhǔn)確度;
7、步驟4,基于開放學(xué)術(shù)數(shù)據(jù)集的構(gòu)建異構(gòu)學(xué)術(shù)網(wǎng)絡(luò)表示和檢測(cè)系統(tǒng),通過集成上述模型算法,實(shí)現(xiàn)核心學(xué)者檢測(cè)和學(xué)者重疊社區(qū)檢測(cè)功能并進(jìn)行可視化展示。
8、作為本專利技術(shù)的進(jìn)一步方案,步驟2中,基于對(duì)比學(xué)習(xí)構(gòu)建異構(gòu)圖表示學(xué)習(xí)模型,通過使用對(duì)比學(xué)習(xí)構(gòu)建自監(jiān)督異構(gòu)圖神經(jīng)網(wǎng)絡(luò)模型并改進(jìn)擾動(dòng)視圖和對(duì)比機(jī)制,具體為:
9、步驟11,通過異構(gòu)圖上的自適應(yīng)數(shù)據(jù)增強(qiáng)方法構(gòu)造擾動(dòng)視圖,根據(jù)邊的異構(gòu)性和重要程度進(jìn)行隨機(jī)刪除,使擾動(dòng)視圖保留主要數(shù)據(jù)結(jié)構(gòu);
10、步驟12,通過圖神經(jīng)網(wǎng)絡(luò)將原始圖轉(zhuǎn)換為特征矩陣,并將擾動(dòng)視圖轉(zhuǎn)換為擾動(dòng)特征矩陣;
11、步驟13,基于生成的擾動(dòng)視圖,提出基于自適應(yīng)關(guān)系權(quán)重的對(duì)比機(jī)制,通過使用結(jié)構(gòu)信息約束正負(fù)樣本的相關(guān)程度,增強(qiáng)模型的對(duì)比性能;
12、步驟14,引入基于自編碼的對(duì)比機(jī)制,使用編碼器將擾動(dòng)視圖中重要信息進(jìn)行壓縮提取,再按原視圖特征進(jìn)行還原,使不同視圖的特征趨于一致,再聯(lián)合兩種對(duì)比損失訓(xùn)練模型學(xué)習(xí)屬性和結(jié)構(gòu)信息。
13、作為本專利技術(shù)的進(jìn)一步方案,步驟2中,基于重疊集群和深度聚類的學(xué)者社區(qū)檢測(cè)算法的構(gòu)建步驟為:
14、步驟21,局部自我網(wǎng)絡(luò)分區(qū):通過分區(qū)算法解耦真實(shí)學(xué)者社區(qū)的重疊結(jié)構(gòu),將學(xué)術(shù)異構(gòu)網(wǎng)絡(luò)的元路徑圖分區(qū)為多個(gè)局部自我網(wǎng)絡(luò),使重疊聚類問題簡(jiǎn)化為非重疊問題;
15、步驟22,全局特征生成:使用對(duì)比自監(jiān)督的方法生成全局重疊特征,使重疊學(xué)者的多個(gè)角色節(jié)點(diǎn)具有不同語義特征;
16、步驟23,社區(qū)深度聚類:在融合屬性和結(jié)構(gòu)信息的同時(shí)使用聚類的高置信軟標(biāo)簽進(jìn)行監(jiān)督,使生成的學(xué)者特征向量具有更凝聚的集群分布,再聯(lián)合圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)學(xué)者的聚類嵌入特征。
17、一種基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)學(xué)者表示系統(tǒng),用于實(shí)現(xiàn)上述的一種基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)學(xué)者表示方法,包括數(shù)據(jù)處理層、深度學(xué)習(xí)層、數(shù)據(jù)存儲(chǔ)層、智能計(jì)算層以及應(yīng)用服務(wù)層;
18、數(shù)據(jù)處理層所使用數(shù)據(jù)抽取自開放學(xué)術(shù)數(shù)據(jù)集,對(duì)原始數(shù)據(jù)進(jìn)行篩選過濾,保留計(jì)算機(jī)近五年的論文并選取四個(gè)二級(jí)領(lǐng)域作為研究領(lǐng)域,并選取具有高影響力的論文和發(fā)表論文數(shù)較多的學(xué)者進(jìn)行社區(qū)檢測(cè);
19、深度學(xué)習(xí)層使用基于對(duì)比學(xué)習(xí)構(gòu)建異構(gòu)圖表示學(xué)習(xí)模型和基于重疊集群和深度聚類的學(xué)者社區(qū)檢測(cè)算法生成學(xué)者的聚類嵌入表示:使用對(duì)比自監(jiān)督表示學(xué)習(xí)模型獲取學(xué)者包含異構(gòu)屬性和結(jié)構(gòu)的特征向量,再使用重疊社區(qū)構(gòu)建模塊將學(xué)者社區(qū)進(jìn)行分區(qū)拆解,基于社區(qū)深度聚類模塊使用部分學(xué)者領(lǐng)域標(biāo)簽進(jìn)行約束,得到重疊學(xué)者的多種向量表征;
20、數(shù)據(jù)存儲(chǔ)層使用mysql學(xué)術(shù)知識(shí)庫存儲(chǔ)數(shù)據(jù)集的原始信息,包括論文、學(xué)者、領(lǐng)域、機(jī)構(gòu)和期刊,基于文件保存深度學(xué)習(xí)層生成的學(xué)者特征向量,通過dgl框架構(gòu)建存儲(chǔ)學(xué)術(shù)圖數(shù)據(jù),統(tǒng)計(jì)圖結(jié)構(gòu)的連接關(guān)系;
21、智能計(jì)算層使用學(xué)者特征向量進(jìn)行聚類分析和業(yè)務(wù)邏輯實(shí)現(xiàn):領(lǐng)域核心學(xué)者排名功能首先使用聚類中心計(jì)算定位社區(qū)的中心向量,再使用類簇距離計(jì)算每個(gè)領(lǐng)域社區(qū)最相關(guān)的學(xué)者,通過學(xué)者關(guān)聯(lián)社區(qū)檢測(cè)功能首先找到學(xué)者的多個(gè)聚類向量,再分別使用類內(nèi)相似度計(jì)算獲得重疊學(xué)者的多維度相關(guān)社區(qū);
22、應(yīng)用服務(wù)層將功能模塊提供給用戶,并使用前端界面進(jìn)行交互傳遞結(jié)果;其中功能模塊分別為聚類可視化、領(lǐng)域核心學(xué)者排名、學(xué)者關(guān)聯(lián)社區(qū)檢測(cè)、學(xué)者和論文詳情展示。
23、本專利技術(shù)一種基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)學(xué)者表示方法及系統(tǒng)的技術(shù)效果和優(yōu)點(diǎn):本專利技術(shù)提出基于對(duì)比學(xué)習(xí)的異構(gòu)圖表示學(xué)習(xí)模型,通過使用對(duì)比學(xué)習(xí)構(gòu)建自監(jiān)督異構(gòu)圖神經(jīng)網(wǎng)絡(luò)模型并改進(jìn)擾動(dòng)視圖和對(duì)比機(jī)制,解決了異構(gòu)學(xué)術(shù)網(wǎng)絡(luò)標(biāo)簽依賴性強(qiáng)、結(jié)構(gòu)復(fù)雜等問題;提出基于重疊集群和深度聚類的學(xué)者社區(qū)檢測(cè)算法,使用局部分區(qū)方法將具有交叉領(lǐng)域?qū)W者的重疊網(wǎng)絡(luò)結(jié)構(gòu)分解為多重節(jié)點(diǎn)嵌入的學(xué)者角色圖,使社區(qū)具有更清晰的聚類邊界;同時(shí)針對(duì)圖嵌入過程缺乏聚類導(dǎo)向的問題,提出使用聚類信息作為高置信軟標(biāo)簽監(jiān)督屬性和結(jié)構(gòu)信息的融合,使生成的學(xué)者特征向量具有更凝聚的集群分布和準(zhǔn)確度;研制基于開放學(xué)術(shù)數(shù)據(jù)集的異構(gòu)學(xué)術(shù)網(wǎng)絡(luò)表示和檢測(cè)系統(tǒng),通過集成上述模型算法,實(shí)現(xiàn)了核心學(xué)者檢測(cè)和學(xué)者重疊社區(qū)檢測(cè)功能并進(jìn)行可視化展示。
本文檔來自技高網(wǎng)...【技術(shù)保護(hù)點(diǎn)】
1.一種基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)學(xué)者表示方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)學(xué)者表示方法,其特征在于,步驟2中,基于對(duì)比學(xué)習(xí)構(gòu)建異構(gòu)圖表示學(xué)習(xí)模型,通過使用對(duì)比學(xué)習(xí)構(gòu)建自監(jiān)督異構(gòu)圖神經(jīng)網(wǎng)絡(luò)模型并改進(jìn)擾動(dòng)視圖和對(duì)比機(jī)制,具體為:
3.根據(jù)權(quán)利要求1所述的基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)學(xué)者表示方法,其特征在于,步驟2中,基于重疊集群和深度聚類的學(xué)者社區(qū)檢測(cè)算法的構(gòu)建步驟為:
4.一種基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)學(xué)者表示系統(tǒng),用于實(shí)現(xiàn)權(quán)利要求1-3任一項(xiàng)所述的一種基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)學(xué)者表示方法,其特征在于,包括數(shù)據(jù)處理層、深度學(xué)習(xí)層、數(shù)據(jù)存儲(chǔ)層、智能計(jì)算層以及應(yīng)用服務(wù)層;
【技術(shù)特征摘要】
1.一種基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)學(xué)者表示方法,其特征在于,包括如下步驟:
2.根據(jù)權(quán)利要求1所述的基于異構(gòu)圖神經(jīng)網(wǎng)絡(luò)學(xué)者表示方法,其特征在于,步驟2中,基于對(duì)比學(xué)習(xí)構(gòu)建異構(gòu)圖表示學(xué)習(xí)模型,通過使用對(duì)比學(xué)習(xí)構(gòu)建自監(jiān)督異構(gòu)圖神經(jīng)網(wǎng)絡(luò)模型并改進(jìn)擾動(dòng)視圖和對(duì)比機(jī)制,具體為:
3.根據(jù)權(quán)利要求1所述的...
【專利技術(shù)屬性】
技術(shù)研發(fā)人員:胡燕林,楊近朱,孫笑科,馮婧怡,黨向磊,李達(dá),
申請(qǐng)(專利權(quán))人:國家計(jì)算機(jī)網(wǎng)絡(luò)與信息安全管理中心,
類型:發(fā)明
國別省市:
還沒有人留言評(píng)論。發(fā)表了對(duì)其他瀏覽者有用的留言會(huì)獲得科技券。