System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 日韩精品无码视频一区二区蜜桃 ,av区无码字幕中文色,无码尹人久久相蕉无码
  • 
    <ul id="o6k0g"></ul>
    <ul id="o6k0g"></ul>

    一種基于圖神經網絡的節點分類方法、系統及相關設備技術方案

    技術編號:44486346 閱讀:2 留言:0更新日期:2025-03-04 17:51
    一種基于圖神經網絡的節點分類方法、系統及相關設備,該方法在對模型進行訓練時,先對圖數據樣本中的多個鄰居節點樣本的類別進行預測,獲得多個鄰居節點樣本的類別分布,然后基于該類別分布和用戶輸入的采樣參數,對多個鄰居節點樣本進行采樣獲得多個采樣節點,使得多個采樣節點的類別分布與多個鄰居節點樣本的類別分布相似或一致,這樣采樣得到的采樣節點的特征不僅可以概括所有鄰居節點的特征,減少了計算復雜度,而且采樣節點的類別分布與鄰居節點的真實分布更加貼合,從而提高圖神經網絡的性能。

    【技術實現步驟摘要】

    本申請涉及計算機領域,尤其涉及一種基于圖神經網絡的節點分類方法、系統及相關設備


    技術介紹

    1、圖神經網絡(graph?neural?network,gnn)是一種用于處理圖(graph)數據的神經網絡,傳統的神經網絡可以處理向量或者矩陣形式的數據,gnn專門用于處理具有復雜關系的圖數據,圖數據通常包括多個節點和邊,節點代表圖中的個體或者實體,比如用戶等,每個節點具有自己的特征,比如用戶的姓名,節點之間的邊代表節點之間的關系,比如朋友關系,邊可以包含權重或標簽,用于表示關系的強度或類型。圖神經網絡通過聚合中心節點自身的特征和鄰居節點的特征獲得聚合特征,然后使用聚合特征參與神經網絡的訓練,訓練好的模型可以根據輸入的待檢測節點的圖數據,預測出該待檢測節點的類別。

    2、但是,圖神經網絡中的一個中心節點可能存在很多的鄰居節點,如果將所有鄰居節點的特征與中心節點的特征進行聚合,計算復雜度很高,預測準確率低,難以滿足應用要求。


    技術實現思路

    1、本申請提供了一種基于圖神經網絡的節點分類方法、系統及相關設備,用于解決圖神經網絡預測效果差的問題。

    2、第一方面,提供了一種節點分類方法,該方法包括以下步驟:首先,獲取待檢測節點的圖數據和推理采樣參數,其中,該圖數據包括待檢測節點以及與待檢測節點相連的多個鄰居節點,其次,將圖數據輸入節點分類模型,獲得多個鄰居節點的類別分布,接著根據推理采樣參數和多個鄰居節點的類別分布,對多個鄰居節點進行采樣,獲得多個采樣節點,最后將多個采樣節點的特征以及待檢測節點的特征輸入節點分類模型,獲得待檢測節點的預測類別。

    3、實施第一方面描述的方法,先預測獲得圖數據中多個鄰居節點的類別分布,然后利用該類別分布對多個鄰居節點進行采樣獲得多個采樣節點,再基于采樣節點的特征來預測待檢測節點的預測類別,從而減少計算復雜度,同時,采樣節點的采樣分布是根據多個鄰居節點的預測結果獲得的,而不是根據少量的有標簽的鄰居節點的標簽獲得的,使得采樣節點可以獲得更多鄰居節點的特征,從而提高預測準確率。

    4、在一可能的實現方式中,多個采樣節點的類別分布與多個鄰居節點的類別分布之間的相似度高于第一閾值。

    5、上述實現方式,對多個鄰居節點進行采樣時,采樣分布與多個鄰居節點的類別分布相同或者相似,這樣采樣得到的采樣節點的特征不僅可以概括所有鄰居節點的特征,還可以避免樣本不均衡導致模型在少數類別上的預測效果差的問題。

    6、在一可能的實現方式中,待檢測節點包括有標簽節點和無標簽節點,多個鄰居節點的類別分布是根據有標簽節點的標簽以及無標簽節點的預測結果獲得的,無標簽節點的預測結果是將圖數據輸入節點分類模型之后獲得的。

    7、上述實現方式,本申請使用的鄰居節點的類別分布是根據有標簽鄰居節點的標簽以及無標簽鄰居節點的預測結果獲得的,現有技術會根據有標簽的鄰居節點的特征輸入以及待檢測節點的特征輸入節點分類模型,而有標簽鄰居節點的類別分布與真實的鄰居節點的類別分布是存在差距的,因為并不是每一個鄰居節點都有標簽,而本申請通過預測獲得多個鄰居節點的類別分布,使得每一個鄰居節點都有標簽的分類或者預測的分類,所以預測獲得的類別分布相比有標簽鄰居節點的類別分布會更加貼近真實的分布,以此進行采樣獲得的采樣節點的類別分布也會更加貼近真實的分布,使用貼近真實分布的采樣節點進行推理不僅可以減少計算量,提高推理效率,而且可以獲得更加準確的結果,提高預測效果。

    8、在一可能的實現方式中,推理采樣參數包括采樣節點的數量,也就是需要采樣的鄰居節點的總數量,根據該總數量和鄰居節點的類別分布,可以確定所采樣的每種類別的采樣節點的數量,使得最終獲得的采樣節點的類別分布與鄰居節點的類別分布相似或一致。

    9、可選地,推理采樣參數包括采樣層數,采樣層數用于根據多個鄰居節點的類別分布對多個鄰居節點進行分層采樣獲得多個采樣節點,其中,每個采樣層包括類別相同的多個采樣節點,每個類別的采樣節點對應一個或者多個采樣層。具體實現中,可以在獲取到多個鄰居節點的類別分布之后,根據采樣層數將多個鄰居節點劃分為多個層次,每個層次內的是同一個類別的,然后在不同的采樣層中進行分層采樣,使得抽樣后得到的多個采樣節點的類別分布與多個鄰居節點的類別分布相似或一致,具體可根據需求使用不同的分層采樣方法,如等距分層采樣、等比分層采樣等,本申請不作具體限定。

    10、需要說明的,用戶輸入的采樣層數可以與鄰居節點的類別數量相同或者不同,換句話說,同一個類別的可以被分為一個層次,也可以被分為多個層次,比如鄰居節點擁有5種類別,用戶設定的采樣層數為10層,那么一種類別的鄰居節點被劃分為2個層次,本申請不作具體限定。

    11、上述實現方式,用戶可以根據業務需求靈活設置采樣數量或者采樣參數,使得本申請提供的方案可以靈活適配各種應用場景。同時,某些類別的鄰居節點數量可能明顯少于其他類別,通過將一個類別分成多個層次,并在每個層次中進行抽樣,可以減少鄰居節點的分類不平衡問題對模型訓練的影響,通過在多個不同的層次中抽取來自同一類別的鄰居節點,可以使得所采樣的鄰居節點能夠更好地代表整個類別的特點,可以更好地覆蓋該類別的不同特征和變化趨勢,使用這樣的采樣節點訓練出的模型在處理新的未見樣本時,可以更好地適應各個層次的變化,從而使得訓練的模型有更強的泛化能力。

    12、在一可能的實現方式中,推理采樣參數包括采樣次數,采樣次數用于對多個鄰居節點進行多次采樣,多個采集節點包括多個采集節點集合,一個采集節點集合對應一次采樣,待檢測節點的預測類別是根據多個預測結果獲得的,一個預測結果是一個采樣節點集合輸入節點分類模型獲得的。

    13、具體實現中,可以通過多數投票、加權投票、概率融合、投票閾值等投票策略,基于多個預測結果確定待檢測節點的預測類別,其中,多數投票指的是根據預測結果進行投票,票數最多的類別確定為該待檢測節點的預測類別;加權投票指的是為每個預測結果賦予一個權重,根據權重計算平均值獲得最終的預測結果,根據該最終的預測結果確定待檢測節點的預測類別;概率融合可以對每個預測結果對應的概率值進行平均概率或者最大概率的計算,獲得融合概率,然后根據融合概率確定待檢測節點的預測類別;投票閾值指的是設定一個閾值,當只有票數對多的類別的投票數量超過閾值時,該類別可以確認為待檢測節點的預測類別,應理解,上述舉例用于說明,本申請不對投票策略進行限定。

    14、上述實現方式,通過用戶輸入的采樣次數對多個鄰居節點進行多次采樣,獲得多個預測結果,然后投票獲得最終的預測類別,不同次數的采樣獲得的采樣節點集合存在相同或者不同的鄰居節點,從而最大程度保證每個鄰居節點的特征都可以參與模型的推理,提高模型的預測準確度。

    15、在一可能的實現方式中,在獲取待檢測節點的圖數據和推理采樣參數之前,方法還包括以下步驟:獲取中心節點的圖數據樣本和訓練參數,圖數據樣本包括中心節點以及與中心節點相連的多個鄰居節點樣本,訓練采樣參數包括本文檔來自技高網...

    【技術保護點】

    1.一種基于圖神經網絡的節點分類方法,其特征在于,所述方法包括:

    2.根據權利要求1所述的方法,其特征在于,所述多個采樣節點的類別分布與所述多個鄰居節點的類別分布之間的相似度高于第一閾值。

    3.根據權利要求1或2所述的方法,其特征在于,所述待檢測節點包括有標簽節點和無標簽節點,所述多個鄰居節點的類別分布是根據所述有標簽節點的標簽以及所述無標簽節點的預測結果獲得的,所述無標簽節點的預測結果是將所述圖數據輸入所述節點分類模型之后獲得的。

    4.根據權利要求1至3任一權利要求所述的方法,其特征在于,所述推理采樣參數包括所述采樣節點的數量;

    5.根據權利要求4所述的方法,其特征在于,所述推理采樣參數包括采樣次數,所述采樣次數用于對所述多個鄰居節點進行多次采樣,所述多個采集節點包括多個采集節點集合,一個采集節點集合對應一次采樣,所述待檢測節點的預測類別是根據多個預測結果獲得的,一個預測結果是所述一個采樣節點集合輸入所述節點分類模型獲得的。

    6.根據權利要求1至5任一權利要求所述的方法,其特征在于,在所述獲取待檢測節點的圖數據和推理采樣參數之前,所述方法還包括:

    7.根據權利要求6所述的方法,其特征在于,所述多個采樣節點樣本的生成時間早于所述中心節點的生成時間。

    8.根據權利要求6或7所述的方法,其特征在于,所述將所述多個采樣節點樣本的特征輸入所述初始模型進行訓練,獲得所述節點分類模型包括:

    9.根據權利要求8所述的方法,其特征在于,所述訓練采樣參數包括偽標簽閾值,所述偽標簽的置信度高于所述偽標簽閾值。

    10.根據權利要求1至9任一權利要求所述的方法,其特征在于,所述圖數據包括社交媒體網絡圖數據、交易網絡圖數據、商品網絡圖數據、知識圖譜、生物分子結構圖數據中的任一種。

    11.一種基于圖神經網絡的節點分類系統,其特征在于,所述系統包括:

    12.根據權利要求10所述的系統,其特征在于,所述多個采樣節點的類別分布與所述多個鄰居節點的類別分布之間的相似度高于第一閾值。

    13.根據權利要求11或12所述的系統,其特征在于,所述待檢測節點包括有標簽節點和無標簽節點,所述多個鄰居節點的類別分布是根據所述有標簽節點的標簽以及所述無標簽節點的預測結果獲得的,所述無標簽節點的預測結果是將所述圖數據輸入所述節點分類模型之后獲得的。

    14.根據權利要求11至13任一權利要求所述的系統,其特征在于,所述推理采樣參數包括所述采樣節點的數量;

    15.根據權利要求14所述的系統,其特征在于,所述推理采樣參數包括采樣次數,所述采樣次數用于對所述多個鄰居節點進行多次采樣,所述多個采集節點包括多個采集節點集合,一個采集節點集合對應一次采樣,所述待檢測節點的預測類別是根據多個預測結果獲得的,一個預測結果是所述一個采樣節點集合輸入所述節點分類模型獲得的。

    16.根據權利要求11至15任一權利要求所述的系統,其特征在于,所述系統還包括訓練單元和采樣單元,所述訓練單元,用于在所述獲取單元獲取待檢測節點的圖數據和推理采樣參數之前,獲取中心節點的圖數據樣本和訓練參數,所述圖數據樣本包括所述中心節點以及與所述中心節點相連的多個鄰居節點樣本,所述訓練采樣參數包括所述采樣節點的數量或者采樣層數,所述待檢測節點的圖數據與所述中心節點的圖數據樣本是同一個圖中的不同子圖;

    17.根據權利要求16所述的系統,其特征在于,所述多個采樣節點樣本的生成時間早于所述中心節點的生成時間。

    18.根據權利要求16或17所述的系統,其特征在于,所述系統包括標簽生成單元,

    19.根據權利要求18所述的系統,其特征在于,所述訓練采樣參數包括偽標簽閾值,所述偽標簽的置信度高于所述偽標簽閾值。

    20.根據權利要求11至19任一權利要求所述的系統,其特征在于,所述圖數據包括社交媒體網絡圖數據、交易網絡圖數據、商品網絡圖數據、知識圖譜、生物分子結構圖數據中的任一種。

    21.一種計算設備,其特征在于,所述計算設備包括處理器和存儲器,所述存儲器用于存儲指令,所述處理器用于執行所述指令,以使得所述計算設備實現如權利要求1至10任一權利要求所述的系統。

    22.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質中存儲有指令,所述指令被計算設備或者計算設備集群運行時實現如權利要求1至10任一權利要求所述的系統。

    ...

    【技術特征摘要】

    1.一種基于圖神經網絡的節點分類方法,其特征在于,所述方法包括:

    2.根據權利要求1所述的方法,其特征在于,所述多個采樣節點的類別分布與所述多個鄰居節點的類別分布之間的相似度高于第一閾值。

    3.根據權利要求1或2所述的方法,其特征在于,所述待檢測節點包括有標簽節點和無標簽節點,所述多個鄰居節點的類別分布是根據所述有標簽節點的標簽以及所述無標簽節點的預測結果獲得的,所述無標簽節點的預測結果是將所述圖數據輸入所述節點分類模型之后獲得的。

    4.根據權利要求1至3任一權利要求所述的方法,其特征在于,所述推理采樣參數包括所述采樣節點的數量;

    5.根據權利要求4所述的方法,其特征在于,所述推理采樣參數包括采樣次數,所述采樣次數用于對所述多個鄰居節點進行多次采樣,所述多個采集節點包括多個采集節點集合,一個采集節點集合對應一次采樣,所述待檢測節點的預測類別是根據多個預測結果獲得的,一個預測結果是所述一個采樣節點集合輸入所述節點分類模型獲得的。

    6.根據權利要求1至5任一權利要求所述的方法,其特征在于,在所述獲取待檢測節點的圖數據和推理采樣參數之前,所述方法還包括:

    7.根據權利要求6所述的方法,其特征在于,所述多個采樣節點樣本的生成時間早于所述中心節點的生成時間。

    8.根據權利要求6或7所述的方法,其特征在于,所述將所述多個采樣節點樣本的特征輸入所述初始模型進行訓練,獲得所述節點分類模型包括:

    9.根據權利要求8所述的方法,其特征在于,所述訓練采樣參數包括偽標簽閾值,所述偽標簽的置信度高于所述偽標簽閾值。

    10.根據權利要求1至9任一權利要求所述的方法,其特征在于,所述圖數據包括社交媒體網絡圖數據、交易網絡圖數據、商品網絡圖數據、知識圖譜、生物分子結構圖數據中的任一種。

    11.一種基于圖神經網絡的節點分類系統,其特征在于,所述系統包括:

    12.根據權利要求10所述的系統,其特征在于,所述多個采樣節點的類別分布與所述多個鄰居節點的類別分布之間的相似度高于第一閾值。

    13.根據權利要求11或12所述的系統,其特征在于,所述待檢測節點包括有標簽節點和無標簽節點...

    【專利技術屬性】
    技術研發人員:林方正宋昊楠胡康興王余賢王雄文盧勇
    申請(專利權)人:華為技術有限公司
    類型:發明
    國別省市:

    網友詢問留言 已有0條評論
    • 還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

    1
    主站蜘蛛池模板: 亚洲?v无码国产在丝袜线观看| 免费无码一区二区三区蜜桃大| 人妻无码久久精品| 国产精品无码久久av不卡| 国产AV无码专区亚洲AWWW| 无码人妻丰满熟妇啪啪网站| 中文无码喷潮在线播放| 亚洲日韩中文字幕无码一区| 日韩a级无码免费视频| 无码国产精品一区二区免费式直播| 五月婷婷无码观看| 亚洲AV无码一区二区乱子仑| 亚洲av无码av制服另类专区| 亚洲午夜AV无码专区在线播放| JAVA性无码HD中文| 高h纯肉无码视频在线观看| YY111111少妇无码理论片| 亚洲精品无码日韩国产不卡av| 午夜不卡久久精品无码免费| 中文成人无码精品久久久不卡| av无码aV天天aV天天爽| 亚洲成a人片在线观看天堂无码| 日韩精品久久无码人妻中文字幕| 中文字幕无码人妻AAA片| 国产成人无码a区在线观看视频免费 | 午夜无码熟熟妇丰满人妻| 无码中文字幕av免费放dvd| 国产综合无码一区二区三区| 亚洲精品国产日韩无码AV永久免费网 | 色综合热无码热国产| 亚洲AV色无码乱码在线观看| 久久久久久亚洲Av无码精品专口 | 国产精品午夜无码AV天美传媒| 精品久久久久久无码专区 | 无码VA在线观看| 亚洲av无码日韩av无码网站冲| 亚洲无码一区二区三区| 亚洲日韩精品无码专区加勒比 | 国产精品无码一区二区三区不卡| 亚洲av成人中文无码专区| 无遮掩无码h成人av动漫|