System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及人工智能及金融科技,尤其是涉及到缺失數據的處理方法、裝置、設備及介質。
技術介紹
1、隨著大數據技術的快速發展,數據缺失是數據分析和挖掘過程中常見的難題之一。在壽險場景中,客戶數據的飽和度也存在明顯的不平衡性,例如老客戶的數據飽和度高,而新客戶的數據飽和度一般較低,因而導致對新客戶的開發和智能營銷帶來很大的挑戰。
2、傳統的缺失數據處理方法主要有三種:①直接刪除;②統計方法填補:如均值、中位數、眾數等;③插值法:如線性插值、多項式插值等。以上三種處理方法中,直接刪除往往會造成信息丟失,而統計方法和插值法難以處理高維、非線性等復雜的數據關系及數據分布情況。此外,現有方法在處理缺失數據時也可能會引入偏見和誤差,影響后續的數據分析和決策。
技術實現思路
1、有鑒于此,本申請提供了缺失數據的處理方法、裝置、設備及介質,主要目的在于解決現有缺失數據刪除與缺失數據填充的方案無法保證數據的準確性和完整性的技術問題。
2、根據本申請的一個方面,提供了一種缺失數據的處理方法,該方法包括:
3、根據任務應用需求獲取待填充的圖結構數據;
4、根據所述圖結構數據中的每個節點,利用圖神經網絡模型生成每個節點的向量化表示;
5、根據所述向量化表示,生成每個節點的節點相似度矩陣;
6、根據所述節點相似度矩陣,填充每個節點中的缺失數據。
7、根據本申請的另一方面,提供了一種缺失數據的處理裝置,該裝置包括:
8
9、第一生成模塊,用于根據所述圖結構數據中的每個節點,利用圖神經網絡模型生成每個節點的向量化表示;
10、第二生成模塊,用于根據所述向量化表示,生成每個節點的節點相似度矩陣;
11、填充模塊,用于根據所述節點相似度矩陣,填充每個節點中的缺失數據。
12、依據本申請又一個方面,提供了一種計算機存儲介質,其上存儲有計算機程序,所述程序被處理器執行時實現上述缺失數據的處理方法。
13、依據本申請再一個方面,提供了一種計算機設備,包括存儲介質、處理器及存儲在存儲介質上并可在處理器上運行的計算機程序,所述處理器執行所述程序時實現上述缺失數據的處理方法。
14、借由上述技術方案,本申請提供的缺失數據的處理方法、裝置、設備及介質,與現有直接刪除數據項以及通過統計方法和插值法填充數據項的技術方案相比,本申請根據任務應用需求獲取待填充的圖結構數據,并根據所述圖結構數據中的每個節點,利用圖神經網絡模型生成每個節點的向量化表示,以便根據所述向量化表示,生成每個節點的節點相似度矩陣,進而根據所述節點相似度矩陣,填充每個節點中的缺失數據。可見,利用圖神經網絡模型的特征學習和關系建模能力,獲取圖結構數據中每個節點的低維稠密的向量化表示,并利用節點相似度矩陣獲取具有較高趨同性的相近節點,以填充缺失數據,從而提供更準確的數據補全和預測,進而有效提升后續數據分析和決策的準確性。
15、上述說明僅是本申請技術方案的概述,為了能夠更清楚了解本申請的技術手段,而可依照說明書的內容予以實施,并且為了讓本申請的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本申請的具體實施方式。
本文檔來自技高網...【技術保護點】
1.一種缺失數據的處理方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述根據任務應用需求獲取待填充的圖結構數據的步驟,包括:
3.根據權利要求1所述的方法,其特征在于,所述根據所述圖結構數據中的每個節點,利用圖表示學習模型生成每個節點的向量化表示的步驟,包括:
4.根據權利要求1或3所述的方法,其特征在于,所述根據所述節點相似度矩陣,填充每個節點中的缺失數據的步驟,包括:
5.根據權利要求4所述的方法,其特征在于,所述根據所述節點集合,填充每個節點中的缺失數據的步驟,具體包括:
6.根據權利要求2所述的方法,其特征在于,所述方法還包括:
7.根據權利要求1所述的方法,其特征在于,所述方法還包括:
8.一種缺失數據的處理裝置,其特征在于,包括:
9.一種計算機存儲介質,其上存儲有計算機程序,其特征在于,所述程序被處理器執行時實現權利要求1至7中任一項所述缺失數據的處理方法。
10.一種計算機設備,包括存儲介質、處理器及存儲在存儲介質上并可在處理器上運行的
...【技術特征摘要】
1.一種缺失數據的處理方法,其特征在于,包括:
2.根據權利要求1所述的方法,其特征在于,所述根據任務應用需求獲取待填充的圖結構數據的步驟,包括:
3.根據權利要求1所述的方法,其特征在于,所述根據所述圖結構數據中的每個節點,利用圖表示學習模型生成每個節點的向量化表示的步驟,包括:
4.根據權利要求1或3所述的方法,其特征在于,所述根據所述節點相似度矩陣,填充每個節點中的缺失數據的步驟,包括:
5.根據權利要求4所述的方法,其特征在于,所述根據所述節點集合,填充每個節點中的缺失數據的步驟,具體包...
【專利技術屬性】
技術研發人員:林俊鑫,
申請(專利權)人:中國平安人壽保險股份有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。