System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于電池知識圖譜數據處理領域,具體涉及一種基于采樣子圖策略的電池知識圖譜摘要生成方法。
技術介紹
1、隨著互聯網的普及,用戶群體規模與日俱增,由此產生大量的數據,進入大數據時代。互聯網領域產生的數據大都使用圖來建模表示,計算機領域將關于圖的處理稱為圖計算,圖摘要作為圖計算的一個重要方面,是大數據分析和處理的重要手段。圖摘要是將大規模的圖歸納為更加簡潔的表示形式的技術,能夠降低圖的規模和復雜性。圖摘要具有廣泛的應用,如社會網絡分析、圖可視化等,對其它分析和處理大規模圖的技術起到了輔助或促進作用,有著重要的研究意義和應用價值。
2、動力電池產業知識圖譜對于分析行業變化、發展趨勢、供求分析等方面有著重要的作用。而近年來隨著動力電池產業的蓬勃發展,動力電池產業知識圖譜數據的爆炸式增長,圖譜數據的傳輸、存儲和有關知識圖譜的挖掘任務的工作量大大增加,電池產業知識圖譜所包含的信息復雜且龐大,如何高效的進行數據挖掘與分析,以及如何快速、高效的將大量電池知識圖譜生成摘要是本領域技術人員亟需解決的問題。
技術實現思路
1、本專利技術的目的就在于提供一種基于采樣子圖策略的電池知識圖譜摘要生成方法,以解決
技術介紹
中提出的問題。
2、本專利技術通過以下技術方案來實現上述目的:
3、一種基于采樣子圖策略的電池知識圖譜摘要生成方法,方法包括:
4、s1:對預先構建的電池產業知識圖譜中各個節點進行節點重要性指標的計算以及排序,并根據預先設定的閾值對各個節點
5、s2:在所述圖譜群組中選擇重要性指標最大的節點,獲取以此節點為中心的特定階數的中心網絡,并將所述中心網絡作為第一子圖摘要,并將所述第一子圖摘要作為圖譜的根摘要;
6、s3:在所述圖譜群組中按照重要性指標大小進行分層抽樣以獲得采樣節點,將所述采樣節點加入所述中心網絡中的中心節點集合;
7、s4:根據所述中心節點集合對圖譜進行特定階數的中心網絡抽取,并將所有中心網絡作為第二子圖摘要;
8、s5:將第一子圖摘要和第二子圖摘要逐個和所述根摘要按設定融合方式融合為目標摘要。
9、作為本專利技術的進一步優化方案,步驟s1中,通過獲取電池產業鏈信息來構建電池產業知識圖譜,電池產業鏈信息至少包括鋰電池產業鏈信息、電解銅箔產業鏈信息、氫燃料電池產業鏈信息、鋰電池負極材料產業鏈信息、硅碳負極材料產業鏈信息、動力電池電解液產業鏈信息、以及各產業經營公司詳細信息。
10、作為本專利技術的進一步優化方案,步驟s1具體為:
11、s1.1:首先針對圖譜中的各個節點進行重要性計算,從而得到所有節點的重要性指標;其中,節點重要性指標的計算方法至少包括:度中心性算法、pagerank算法和hits算法;
12、s1.2:通過對所有節點重要性指標進行排序,并利用設定閾值將具有不同重要性的節點劃分到不同的圖譜群組中,得到如下群組:
13、
14、其中,x為節點的重要性指標,將x排序后得到從大到小的序列,xi≥xi+1,i∈(1,2,3,…,n),n為圖中節點的數量;通過預定義的多個閾值βi≥βi+1,i∈(1,2,3,…,m),將具有不同重要性指標的節點劃分為m+1個群組。
15、作為本專利技術的進一步優化方案,步驟s2中將所述中心網絡作為第一子圖摘要具體為:
16、s2.1:從中心節點開始,利用廣度優先遍歷方法遍歷中心網絡,
17、s2.2:結構處理:遍歷過程中將節點的一階鄰居中具有相同類型的節點、關系進行合并,不同則保留;
18、s2.3:屬性處理:對同類型的節點或關系中所具有的不同屬性進行合并去重;
19、s2.4:最終得到描述中心網絡中節點、關系及其屬性包含信息的圖,將中心網絡對應的圖作為第一子圖摘要。
20、作為本專利技術的進一步優化方案,步驟s3中,所述分層抽樣采用如下方式中的任一種:
21、(1)在所述圖譜群組中,采樣節點數量與節點重要性指標高低成反比;
22、(2)在所述圖譜群組中,采樣節點數量與節點重要性指標高低成正比。
23、作為本專利技術的進一步優化方案,步驟s5中,所述設定融合方式包括結構融合和屬性融合,須按如下融合遵循規則進行:
24、(1)相同類型的節點至多保存兩個;
25、(2)同類型邊僅保留一條;
26、節點或邊的屬性融合過程中須保存屬性信息。
27、本專利技術的有益效果在于:
28、本專利技術提出的圖摘要方法是在保持圖整體結構的同時,將節點和邊進行有效地合并,從而得到更為簡潔、抽象的超圖的過程。與傳統的圖摘要方法不同,本專利技術提出了一種構造速度快的面向知識圖譜的圖聚集方法,可以有效地把一個知識圖譜劃分成一個規模較小,把包含核心知識的摘要知識圖譜,以及由其他從屬知識構成的詳細知識圖譜,將知識圖譜中的核心部分和詳細部分分離能夠大大減少搜索空間從而加速挖掘任務。
本文檔來自技高網...【技術保護點】
1.一種基于采樣子圖策略的電池知識圖譜摘要生成方法,其特征在于,方法包括:
2.根據權利要求1所述的一種基于采樣子圖策略的電池知識圖譜摘要生成方法,其特征在于:步驟S1中,通過獲取電池產業鏈信息來構建電池產業知識圖譜,電池產業鏈信息至少包括鋰電池產業鏈信息、電解銅箔產業鏈信息、氫燃料電池產業鏈信息、鋰電池負極材料產業鏈信息、硅碳負極材料產業鏈信息、動力電池電解液產業鏈信息、以及各產業經營公司詳細信息。
3.根據權利要求1所述的一種基于采樣子圖策略的電池知識圖譜摘要生成方法,其特征在于:步驟S1具體為:
4.根據權利要求1所述的一種基于采樣子圖策略的電池知識圖譜摘要生成方法,其特征在于:步驟S2中將所述中心網絡作為第一子圖摘要具體為:
5.根據權利要求1所述的一種基于采樣子圖策略的電池知識圖譜摘要生成方法,其特征在于:步驟S3中,所述分層抽樣采用如下方式中的任一種:
6.根據權利要求1所述的一種基于采樣子圖策略的電池知識圖譜摘要生成方法,其特征在于:步驟S5中,所述設定融合方式包括結構融合和屬性融合,須按如下融合遵循規則進
...【技術特征摘要】
1.一種基于采樣子圖策略的電池知識圖譜摘要生成方法,其特征在于,方法包括:
2.根據權利要求1所述的一種基于采樣子圖策略的電池知識圖譜摘要生成方法,其特征在于:步驟s1中,通過獲取電池產業鏈信息來構建電池產業知識圖譜,電池產業鏈信息至少包括鋰電池產業鏈信息、電解銅箔產業鏈信息、氫燃料電池產業鏈信息、鋰電池負極材料產業鏈信息、硅碳負極材料產業鏈信息、動力電池電解液產業鏈信息、以及各產業經營公司詳細信息。
3.根據權利要求1所述的一種基于采樣子圖策略的電池知識圖譜摘要生成方法...
【專利技術屬性】
技術研發人員:羅剛,劉振國,趙大鵬,
申請(專利權)人:安徽國麒科技有限公司,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。