System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本專利技術屬于智能博弈,尤其涉及一種基于知識圖譜的博弈任務需求智能生成方法及系統。
技術介紹
1、隨著人工智能的飛速發展,智能博弈已經成為當今研究的熱點之一,其中戰略性推演領域的智能博弈研究也逐漸興起。本專利技術的研究聚焦于兵棋推演場景下任務需求的智能生成方法,兵棋推演中的博弈問題遠比圍棋上的問題困難,難點主要在于推演狀態的復雜性、任務組合的多樣性和推演時間長。智能博弈通過模擬復雜的決策環境,幫助人們或機器在面對不確定性和競爭對手的情況下做出更優的決策。這樣可以提升在現實生活中,例如商業、軍事、金融等領域的決策質量。
2、現有的方法多使用深度強化學習或者多智能體的方法對兵棋推演的回放進行學習。但是基于深度強化學習的方法需要大量的計算資源,訓練成本大,訓練時間長并且任務生成過程可解釋性較低。
3、因此,目前急需一種需要訓練時間短、準確率高、具備可解釋性的任務生成方法。
技術實現思路
1、針對上述問題,本專利技術提出一種基于知識圖譜的博弈任務需求智能生成方法及系統,將兵棋推演中的任務詳情表示為知識圖譜,并通過神經網絡對圖節點與關系進行時間上的預測,進而獲取下一步任務,這樣不僅訓練時間短,而且模型可解釋性高,準確率也高。
2、為實現上述目的,本專利技術的技術方案包括以下內容。
3、一種基于知識圖譜的博弈任務需求智能生成方法,所述方法包括:
4、基于兵棋推演的當前對局狀態,生成當前時刻對局狀態知識圖譜;其中,對局狀態知識圖譜中的節
5、通過聚合節點周圍信息,得到當前時刻對局狀態知識圖譜中的節點向量;
6、將當前時刻對局狀態知識圖譜與之前時刻對局狀態知識圖譜視為時間上的序列,并基于循環神經網絡對該序列進行編碼,得到當前時刻的全局表示、節點局部表示和關系局部表示;
7、基于全局表示、節點局部表示、關系局部表示以及當前時刻對局狀態知識圖譜中的節點向量,生成當前時刻的執行任務。
8、進一步地,所述基于兵棋推演過程中的對局狀態與執行操作,生成當前時刻對局狀態知識圖譜,包括:
9、獲取當前時刻兵棋推演的對局狀態;其中,所述對局狀態包括當前時刻兵棋推演的實體以及對應的實體狀態;
10、將上一時刻到當前時刻之間的有效操作集at,作為當前時刻兵棋推演的執行操作;其中,所述有效操作集at的第一個動作為上一時刻的執行任務;
11、生成當前時刻的幀節點;
12、將當前時刻兵棋推演的實體作為所述當前時刻對局狀態知識圖譜中的實體節點,并基于所述當前時刻兵棋推演的實體狀態,將所述實體節點與所述幀節點相連;
13、基于任務類別生成任務操作節點,并基于當前時刻兵棋推演的執行操作,將所述任務操作節點與所述幀節點相連;
14、在時間維度上將相鄰的幀節點相連,得到當前時刻對局狀態知識圖譜。
15、進一步地,所述實體包括:單位、建筑、科技和資源;所述實體狀態包括:擁有、觀察到、訓練、建造和研究。
16、進一步地,所述任務類別包括:建造建筑、訓練單元、研究技術、建筑變形和空任務。
17、進一步地,所述通過聚合節點周圍信息,得到當前時刻對局狀態知識圖譜中的節點向量,包括:
18、生成所述對局狀態知識圖譜的鄰接矩陣;
19、基于所述鄰接矩陣,生成對局狀態知識圖譜三元組(s,r,e);其中,s表示頭節點,r表示關系,e表示尾節點;
20、基于頭節點的可學習嵌入向量vs、關系的可學習嵌入向量vs和尾節點的可學習嵌入向量ve,計算尾節點e傳遞給頭節點s的注意力值αe;其中,所述可學習嵌入向量vs、所述可學習嵌入向量vs和所述學習嵌入向量ve基于xavier均勻分布進行初始化;
21、基于所述注意力值αe聚合可學習嵌入向量ve,得到頭節點s的節點向量。
22、進一步地,所述基于循環神經網絡對該序列進行編碼,得到全局表示和局部表示,包括:
23、基于當前時刻對局狀態知識圖譜的全局圖結構f(gt)以及上一時刻對局狀態知識圖譜的全局表示ut-1,計算當前時刻對局狀態知識圖譜的全局表示ut;
24、基于當前時刻對局狀態知識圖譜的節點向量、當前時刻對局狀態知識圖譜的全局表示ut以及上一時刻對局狀態知識圖譜的關系局部表示lt-1(s,r),計算前時刻對局狀態知識圖譜的關系局部表示lt(s,r);其中,所述局部表示lt(s,r)專注于所述當前時刻對局狀態知識圖譜中邊的局部信息;
25、基于當前時刻對局狀態知識圖譜的節點向量、當前時刻對局狀態知識圖譜的全局表示ut以及上一時刻對局狀態知識圖譜的節點局部表示lt-1(s),計算前時刻對局狀態知識圖譜的節點局部表示lt(s);其中,所述局部表示lt(s)專注于所述當前時刻對局狀態知識圖譜中節點的局部信息。
26、進一步地,基于全局表示、節點局部表示、關系局部表示以及當前時刻對局狀態知識圖譜中的節點向量,生成當前時刻的執行任務,包括:
27、獲取前h步的事件gt-h:t-1;
28、基于所述全局表示計算該事件gt-h:t-1對應的頭實體s;
29、基于該頭實體s的節點向量vs和節點局部表示lt-1(s),得到該事件gt-h:t-1對應的關系r;
30、基于該頭實體s的節點向量vs以及該關系r的邊向量vr和關系局部表示lt-1(s,r),得到該事件gt-h:t-1對應的尾節點;
31、根據該事件gt-h:t-1對應的任務操作節點,得到當前時刻的執行任務。
32、一種基于知識圖譜的博弈任務需求智能生成系統,所述系統包括:
33、知識圖譜生成模塊,用于基于兵棋推演的當前對局狀態,生成當前時刻對局狀態知識圖譜;其中,對局狀態知識圖譜中的節點包括:幀節點、實體節點和任務操作節點;
34、節點向量計算模塊,用于通過聚合節點周圍信息,得到當前時刻對局狀態知識圖譜中的節點向量;
35、全局與局部表示生成模塊,用于將當前時刻對局狀態知識圖譜與之前時刻對局狀態知識圖譜視為時間上的序列,并基于循環神經網絡對該序列進行編碼,得到當前時刻的全局表示、節點局部表示和關系局部表示;
36、任務生成模塊,用于基于全局表示、節點局部表示、關系局部表示以及當前時刻對局狀態知識圖譜中的節點向量,生成當前時刻的執行任務。
37、一種電子設備,其特征在于,所述電子設備包括:處理器以及存儲有計算機程序指令的存儲器;所述處理器執行所述計算機程序指令時實現上述任一項所述的基于知識圖譜的博弈任務需求智能生成方法。
38、一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有計算機程序指令,所述計算機程序指令被處理器執行時實現上述任一項所述的基于知識圖譜的博弈任務需求智能生成方法。
39、本文檔來自技高網...
【技術保護點】
1.一種基于知識圖譜的博弈任務需求智能生成方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述基于兵棋推演過程中的對局狀態與執行操作,生成當前時刻對局狀態知識圖譜,包括:
3.根據權利要求2所述的方法,其特征在于,所述實體包括:單位、建筑、科技和資源;所述實體狀態包括:擁有、觀察到、訓練、建造和研究。
4.根據權利要求2所述的方法,其特征在于,所述任務類別包括:建造建筑、訓練單元、研究技術、建筑變形和空任務。
5.根據權利要求1所述的方法,其特征在于,所述通過聚合節點周圍信息,得到當前時刻對局狀態知識圖譜中的節點向量,包括:
6.根據權利要求5所述的方法,其特征在于,所述基于循環神經網絡對該序列進行編碼,得到全局表示和局部表示,包括:
7.根據權利要求5所述的方法,其特征在于,基于全局表示、節點局部表示、關系局部表示以及當前時刻對局狀態知識圖譜中的節點向量,生成當前時刻的執行任務,包括:
8.一種基于知識圖譜的博弈任務需求智能生成系統,其特征在于,所述系統包括:
...【技術特征摘要】
1.一種基于知識圖譜的博弈任務需求智能生成方法,其特征在于,所述方法包括:
2.根據權利要求1所述的方法,其特征在于,所述基于兵棋推演過程中的對局狀態與執行操作,生成當前時刻對局狀態知識圖譜,包括:
3.根據權利要求2所述的方法,其特征在于,所述實體包括:單位、建筑、科技和資源;所述實體狀態包括:擁有、觀察到、訓練、建造和研究。
4.根據權利要求2所述的方法,其特征在于,所述任務類別包括:建造建筑、訓練單元、研究技術、建筑變形和空任務。
5.根據權利要求1所述的方法,其特征在于,所述通過聚合節點周圍信息,得到當前時刻對局狀態知識圖譜中的節點向量,包括:
6.根據權利要求5所述的方法,其特征在于,所述基于循環神經網絡對該序列進行編碼,...
【專利技術屬性】
技術研發人員:王丹丹,朱家震,王青,
申請(專利權)人:中國科學院軟件研究所,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。