【技術實現步驟摘要】
一種基于人工智能的作戰任務規劃方法及系統
[0001]本專利技術實施例涉及軍事運籌和人工智能
,具體是一種基于人工智能的作戰任務規劃方法及系統。
技術介紹
[0002]作戰任務規劃作為軍事信息系統的大腦,主要是依據上級作戰意圖,以作戰資源和作戰規則為約束條件,運用科學規劃方法和計算機工具,對作戰進程、任務編組、兵力協同、戰場布勢和武器組合運用等進行籌劃設計,擬制生成作戰方案計劃的過程。作戰任務規劃按照服務對象所處指揮層級,分為武器平臺級、戰術級、戰役級和戰略級四個層次。
[0003]隨著新武器、新技術和新作戰概念的不斷發展,現代戰役越來越呈現出高端化發展趨勢:一方面表現為大規模、深協同,即參戰部隊規模、作戰地域、武器種類和武器數量超出以往,打擊目標數量也顯著增加,且不同部隊、地域、武器的協同運用對作戰效果影響較大,使得作戰任務規劃求解壓力巨大;另一方面表現為快節奏、強對抗,即戰場態勢瞬息萬變,武器面臨的火力攔截和電子干擾環境復雜,要求作戰方案計劃必須能夠隨之完成動態調整生成,對作戰任務規劃提出了非常高的效率要求。因此,面對大規模、快節奏的現代高端戰役,傳統的數學規劃或仿生進化等作戰任務規劃方法,建模困難、計算速度慢,已無法滿足戰役級作戰任務規劃要求。
[0004]傳統的作戰任務規劃方法,包括數學規劃和仿生進化等方法。其中,數學規劃方法包括排隊論、動態規劃、存貯論、分支定界、回溯法等,求解大規模作戰任務規劃問題時,難以建模且容易陷入維數災難。仿生進化方法包括遺傳算法、粒子群算法、差分進化算法等,隨 ...
【技術保護點】
【技術特征摘要】
1.一種基于人工智能的作戰任務規劃方法,其特征在于,該方法包括以下步驟:S1、設計作戰任務規劃人工智能AI求解環境;S2、建立多層深度作戰決策神經網絡模型;S3、采用IMPALA強化學習算法訓練所述多層深度作戰決策神經網絡模型;S4、應用所述訓練的結果構建智能作戰任務規劃系統,所述智能作戰任務規劃系統自動生成作戰方案。2.根據權利要求1所述的方法,其特征在于,步驟S1中所述設計作戰任務規劃AI求解環境包括設計狀態特征、設計動作集和設計綜合評價獎勵函數。3.根據權利要求2所述的方法,其特征在于,所述狀態特征包括打擊目標狀態、打擊目標標志狀態、部隊狀態、部隊標志狀態、作戰地域狀態、作戰地域標志狀態和武器類型標志狀態;其中,打擊目標狀態,具體包括:打擊目標屬性,所述打擊目標屬性包括當前打擊目標的序列編號和類型、每個打擊目標的毀傷等級和打擊目標的武器種類數量;打擊目標標志狀態包括:全部有效打擊目標;部隊狀態,具體包括:任務部隊屬性,所述部隊屬性包括當前部隊的序列編號、單個波次最多能發射的武器數量、最多可用的作戰地域數量、所使用的作戰地域;部隊標志狀態,具體包括:部隊全部可使用的武器類型;作戰地域狀態,具體包括:作戰地域被哪支部隊使用、剩余武器類型與數量;戰地域標志狀態,具體包括:每個作戰地域的可用狀態;武器類型標志狀態,具體包括:為每個目標分配的武器類型。4.根據權利要求2所述的方法,其特征在于,所述動作集包括:打擊目標動作、武器類型動作、部隊動作、作戰地域動作和武器數量動作;其中,打擊目標動作,表示當前決策的作戰組的打擊目標;武器類型動作,表示當前決策的作戰組使用的武器類型;部隊動作,表示當前決策的作戰組調用的部隊;作戰地域動作,表示當前決策的作戰組部隊作戰的作戰地域;武器數量動作,表示當前決策的作戰組打擊目標使用的武器數量。5.根據權利要求2所述的方法,其特征在于,所述綜合評價獎勵函數包括作戰效果實現獎勵函數、作戰損失降低獎勵函數和作戰風險管控獎勵函數,所述綜合評價獎勵函數根據如下公式獲取:其中,R為獎勵值;τ1為作戰效果實現獎勵的權重,τ2為作戰損失降低獎勵的權重,τ3為作戰風險管控獎勵的權重,所述權重根據實際情況預先設定;r1為作戰效果實現獎勵函數,r2為作戰損失降低獎勵函數,r3為作戰風險管控獎勵函數。6.根據權利要求1所述的方法,其特征在于,步驟S2中所述多層深度作戰決策神經網絡
模型包括:模型輸入部分和模型輸出部分,所述模型輸出部分包括:價值網絡和策略網絡;所述建立多層深度作戰決策神經網絡模型包括以下步驟:S21、所述輸入部分接收所述作戰任務規劃AI求解環境的3個狀態特征;S22、所述輸入部分采用全連接神經網絡將所述3個狀態特征轉換成一致的維度,并拼接為一個特征向量輸入由GRU循環神經網絡組成的核心網絡進行時間序列特征提??;S23、所述價值網絡獲取所述核心網絡輸出的時間序列特征向量,采用多層全連接神經網絡計算動作價值并輸出所述3個狀態特征的動作價值;S24、所述策略網絡中目標動作策略神經網絡獲取所述核心網絡輸出的時間序列特征向量,以及與目標狀態特征相對應的目標標志狀態特征,通過所述目標標志狀態特征實現決策動作過濾,輸出目標特征向量;其中,所述策略網絡由目標動作策略神經網絡、武器類型動作策略神經網絡、部隊動作策略神經網絡、作戰地域動作策略神經網絡、武器數量動作策略神經網絡依次連接構成,前序動作...
【專利技術屬性】
技術研發人員:王才紅,呂乃冰,許馨月,高軍強,肖保軍,曹揚,趙思聰,吳京輝,趙若帆,
申請(專利權)人:中國人民解放軍九六九零一部隊二六分隊,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。