System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本公開總體說來涉及人工智能算法和自然語言處理,更具體地,涉及一種可解釋的無人機任務決策方法及裝置。
技術介紹
1、在相關領域中,隨著人工智能相關技術的快速發展,對于各種智能任務的處理逐漸成為熱門問題。針對與無人機領域的無人機任務的處理方面,已經提出了一些智能決策方法和系統。傳統的智能決策系統主要依賴于規則基礎系統和專家系統,通過預定義的規則集和邏輯集來進行決策。這些決策系統雖然具有較強的可解釋性且在一些特定場景下表現出較強的適應性,但是由于其缺乏自適應性和靈活性,因此傳統的決策系統難以應對例如無人機任務決策相關的復雜環境。
2、針對包括復雜環境的無人機任務的決策,目前亟需實現這種無人機任務相關決策的可解釋性研究,并且需要一種改進的無人機任務相關的決策方法。
技術實現思路
1、本公開的實施例提供一種可解釋的無人機任務決策方法及裝置,通過利用shap算法對針對包括時間序列和動態環境的無人機任務數據的動態決策結果進行特征分析,提供對復雜的無人機調整決策方案的決策過程的全面解釋。
2、在一個總體方面,提供了一種可解釋的無人機任務決策方法,所述無人機任務決策方法包括:獲取針對無人機決策任務的第一輸入數據集,所述第一輸入數據集是以表格形式存儲的基于時間序列和動態環境的無人機任務數據,所述無人機任務數據包括針對目標任務的位置數據、與目標任務相關的至少一個障礙物的位置數據、與目標任務相關的當前航線數據、與目標任務相關的時間數據;將所述第一輸入數據集輸入到預先構建的第一預設決
3、可選地,所述將所述第一策略數據集和所述第一輸入數據集輸入到基于shap算法的特征分析模型,得到針對所述無人機決策任務的決策特征數據集的步驟可包括:針對所述第一策略數據集中的每種策略,從所述第一輸入數據集中提取與每種策略相對應的當前輸入數據;對每種策略的當前輸入數據進行基于shap值的特征分析,并且基于與分析出的不同特征在不同策略所對應的情境下的邊際貢獻來進行特征提取,得到對每種策略的當前策略影響程度最大的特征集,作為針對每種策略的當前輸入數據的決策特征數據集,并且將針對每種策略的當前輸入數據的決策特征數據集進行匯總,得到針對所述無人機決策任務的決策特征數據集。
4、可選地,可通過以下公式來計算所述對每種策略的當前策略影響程度最大的特征集中包含的每個特征對應的邊際貢獻:
5、
6、其中,表示每個特征對應的邊際貢獻函數, u表示預設特征子集合作后得到的效用函數, n表示特征全集, n表示特征全集的數量, s表示特征子集的數量, i表示當前特征的序號, k是大于等于1且小于等于 n的整數。
7、可選地,所述第二預設決策模型的構建過程可包括:從所述決策特征數據集中選擇多個特征;根據針對所述多個特征的預設評估參數,構建決策樹的各個節點,直到滿足預設終止條件時結束所述構建過程。
8、可選地,所述第一預設決策模型可包括基于強化學習算法的決策模型、基于深度學習算法的決策模型和基于貝葉斯網絡算法的決策模型中的至少一者。
9、可選地,所述第一預設決策模型可包括基于強化學習算法的決策模型,并且所述將所述第一輸入數據集輸入到預先構建的第一預設決策模型,得到用于輸出決策結果的第一策略數據集的步驟可包括:基于所述第一輸入數據集,執行包括行動、反饋、調整、再行動的強化學習操作,得到滿足使與預設累計獎勵目標最大化的條件的決策結果,作為所述第一策略數據集。
10、可選地,所述第一預設決策模型可包括基于深度學習算法的決策模型,并且可通過以下方式來訓練所述第一預設決策模型:獲取針對無人機決策任務的第一樣本數據集,所述第一樣本數據集是以表格形式存儲的基于時間序列和動態環境的樣本無人機任務數據,所述樣本無人機任務數據包括針對預設任務的位置數據、與預設任務相關的至少一個障礙物的位置數據、與預設任務相關的當前航線數據、與預設任務相關的時間數據;基于所述第一樣本數據集,確定對應的樣本策略數據集,所述對應的樣本策略數據集包括用于指示無人機針對預設任務的下一動作的調整方案;基于所述第一樣本數據集和所述對應的樣本策略數據集,計算預設損失函數;根據所述預設損失函數,調整所述第一預設決策模型的模型參數,得到訓練后的第一預設決策模型。
11、在另一總體方面,提供了一種可解釋的無人機任務決策裝置,所述無人機任務決策裝置包括:數據獲取模塊,被配置為:獲取針對無人機決策任務的第一輸入數據集,所述第一輸入數據集是以表格形式存儲的基于時間序列和動態環境的無人機任務數據,所述無人機任務數據包括針對目標任務的位置數據、與目標任務相關的至少一個障礙物的位置數據、與目標任務相關的當前航線數據、與目標任務相關的時間數據;決策生成模塊,被配置為:將所述第一輸入數據集輸入到預先構建的第一預設決策模型,得到用于輸出決策結果的第一策略數據集,所述第一策略數據集包括用于指示無人機針對目標任務的下一動作的調整方案;特征分析模塊,被配置為:將所述第一策略數據集和所述第一輸入數據集輸入到基于shap算法的特征分析模型,得到針對所述無人機決策任務的決策特征數據集,所述決策特征數據集包括與所述調整方案相對應的無人機決策特征數據;決策解釋模塊,被配置為:利用所述決策特征數據集構建基于決策樹算法的第二預設決策模型,得到用于呈現針對所述調整方案的決策路徑和決策理由的決策樹數據,作為用于解釋所述無人機決策任務的解釋數據集。
12、可選地,所述將所述第一策略數據集和所述第一輸入數據集輸入到基于shap算法的特征分析模型,得到針對所述無人機決策任務的決策特征數據集的操作可包括:針對所述第一策略數據集中的每種策略,從所述第一輸入數據集中提取與每種策略相對應的當前輸入數據;對每種策略的當前輸入數據進行基于shap值的特征分析,并且基于與分析出的不同特征在不同策略所對應的情境下的邊際貢獻來進行特征提取,得到對每種策略的當前策略影響程度最大的特征集,作為針對每種策略的當前輸入數據的決策特征數據集,并且將針對每種策略的當前輸入數據的決策特征數據集進行匯總,得到針對所述無人機決策任務的決策特征數據集。
13、可選地,可通過以下公式來計算所述對每種本文檔來自技高網...
【技術保護點】
1.一種可解釋的無人機任務決策方法,其特征在于,所述無人機任務決策方法包括:
2.根據權利要求1所述的無人機任務決策方法,其特征在于,所述將所述第一策略數據集和所述第一輸入數據集輸入到基于SHAP算法的特征分析模型,得到針對所述無人機決策任務的決策特征數據集的步驟包括:
3.根據權利要求2所述的無人機任務決策方法,其特征在于,通過以下公式來計算所述對每種策略的當前策略影響程度最大的特征集中包含的每個特征對應的邊際貢獻:
4.根據權利要求1所述的無人機任務決策方法,其特征在于,所述第二預設決策模型的構建過程包括:
5.根據權利要求1所述的無人機任務決策方法,其特征在于,所述第一預設決策模型包括基于強化學習算法的決策模型、基于深度學習算法的決策模型和基于貝葉斯網絡算法的決策模型中的至少一者。
6.根據權利要求5所述的無人機任務決策方法,其特征在于,所述第一預設決策模型包括基于強化學習算法的決策模型,并且所述將所述第一輸入數據集輸入到預先構建的第一預設決策模型,得到用于輸出決策結果的第一策略數據集的步驟包括:
7.
8.一種可解釋的無人機任務決策裝置,其特征在于,所述無人機任務決策裝置包括:
9.一種計算機程序產品,其特征在于,所述計算機程序產品包括計算機程序/指令,所述計算機程序/指令被處理器執行時實現如權利要求1至7中的任一權利要求所述的可解釋的無人機任務決策方法。
10.一種計算設備,其特征在于,所述計算設備包括:至少一個處理器;至少一個存儲計算機可執行指令的存儲器,其中,所述計算機可執行指令在被所述至少一個處理器運行時,促使所述至少一個處理器執行如權利要求1至7中的任一權利要求所述的可解釋的無人機任務決策方法。
...【技術特征摘要】
1.一種可解釋的無人機任務決策方法,其特征在于,所述無人機任務決策方法包括:
2.根據權利要求1所述的無人機任務決策方法,其特征在于,所述將所述第一策略數據集和所述第一輸入數據集輸入到基于shap算法的特征分析模型,得到針對所述無人機決策任務的決策特征數據集的步驟包括:
3.根據權利要求2所述的無人機任務決策方法,其特征在于,通過以下公式來計算所述對每種策略的當前策略影響程度最大的特征集中包含的每個特征對應的邊際貢獻:
4.根據權利要求1所述的無人機任務決策方法,其特征在于,所述第二預設決策模型的構建過程包括:
5.根據權利要求1所述的無人機任務決策方法,其特征在于,所述第一預設決策模型包括基于強化學習算法的決策模型、基于深度學習算法的決策模型和基于貝葉斯網絡算法的決策模型中的至少一者。
6.根據權利要求5所述的無人機任務決策方法,其特征在于,所述第一預設決策模型包括基于強化...
【專利技術屬性】
技術研發人員:楊陽,蔡懷廣,白江波,章路,張文生,
申請(專利權)人:中國科學院自動化研究所,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。