System.ArgumentOutOfRangeException: 索引和長度必須引用該字符串內的位置。 參數名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技術實現步驟摘要】
本申請涉及人工智能與機器人領域,特別是涉及一種基于動作并行化與圖轉換的應急規劃優化方法、裝置、設備、介質及產品。
技術介紹
1、在人工智能與機器人領域中,智能體的決策能力是決定其智能化程度的一項重要指標,任務規劃作為實現智能體有效決策的一種重要途徑,根據當前環境狀態信息,通過產生一系列動作序列來指引智能體將當前狀態轉變至目標狀態,完成任務需求。
2、在現實世界中,環境的不確定性往往給智能體的任務規劃帶來諸多挑戰。為此,應急規劃作為傳統任務規劃的一個重要分支,旨在關注此類不確定初始狀態的規劃問題。應急規劃器通過前向搜索可用的效應動作和觀察動作,產生樹形結構的應急規劃。輸出的應急規劃由效應動作和觀察動作組成,其執行可視為從根節點到葉節點依次遍歷整棵規劃樹,根據觀察動作獲得的觀察結果選擇正確的分支。在前向狀態搜索過程中,規劃器選擇當前狀態下效用值最高的動作,并應用其動作效果進行當前狀態的轉換,直到目標狀態得到滿足。
3、然而,由于前向狀態搜索過程中,在每個搜索狀態中應急規劃器僅考慮效用值最高的動作,并將其作為該狀態下的后繼動作,因此對于得到的應急規劃結果,僅允許按順序執行,這將導致在長周期、可并行的場景中,應急規劃的執行效率低下。對于現實世界中的復雜機器人任務,這種限制變得更加突出,進一步阻礙了應急規劃方法在生產實際中的落地應用。
技術實現思路
1、本申請的目的是提供一種基于動作并行化與圖轉換的應急規劃方法、裝置、設備、介質及產品,以解決應急規劃執行效率低下的問題
2、為實現上述目的,本申請提供了如下方案:
3、第一方面,本申請提供了一種基于動作并行化與圖轉換的應急規劃方法,包括:
4、根據用戶需求對應的任務,選擇應急規劃器,構建應急規劃樹;所述應急規劃樹包括多個節點;所述節點包括觀察動作節點以及效應動作節點,且所述應急規劃樹上每兩個節點之間的邊具有信念狀態;兩個觀察動作節點對應的觀察動作之間具有多個效應動作;所述觀察動作用于獲取環境狀態信息;所述效應動作用于改變環境狀態;
5、基于所述觀察動作的每個觀察結果進行分支構建觀察動作分支結構;每個所述觀察動作分支結構包括線性效應動作序列,所述線性效應動作序列中包括多個效應動作;
6、抽取所述應急規劃樹中兩個觀察動作節點之間的效應動作以及信念狀態;
7、基于所述信念狀態,確定所述線性效應動作序列中可并行的效應動作對;
8、基于規劃圖模型,將所述可并行的效應動作對表示為層次圖;所述層次圖中的同一級效應動作能夠并行執行;
9、將所有的層次圖以及所述觀察動作分支結構遞歸合并,構建優化后的全局應急規劃樹,并按照所述全局應急規劃樹執行用戶需求對應的任務。
10、第二方面,本申請提供了一種基于動作并行化與圖轉換的應急規劃裝置,包括:
11、應急規劃樹構建模塊,用于根據用戶需求對應的任務,選擇應急規劃器,構建應急規劃樹;所述應急規劃樹包括多個節點;所述節點包括觀察動作節點以及效應動作節點,且所述應急規劃樹上每兩個節點之間的邊具有信念狀態;兩個觀察動作節點對應的觀察動作之間具有多個效應動作;所述觀察動作用于獲取環境狀態信息;所述效應動作用于改變環境狀態;
12、觀察動作分支結構構建模塊,用于基于所述觀察動作的每個觀察結果進行分支構建觀察動作分支結構;每個所述觀察動作分支結構包括線性效應動作序列,所述線性效應動作序列中包括多個效應動作;
13、抽取模塊,用于抽取所述應急規劃樹中兩個觀察動作節點之間的效應動作以及信念狀態;
14、可并行的效應動作對確定模塊,用于基于所述信念狀態,確定所述線性效應動作序列中可并行的效應動作對;
15、層次圖構建模塊,用于基于規劃圖模型,將所述可并行的效應動作對表示為層次圖;所述層次圖中的同一級效應動作能夠并行執行;
16、優化后的全局應急規劃樹構建模塊,用于將所有的層次圖以及所述觀察動作分支結構遞歸合并,構建優化后的全局應急規劃樹,并按照所述全局應急規劃樹執行用戶需求對應的任務。
17、第三方面,本申請提供了一種計算機設備,包括:存儲器、處理器以存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述計算機程序以實現上述中任一項所述的基于動作并行化與圖轉換的應急規劃方法。
18、第四方面,本申請提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該計算機程序被處理器執行時實現上述中任一項所述的基于動作并行化與圖轉換的應急規劃方法。
19、第五方面,本申請提供了一種計算機程序產品,包括計算機程序,該計算機程序被處理器執行時實現上述中任一項所述的基于動作并行化與圖轉換的應急規劃方法。
20、根據本申請提供的具體實施例,本申請公開了以下技術效果:
21、首先,根據用戶需求對應的任務,構建應急規劃樹,并構建觀察動作分支結構,抽取應急規劃樹中兩個觀察動作節點之間的效應動作以及信念狀態,識別應急規劃樹中動作之間隱藏的并行關系,得到線性效應動作序列中可并行的效應動作對;其次,基于規劃圖模型將上述得到的可并行的效應動作對轉化為層次圖,在該層次圖中,同一級的效應動作能夠并行執行,不同于傳統技術方案中這些動作在原始規劃樹中只能按順序排序并執行,本申請確定可并行的效應動作對,并轉換為層次圖,實現效應動作同級并行執行,提高了應急規劃的執行效率。
22、此外,本申請通過識別可并行的效應動作,基于規劃圖模型將該可并行的效應動作轉換成單個層次圖,然后遞歸地將層次圖逐步合并到應急規劃樹中,從而使得最終結果可以支撐效應動作的并行執行并通過觀察動作處理不確定的觀察結果。
本文檔來自技高網...【技術保護點】
1.一種基于動作并行化與圖轉換的應急規劃方法,其特征在于,所述基于動作并行化與圖轉換的應急規劃方法包括:
2.根據權利要求1所述的基于動作并行化與圖轉換的應急規劃方法,其特征在于,基于所述信念狀態,確定所述線性效應動作序列中可并行的效應動作對,具體包括:
3.根據權利要求1所述的基于動作并行化與圖轉換的應急規劃方法,其特征在于,基于規劃圖模型,將所述可并行的效應動作對表示為層次圖,具體包括:
4.根據權利要求3所述的基于動作并行化與圖轉換的應急規劃方法,其特征在于,在擴展過程中,若所述線性效應動作序列中,存在任一效應動作的先決條件在上一個命題層中得到滿足,則將該效應動作插入至下一個動作層中,并將該效應動作的效果添加到下一個命題層中。
5.根據權利要求3所述的基于動作并行化與圖轉換的應急規劃方法,其特征在于,在擴展過程中,構建所述規劃圖模型內節點之間的互斥關系;同一層次上的兩個動作之間包括三種類型的互斥約束;所述互斥約束包括需求競爭約束、不一致效果約束以及執行干擾約束;所述需求競爭約束為兩個動作在前一個命題層中具有互斥前提條件;所述不
6.根據權利要求3所述的基于動作并行化與圖轉換的應急規劃方法,其特征在于,將所有的層次圖以及所述觀察動作分支結構遞歸合并,構建優化后的全局應急規劃樹,并按照所述全局應急規劃樹執行用戶需求對應的任務,具體包括:
7.一種基于動作并行化與圖轉換的應急規劃裝置,其特征在于,所述基于動作并行化與圖轉換的應急規劃裝置包括:
8.一種計算機設備,包括:存儲器、處理器以及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序以實現權利要求1-6中任一項所述的基于動作并行化與圖轉換的應急規劃方法。
9.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該計算機程序被處理器執行時實現權利要求1-6中任一項所述的基于動作并行化與圖轉換的應急規劃方法。
10.一種計算機程序產品,包括計算機程序,其特征在于,該計算機程序被處理器執行時實現權利要求1-6中任一項所述的基于動作并行化與圖轉換的應急規劃方法。
...【技術特征摘要】
1.一種基于動作并行化與圖轉換的應急規劃方法,其特征在于,所述基于動作并行化與圖轉換的應急規劃方法包括:
2.根據權利要求1所述的基于動作并行化與圖轉換的應急規劃方法,其特征在于,基于所述信念狀態,確定所述線性效應動作序列中可并行的效應動作對,具體包括:
3.根據權利要求1所述的基于動作并行化與圖轉換的應急規劃方法,其特征在于,基于規劃圖模型,將所述可并行的效應動作對表示為層次圖,具體包括:
4.根據權利要求3所述的基于動作并行化與圖轉換的應急規劃方法,其特征在于,在擴展過程中,若所述線性效應動作序列中,存在任一效應動作的先決條件在上一個命題層中得到滿足,則將該效應動作插入至下一個動作層中,并將該效應動作的效果添加到下一個命題層中。
5.根據權利要求3所述的基于動作并行化與圖轉換的應急規劃方法,其特征在于,在擴展過程中,構建所述規劃圖模型內節點之間的互斥關系;同一層次上的兩個動作之間包括三種類型的互斥約束;所述互斥約束包括需求競爭約束、不一致效果約束以及執行干擾約束;所述需求競爭約束為兩個動作在前一個命題層中具有互斥前提條件;所述不一致效...
【專利技術屬性】
技術研發人員:楊碩,毛新軍,肖志群,趙雨欣,張琪,石超,
申請(專利權)人:中國人民解放軍國防科技大學,
類型:發明
國別省市:
還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。