一種基于自適應動態規劃的輸入受限最優編隊跟蹤控制方法技術

技術編號：44395535 閱讀：3 留言：0更新日期：2025-02-25 10:09

本發明專利技術涉及一種基于自適應動態規劃的輸入受限最優編隊跟蹤控制方法。首先建立每個智能體的編隊跟蹤一致性誤差模型和集群通信模型，設計前饋控制率；然后定義每個智能體的性能指標函數；其次，根據貝爾曼最優性原理推導與所定義性能指標函數對應的哈密頓－雅可比－貝爾曼方程，求解最優反饋控制率理論公式；最后，利用自適應動態規劃方法建立單評價網結構，對最優反饋控制率進行近似求解，并設計網絡權重更新率。本發明專利技術建立了一種基于自適應動態規劃的輸入受限最優編隊跟蹤控制方法，可用于無人機集群編隊跟蹤控制。

全部詳細技術資料下載

【技術實現步驟摘要】

本專利技術屬于集群協同控制領域，具體涉及一種基于自適應動態規劃的輸入受限最優編隊跟蹤控制方法，可在輸入受限條件下完成集群按特定編隊構型對指定軌跡的跟蹤，并獲得最優的控制性能。

技術介紹

1、隨著無人機技術的飛速發展，集群編隊的應用需求與日俱增，在緊急搜救、編隊表演和環境監測等場合都需要多智能體系統通過編隊完成相關任務。但是集群編隊跟蹤控制要求智能體在跟蹤預定軌跡的同時相互之間滿足編隊幾何構型約束，這使得編隊跟蹤控制任務要求更高難度更大，研究集群編隊跟蹤的控制算法是保證集群能夠充分發揮多體智能優勢的關鍵。

2、目前常用的編隊控制方法包括行為法、領導跟隨法虛擬結構法和人工勢場法。領導跟隨法和人工勢場法計算簡單、易于實現；虛擬結構法可以避免領導跟隨法中實際領導者個體的干擾問題。相較于行為法，人工勢場法實時性更好，適合四旋翼無人機此類時延要求較高的系統，但很難解決非完整運動學約束問題。在隊形變換上，人工勢場法比領航法更為靈活，能夠滿足四旋翼無人機群此類系統協同飛行的功能需求。但上述控制方法難以保證集群的控制性能，如集群控制的能量消耗以及過渡過程表現。此外，實際應用場景中能提供的控制量是有界的，在設計控制算法時應充分考慮這一約束。因此，研究輸入受限情況下的集群最優編隊跟蹤控制算法對提升集群工作效率，充分發揮集群工作能力具有重要意義。

3、自適應動態規劃方法為解決最優控制問題提供了思路。目前基于自適應動態規劃方法的控制算法在單體軌跡跟蹤控制領域、集群一致性控制以及包含控制領域已取得較多研究成果，但針對集群輸入受限情況

技術實現思路

1、為了在輸入受限情況下，完成集群編隊跟蹤控制任務，本專利技術提供一種基于自適應動態規劃方法的最優編隊跟蹤控制算法，其根據貝爾曼最優性原理設計最優控制器，利用自適應動態規劃方法求解最優控制器，可在完成編隊跟蹤任務的同時保證集群控制性能。

2、為達到上述目的，本專利技術采用如下技術方案為：

3、一種基于自適應動態規劃的輸入受限最優編隊跟蹤控制方法，包括如下步驟：

4、步驟（1）、建立各智能體編隊跟蹤一致性誤差系統以及集群通信模型，設計前饋控制率；

5、步驟（2）、為每個智能體定義輸入受限類型的性能指標函數；

6、步驟（3）、結合步驟（2）的各智能體的性能指標函數，推導與之對應的哈密頓-雅可比-貝爾曼方程，求解最優控制率理論公式；

7、步驟（4）、利用自適應動態規劃方法建立單評價網結構，對最優控制率進行近似求解，并設計評價網權重更新率；

8、進一步地，所述步驟（1）包括：

9、所述集群系統由個相同的智能體組成，采用領導跟隨編隊控制方法，每個智能體的動態方程為：

10、；

11、其中，，要求是李普希茲連續且包含原點，，表示前饋控制量，表示反饋控制量。

12、領導者動力學模型表示為：

13、；

14、其中，表示虛擬領導者狀態。

15、智能體的編隊信息動力學模型為：

16、；

17、定義第個智能體的誤差為：

18、；

19、對上述誤差求導可得：

20、；

21、為節省通訊資源減小計算壓力，部分跟隨者無法與領導者直接通信，只能與鄰近跟隨者通信，為保證集群整體能夠與領導者同步并形成指定編隊，需確保領導者能與部分跟隨者通信。集群的通信模型采用有向圖描述，表示非空點集，表示有序點集間的邊的集合。分別表示第個智能體，即；表示由到的邊，若，表示第個智能體可以接收來自第個智能體的信息。此圖對應的鄰接關系用鄰接矩陣表示，若，則，反之。此圖對應的度矩陣，其中。定義領導者鄰接矩陣，表示智能體可以接收領導者信息，否則表示不能接收。對每一個跟隨者定義如下一致性誤差：

22、；

23、其中，表示智能體能夠通信的個體組成的集合。

24、對上述一致性誤差求導得到如下一致性誤差動力學模型：

25、；

26、其中，表示與智能體組成的集合。

27、前饋控制求解公式為：

28、；

29、假定存在，那么智能體的前饋控制可求得為：

30、；

31、進一步地，所述步驟（2）中所設計的性能指標函數為：

32、；

33、其中，為正定對稱矩陣，是正定積分函數，定義為：

34、；

35、其中，，，，為最大控制輸入；

36、進一步地，所述步驟（3）包括：

37、對各智能體性能指標函數求導得到對應的hjb方程為：

38、；

39、輸入受限情況下的最優反饋控制可解得為：

40、；

41、進一步地，所述步驟（4）包括：

42、針對智能體，其值函數及其導數可近似為：

43、；

44、其中，表示智能體的評價網絡理想權重參數，表示智能體的激活函數，表示激活函數對一致性誤差的偏導數，表示近似誤差且有界，表示近似誤差對一致性誤差的偏導數。

45、對近似公式做以下標準假設：

46、（1）每個智能體值函數近似誤差及其對一致性誤差的偏導數是有界的，滿足條件，，為大于0的常數

47、（2）每個智能體的激活函數及其對一致性誤差的偏導數是有界的，滿足條件，，為大于0的常數

48、（3）每個智能體評價網理想權重是有界的，滿足條件，為大于0的常數

49、定義評價網絡實際權重為，最優反饋控制率可近似為：

50、；

51、代入hjb方程可得近似誤差為：

52、；

53、其中，

54、定義優化目標函數為：

55、；

56、采用梯度下降法設計評價網權重更新率為：

57、；

58、其中，

59、本專利技術可以控制集群對指定軌跡進行跟蹤并保持指定幾何編隊構型。

60、與現有的技術相比，本專利技術具有以下有益效果：

61、（1）考慮到智能體輸入受限的約束，本專利技術設計了基于自適應動態規劃的輸入受限最優編隊跟蹤控制算法，相比于傳統的編隊跟蹤控制方法，本專利技術的控制算法控制率幅值可控，控制效果更好，且能耗更小。

62、（2）本專利技術所設計的控制算法僅利用智能體及其鄰居智能體的信息，屬于分布式控制器，相比于集中式控制器，本專利技術的控制算法對集群通訊要求更低，計算負擔更小。

63、（3）本專利技術利用神經網絡構造單評價網結構，用于在線近似求解最優控制器，相比于離線迭代求解最優控制方法，本專利技術具有實時性和自適應性。

本文檔來自技高網...

【技術保護點】

1.一種基于自適應動態規劃的輸入受限最優編隊跟蹤控制方法，其特征在于，包括如下步驟：

2.根據權利要求1所述的一種基于自適應動態規劃的輸入受限最優編隊跟蹤控制方法，其特征在于，所述步驟（1）包括：

3.根據權利要求1所述的一種基于自適應動態規劃的輸入受限最優編隊跟蹤控制方法，其特征在于，所述步驟（2）的性能指標函數為：

4.根據權利要求1所述的一種基于自適應動態規劃的輸入受限最優編隊跟蹤控制方法，其特征在于，

5.根據權利要求1所述的一種基于自適應動態規劃的輸入受限最優編隊跟蹤控制方法，其特征在于，

【技術特征摘要】

1.一種基于自適應動態規劃的輸入受限最優編隊跟蹤控制方法，其特征在于，包括如下步驟：

2.根據權利要求1所述的一種基于自適應動態規劃的輸入受限最優編隊跟蹤控制方法，其特征在于，所述步驟（1）包括：

3.根據權利要求1所述的一種基于自適應動態規劃的輸入受...

【專利技術屬性】
技術研發人員：徐燁烽，吳艷薇，徐韜，薛宏濱，王東輝，趙策，
申請(專利權)人：浙江維斗科技有限公司，
類型：發明
國別省市：

全部詳細技術資料下載我是這個專利的主人

相關技術

暫無相關專利

網友詢問留言已有0條評論

還沒有人留言評論。發表了對其他瀏覽者有用的留言會獲得科技券。

發布您的意見

相關領域技術